
Sr.MachineLearningEngineer(HYPERCONNECTEngineeringAI)[Al Lab 소개]하이퍼커넥트 Al Lab은 사람과 사람사이를 연결하는서비스에서 기존의 기술로는 접근하기궂렵지만 머신러닝 기술을 통해 풀 수있는 문제들을 찾아내고 해결하여 사용자경험을 혁신합니다. 이를 위해 영상/음성/자연어/추천 등을 포함하여 다양한 도메인의수많은 모델을 개발하고, 모바일 및 클라우드 서버를 통해 안정적으로 제공하면서 □주하는 문제들을 해결하여AI Lab이 만들어 내는기술이 실제 서비스의 성장에 기여하는 낫을 목표로 합니다. 이러한 목표 아래하이퍼커넥트 Al Lab은 아자르를포함한하이퍼커넥트의 제품에 기여하는 머신러닝기술들을 수년간 발전시켜나가고 있습니다.[ML Team 소개]AI Lab 소속의ML Team은 사용자들의 만족스러운 경험을 위해 콘텐츠가어떤 내용을 담고 있는지를 이해하고활용하는 연구 개발을수행합니다. 모바일,웹 브라우저 및 서버 환경에서 영상이나이미지, 음성 및 자연어로 구성된 비정형 데이터를 입력으로 받아 유용한정보를 추출하기 위해 다음과 같은 문제를함께 풀 수 있는 분들을 찾고 있습니다(인터뷰).모바일, 웹 브라우저 환경에서 짧은 레이턴를 유지하면서도 높은 성능을 달성하는 경량 모델과 최적화에 대한 문제Labelnoisiness를고려하여labeling퀄리티를 추적 및 관리하는 문제서로 다른 도메인에서 수집된데이터 간의 차이를극복하는 도메인 적응 문제-Multi-task 혹은 multi-label 분류모델에 대한 문제Unlabeled 데이터를 활용한 semi-supervlearning, self-supervisedlearn-Multi-modal 데이터를 활용하는 문제- 스트림으로 유입되는 사용자 행동 로그와 content understanding 결과에반한 실시간 이상 사용자(ex.. 스팸/가짜 계정)를탐지하는 문제또, 제품에 포함되는다양한 추천 문제를해결함으로써 사용자들에게 보다은 경험을제공하고,궁극적으로 장기 매출 향상에기여합니다. 다음과 같은 문제들을 고민하고있습니다(인터뷰).- 신규 사용자에게 좋은 경험을 주기 위한cold-start 추천문제(session-basedrecommendationion,contextualbandit과같이few-sho데이터만으로도 사용자의 선호를 파할 수 있는 시스템, 신규 사용자에대한 데이터가 부족할 때 신규 사용자에대한 추천 성능을 향상시키기 위한학습 방법 등)-양쪽 사용자가 모두 만족할 수 있는 상호(reciprocal) 추천 문제실시간으로 변경되는 추천 후보군에대해 매우 빠른 시간 안에 추론을 수행하는 실시간 추천 문제(session-basedrecommendation,graph-basedrecoreinforcement learning, ...)여러 목표 지표들 사이의 trade-off를고려하는 추천 문제장기 지표를 향상시키는1차 목표 지표를 찾는 문제제품에 포함되는 AI 기술을 연구하기위한 노력들도 꾸준히 진행하고 있습니다.실제 프로덕션 환경에서는Kaggle과 같은 정제된데이터셋이 존재하지 않으며, 대부분의 경우매일 새로운 데이터가 시스템에 유입됩니다어제보다 오늘 더 나은 모델을 자동으로생성하는 flywheel을 구축하기 위해, 함께다음과 같은 문제를 해결할 수 있는 분들을 찾고 있습니다.- Highly imbalanced 또는 noisy l데이터를 다루는 방법Active learning을 통한 효율적인 데이터라벨링 방법 혹은 모델 학습에 필요한 데이타를 줄일 수 있는 core-set selection 방-기존에 deploy된 모델을 지속적해서 개선할 수 있는 continual/life-longlearning 방법-모델 task 요구사항의 변화와 신규서비스에 대응할 수 있는meta-learning 방법- Large scale model을 학습하고, 실제서비스 환경에서 초당 수백 또는 수천개의 입력을 안정적으로 처리할 수있도록 할 수 있는modeling, optimization,distillation 방법ML 프로덕션 프로세스를혁신하기 위해 large languagemodels을 활용하는 방법[Responsibilities]ML Engineer는 최첨단의 모델을연구하고 개선하는 과학자로서의연구 능력과, 만들어진 모델의 시간/공적 복잡도를 고려해 추론성능을 극한으로 끌어올리는 공학자로서의개발 능력이 필요합니다. 이런 능력을 바탕으로 실제 서비스에서 겪는 문제를 발견/정의하고, 문제해결을 위한 SotA 모델을 재현 또는 개발하고, 모델을 온디바스 및 서버 환경에 배포하고, 이후모니터링하며지속적으로 모델을 개선하는 Al flywhee을 구축하는 등 다양한 업무를 수행합니다.이 과정에서 백엔드/프론트엔드/DevOps엔지니어, 데이터 분석가, PM 등 다잉한 전문조직과 적극적으로 협업하며도움을 받습니다.일하는 모습에 대한 조금 더 자세한이야기는 다음의 내용을 참고하시면좋습니다.AimSodaDiscovery[How Al Lab Works] Head ofAl - Shurain 인터뷰연구의 결과물을 정리하여 논문 혹은 코드로 공개하는 것 또한 팀 목표 중 하나입니다.제품에 사용하기 위한 목적으로 머신러닝모델을 만들다 보면, 기존 연구로는 부족한 경우가 많습니다.부족한 부분을 채우기 위해 진행된 연구의 결과물을 프로젝트 참여자들이모두 함께 협업하여 연구의 의미 있는부분을 정돈하고 가능하다면 코드와함께 공개합니다. 그 결과, 지금까지 이래와 같은 대외적연구 성과를 거둘 수 있었습니다.- 2023년 TiDAL: 효율적인 학습 과정의 모델 행동에 기반한 액티브 러닝 기법ICCV 2023 게재2023년모더레이션 환경에서 여러 분류 기준을동시에 만족하기 위한 문턱값을 잡는연구 WSDM 2023 게재2022년대화 생성에서의 의미적 다양성을 높이는연구 EMNLP 2022 게재- 2022년 레이블 노이즈가 심한 환경에서효과적으로 학습하는 방법 ECCV2022 게재2022년 타깃 캐릭터의 몇가지 발화만을용하여 타깃 캐릭터를 모방하는 챗봇연구 NAACL 2022 게재2022년 대화 생성 모델에서 예시를활용하여 성능을 높이는 연구 ACL 2022 Workshop 발표2022년 모바일 환경에서 오디오 분를 위한 distillation 기술 연구ICASSP 게재2021년 클릭률 예측을 위한 중요도 보존이 가능한 피쳐 정규화 연구 ICDMWorkshop Best Paper 수상2021년Tabular Learning 기반 효율적인 ClickighRatePrediction모델(CLR2021Wor-2021년 효율적인 Retriever기반 Chatbo위한 Large-Scale Generative 모델 활EMNLP 2021 게재2020년 Long-tailed Visual Recognition 문제를 Label distribution 관점에서 해결하는 기술 CVPR2021 게재- 2020년 퓨샷 러닝을 통한 Text-to-Sbeech(TTS) 기술 INTERSPEECH2020 게재2019년 퓨샷 러닝을 통한 안면 재현기술 AAAI 2020 게재- 2019년 모바일에서 빠르게 동작하는키워드 스팟팅 모델(TC-ResNet)INTERSPEECH 2019 게재2019년 모바일 환경에 최적화된 경량이미지 세그멘테이션 모델(MMNet)아카이브 업로드2018년 저전력 이미지 인식 대회(_PIRC) 2등ML 연구가 잘 진행되기 위해서는 딥러닝 학습을 위한 인프라도 잘 갖추어져야합니다. 하|써커넥트에서는 ML Engineer들이 충분히모델 개발 및 실험을 진행할 수 있도록자체적인 딥러닝 연구용 클러스터를구축하여 활용하고 있습니다DGX-A100 20대로 구성된클러스터(총160대의 A100 GPU)를 포함한 다양한 on-premise 장비들을 연구개발tordotol 활용할 수 있습니다. 추가적으로, 데이수집, 전처리를 포함한 자체적인 데이터 파프라인을 클라우드 서비스를 활용하여 구축및 운영하고 있습니다. 또, ML 모델의제품화를 도와주실다양한 소프트웨어엔지니어(백엔드/프론트엔드/DevOps/MLSE)분들과 함께 일하고 있습니다.RequirementsAI 기술의 서비스화에 관심이많으신 분AI/ML 도메인 전반에 대한 이해와적어도 한 개이상의특정 도메인에대한깊이 있는 지식을갖추고, 3년 이상의 관련프로젝트 경험이 있으신 분지속적인 주도적 학습을 통해 팀의AI/ML을 포함한 기술적경쟁력을 만들고 유지하게 도와주실수 있는 분보통의 방법으로 풀 수없는 엔지니어링제약 조건을AI 모델링능력과소프트웨어엔지니어링전반에 대한 깊은 수준의이해를 바탕으로해결할 수 있는역량을갖춘 분실제 서비스에 AI 기술을 통합하고주요 지표를유의미하게 향상시켜 본 경험이있으신 분ML모델을학습하고 실제서비스에배포하기위해,여러직군의 이해관계자와협업할 수 있는 강력한커뮤니케이션능력과 엔지니어링역량을갖추신 분구현체가 공개되어있지 않은논문을 스크래치부터 빠르고 정확히게 구현해본 경험이있으신 분다른 ML관련 직군 엔지니어 의성장을 도와본경험이있거나,관련한역량을갖추신 분학위나 국적은무관하되,한국어로원활한의사소통이가능한 분Preferred Qualifications기계학습 관련 탑티어 학회 및 저널(NeurIPS, ICLR,ICML,CVPR,ICCV/ECCV, KDD,...) 게재 실적 혹은 AI 관련대회 수상실적이있으신 분공개된 벤치마크 데이터셋에서 SotA를 찍어본 경험이 있으신분클라이언트(Android,iOS),백엔드를 포함해 AI/ML분야 외 개발 경험이 풍부하신 분기계학습 관련 오픈 소스개발에 참여해 본경험이 있으신 분AI/ML 도메인 전반에 대한 방대한지식을자랑할 수 있으신 분On-device ML연구 및 배포경험이 있으신 분A/B 테스트 실험 기획 및 타겟 KPI지표를정의하고,SQL기반 데이터 분석을 진행한경험이 있으신 분인과관계 분석 및기타통계기법을사용하여데이터에서 의미 있는통찰력을 발굴하고 의사결정에 활용해본 경험이있으신 분머신러닝워크플로우의 자동화경험이있으신 분(예:AutoML,Hyperparameter optimization,데이터 및 학습파이프라인 구성 등)영어로 원활한 의사소통이가능하신 분엔지니어링팀을리드해본경험이있으신 분HiringProcess고용 형태: 정규직채용절차:서류전형>코딩테스트/전과제>1차면접>2차면접/Recruter Call > 3차면접(해당시) > 최종합격(*일부 순서가 변경될 수 있습니다.)서류 전형의 경우 합격자에 한하여 개별안내드릴 예정입니다.지원 서류: 자유 양식의 상세경력기반국문 또는 영문이력서(PDF)etc하이퍼커넥트는 증명사진,주민등록번호,가족관계,혼인여부등 채용과 관계없는개인정보를 요구하지 않습니다.수습기간 중 급여 등 처우에 차등이없습니다.제출해 주신 내용 중 허위 사실이있을 경우 채용이취소될 수 있습니다.관련법 상 근로제공에 결격사유가 있는 경우채용이취소될수 있으며,필요 시 사전에안내된 채용절차 외에도 추가전형 및 서류 확인이 진행될수 있습니다.필요 시지원자의 동의 하에평판조회 절차가진행될 수 있으며, 평판조회결과에 따라채용이 취소될 수 있습니다.이 포지션은 산업기능요원 보충역 편입/전직,전문연구요원 현역 전직,전문연구요원 보충역 편입/전직 채용이가능합니다.병역특례요원의 경우,병역특례 관련법에따라복무관리를 진행합니다.(*전문연구요원 현역신규편입은현재마감되었습니다)제출해 주신 내용 중 허위 사실이 있거나관련법 상 근로제공에 결격사유가 있는 경우채용이 취소될 수 있으며, 필요시사전에 안내된 채용절차 외에도 추가 전형 및 서류확인이 진행될 수 있습니다.하이퍼커넥트가 채용하는 포지션에지원하는 경우,개인정보 처리에관하여서는 본 개인정보처리방침이적용됩니다:https://career.hyperconnect.com/privacy







