
ML Engineer (HYPERCONNECT AI)
하이퍼커넥트<h2>직무</h2><p>ML Engineer (HYPERCONNECT AI)</p><h2>포지션 상세</h2><p>[AI Lab 소개]<br><br>하이퍼커넥트 AI Lab은 사람과 사람 사이를 연결하는 제품에서 기존의 기술로는 접근하기 어렵지만 머신러닝 기술을 통해 풀 수 있는 문제들을 찾아내고 해결하여 사용자 경험을 혁신합니다.<br>이를 위해 영상/음성/자연어/추천 등을 포함하여 다양한 도메인의 수많은 모델을 개발하고, 모바일 및 클라우드 서버를 통해 안정적으로 제공하면서 마주하는 문제들을 해결하여 AI Lab이 만들어 내는 기술이 실제 제품의 성장에 기여하는 것을 목표로 합니다.<br>이러한 목표 아래 하이퍼커넥트 AI Lab은 아자르를 포함한 하이퍼커넥트의 제품에 기여하는 머신러닝 기술들을 수년간 발전시켜나가고 있습니다.<br><br><br>[ML Engineer 직무 소개]<br><br>AI Lab의 ML Engineer는 최첨단 모델을 연구하고 개선하는 과학자로서의 연구 능력과, 현실적인 제약사항들을 종합적으로 고려해 기술적 의사결정을 하는 공학자로서의 역량이 필요합니다.<br>이러한 역량을 바탕으로 실제 제품에서 겪는 문제를 발견/청취하고 이를 AI 문제로 치환해 문제를 해결합니다.<br>이 과정에서 백엔드/프론트엔드/DevOps/ML소프트웨어 엔지니어, 데이터 분석가, PM 등 다양한 전문조직과 적극적으로 협업하며 도움을 받습니다. 일하는 모습에 대한 조금 더 자세한 이야기는 다음의 내용을 참고하시면 좋습니다.<br><br>ML Engineer는 제품의 문제 해결 과정을 일종의 연구 과정으로 바라봅니다. 문제 정의, 이해관계자 설득, 목표 설정, SotA 모델 도출, 일정 관리, 성과 분석, 향후 전략 설정까지 문제 해결 과정의 A-Z를 주도적으로 담당합니다.<br>사용자의 요구와 비즈니스 임팩트를 고려해 우선순위를 정의하고, 장기적인 안목으로 제품을 성장시키는 데 AI 관점에서 기여합니다.<br><br>AI로 비즈니스 문제를 해결하기 위해서는 딥러닝 학습을 위한 인프라도 제대로 갖추어져야합니다. 하이퍼커넥트에서는 ML Engineer들이 충분히 모델 개발 및 실험을 진행할 수 있도록 자체적인 딥러닝 연구용 클러스터를 구축하여 활용하고 있습니다.<br>총 160대의 A100 GPU 및 다수의 H100 GPU를 포함한 다양한 on-premise 장비들을 연구개발에 활용할 수 있습니다. 추가적으로, 데이터 수집, 전처리를 포함한 자체적인 데이터 파이프라인을 클라우드 서비스를 활용하여 구축 및 운영하고 있습니다.</p><h2>주요업무</h2><p>[Content Understanding 업무 소개]<br>AI Lab의 contents understadning 업무에서는 영상이나 이미지, 음성 및 자연어로 구성된 비정형 데이터를 입력으로 받아 비즈니스에 유용한 정보를 추출하는 데 집중하며, 모더레이션을 통한 신뢰와 안전(Trust & Safety) 업무에 기여하는 것을 주 목표로 합니다. 하이퍼커넥트 및 Match Group 브랜드에서 생성되는 컨텐츠를 이해하는 데 기여하며 글로벌 신뢰와 안전 기준을 충족하기 위해 Match Group과 협력하여 다양한 과제를 수행합니다.<br><br>• 모바일 및 웹 환경에서 짧은 레이턴시와 낮은 전력 소비를 유지하면서도 높은 정확도를 달성할 수 있는 경량 모델 설계 및 최적화 기법<br>• noise와 imbalance가 심한 데이터에서 레이블 품질을 추적 및 관리하고, 최소한의 라벨링으로 성능을 확보하기 위한 액티브 러닝, core-set selection, semi-/self-supervised 학습 방법<br>• multi-task 또는 multi-label 분류를 제한된 파라미터 budget 내에서 최적화하고, 텍스트, 이미지, 영상 등 multi-modal 정보를 통합하는 모델링 기법<br>• 도메인 간 분포 차이를 극복하는 도메인 적응, 서비스 확장성을 위한 meta-learning 기법<br>• 국제 AI 기준을 맞추기 위한 Fairness 및 Privacy 보장을 위한 학습 방법<br>• 사용자 행동 로그와 콘텐츠 분석 정보를 활용하여 스팸, 가짜 계정 등 이상 행위를 실시간으로 탐지하거나 사전 예측하는 스트리밍 기반 모델링<br>• ML 프로덕션 프로세스를 혁신하기 위한 LLM 활용 방법</p><h2>자격요건</h2><p>• AI/ML 도메인 전반에 대한 이해와 적어도 한 개 이상의 특정 도메인에 대한 깊이 있는 지식을 갖춘 분<br>• AI 기술의 제품화에 관심이 많으신 분<br>• AI를 통한 문제 해결 역량 및 이를 위한 프로젝트 관리 역량을 갖춘 분<br>• Tensorflow, PyTorch, CatBoost, JAX 등 오픈소스 프레임워크 기반 개발역량을 포함한 파이썬 개발역량이 충분하신 분<br>• 강한 오너쉽을 발휘해 프로젝트의 A-Z를 책임지고 완수하실 수 있는 분<br>• 여러 직군의 이해관계자와 협업할 수 있는 강력한 커뮤니케이션 능력을 갖추신 분<br>• ML 시스템의 소프트웨어 개발 구조와 내용을 이해하고 기능을 기획할 수 있는 엔지니어링 역량이 있는 분<br>• 데이터의 통계적 특성과 패턴을 발견하고 이를 AI 문제 해결에 반영하실 수 있는 분<br>• A/B 테스트 실험 기획 및 타겟 KPI 지표를 정의하고, SQL기반 데이터 분석을 진행한 경험이 있으신 분<br>• 학위나 국적은 무관하되 한국어로 원활한 의사소통이 가능한 분</p><h2>우대사항</h2><p>• 기계학습 관련 탑티어 학회 및 저널(NeurIPS, ICLR, ICML, CVPR, ICCV/ECCV, KDD, …) 게재 실적 혹은 AI 관련 대회 수상 실적이 있으신 분<br>• AI/ML 도메인 전반에 대한 방대한 지식을 자랑할 수 있으신 분<br>• 실제 서비스에 AI 기술을 통합하고 주요 지표를 유의미하게 향상시켜 본 경험이 있으신 분<br>• PO/PM 혹은 그에 준하는 경험이 있으신 분<br>• 영어로 원활한 의사소통이 가능하신 분<br>• 인과관계 분석(DID, RCT, Causal Inference 등), 다변량 테스트, Sequential Testing 등에 대한 이해가 깊으신 분</p><h2>혜택 및 복지</h2><p>회사 홈페이지 참고 부탁드립니다.</p>