<h2>직무</h2><p>AI 엔지니어</p><h2>포지션 상세</h2><p>인휴먼즈는 AI 기술을 활용해 누구나 자유롭게 ‘나’를 표현할 수 있도록 돕는 커뮤니케이션 스타트업입니다.<br>외모나 목소리 제약 없이 자유롭게 소통할 수 있도록 돕는 "AI 커뮤니케이션 서비스"를 만들고 있습니다.<br>실시간 얼굴 변환, 음성 변환, 통역 및 정보 검색 기술을 통해 모두가 제약 없는 표현과 소통을 가능케 합니다.<br><br>우리는 '기술'이 아니라 ‘기회를’ 만들고자 합니다.<br>인휴먼즈는 외모, 목소리, 언어, 배경을 넘어 "누구나 표현할 수 있는 세상" 꿈 꾸고 있습니다.</p><h2>주요업무</h2><p>• "실시간 얼굴 변환 기능" 개발 및 최적화를 위한 모델 개발 (영상 인풋 처리)<br>• NSFW와 같은 부정 사용 인풋 필터링/차단 기능 개발<br>• "보이스 클로닝, 음성 변환, 실시간 통역 파이프라인" 설계 및 구현<br>• "RAG 기반 질의응답 시스템" 설계 및 법률 질의 대응 기능 개발<br>• MLOps 환경 구성 및 클라우드 기반 GPU 리소스 연동/운영<br>• Python 및 TypeScript 기반 팀과 협업 및 전체 제품 통합 개발</p><h2>자격요건</h2><p>• 컴퓨터 비전분야 머신러닝/딥러닝 기반 개발 실무 경험<br>• Python 기반 모델링 및 시스템 개발 역량<br>• 클라우드(GCP, AWS, Azure 등) 상에서 GPU 인스턴스를 활용한 AI 개발 경험<br>• MLOps 파이프라인 구축 또는 AI 모델 운영 경험<br>(예: Docker, Kubernetes, 모델 버저닝, 자동 배포 등)<br>• 실시간 시스템 구현을 위한 모델 최적화 및 경량화 경험<br>• 스타트업 또는 소규모 팀 환경에서의 적극적 커뮤니케이션 역량</p><h2>우대사항</h2><p>• 실시간 영상/음성 처리 관련 실무 경험 및 병목 분석, 최적화 경험<br>• Bark, Coqui 등 Text To Speech 오픈소스 활용 경험<br>• Whisper, Google Speech Recognition 등 Speech to Text 오픈소스 활용 경험<br>• Zero Shot Voice Cloning 에 대한 이해<br>• LLM API 또는 On-Device LLM 기반 RAG 시스템 구축 경험<br>• 관련 학위 보유자 또는 해당 분야에 대한 체계적 이해가 있는 분</p><h2>혜택 및 복지</h2><p>근무 조건<br>• 근무지: 서울 광화문 사무실 대면 근무<br>• 근무시간: 09-18시<br>• 근무 형태: 정규직<br>• 급여/처우: 전 직장 대비 우대 협의<br><br>혜택 및 복지<br>• 음료/간식 제공 <br>• 식사 제공<br>• 경조휴가 및 경조사비 제공</p>







