
<h2>직무</h2><p>Deep Learning Engineer (음성 합성 TTS 연구/개발)</p><h2>포지션 상세</h2><p>We are looking for the best<br><br>42dot Audio Generation 팀은 차량 내에서 사용자가 더욱 편안하고 신뢰감 있게 차량과 소통할 수 있도록 최신 음성 합성(TTS) 기술을 개발하고 있습니다. 전 세계 다양한 언어를 자연스러운 음성으로 구현하는 TTS 기술 개발에 함께하실 분을 찾습니다.</p><h2>주요업무</h2><p>• Autoregressive(AR) 기반 TTS 모델 연구개발<br>• Non-autoregressive(NAR) 기반 TTS 모델 연구개발<br>• 오디오 코덱(Audio Codec) 연구개발<br>• Zero-shot TTS 모델 연구개발<br>• 음성 데이터 수집 및 정제</p><h2>자격요건</h2><p>• 음성 합성(TTS) 관련 분야에서 2~3년 이상의 실무 경험 또는 석사 학위 취득 예정자<br>• 음성 신호 처리에 대한 기본 개념 및 지식 보유<br>• 딥 러닝에 대한 기본 개념 및 지식 보유<br>• Python 및 PyTorch 활용 능숙자</p><h2>우대사항</h2><p>• 음성 합성(TTS) 기술을 개발하여 실제 상용화/서비스를 한 경험이 있으신 분<br>• Streaming TTS 개발 경험이 있으신 분<br>• Code-mixed TTS 개발 경험이 있으신 분<br>• 최신 TTS 모델(AudioLM, VALL-E, XTTS, Voicebox, NaturalSpeech, F5-TTS 등) 에 대해 이해도가 높으신 분<br>• 최신 오디오 코덱(Audio Codec) 모델(SoundStream, EnCodec, Mimi 등) 에 대해 이해도가 높으신 분<br>• Diffusion/CFM 기반 생성 모델에 대해 이해도가 높으신 분<br>• Zero-shot TTS 모델(YourTTS, Spark-TTS 등) 에 대해 이해도가 높으신 분<br>• 음성(Speech), 기계학습(Machine Learning), 인공지능(Artificial Intelligence) 분야 상위급 저널/학회 논문 게재 저자</p><h2>혜택 및 복지</h2><p>[42dot만의 업무 몰입 프로그램]<br>https://42dot.ai/careers/program</p>






