
Research Scientist/Engineer - STT(Speech- To-Text)/TTS(Text-To-Speech) #Language •Magok, Seoul 팀 소개 Language Lab은 음성 및 언어처리 분야의 기술적 난제 해결을 위한 핵심 선행기술을 연구하며 Learning-by-Reading Al 확보를 통한 LG 그룹차원의 챗봇, 음성 에이전트 등 Language 분야 서비스 혁신 이라는 비전을 가지고 있습니다. 그 중에서도 음성 인식(STT, Speech-to-Text)과 음성 합성(TTS, Text-to-Speech) 기술을 중심으로, 음성 기반 AI 서비스의 핵 심 기술을 연구·개발하고 있습니다. 주요 연구 분야로는 실시간 음성 인식, 자연스러운 음성 합성, 화자 분리 및 Diarization, 음성 기반 회의록 생성, Speech LLM, 그 리고 Speech Foundation Model 등이 있으며, 이러한 기술들을 기반으로 AI Contact Center (AICC) 및 다양한 음성 애플리케 이션에 적용 가능한 솔루션을 개발하고 있습니다. STT/TTS 모델 개발은 물론, 음성 데이터 전처리, 학습 파이프라인 구축, Inference 최적화 등 음성 AI 전반에 걸친 실질적인 기술 역량을 바탕으로, 사람과 AI 간의 더 자연스러운 음성 소통 환경을 만들어가고 있습니다. . 수행 업무 최신 딥러닝 기반 STT/TTS 모델의 연구 개발 •Streaming 환경에 최적화된 STT/TTS 설계, 학습 파이프라인 구축 및 튜닝 다양한 환경에 대응 가능한 Customizable Decoder 개발 및 구조 개선 음성 데이터 전처리, 정제, 증강 등 데이터 기반 모델 개선 및 실험 설계 모델 경량화 및 실시간 추론 최적화 • STT/TTS 모델을 실서비스에 적용하기 위한 서버 연동, API 설계 및 배포 환경 구성 ・STT/TTS 추론 서버의 안정성 확보 및 운영 최적화 Speech Foundation Model, Speech LLM 등 차세대 음성 AI 기술에 대한 연구 개발 팀 내/외부 협업을 통한 서비스 적용, 테스트 및 지속적인 기술 고도화 지원자격 • STT/TTS 분야에서 석사 후 3년 이상의 경력 혹은 이에 준하는 경력 필요 최신 딥러닝 기반 STT/TTS 알고리즘에 대한 이해와 구현 역량이 있는 분 (TensorFlow, PyTorch 등) 음성 AI 시스템을 위한 데이터 전처리, 모델 학습, 추론 및 튜닝 파이프라인을 구축해본 경험 ・독창적인 기술 제시 및 문제 해결을 위한 프로그래밍 능력을 보유하신 분 (C/C++/Python/shell 등) 우대사항 •Kaldi, Icefall, WeNet, Coqui TTS 등 음성 특화 오픈소스 툴킷 사용 및 커스터마이징 경험 ・Whisper, HuBERT, Wav2Vec 및 VITS, XTTS, NeuralSpeech 등 최신 음성 모델에 대한 실험 경험 ・Streaming STT를 위한 모델 경량화 및 Inference 최적화 경험 · Streaming STT 서버 구축/운영 경험 (Java 기반 포함) STT/TTS 모델의 상용 서비스 적용 및 운영 경험 Speech LLM, Speech Foundation Model 관련 연구 또는 프로토타입 개발 경험 • Al 관련 Top-Tier 학회 (ICASSP, Interspeech, NeurIPS, ICLR 등) 논문 발표 혹은 연구 프로젝트 참여 경험 전공 컴퓨터공학, 전산학, 전자공학, 산업공학 전형절차 서류심사 → 코딩테스트 → 1차 기술 인터뷰(온라인) → LG Al Fit Check (온라인)→ 2차 Culture Fit 인터뷰(온사이트)→ 최종 합격 *전형 절차는 변경될 수 있습니다. 서류 합격 시 전형 절차에 대해 별도로 안내 해 드립니다. *기술 면접 시 개인 Research area 위주의 Portfolio 발표가 예정된 점 참고 부탁드립니다. 현재 LG AI연구원은 병역지정업체가 아님으로, 전문연구요원 채용 및 전직이 불가함을 알려드립니다. 지원시 문제가 있을 경우 careers @lgresearch.ai 로 문의 부탁드립니다.







