
<h2>직무</h2><p>Senior Data Engineer - LLM</p><h2>포지션 상세</h2><p>업스테이지는 AI 기술을 활용하여 비즈니스 문제를 해결하는 데 주력하고 있습니다. “Making AI Beneficial” 이라는 비전과 “Building intelligence for the future of work” 라는 미션을 바탕으로, 단순한 업무 자동화를 넘어서 복잡한 의사결정 지원 및 비용 절감을 통해 기업의 생산성을 증진시킬 수 있는 AI 제품과 솔루션을 제공합니다. 이를 통해 우리는 기업들이 업무 처리 방식을 혁신하고 더욱 효율적으로 성장할 수 있도록 지원합니다.<br><br>업스테이지는 누구나 손쉽게 AI 기술을 활용할 수 있도록 ‘사용이 쉬운 AI 솔루션’을 제공하는 것을 목표로 하고 있습니다. 이미 최고 수준의 OCR 기술과 문서 내 의미 있는 정보를 자동으로 추출하는 Key-Value 추출 기술을 보유하고 있으며, 최근에는 다양한 문서 레이아웃을 분석하는 Document Parsing 모델을 공개하였습니다. 이러한 기술들을 바탕으로, 업스테이지는 기업들의 업무 효율과 생산성을 극대화하는 맞춤형 AI 솔루션을 제공하여 AI가 실제 비즈니스에서 큰 가치를 창출할 수 있도록 노력하고 있습니다.<br><br>또한 LLM 기술을 비즈니스 환경에 맞게 최적화해 기업들의 업무 효율과 생산성을 높일 수 있는 Private LLM 서비스를 제공하는 등 AI가 세상에 이롭게 쓰이게 하기 위해 세계 최고 수준의 AI 모델을 다양한 분야에서 손쉽게 활용할 수 있는 API 시리즈를 출시하여 기업 고객들의 비즈니스 성공에 기여하고 있습니다. 그 중에서 업스테이지 Document AI는 세계 최고 수준의 OCR 및 정보추출 기술력을 바탕으로 한 제품으로, AI를 통해 번거로운 문서 처리를 자동화하고 효율화하겠다는 목표를 가지고 있습니다.<br><br>데이터는 최근 LLM 개발의 전부라고 생각이 될 정도로 중요하게 판단되고 있습니다. 해당 직무는 좋은 데이터를 인수, 처리, 사용, 발전하는 데이터 리니지(data lineage)를 설계하고 그에 필요한 툴을 개발하는 업무를 수행하여 Upstage의 LLM 개발 사이클을 더 나은 방향으로 발전시킵니다. 현재 중요하게 생각되는 (1) 데이터 전처리 파이프라인, (2) 데이터 관리 시스템, (3) 휴먼 피드백 파이프라인 개발에 기여하여 발전을 시킬 수 있으며, 그 외에 더 큰 뷰에서 데이터 리니지를 개선, 확장하는 롤을 수행합니다.<br><br>Upstage의 LLM Data Team은 크게 Data Engineer, Data Curator, Human Annotation Manager로 구성이 되어 있으며, Solar의 데이터 리니지를 설계하고 개발하며, 이를 통하여 좋은 데이터를 인수, 개선을 수행합니다.</p><h2>주요업무</h2><p>주요 업무<br>• LLM 데이터 전처리 자동화 파이프라인 설계 및 개발<br>• LLM 데이터 관리 시스템 설계 및 개발<br>• Human Feedback Tool 설계 및 개발<br>• 데이터 획득, 제작, 개선을 위한 LLM Data Lineage 개발<br><br>근무 형태<br>• 정규직 <br><br>*지원자의 민감 정보(연봉 정보, 주민번호 등) 및 고유식별번호는 이력서에 기재하지 않도록 유의해주시기를 바랍니다.<br>*제출하시는 모든 문서는 반드시 PDF 파일로 업로드해주시기를 바랍니다.</p><h2>자격요건</h2><p>• API 설계, 개발 및 유지보수 경력 3~10년 또는 그에 준하는 개발 업무 역량<br>• 아래 3가지 요건 중 최소 1가지 충족<br>1) supervised fine-tuning (SFT), Reinforcement Learning from Human Feedback (RLHF) 등에 대한 개념적 이해<br>2) LLM 및 MLLM을 위한 사전 훈련 데이터의 최근 동향에 대한 이해<br>3)레이블이 지정된 데이터 구성(LLM용), 데이터 큐레이션 및 데이터 합성에 대한 경험<br>• AI 기술에 대한 최소 7년 이상의 경험(M.S. 및 Ph.D 기간 포함)</p><h2>우대사항</h2><p>• 업무 환경에서의 LLM과 인간 행동에 대한 강한 관심<br>• 열정적인 학습 의지와 가설을 테스트하기 위해 데이터를 빠르게 실험할 수 있는 능력<br>• 강력한 커뮤니케이션 기술과 다른 사람들에게 영향을 미칠 수 있는 역량<br>• 한 번에 여러 프로젝트를 동시에 처리하는 데 성공한 경험<br>• LLM/MLLM 데이터에 대한 multipotentionality을 가진 분</p><h2>혜택 및 복지</h2><p>업스테이지의 문화와 제도는 지금, 이순간에도 진화 중입니다.<br><br>• Anywhere On Earth But Together! ‘어디서든’ 함께 일할 수 있으며, 고객사 미팅/협업을 위해 주로 사용하시게 될 오프라인 오피스는 삼성역/상현역 근처에 있습니다. (필요시 국내외 고객사 파견/출장)<br>• 원격근무에 필요한 장비를 500만원 예산 내에 자유롭게 선택하실 수 있습니다.<br>• 근무를 위한 카페 이용 시 음료 비용, 스터디룸 혹은 공유오피스 이용 비용 등을 지원해드립니다.<br>• 업무 관련 소프트웨어, 도서, 자료, 교육 및 어학 수강비 등 성장에 필요한 비용을 지원해드립니다.<br>• 건강을 위한 운동비, 직장 단체보험 및 종합건강검진을 지원해드립니다.</p>







