
<h2>직무</h2><p>LLM Engineer (Reinforcement Learning)</p><h2>포지션 상세</h2><p>We are looking for the best<br><br>LLM Engineer(Reinforcement Learning)는 LLM학습 파이프라인을 설계하여 실서비스에서 활용 가능한 생성형 언어모델을 학습합니다. 지속적인 품질 향상을 위하여 끊임없이 새로운 방법론을 시도하여, 실사용자에게 꼭 필요한 서비스를 출시하고, LLM 스스로 품질을 개선할 수 있도록 가다듬는 일에 기여합니다.</p><h2>주요업무</h2><p>• LLM학습 과정의 효율 향상: PLM 또는 Fine-tuned LLM의 Direct Alignment Algorithm / PPO, GRPO, DPO 등을 이용한 학습 과정의 전반적인 효율 향상<br>• 생성 결과의 전반적인 정확성과 안정성 향상: 생성 결과의 품질 향상을 위하여 Reward Hacking을 방지하고, Self-Refine이 가능한 학습 구조 설계<br>• 외부 지식 및 API와 연동 가능한 기초 모델 개발: 지시의 종류에 따라 스스로 필요한 외부 연동 Tool을 선택하는 LLM 학습</p><h2>자격요건</h2><p>• Deep Learning 또는 NLP 관련 경력 5년 이상<br>• 숙련된 프로그래밍 (Python & pytorch) 능력<br>• PyTorch를 활용한 모델 설계, 학습, 평가 및 최적화 경험<br>• GPU를 활용한 LLM 학습 및 Trouble shooting 능력<br>• 분산 학습 프레임워크(Slurm, DDP, Horovod 등) 사용 경험<br>• 동료와의 원활한 협업 능력</p><h2>우대사항</h2><p>• Deep Learning/NLP 관련 논문 제출 또는 석박사 학위 소지자<br>• 주요 학술 대회(ACL, EMNLP, NeurIPS 등) 논문 발표 경험<br>• Docker 및 Kubernetes에 대한 경험: GPU 클러스터를 활용한 학습 파이프라인 설계 및 관리 경험<br>• GPU를 활용한 학습 및 서비스 개발 경험: GPU 기반의 Training 또는 Inference 시스템 구축 경험<br>• LLM의 Post-training 관련 경험: Supervised Fine-Tuning 및 Parameter Efficient Fine-Tuning 활용 경험</p><h2>혜택 및 복지</h2><p>[42dot Way]<br>Only hire competent and self-motivated team players with humble leadership.<br>서로를 성장시킬 수 있고 자체 무한동력을 가진 누구에게나 배울 수 있는 겸손한 리더십을 가진 팀 플레이어를 채용하라.<br><br>Influence with trust, not with authority.<br>직급과 권한이 아닌 신뢰와 건강한 영향력을 토대로 업무하고 서로를 성장시켜라. 직책을 가졌다고 리더가 되는 것은 아니다. 여기는 직책에 관계없이 미션과 비전에 맞는 영향력을 행사할 수 있는 곳이다.<br><br>Deliver with agility rather than perfecting.<br>완벽보다 빠른 완성이다. 세상의 거대한 문제를 풀려고 하지 말아야 한다. 작게 시작해서 빠르게 지속적인 결과물을 내자. 그러면 생각보다 빠르게 큰 문제를 풀 수 있다. 그러기 위해서는 지독하게 스마트하게 일해야 한다. 여기는 연구하는 곳도 아니고 성실하게 열심히만 해서 되는 곳도 아니다. 가장 잘 되는 방법을 찾고 가장 빠르게 실행해야 한다. 대신 대충하지 마라. 결코 현재의 결과물에 만족하지 말아라.<br><br>Do the right thing.<br>회사의 미션(회사의 존재 이유)과 비전(목표)에 집중하고 시장에서의 성공적인 결과물에 집중해야 한다. 여기는 회사와 개인이 같은 이유와 목표를 가지고 성장하는 곳이다. 개인/조직끼리 협의나 타협보다 회사가 올바른 방향으로 나가기 위해 조직의 희생까지 감수할 수 있는 과감한 결정을 지속적으로 내려야 한다.<br><br>Disagree now, but align.<br>결정되기 전 자신의 의견을 충분히 내고 결정 후에는 공동의 목표에 align 하라.<br><br>Collaborate & communicate transparently beyond team boundaries.<br>투명하게 정보와 지식을 공유하고 팀이 없는 것처럼 협업하라. 협업의 시작은 투명한 정보 공유이다.<br><br>Be prepared to be totally transparent. A penny you spend, or even when you arrive or leave will be open to everyone.<br>사내의 많은 것들이 투명하게 공유된다. 투명함은 몰입에 방해되는 많은 요소들을 없애기 때문이다.<br><br>Be aware that all the benefits & perks are provided for faster execution & delivery.<br>회사의 모든 혜택들은 즐기라고 있는 것이 아니고 업무의 몰입을 극대화해서 빠르게 좋은 결과물을 내기 위해서이다.<br><br>Never stop learning! Never stop changing! Never stop dreaming!</p>






