<div style="font-family: sans-serif; line-height: 1.6; padding: 20px;"><div style="margin-bottom: 40px;"><h2 style="font-size: 22px; margin-bottom: 16px; font-weight: bold; color: #333;">주요업무</h2><div style="color: #333;"><ul><li>문서에서 key-value extraction, table recognition, layout analysis 등을 위한 모델을 설계하여 정량적 지표를 기반으로 모델 정확도를 개선</li><li>최신 SOTA LVLM(Large Vision-Language Models)을 모델링하고, 배포 환경에 적합한 구조로 세팅하여 최적화된 추론 파이프라인 구축 및 성능 튜닝</li><li>학습 없이도 다양한 문서 포맷에 robust하게 대응하기 위한 알고리즘·모델 구조를 고안하고, 성능 검증(PoC) 후 확장</li><li>에러 로깅 및 모니터링 지표를 통해 성능 저하 요인을 파악·분석하고, 최적화(하드웨어 가속, 파라미터 튜닝 등)를 주도</li><li>프로젝트 전개 과정에서 예상 리스크를 사전에 파악하고, 타 부서(AI, FE, BE 등)와 협업해 문제 해결 방안을 제안</li></ul></div></div><div style="margin-bottom: 40px;"><h2 style="font-size: 22px; margin-bottom: 16px; font-weight: bold; color: #333;">자격요건</h2><div style="color: #333;"><ul><li>문서(PDF, 이미지 등)에서 다양한 형태의 정보(Key-info, 표 인식 등)를 정확히 추출하기 위한 AI 파이프라인을 설계·개발해본 분</li><li>OCR, Pre-processing, Prompting, LLM 등 최신 기술 스택을 빠르게 이해하고, 새로운 아이디어를 실험·적용하는 것을 즐기시는 분</li><li>복잡한 오류나 성능 이슈가 발생했을 때, 정량적 분석과 디버깅 노하우를 통해 신속하고 정확하게 문제를 해결할 수 있는 분</li><li>딥러닝 프레임워크(PyTorch 등) 및 분산 학습·고성능 컴퓨팅 환경에서 5년 이상 연구·개발 경험</li><li>문서 내 구조적 데이터(table, form 등)에 대한 분석 및 모델링 경험</li><li>LayoutLM, .Donut 등 document understanding 모델 개발 경험</li><li>FUNSD, SROIE, RVL-CDIP 등의 데이터셋을 활용해본 경험</li><li>컴퓨터 비전 또는 자연어처리 기반 정보 추출 관련 프로젝트 경험</li></ul></div></div><div style="margin-bottom: 40px;"><h2 style="font-size: 22px; margin-bottom: 16px; font-weight: bold; color: #333;">우대사항</h2><div style="color: #333;"><ul><li>글로벌 학회(NeurIPS, CVPR 등)에 논문 게재(특히 1저자) 또는 특허 등 의미 있는 연구 성과를 보유하신 분</li><li>오픈소스 프로젝트에서 주요 기여자(major contributor)로 활동한 사례</li><li>실험 설계(통계 분석 등)부터 실무 적용까지 균형 있게 수행한 경험</li><li>Git, Notion, Jira, DVC 등 협업 툴 활용 및 문서화·프로세스 관리에 능숙한 분</li></ul></div></div><div style="margin-bottom: 40px;"><h2 style="font-size: 22px; margin-bottom: 16px; font-weight: bold; color: #333;">채용절차</h2><div style="color: #333;"><p>서류전형-1차 면접(직무 적합성)-2차 면접(조직 적합성)-처우협의&입사일 조정</p></div></div></div>
주요업무
- 문서에서 key-value extraction, table recognition, layout analysis 등을 위한 모델을 설계하여 정량적 지표를 기반으로 모델 정확도를 개선
- 최신 SOTA LVLM(Large Vision-Language Models)을 모델링하고, 배포 환경에 적합한 구조로 세팅하여 최적화된 추론 파이프라인 구축 및 성능 튜닝
- 학습 없이도 다양한 문서 포맷에 robust하게 대응하기 위한 알고리즘·모델 구조를 고안하고, 성능 검증(PoC) 후 확장
- 에러 로깅 및 모니터링 지표를 통해 성능 저하 요인을 파악·분석하고, 최적화(하드웨어 가속, 파라미터 튜닝 등)를 주도
- 프로젝트 전개 과정에서 예상 리스크를 사전에 파악하고, 타 부서(AI, FE, BE 등)와 협업해 문제 해결 방안을 제안
자격요건
- 문서(PDF, 이미지 등)에서 다양한 형태의 정보(Key-info, 표 인식 등)를 정확히 추출하기 위한 AI 파이프라인을 설계·개발해본 분
- OCR, Pre-processing, Prompting, LLM 등 최신 기술 스택을 빠르게 이해하고, 새로운 아이디어를 실험·적용하는 것을 즐기시는 분
- 복잡한 오류나 성능 이슈가 발생했을 때, 정량적 분석과 디버깅 노하우를 통해 신속하고 정확하게 문제를 해결할 수 있는 분
- 딥러닝 프레임워크(PyTorch 등) 및 분산 학습·고성능 컴퓨팅 환경에서 5년 이상 연구·개발 경험
- 문서 내 구조적 데이터(table, form 등)에 대한 분석 및 모델링 경험
- LayoutLM, .Donut 등 document understanding 모델 개발 경험
- FUNSD, SROIE, RVL-CDIP 등의 데이터셋을 활용해본 경험
- 컴퓨터 비전 또는 자연어처리 기반 정보 추출 관련 프로젝트 경험
우대사항
- 글로벌 학회(NeurIPS, CVPR 등)에 논문 게재(특히 1저자) 또는 특허 등 의미 있는 연구 성과를 보유하신 분
- 오픈소스 프로젝트에서 주요 기여자(major contributor)로 활동한 사례
- 실험 설계(통계 분석 등)부터 실무 적용까지 균형 있게 수행한 경험
- Git, Notion, Jira, DVC 등 협업 툴 활용 및 문서화·프로세스 관리에 능숙한 분
채용절차
서류전형-1차 면접(직무 적합성)-2차 면접(조직 적합성)-처우협의&입사일 조정








