<div style="font-family: sans-serif; line-height: 1.6; padding: 20px;"><div style="margin-bottom: 40px;"><h2 style="font-size: 22px; margin-bottom: 16px; font-weight: bold; color: #333;">주요업무</h2><div style="color: #333;"><p><span style="color: rgb(23, 23, 25);">• OCR + Layout Analysis 통합 모델링 : Key‑Value Extraction, Document Layout Analysis, Table Recognition 등 지표‑기반 성능 개선</span></p><p><span style="color: rgb(23, 23, 25);">• SOTA LVLM·특화 Visual Encoder 평가 및 경량화: 모델 선택 기준 수립, 파라미터 효율화·quantization/LoRA 적용</span></p><p><span style="color: rgb(23, 23, 25);">• RAG에 최적화된 데이터 출력 형식 연구(metadata, xml, markdown등 비교 분석)</span></p><p><span style="color: rgb(23, 23, 25);">• Latency·Throughput 모니터링 후 하드웨어 가속(ONNX, TensorRT, vLLM 등) 적용</span></p><p><span style="color: rgb(23, 23, 25);">• AI·BE·DevOps 팀과 협업하여 기술 리스크 공유 및 해결책 도출</span></p></div></div><div style="margin-bottom: 40px;"><h2 style="font-size: 22px; margin-bottom: 16px; font-weight: bold; color: #333;">자격요건</h2><div style="color: #333;"><p><span style="color: rgb(23, 23, 25);">• PyTorch등 딥러닝 프레임워크 기반 모델 개발 경험 1 년 이상</span></p><p><span style="color: rgb(23, 23, 25);">• Document AI(LayoutLM, Donut 등) 학습·추론 경험 (개인/사내 프로젝트 모두 인정)</span></p><p><span style="color: rgb(23, 23, 25);">• OCR 엔진(Tesseract, EasyOCR, PaddleOCR 등) 사용 경험 및 후처리 파이프라인 구현 사례</span></p><p><span style="color: rgb(23, 23, 25);">• 벡터 DB / Retrieval‑Reader 구조 이해 또는 RAG PoC 경험</span></p><p><span style="color: rgb(23, 23, 25);">• Docker 사용 및 Git 기반 협업 경험</span></p></div></div><div style="margin-bottom: 40px;"><h2 style="font-size: 22px; margin-bottom: 16px; font-weight: bold; color: #333;">우대사항</h2><div style="color: #333;"><p><span style="color: rgb(23, 23, 25);">• 문서 이해 분야에서 PoC 수준 이상의 개발경험</span></p><p><span style="color: rgb(23, 23, 25);">• 문서 레이아웃 데이터셋 활용 실험 경험</span></p><p><span style="color: rgb(23, 23, 25);">• 국내·국제 학회·컨퍼런스 포스터/논문 발표 또는 오픈소스 기여 경험</span></p><p><span style="color: rgb(23, 23, 25);">• Python 테스트·코드 리뷰·문서화 문화에 익숙하신 분</span></p><p><span style="color: rgb(23, 23, 25);">• 기술 문서 작성·이슈 트래킹이 가능한 분</span></p></div></div><div style="margin-bottom: 40px;"><h2 style="font-size: 22px; margin-bottom: 16px; font-weight: bold; color: #333;">채용절차</h2><div style="color: #333;"><p>서류전형-1차 면접(직무 적합성)-2차 면접(조직 적합성)-처우협의&입사일 조정</p></div></div></div>
주요업무
• OCR + Layout Analysis 통합 모델링 : Key‑Value Extraction, Document Layout Analysis, Table Recognition 등 지표‑기반 성능 개선
• SOTA LVLM·특화 Visual Encoder 평가 및 경량화: 모델 선택 기준 수립, 파라미터 효율화·quantization/LoRA 적용
• RAG에 최적화된 데이터 출력 형식 연구(metadata, xml, markdown등 비교 분석)
• Latency·Throughput 모니터링 후 하드웨어 가속(ONNX, TensorRT, vLLM 등) 적용
• AI·BE·DevOps 팀과 협업하여 기술 리스크 공유 및 해결책 도출
자격요건
• PyTorch등 딥러닝 프레임워크 기반 모델 개발 경험 1 년 이상
• Document AI(LayoutLM, Donut 등) 학습·추론 경험 (개인/사내 프로젝트 모두 인정)
• OCR 엔진(Tesseract, EasyOCR, PaddleOCR 등) 사용 경험 및 후처리 파이프라인 구현 사례
• 벡터 DB / Retrieval‑Reader 구조 이해 또는 RAG PoC 경험
• Docker 사용 및 Git 기반 협업 경험
우대사항
• 문서 이해 분야에서 PoC 수준 이상의 개발경험
• 문서 레이아웃 데이터셋 활용 실험 경험
• 국내·국제 학회·컨퍼런스 포스터/논문 발표 또는 오픈소스 기여 경험
• Python 테스트·코드 리뷰·문서화 문화에 익숙하신 분
• 기술 문서 작성·이슈 트래킹이 가능한 분
채용절차
서류전형-1차 면접(직무 적합성)-2차 면접(조직 적합성)-처우협의&입사일 조정








