<h2>직무</h2><p>[ETL/AI] Data Engineer</p><h2>포지션 상세</h2><p>디써클의 데이터 엔지니어는 매우 똑똑해야 합니다.<br>디써클은 다양한 소스에서 수집 가능한 데이터를 토대로 R&D 시장의 '의사 결정'을 지원하는 플랫폼을 구축중입니다.<br>이를 달성하기 위해선 데이터 엔지니어링 경험은 물론, 여러 소스의 비정형적인 데이터를 정형화하기 위한 효율적인 알고리즘의 설계와 적재적소에 AI를 활용하는 능력, 그리고 견고한 파이프라인의 구축이 필수적입니다.<br>R&D라는 거대한 시장의 온톨로지를 구축하는 핵심 인재가 될, 훌륭한 데이터 엔지니어를 모집합니다.<br>----------<br>디써클은 세상에 필요한 기술의 출현과 상용화를 가속화하고자 합니다.<br>이를 통해 5년 내 글로벌 1위 R&D Service Provider로 도약하는 것을 꿈꾸고 있는 스타트업입니다.<br><br>디써클은 기업과 연구실 R&D 시장에 존재하는 다양한 문제 해결을 통해 매우 빠른 속도로 비즈니스를 성장시키고 있습니다. 저희 팀은 AI 및 빅데이터 기술을 활용하여 기업과 연구실을 연결하는 R&D 파트너 매칭 서비스를 제공하고 있으며, 궁극적으로는 AI와 온톨로지 기술을 활용한 ‘R&D Intelligence’를 통해 연구개발 관련 의사결정을 지원하는 것을 목표로 하고 있습니다.<br><br><팀소개><br>• 창업 7개월 만에 국내 TOP 투자사 블루포인트파트너스, 더벤처스, 앤틀러코리아로부터 누적 6.5억원 투자 유치; <br>• 시드팁스 5천만원 / 팁스 7억원 지원금 확보<br>• 네이버, Kearney, 제일기획, 카카오, 넥슨 등 각 분야 전문가로 이루어진 매우 강력한 팀<br> - Co-CEO / COO: 前 Kearney 전략 컨설턴트<br> - Co-CEO / CPO: 前 제일기획 글로벌 프로젝트 기획<br> - CTO: 前 네이버 보안 & 풀스택 엔지니어<br> - Tech Lead: 前 카닥, 휴맥스, 체카 백엔드 개발자<br> - Software Engineer: 前 카카오 개발자<br> - Software Engineer: 前 스마일드래곤 개발자<br> - Growth & Data Analyst: 前 두잇 스토어팀 PO<br> - Project Owner: 前 컨텐츠 제작 컨설팅 및 솔루션 대표<br> - Designer: 前 넥슨 코리아 디자이너<br> - Designer: 前 PINGPONG 디자이너<br> - Intern 2명<br><br><디써클 개발팀이 원하는 분><br>• 높은 자유도, 큰 책임, 동등한 관계를 추구하시는 분<br>• 개발도 잘 하는데 문서화에도 강하신 분<br> - 코드 컨벤션 강박증, commit 메시지 컨벤션 지키미, 최소 단위의 PR 및 자세한 개발 로그 등<br> - 이미 문서화 된 로그를 읽고 수정하시며 개발팀 업무를 follow-up 하시게 됩니다.<br>• 새로운 기술 습득과 개발을 덕질로 여기시는 분<br>• 지나간 코드도 꾸준히 리팩토링 하시는 분<br>• 개발 뿐만 아니라 사업에 대한 고민까지 욕심내시는 분<br>• ‘그럴 수 있지’ + ‘솔직한게 최고야’ 마인드를 가지신 분</p><h2>주요업무</h2><p>• 다양한 웹과 API를 대상으로 스크래이핑 시스템을 설계, 개발, 운영합니다.<br>• ETL 파이프라인을 구축하고 비즈니스 요구 사항에 맞게 데이터 표준화 전략을 수립하며, 데이터를 통합합니다.<br>• 정제된 데이터를 서비스에서 활용할 수 있는 간단한 형태로 구축합니다. (Elasticsearch, Vector DB 등)<br>• LLM을 적극 활용하여 각 단계별 정제 전략을 수립합니다.<br>• (Optional) 비즈니스 요구사항에 맞는 AI Agent를 설계, 개발하고 FastAPI로 서빙합니다.</p><h2>자격요건</h2><p>• 데이터 어플리케이션 개발을 위한 개발 역량을 갖추신 분 (Python)<br>• 내부가 아닌 외부 데이터를 대상으로 한 데이터 파이프라인 구축 경험<br>• BigQuery, RedShift 등을 활용한 클라우드 기반의 인프라 엔지니어링 및 데이터 파이프라인 개발 경험<br>• 다양한 웹 소스들을 스크래이핑하며 발생할 수 있는 허들에 대한 트러블슈팅 경험<br>• 데이터 엔지니어링 원칙과 방법론, 프레임워크, 트렌드에 대한 이해</p><h2>우대사항</h2><p>• Python을 본인의 손과 발처럼 다루시는 분<br>• Elasticsearch, Vector DB, Redash 등 타 팀에서 활용 가능한 형태로 데이터를 서빙해 본 경험<br>• 다양한 Orchestration tool(Airflow, Dagster)을 이용한 체계적 ETL 데이터 레이크 운용 및 엔지니어링 경험<br>• AI Agent, Langchain, RAG, Vector DB 어플리케이션 개발 경험<br>• Data Analyst와 비즈니스 팀과의 원활한 소통이 가능한 분</p><h2>혜택 및 복지</h2><p>• M4 맥북, 4K DELL 모니터, 액세서리, 사무 기기와 업무 환경 제공<br>• 마포 프론트원 근무 (https://front1.kr/facilities)<br> - 공덕역 4번 출구에서 8초 소요<br> - 편의시설 다수 보유(탁구장, 넓은 주차장, 카페, 수면실, 키즈존, 저렴한 구내식당, 주변 맛집 등)<br> - 6개월 내 강남으로 오피스 이전 예정<br>• 자기계발 지원 (도서, 영어 교육, 헬스장 등)</p>







