<h2>직무</h2><p>데이터 엔지니어(5년 이상)</p><h2>포지션 상세</h2><p>이노케어플러스는 디지털 헬스케어 플랫폼 스타트업입니다.<br>국내 대표 의사 커뮤니티 플랫폼 "닥플"과 1,800여개 1차 의원들이 사용중인 청구사전심사 솔루션 "닥플 체크"를 운영하고 있습니다.<br>수십억 건의 의료 정보 데이터에서 발견한 인사이트를 기반으로 다양한 비즈니스 영역에서 새로운 도전을 계속해 나가고 있습니다.<br><br>닥플(docple.com)<br>국내 대표 의료 전문 플랫폼으로 최신 의료 정보, 병원 경영 등 영역에서 다양한 진료 과목 의사들을 연결하고 차별화 된 가치를 창출합니다. <br>향후 인공지능, 빅데이터 분석, loT, Cloud, VR/AR 등 다양한 첨단 융복합 기술을 접목하여 차세대 디지털 헬스케어 플랫폼으로 발전하고자 합니다.<br><br>닥플 체크(check.docple.com)<br>업계 최고의 사전심사청구 솔루션을 제공하여 병원 경영 효율화 및 적정 진료를 지원합니다. <br>의료, 헬스케어 관련 다양한 데이터를 융복합하여 데이터 분석 기반의 인사이트를 제공합니다.</p><h2>주요업무</h2><p>ㆍ AWS Glue를 활용한 대용량 ETL/ELT 파이프라인 설계 및 개발<br>ㆍ AWS Data Catalog 기반 메타데이터 관리 및 데이터 거버넌스 구축<br>ㆍ Amazon Athena를 통한 서버리스 쿼리 환경 구축 및 최적화<br>ㆍ S3 기반 데이터 레이크 아키텍처 설계 및 데이터 파티셔닝 전략 수립<br>ㆍ Python을 활용한 데이터 처리 로직 구현 및 성능 최적화<br>ㆍ 규모 추정 알고리즘 설계 및 구현<br>ㆍ 데이터 검증 및 이상치 탐지 알고리즘 개발<br>ㆍ BI 도구와의 연동을 위한 데이터 마트 구축 및 API 개발<br>ㆍ실시간 스트리밍 데이터 파이프라인 구축 및 운영<br>ㆍ데이터 품질 모니터링 시스템 구축 및 이상 탐지 알고리즘 구현<br>ㆍ데이터 파이프라인 성능 튜닝 및 비용 최적화<br><br>[개발 문화]<br>ㆍ데이터 중심의 의사결정 문화<br>ㆍ지속적인 기술 공유 및 학습 지원<br>ㆍ자율적이고 책임감 있는 업무 환경</p><h2>자격요건</h2><p>ㆍ데이터 엔지니어링 관련 5년 이상의 실무 경험<br>ㆍPython 활용 능력 (pandas, numpy, boto3, pyspark 등)<br>ㆍAWS 데이터 서비스 (Glue, S3, Athena, Data Catalog) 운영 경험 3년 이상<br>ㆍSQL 고급 활용 및 복잡한 쿼리 최적화 능력<br>ㆍETL/ELT 프로세스 설계 및 대용량 데이터 처리 경험<br>ㆍ데이터 웨어하우스 및 데이터 레이크 아키텍처 설계 경험<br>ㆍ통계적 분석 및 알고리즘 구현 경험 (규모 추정, 이상치 탐지 등)<br>ㆍ모델링 및 비즈니스 로직 구현 능력<br>ㆍ리눅스 환경에서의 개발 및 운영 경험<br>ㆍGit을 활용한 협업 및 코드 관리 경험<br><br>[기술 스택]<br>ㆍ언어: Python, SQL, Scala(우대), R(통계분석용 우대)<br>ㆍAWS 서비스: Glue, S3, Athena, Data Catalog, Redshift, Kinesis, Lambda, Step Functions<br>ㆍ빅데이터 처리: Apache Spark, PySpark, Pandas<br>ㆍ스트리밍: Apache Kafka, Amazon Kinesis<br>ㆍ워크플로우: Apache Airflow, AWS Step Functions<br>ㆍ데이터베이스: Amazon Redshift, RDS(PostgreSQL, MySQL), DynamoDB<br>ㆍBI 도구: Tableau, Power BI, QuickSight, Looker<br>ㆍ알고리즘/분석: scikit-learn, numpy, scipy, statsmodels<br>ㆍ인프라: Docker, Kubernetes, Terraform<br>ㆍ모니터링: CloudWatch, Grafana, DataDog<br>ㆍ버전 관리: Git, GitHub/GitLab<br>ㆍ테이블 포맷: Delta Lake, Apache Iceberg(우대)<br>ㆍ데이터 변환: dbt(data build tool)<br><br>[필요 역량]<br>ㆍ대용량 데이터 처리 및 성능 최적화에 대한 깊은 이해<br>ㆍ복잡한 비즈니스 요구사항을 데이터 파이프라인으로 구현하는 능력<br>ㆍ데이터 품질과 신뢰성에 대한 높은 기준과 책임감<br>ㆍ클라우드 네이티브 아키텍처 설계 및 구현 능력<br>ㆍ팀 리딩 및 주니어 개발자 멘토링 능력<br>ㆍ새로운 기술 트렌드 파악 및 빠른 학습 능력<br>ㆍ다양한 이해 관계자와의 원활한 커뮤니케이션 능력</p><h2>우대사항</h2><p>ㆍAWS 자격증 (Data Engineer Associate/Professional, Solutions Architect 등)<br>ㆍApache Spark/PySpark를 활용한 대용량 데이터 처리 경험<br>ㆍApache Kafka, Amazon Kinesis 등 스트리밍 데이터 처리 경험<br>ㆍTerraform, CloudFormation 등 IaC 도구 활용 경험<br>ㆍApache Airflow, AWS Step Functions 등 워크플로우 도구 운영 경험<br>ㆍRedshift, RDS, DynamoDB 등 AWS 데이터베이스 서비스 경험<br>ㆍDocker, Kubernetes 컨테이너 기술 활용 경험<br>ㆍdbt(data build tool)를 활용한 데이터 변환 경험<br>ㆍScala, Java 등 추가 프로그래밍 언어 능력<br>ㆍDelta Lake, Apache Iceberg 등 테이블 포맷 기술 경험<br>ㆍ 데이터 거버넌스 및 데이터 보안 구현 경험<br>ㆍ 머신러닝/딥러닝을 활용한 예측 모델링 경험</p><h2>혜택 및 복지</h2><p>ㆍ건강검진 지원<br>ㆍ직무 역량 강화 교육 프로그램 지원<br>ㆍ명절 선물<br>ㆍ유연출퇴근 시간제<br>ㆍ1시간 단위부터 사용 가능한 연차 휴가 제도<br>ㆍ영어이름 호칭 수평적 문화<br>ㆍ사내 간식 제공</p>






