국내·미국 시장과 기업을 아우르는 대규모 금융 데이터를 수집·정제·표준화하여, Finorma·Index·DeepSearchAI가 공통으로 신뢰하는 회사의 데이터 기반(Database)을 만들고 운영할 Data Engineer를 찾습니다.
회사소개
딥서치는 기업 및 금융 정보 서비스 "Finorma", 금융 AI 애널리스트 "DeepSearchAI", M&A 플랫폼 "LISTING"을 서비스하고 있습니다. 한국투자파트너스, 스톤브릿지, 신한벤처투자 등 국내 굴지의 투자사에서 130억을 투자받았고, 한국거래소·삼성증권·신한은행·국민연금 등 국내 최정상의 금융회사에서 기술력을 인정받아 솔루션을 제공하고 있습니다. 딥서치는 ETF 기초지수사업자로서 국내 Top 10 ETF 지수(코덱스 2차전지)를 공급하고 있으며, 정형·비정형 데이터를 처리하는 업계 최고 수준의 기술력을 보유하고 있습니다.
직무소개
Data Engineer는 Finorma·DeepSearchAI를 만드는 팀에 소속되어, Finorma·Index 사업·DeepSearchAI가 공통으로 사용하는 회사 자체 Database의 핵심 파이프라인을 설계·구현·운영합니다. 국내·미국 시장·기업 데이터를 폭넓게 수집해 메달리온구조로 정제·검증하고, 출처·시점·엔티티·인용이 보장되는 신뢰도 높은 데이터로 가공합니다. 나아가 이 데이터를 LLM/Agent가 바로 쓸 수 있는 검색 가능한(retrieval-ready) 형태로 확장하여, 금융 전문가의 의사결정을 돕는 제품의 데이터 토대를 책임집니다.
주요업무
- 국내/미국 시장·경제·기업 데이터(정형·비정형) 수집·정제·표준화·가공
- 대규모 수집 파이프라인 구축·운영과 스케줄링·재처리·백필 설계
- 메달리온데이터 모델 운영
- 데이터 품질 관리 — freshness/lineage/SLA, 검증·이상 탐지, 스키마·마이그레이션 변경의 리뷰 가능한 기록화
- 엔티티 해소·표준화 — company/deal/document 등 entity ID, 도메인 taxonomy, 금융 온톨로지 기반 정규화
- Agent-ready 데이터 확장 — metadata-rich 검색, 인용 가능한 fetch, vector/검색 인덱스 등 검색 레이어 설계·운영
- 데이터 접근의 권한·감사
자격요건
- 대규모 데이터 파이프라인(배치/스트리밍)의 설계·구축·운영 경험이 풍부한 분
- SQL과 RDBMS(MySQL/PostgreSQL 등)에 능숙하고, 데이터 모델링·스키마 설계 경험이 있는 분
- 데이터 품질·정합성·신뢰성을 책임지고 운영해 본 경험이 있는 분 (언어·프레임워크 무관)
- 새로운 기술·방법을 빠르게 학습하고, 효율적이고 논리적으로 커뮤니케이션하는 분
- 빠른 성장을 추구하는 분
우대사항
- 안정적이고 확장 가능한 데이터 수집·파이프라인 설계 및 대규모 운영 경험
- 워크플로 오케스트레이션(Airflow, Dagster 등), dbt, 데이터 레이크하우스/메달리온 아키텍처 경험
- 정형·비정형 혼합 데이터(문서·공시·뉴스 등) 처리 및 엔티티 해소·표준화 경험
- Vector DB, OpenSearch 등 검색/리트리벌 인프라 설계·운영 경험
- 데이터 관측성·계보(lineage)·품질 모니터링 체계 구축 경험
- AWS/EKS, LGTM Stack + OpenTelemetry 기반 운영 환경 경험
- 스타트업 환경에서 데이터 플랫폼을 스케일업한 경험
- 금융(주식·투자·경제 등) 도메인에 대한 높은 이해도
- LLM/RAG에 데이터를 공급한 경험, AI 도구·툴 사용에 능숙하신 분
혜택 및 복지
- 업계 최고 수준의 연봉
- 최고급 하드웨어 및 소프트웨어 제공 ( 1인당 350만원 상당 )
- 도서, 워크샵, 세미나 등 업무 교육비 100% 지원
- 업무 생산성 향상을 위한 AI 도구 지원
- 100만원 상당의 건강 검진 지원 ( 연 1회 )