
한글과컴퓨터(한컴)가 글로벌 오픈소스 전문 기업 듀얼랩과 협력해 PDF 데이터 추출 기술 기반으로 글로벌 오픈소스 시장 공략에 나선다.
한컴은 듀얼랩과 '오픈 PDF 데이터 로더' 공동 개발 및 사업 협력을 위한 양해각서(MOU)를 체결했다고 9일 밝혔다.
이번 프로젝트는 AI 기반 문서 처리 기술을 오픈소스로 개방해 개발자 생태계와 연계를 강화하고 기술 고도화와 시장 확장을 동시에 꾀하는 전략의 일환이다.
두 회사가 개발하는 오픈 PDF 데이터 로더는 PDF 문서 내 텍스트, 표, 이미지 등을 정밀하게 추출하는 소프트웨어 개발 도구(SDK)다. AI 모델과 쉽게 연동할 수 있는 구조가 특징이다.
한컴은 해당 기술을 통해 다양한 AI 서비스 개발자 및 기업 사용자들과의 협업을 확대할 예정이다.
듀얼랩은 PDF 기술 표준 단체인 PDF 협회 회원으로, 오픈소스 기반 PDF 유효성 검사 도구인 '베라PF(veraPDF)' 개발을 주도한 기업이다.
한컴은 듀얼랩 오픈소스 개발 경험과 글로벌 네트워크를 활용해 이번 프로젝트 기술 완성도를 높이고 오픈소스 생태계에서 영향력을 확대할 계획이다.
한컴은 이번 프로젝트를 포함해 자체 AI 기반 문서 데이터 추출 솔루션인 '한컴 데이터 로더'도 운영 중이다. 해당 솔루션은 다양한 문서 포맷에서 텍스트와 표, 이미지 등을 추출해 검색증강생성(RAG) 기반 AI 학습을 지원한다.
또한, 한컴은 오픈소스를 기반으로 핵심 기술은 공개하고 고급 기능은 상용 애드온(Add-on) 형태로 제공하는 '오픈 코어' 전략도 병행할 방침이다.
문서 내 표, 수식, 차트 등 인식 정확도를 높이는 고도화 기능은 수익 모델로 연계하고 글로벌 개발자 커뮤니티와 교류를 통해 시장 반응을 확대할 계획이다.
김연수 한컴 대표는 "이번 듀얼랩과 협력은 한컴이 축적해 온 문서 기술력과 최신 AI, 오픈소스 트렌드를 결합해 글로벌 시장에 본격 진출하는 중요한 전환점"이라며 "한컴이 글로벌 AI 서비스 기업으로 도약하는 기반을 마련하겠다"고 말했다.
관련뉴스






