코스피
5,507.99
(75.26
1.35%)
코스닥
1,152.46
(4.06
0.35%)
버튼
가상화폐 시세 관련기사 보기
정보제공 : 빗썸 닫기

한컴, 오픈소스 PDF 데이터 추출 부문 벤치마크 1위

입력 2026-03-12 10:55  

한컴, 오픈소스 PDF 데이터 추출 부문 벤치마크 1위



(서울=연합뉴스) 오지은 기자 = 한글과컴퓨터[030520]가 오픈소스 PDF 데이터 추출 부문에서 벤치마크 1위 성능을 달성한 '오픈데이터로더 PDF v2.0'을 12일 공개했다.
이번 버전의 특징은 AI 방식과 직접 추출 방식을 결합한 하이브리드 엔진이다.
기업과 개발자는 외부 서버로 데이터 유출 우려 없이 차단된 로컬 환경에서 고성능 PDF 데이터 추출 기능을 무료로 활용할 수 있다.
이번 버전에는 문서 내 복잡한 요소를 추출하는 무료 AI 애드온 4종이 탑재됐다.
광학문자인식(OCR)은 이미지 기반 PDF와 스캔 문서의 텍스트 인식률을 높였고 표 추출은 AI 모델로 병합된 셀 등 복잡한 표 구조를 정밀하게 분석한다.
수식 추출은 과학이나 수학 논문의 복잡한 수식을 로컬 환경에서 인식하며 차트 분석은 차트가 의미하는 맥락을 문장 형태로 설명한다.
정지환 한컴 최고기술책임자(CTO)는 "오픈데이터로더 PDF v2.0은 AI 하이브리드 엔진과 아파치 2.0 라이선스 전환으로 누구나 자유롭게 활용하고 확장할 수 있는 개방형 PDF 데이터 플랫폼으로 진화했다"라고 말했다.
built@yna.co.kr
(끝)


<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>

관련뉴스

    top
    • 마이핀
    • 와우캐시
    • 고객센터
    • 페이스 북
    • 유튜브
    • 카카오페이지

    마이핀

    와우캐시

    와우넷에서 실제 현금과
    동일하게 사용되는 사이버머니
    캐시충전
    서비스 상품
    월정액 서비스
    GOLD 한국경제 TV 실시간 방송
    GOLD PLUS 골드서비스 + VOD 주식강좌
    파트너 방송 파트너방송 + 녹화방송 + 회원전용게시판
    +SMS증권정보 + 골드플러스 서비스

    고객센터

    강연회·행사 더보기

    7일간 등록된 일정이 없습니다.

    이벤트

    7일간 등록된 일정이 없습니다.

    공지사항 더보기

    open
    핀(구독)!