바이브컴퍼니가 `2022년 인공지능 학습용 데이터 구축 지원 사업`의 일환인 `숫자연산 기계독해 데이터` 구축 과제를 성공적으로 마무리했다고 26일 밝혔다.
이는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 사업으로, 바이브는 `숫자연산 기계독해 데이터` 구축 과제의 주관기관으로 딥네츄럴, 포티투마루와 함께 컨소시엄을 구성해 사업을 수행했다.
숫자연산 기계독해 데이터란 사칙연산 등 숫자연산이 필요한 분야의 문서에 기계독해를 적용해 수치연산 질의를 통해 답을 찾아내는 인공지능 모델을 구축하기 위한 학습용 데이터를 뜻한다.
바이브 컨소시엄은 2022년 6월부터 12월까지 7개월간 경제, 스포츠 분야 신문 기사 데이터에서 뽑은 30만 개 지문에 대한 39만 건의 질의응답 라벨링과 숫자연산 기계독해 AI 모델 구축을 진행했다.
이번에 구축된 데이터와 AI 모델은 다음해 상반기 중 NIA에서 운영하는 `AI 허브`를 통해 공개될 예정이다.
이기황 바이브 인공지능빅데이터연구소 이사는 "이번 과제 수행을 통해 세계적으로 아직 초기 단계에 있는 숫자연산 기계독해 기술의 개발과 발전에 큰 기여를 하게 될 것으로 기대하고 있다"고 전했다.
관련뉴스