ETRI(한국전자통신연구원)는 2011년부터 구축해온 '스마트 모바일용 다국어 언어음성 데이터베이스(DB)' 가운데 스페인어 데이터베이스 20만 문장을 공개한다고 3일 밝혔다.
데이터베이스는 스페인어 대화체 음성 DB와 한국어-스페인어 대화체 대역문장DB로 돼 있으며, 여행이나 일상생활에서 쓰이는 대화체(구어체) 문장으로 구성됐다.
스페인어 구어체를 배포하는 것은 이번이 처음으로, 다국어 음성인식 및 자동번역 기술, 영어교육 개발 등에 활용될 것으로 기대된다.
이번에 공개한 데이터베이스는 700명분으로, 국내 교육기관이나 기업체 등은 수십만∼수백만원의 저렴한 가격에 이용할 수 있다.
기존 해외 언어음성 DB의 경우 300∼500명이 발화한 음성 DB가 1억∼2억원 정도소요된다.
ETRI는 2007년부터 한·영·일·중 등 다국어 언어음성 DB를 구축해 배포해 왔으며, 올해는 프랑스어를 추가로 구축할 예정이다.
특히 이번에 스페인어 DB를 배포하면서 기존 중국어 대화체 음성DB와 일본어 대화체 음성DB에 각각 400명분과 300명분의 음성 DB를 추가로 보강했다.
jyoung@yna.co.kr(끝)<저 작 권 자(c)연 합 뉴 스. 무 단 전 재-재 배 포 금 지.>
데이터베이스는 스페인어 대화체 음성 DB와 한국어-스페인어 대화체 대역문장DB로 돼 있으며, 여행이나 일상생활에서 쓰이는 대화체(구어체) 문장으로 구성됐다.
스페인어 구어체를 배포하는 것은 이번이 처음으로, 다국어 음성인식 및 자동번역 기술, 영어교육 개발 등에 활용될 것으로 기대된다.
이번에 공개한 데이터베이스는 700명분으로, 국내 교육기관이나 기업체 등은 수십만∼수백만원의 저렴한 가격에 이용할 수 있다.
기존 해외 언어음성 DB의 경우 300∼500명이 발화한 음성 DB가 1억∼2억원 정도소요된다.
ETRI는 2007년부터 한·영·일·중 등 다국어 언어음성 DB를 구축해 배포해 왔으며, 올해는 프랑스어를 추가로 구축할 예정이다.
특히 이번에 스페인어 DB를 배포하면서 기존 중국어 대화체 음성DB와 일본어 대화체 음성DB에 각각 400명분과 300명분의 음성 DB를 추가로 보강했다.
jyoung@yna.co.kr(끝)<저 작 권 자(c)연 합 뉴 스. 무 단 전 재-재 배 포 금 지.>

