HOME

'귀'신같이 알아듣는 AI 스피커 나온다

입력 2021-02-15 17:57 수정 2021-02-16 00:50

'귀'신같이 알아듣는 AI 스피커 나온다

챗봇, 디지털 휴먼 등 인공지능(AI) 기기가 먼 거리의 소리를 정확하게 인식할 수 있도록 돕는 기술이 개발됐다. KAIST는 이건재 신소재공학과 교수 연구팀이 인간의 귀를 닮은 신개념 음성 센서를 개발했다고 15일 밝혔다. 연구팀은 스마트폰과 AI 스피커에 이 센서를 장착하는 데도 성공했다.

달팽이관 모사해 잡음 줄여

현재 상용화된 AI 스피커는 가까이서 발생하는 소리는 잘 듣지만 먼 거리의 소리에는 약하다. 귀의 구조에 비밀이 숨겨져 있다. 인간은 특정 주파수 영역에서 센서가 큰 폭으로 진동하는 공진 현상을 통해 먼 거리의 소리를 인식한다. 달팽이관에 있는 사다리꼴 막이 가청 주파수 대역에서 공진 현상을 통해 소리를 증폭하는 방식이다.

이 교수 연구팀은 이 같은 원리를 인공적으로 구현해 신호 대 잡음 비가 낮은 센서를 개발하는 데 성공했다. 매우 얇은 유연 압전 막을 사용해 인간의 달팽이관을 모사했다. 압전은 압력을 가했을 때 전기적인 신호가 생성되는 현상이다. 센서에서 음성이 막을 진동시키면 인간의 귀에서처럼 공진 현상이 일어나 민감도가 높은 전압 신호를 얻을 수 있게 된다.

연구팀은 2019년 최초로 공진형 유연 압전 센서를 개발했다. 첫 제품은 크기가 가로·세로 3㎝로 커 모바일용 제품에 적용하기 어렵다는 한계가 있었다. 연구팀은 이번 연구 과정에서 초박형 미세 박막 공정을 적용해 크기를 70%가량 줄이는 데 성공했다. 센서 구조에 따른 공진, 주파수, 압전 막의 역할 등을 이론적으로 밝혀내 디자인을 최적화했다. 음성을 암호화하는 보안 기술도 함께 선보였다.

이 교수는 “이번에 제품화한 센서는 민감도가 높으면서도 크기가 작아 미래 AI 기술을 구동하는 핵심 센서로 활용될 수 있을 것”이라고 말했다.

적은 데이터로도 화자 식별

개발된 센서는 화자 식별 오류율이 기존 상용 센서에 비해 최대 95% 낮다. 오류율이 낮으면 AI가 적은 데이터로도 화자를 정확하게 식별할 수 있다. 음성인식 기능이 적용된 스마트폰, AI 스피커 등 사물인터넷(IoT) 기기에 폭넓게 활용될 것으로 전망된다. 음성을 암호화하는 보안 기술은 사용자 맞춤형 서비스와 핀테크 분야 등에서 적용될 것으로 기대되고 있다.

이 교수는 2016년 KAIST 내에서 자신이 창업한 기업인 프로닉스를 통해 이 기술을 상용화할 예정이다. 이 교수는 “현재 대량생산 공정도 완성 단계”라며 “프로닉스 미국 지사를 통해 여러 미국 정보기술(IT) 기업과 협업을 추진하고 있다”고 말했다. 이 교수는 지난해 열린 세계 최대 IT·가전 전시회 ‘CES 2020’에서 이 기술을 세계 시장에 처음으로 선보였다.

이번 연구는 한국연구재단의 휴먼플러스 인공지능 센서 센터의 지원을 받아 진행됐다. 연구 결과는 국제 학술지 ‘사이언스 어드밴시스’에 지난 12일자로 게재됐다.

최한종 기자 onebell@hankyung.com