'귀'신같이 알아듣는 AI 스피커 나온다

입력 2021-02-15 17:57   수정 2021-02-16 00:50


챗봇, 디지털 휴먼 등 인공지능(AI) 기기가 먼 거리의 소리를 정확하게 인식할 수 있도록 돕는 기술이 개발됐다. KAIST는 이건재 신소재공학과 교수 연구팀이 인간의 귀를 닮은 신개념 음성 센서를 개발했다고 15일 밝혔다. 연구팀은 스마트폰과 AI 스피커에 이 센서를 장착하는 데도 성공했다.
달팽이관 모사해 잡음 줄여
현재 상용화된 AI 스피커는 가까이서 발생하는 소리는 잘 듣지만 먼 거리의 소리에는 약하다. 귀의 구조에 비밀이 숨겨져 있다. 인간은 특정 주파수 영역에서 센서가 큰 폭으로 진동하는 공진 현상을 통해 먼 거리의 소리를 인식한다. 달팽이관에 있는 사다리꼴 막이 가청 주파수 대역에서 공진 현상을 통해 소리를 증폭하는 방식이다.

이 교수 연구팀은 이 같은 원리를 인공적으로 구현해 신호 대 잡음 비가 낮은 센서를 개발하는 데 성공했다. 매우 얇은 유연 압전 막을 사용해 인간의 달팽이관을 모사했다. 압전은 압력을 가했을 때 전기적인 신호가 생성되는 현상이다. 센서에서 음성이 막을 진동시키면 인간의 귀에서처럼 공진 현상이 일어나 민감도가 높은 전압 신호를 얻을 수 있게 된다.

연구팀은 2019년 최초로 공진형 유연 압전 센서를 개발했다. 첫 제품은 크기가 가로·세로 3㎝로 커 모바일용 제품에 적용하기 어렵다는 한계가 있었다. 연구팀은 이번 연구 과정에서 초박형 미세 박막 공정을 적용해 크기를 70%가량 줄이는 데 성공했다. 센서 구조에 따른 공진, 주파수, 압전 막의 역할 등을 이론적으로 밝혀내 디자인을 최적화했다. 음성을 암호화하는 보안 기술도 함께 선보였다.

이 교수는 “이번에 제품화한 센서는 민감도가 높으면서도 크기가 작아 미래 AI 기술을 구동하는 핵심 센서로 활용될 수 있을 것”이라고 말했다.
적은 데이터로도 화자 식별
개발된 센서는 화자 식별 오류율이 기존 상용 센서에 비해 최대 95% 낮다. 오류율이 낮으면 AI가 적은 데이터로도 화자를 정확하게 식별할 수 있다. 음성인식 기능이 적용된 스마트폰, AI 스피커 등 사물인터넷(IoT) 기기에 폭넓게 활용될 것으로 전망된다. 음성을 암호화하는 보안 기술은 사용자 맞춤형 서비스와 핀테크 분야 등에서 적용될 것으로 기대되고 있다.

이 교수는 2016년 KAIST 내에서 자신이 창업한 기업인 프로닉스를 통해 이 기술을 상용화할 예정이다. 이 교수는 “현재 대량생산 공정도 완성 단계”라며 “프로닉스 미국 지사를 통해 여러 미국 정보기술(IT) 기업과 협업을 추진하고 있다”고 말했다. 이 교수는 지난해 열린 세계 최대 IT·가전 전시회 ‘CES 2020’에서 이 기술을 세계 시장에 처음으로 선보였다.

이번 연구는 한국연구재단의 휴먼플러스 인공지능 센서 센터의 지원을 받아 진행됐다. 연구 결과는 국제 학술지 ‘사이언스 어드밴시스’에 지난 12일자로 게재됐다.

최한종 기자 onebell@hankyung.com


관련뉴스

    top
    • 마이핀
    • 와우캐시
    • 고객센터
    • 페이스 북
    • 유튜브
    • 카카오페이지

    마이핀

    와우캐시

    와우넷에서 실제 현금과
    동일하게 사용되는 사이버머니
    캐시충전
    서비스 상품
    월정액 서비스
    GOLD 한국경제 TV 실시간 방송
    GOLD PLUS 골드서비스 + VOD 주식강좌
    파트너 방송 파트너방송 + 녹화방송 + 회원전용게시판
    +SMS증권정보 + 골드플러스 서비스

    고객센터

    강연회·행사 더보기

    7일간 등록된 일정이 없습니다.

    이벤트

    7일간 등록된 일정이 없습니다.

    공지사항 더보기

    open
    핀(구독)!