네이버 '하이퍼클로바X' 기술평가 공개

입력 2024-04-04 09:58  

락토핏 당케어 광고 이미지
난각막NEM 광고 이미지


네이버가 자사 인공지능(AI) 거대언어모델(LLM)인 '하이퍼클로바X'에 대한 기술 보고서를 공개했다.

네이버가 작성한 보고서를 보면 하이퍼클로바X는 한국어, 일반 상식, 수학, 코딩 부문에서 비교·평가를 위해 선정한 14개 모델 가운데 1위를 기록했다.

한국어 능력 부문에서는 세계 최고 수준 모델을 포함해 비교·평가를 위해 보고서에서 선정한 4개 모델 중 1위에 올랐고, 영어 능력 분야에서도 같은 모델들 가운데 2위로 평가됐다.

하이퍼클로바X의 사전학습(Pretraining) 데이터는 대부분 한국어, 영어, 코드 데이터로 구성됐다.


양질의 사전학습 데이터 구축을 위해 매우 짧거나 반복적인 저품질 문서는 데이터세트에서 제외했고, 개인 정보가 포함된 데이터도 삭제했다.

또 사용자의 의도와 지시를 AI가 더 잘 이해할 수 있도록 모델을 고도화했다.

보고서에서 강조한 하이퍼클로바X의 또 다른 특징은 '다국어 능력'(Multilinguality)이다.

네이버는 학습 데이터의 대부분을 차지하는 한국어와 영어 정보를 활용해 제3의 언어로 추론하는 능력을 갖춘 것이 확인됐다고 소개했다.

한국어를 일본어로, 일본어를 한국어로 번역하는 능력은 보고서에서 선정한 10개의 모델 가운데 1위로 평가됐고, 영어를 한국어로 번역하는 정확도 역시 동일한 10개 모델 중 가장 높은 점수를 기록했다.

관련뉴스

    top
    • 마이핀
    • 와우캐시
    • 고객센터
    • 페이스 북
    • 유튜브
    • 카카오페이지

    마이핀

    와우캐시

    와우넷에서 실제 현금과
    동일하게 사용되는 사이버머니
    캐시충전
    서비스 상품
    월정액 서비스
    GOLD 한국경제 TV 실시간 방송
    GOLD PLUS 골드서비스 + VOD 주식강좌
    파트너 방송 파트너방송 + 녹화방송 + 회원전용게시판
    +SMS증권정보 + 골드플러스 서비스

    고객센터

    강연회·행사 더보기

    7일간 등록된 일정이 없습니다.

    이벤트

    7일간 등록된 일정이 없습니다.

    공지사항 더보기

    open
    핀(구독)!