[AI픽] KT 자체 AI '믿:음 K', 글로벌 평가서 국내 중소형 1위

입력 2026-01-05 09:26

[AI픽] KT 자체 AI '믿:음 K', 글로벌 평가서 국내 중소형 1위

[AI픽] KT 자체 AI '믿:음 K', 글로벌 평가서 국내 중소형 1위
에이전트 벤치마크 τ²-bench 87% 기록
40B 이하 모델로 B2B AI 경쟁력 입증

(서울=연합뉴스) 박형빈 기자 = KT[030200]는 자체 개발한 인공지능(AI) 모델 '믿:음 K'가 글로벌 AI 모델 성능을 종합 평가하는 플랫폼 AAII에서 국내 중소형 모델 중 1위를 차지했다고 5일 밝혔다.
AAII는 AI 평가 전문 기관인 '아티피셜 애널리시스'가 운영하는 플랫폼으로, LG 엑사원, 네이버 하이퍼클로바, 업스테이지 솔라, 모티프 등 국내 주요 모델도 함께 등재돼있다.
이번 AAII 공개 결과에서 KT의 '믿:음 K'는 주요 에이전트 성능 벤치마크 중 하나인 'τ²-bench'(타우 스퀘어 벤치)에서 87%를 기록하며 에이전틱 AI 분야 최정상 모델로 이름을 올렸다.
타우 스퀘어 벤치는 AI가 실제 업무 환경에서 사람과 협업하며 여러 도구를 활용해 과업을 끝까지 수행할 수 있는지를 평가하는 에이전트 특화 벤치마크로, 믿:음 K는 최정상 수준으로 구글의 제미나이3와도 비슷한 성능을 보였다.
에이전트 지표 외에도 믿:음 K는 MMLU Pro, GPQA, HLE 등 전문지식 및 고난도 추론 역량을 평가하는 주요 벤치마크에서도 고른 성능을 보였으며, 특히 한국어 이해 성능에서는 국내 최고 수준을 기록했다고 KT는 전했다.
KT는 "매개변수 40B 이하급 모델에서 해당 성능이 구현됐다는 점에서 의미가 크다"며 "초기 개발 단계부터 철저히 B2B 시장을 정조준하며 모델 개발을 추진한 결과"라고 밝혔다.
KT는 믿:음 K를 국내 B2B 환경에 최적화된 에이전틱 AI 모델로 확산한다는 계획이다. 산업별 특화 업무를 자동화하고 스스로 판단·처리가 가능한 맞춤형 AI 에이전트를 제공해 기업 고객의 업무 경험(AX) 혁신을 지원하겠다는 전략이다.
KT 기술혁신부문장 오승필 부사장은 "이번 AAII 등재는 KT의 자체 AI 기술력이 글로벌 기준에 도달했음을 객관적으로 입증한 성과"라며 "에이전틱 AI를 통해 한국 기업들의 업무 혁신과 디지털 전환을 이끄는 최고의 AI 파트너가 되겠다"고 말했다.
binzz@yna.co.kr
(끝)

<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>