코스피
5,221.25
(50.44
0.98%)
코스닥
1,164.41
(30.89
2.73%)
버튼
가상화폐 시세 관련기사 보기
정보제공 : 빗썸 닫기

AI 콧대 꺾은 '인류 마지막 시험'…韓 연구자 8명 출제·평가자 참여

입력 2026-01-29 17:59   수정 2026-01-29 23:44


인공지능(AI) 모델의 성능을 비교하기 위해 만든 초고난도 시험 ‘인류의 마지막 시험(Humanity‘s Last Exam·HLE)’ 출제자 명단에 박하언 에임인텔리전스 최고기술책임자(CTO·사진) 등 한국인 연구자 8명이 이름을 올렸다. HLE는 50개국 500여 개 기관의 연구자 약 1000명이 참여한 글로벌 AI 평가 프로젝트다.

국제학술지 네이처는 28일(현지시간) 논문을 통해 HLE 질문 분야와 문항 형식, 정답 해설, 출제자 이름과 소속 등 주요 데이터셋을 공개했다. 논문에 따르면 박 CTO와 김대현 연세대 교수를 비롯해 KAIST, 한국기술교육대, 건국대, 서울대 등의 한국인 연구자들이 HLE 출제에 참여했다. 미국 카네기멜런대, 컬럼비아대 등 해외 대학에 소속된 한인 연구자들도 명단에 이름을 올렸다.

HLE 프로젝트는 AI 기술이 빠르게 고도화되면서 각종 벤치마크에서 주요 AI 모델이 만점에 가까운 점수를 따는 등 평가가 사실상 무력화하자 인류조차 풀기 어려운 문제를 내 모델 간 성능을 제대로 가리자는 취지로 추진됐다. 출제 당시 최고 성능의 AI 모델도 풀지 못한 문제를 엄선해 2500개 문항으로 추려졌다. 후보 문항을 취합하고 분야별 전문가가 점수를 매겨 높은 점수를 얻은 문제만 최후의 문제로 남았다.

HLE는 수학, 물리학, 화학, 생물학, 공학, 컴퓨터과학, 인문학 등 100여 개 세부 학문 분야를 총망라한다. 묘비에서 발견된 로마 비문 일부를 번역하거나 벌새의 종자골이 몇 쌍의 힘줄을 지지하는지 등 분야별 전문성을 요구하는 문제가 다수 출제됐다. 일부 문항은 글과 이미지를 함께 이해해야 풀 수 있는 멀티모달 문제로 구성됐다. 출제에 참여한 박 CTO는 “이산수학 문제를 냈는데 복잡한 계산이 필요해 소수점이 많이 나오는 답을 가진 질문으로 모델이 풀이는 비슷하게 하지만 결국 숫자 차이가 나게 되는 문제를 만들었다”고 말했다.

AI안전센터가 공개한 데이터에 따르면 구글 제미나이 3 프로가 정확도 38.3점으로 HLE에서 가장 높은 성적을 거뒀다. 오픈AI의 GPT-5.2가 29.9점, 오푸스 4.5가 25.8점, 딥시크 3.2가 21.8점을 기록했다. 정부의 독자 파운데이션 모델 경쟁에 참여 중인 국내 AI 모델은 상대적으로 낮은 점수를 기록했다. HLE 중 텍스트만 추린 평가에서 LG AI연구원의 ‘엑사원’이 13.6점, 업스테이지의 ‘솔라 오픈’은 10.5점, SK텔레콤의 ‘에이닷엑스 케이원’은 7.6점을 받았다.

글로벌 AI업계에서 한국이 차지하는 위상을 비교했을 때 한국인의 HLE 출제 참여가 적은 편이라는 평가도 나온다. 박 CTO는 “한국에 홍보가 잘 안 됐다”며 “상금도 걸려 있고, 중요한 평가에 실제로 기여하며 논문에도 이름이 들어가는 만큼 의미가 있는 일”이라고 말했다. 해외에선 알렉산드르 왕 스케일AI 최고경영자(CEO) 같은 스타 엔지니어들이 출제를 주도하고 있다. AI 최종 성능의 기준을 세우는 일이라 AI 평가 기준은 물론 AI 규제, 투자 등 주요 가이드라인을 만드는 데 영향을 미친다.

고은이 기자 koko@hankyung.com


관련뉴스

    top
    • 마이핀
    • 와우캐시
    • 고객센터
    • 페이스 북
    • 유튜브
    • 카카오페이지

    마이핀

    와우캐시

    와우넷에서 실제 현금과
    동일하게 사용되는 사이버머니
    캐시충전
    서비스 상품
    월정액 서비스
    GOLD 한국경제 TV 실시간 방송
    GOLD PLUS 골드서비스 + VOD 주식강좌
    파트너 방송 파트너방송 + 녹화방송 + 회원전용게시판
    +SMS증권정보 + 골드플러스 서비스

    고객센터

    강연회·행사 더보기

    7일간 등록된 일정이 없습니다.

    이벤트

    7일간 등록된 일정이 없습니다.

    공지사항 더보기

    open
    핀(구독)!