코스피
5,584.87
(0.97
0.02%)
코스닥
1,154.67
(38.26
3.43%)
버튼
가상화폐 시세 관련기사 보기
정보제공 : 빗썸 닫기

오픈AI 신모델 GPT-5.4 공개…"이젠 제미나이에 안되네"

입력 2026-03-06 11:07   수정 2026-03-06 11:11


오픈AI가 최신 인공지능(AI) 모델 GPT-5.4를 5일(현지시간) 출시했다. 실제 문서 작업에서는 경쟁사 구글 제미나이보다 나은 성과를 보였지만 범용 지능에서는 벽을 넘는 데 실패했다.

이날 출시된 GPT-5.4와 GPT-5.4프로는 추론(GPT-5.2 사고)·코딩(GPT-5.3 코덱스) 등 여러 개로 나뉜 모델을 하나로 통합한 것이 특징이다. 또 회사 범용 AI 모델 최초로 AI가 직접 브라우저를 검색·클릭하고 텍스트를 입력하는 '컴퓨터 활용' 기능을 적용했다. 이 기능은 그간 AI에이전트 모델 오퍼레이터에만 적용됐다.

오픈AI는 GPT-5.4가 "전문가 작업에 최적화된 가장 강력하고 효율적인 최첨단 모델"이라고 강조했다. 스프레드시트, 프레젠테이션, 엑셀 등 소프트웨어 작업을 할 때 강력한 효율을 낼 수 있다는 얘기다. 실제 법률 서류·엔지니어링 설계·고객 지원 등 44개 직종의 업무를 AI가 수행할 수 있는지 확인하는 GDPval 테스트에서 GPT-5.4는 83%의 문항에서 전문가와 동일하거나 같은 성과를 거뒀다.

정보 검색 능력을 측정하는 '브라우즈컴프' 지표에서는 89.3%로 구글 제미나이 3.1프로(85.9%) 앤스로픽 클로드 오퍼스 4.6(84%)보다 높은 점수를 받았다. 코딩 능력을 매기는 'SWE-벤치 프로 퍼블릭' 지표에서도 57.7%로 제미나이3.1 프로(54.2%)를 상회했다.

답변 정확성도 개선됐다. GPT-5.2 대비 개별 주장에서 오류가 발생할 확률은 33%, 전체 응답에 오류가 포함될 확률은 18% 낮았다.

다만 범용적인 AI 성능을 측정하는 지표 '인류 마지막 시험(HLE)' 성적은 39.8%(GPT-5.4프로는 42.7%)로 제미나이 3.1프로(45.9%)를 뛰어넘지 못했다. GPT-5.2 출시 이후 4개월간 준비한 모델임에도 성능 수준이 기대에 못 미쳤다는 평가가 나왔다.

이날 공개된 GPT-5.4 모델은 챗GPT 유료 가입자에게 즉시 제공된다. 기존 모델인 GPT-5.2 사고 모델은 3개월간 유지된 이후 오는 6월 5일 서비스를 종료할 예정이다.

실리콘밸리=김인엽 특파원 inside@hankyung.com


관련뉴스

    top
    • 마이핀
    • 와우캐시
    • 고객센터
    • 페이스 북
    • 유튜브
    • 카카오페이지

    마이핀

    와우캐시

    와우넷에서 실제 현금과
    동일하게 사용되는 사이버머니
    캐시충전
    서비스 상품
    월정액 서비스
    GOLD 한국경제 TV 실시간 방송
    GOLD PLUS 골드서비스 + VOD 주식강좌
    파트너 방송 파트너방송 + 녹화방송 + 회원전용게시판
    +SMS증권정보 + 골드플러스 서비스

    고객센터

    강연회·행사 더보기

    7일간 등록된 일정이 없습니다.

    이벤트

    7일간 등록된 일정이 없습니다.

    공지사항 더보기

    open
    핀(구독)!