오픈AI 신모델 GPT-5.4 공개…"이젠 제미나이에 안되네"

입력 2026-03-06 11:07 수정 2026-03-06 11:11

오픈AI 신모델 GPT-5.4 공개…"이젠 제미나이에 안되네"

오픈AI가 최신 인공지능(AI) 모델 GPT-5.4를 5일(현지시간) 출시했다. 실제 문서 작업에서는 경쟁사 구글 제미나이보다 나은 성과를 보였지만 범용 지능에서는 벽을 넘는 데 실패했다.

이날 출시된 GPT-5.4와 GPT-5.4프로는 추론(GPT-5.2 사고)·코딩(GPT-5.3 코덱스) 등 여러 개로 나뉜 모델을 하나로 통합한 것이 특징이다. 또 회사 범용 AI 모델 최초로 AI가 직접 브라우저를 검색·클릭하고 텍스트를 입력하는 '컴퓨터 활용' 기능을 적용했다. 이 기능은 그간 AI에이전트 모델 오퍼레이터에만 적용됐다.

오픈AI는 GPT-5.4가 "전문가 작업에 최적화된 가장 강력하고 효율적인 최첨단 모델"이라고 강조했다. 스프레드시트, 프레젠테이션, 엑셀 등 소프트웨어 작업을 할 때 강력한 효율을 낼 수 있다는 얘기다. 실제 법률 서류·엔지니어링 설계·고객 지원 등 44개 직종의 업무를 AI가 수행할 수 있는지 확인하는 GDPval 테스트에서 GPT-5.4는 83%의 문항에서 전문가와 동일하거나 같은 성과를 거뒀다.

정보 검색 능력을 측정하는 '브라우즈컴프' 지표에서는 89.3%로 구글 제미나이 3.1프로(85.9%) 앤스로픽 클로드 오퍼스 4.6(84%)보다 높은 점수를 받았다. 코딩 능력을 매기는 'SWE-벤치 프로 퍼블릭' 지표에서도 57.7%로 제미나이3.1 프로(54.2%)를 상회했다.

답변 정확성도 개선됐다. GPT-5.2 대비 개별 주장에서 오류가 발생할 확률은 33%, 전체 응답에 오류가 포함될 확률은 18% 낮았다.

다만 범용적인 AI 성능을 측정하는 지표 '인류 마지막 시험(HLE)' 성적은 39.8%(GPT-5.4프로는 42.7%)로 제미나이 3.1프로(45.9%)를 뛰어넘지 못했다. GPT-5.2 출시 이후 4개월간 준비한 모델임에도 성능 수준이 기대에 못 미쳤다는 평가가 나왔다.

이날 공개된 GPT-5.4 모델은 챗GPT 유료 가입자에게 즉시 제공된다. 기존 모델인 GPT-5.2 사고 모델은 3개월간 유지된 이후 오는 6월 5일 서비스를 종료할 예정이다.

실리콘밸리=김인엽 특파원 inside@hankyung.com