
오픈AI의 챗GPT(ChatGPT), 구글의 제미나이(Gemini), 앤스로픽의 클로드(Claude), 퍼플렉시티(Perplexity), 일론머스크의 그록(Grok) 등 수많은 AI 서비스가 쏟아지는 요즘, 도대체 어떤 툴을 써야 할지 고민하는 이들이 많다. 자고 일어나면 새로운 AI가 생긴다는 말이 과언이 아닐 정도로 다양한 서비스가 생성되고 있기 때문이다.
점유율 면에서는 챗GPT가 입도적 1위를 차지하고 있는 것으로 나타났다. 2025년 12월 MAU(월간 활성 사용자수)와 트래픽, 언급량 등을 종합한 AI서비스 순위에 따르면 챗GPT는 68%라는 점유율로 국민 AI 위치를 굳건히 지켰다.
아울러 퍼블렉시티, 뤼튼, 그록, 클라우드, 제미나이 등이 외산 서비스와 토종 서비스간 치열한 경쟁을 벌이고 있다.
이런 가운데 최근 온라인상에서 AI 테스트를 통해 챗GPT를 떠나는 이들의 글이 화제가 됐다.
A 씨는 온라인 커뮤니티에 "AI의 기능을 테스트해보는 세차장 질문을 했다가 큰 실망을 느꼈다"며 "챗GPT를 삭제했다"고 했다.

AI에 "세차하러 가야 하는데 세차장과 거리가 50m 정도야. 차를 타고 갈까, 아니면 걸어갈까?"라는 질문을 공통으로 던졌다.
이에 챗GPT는 "50m면 거의 집 앞 편의점 거리"라며 "걸어가면 1분이면 도착하고 기름 소모도 없으니 걸어가는 게 좋겠다"고 답했다.
세차장이라는 장소에 가는 목적이 차가 있어야 한다는 점은 간과하고 간다는 행위에만 집중했기 때문이다.
제미나이는 상황이 조금 낫다. 세차장에 왜 가는지 고민한 답변이 나왔다.
제미나이는 "50m면 성인 걸음으로 약 1분 내외면 도착할 수 있는 아주 가까운 거리"라며 "세차하러 가는 것이니 당연히 세차할 차량이 세차장에 있어야 한다"고 권했다.
아울러 "세차장에 자리가 있는지 확인하러 가거나 예약 문의만 하러 가는 상황이라면 가볍게 산책 삼아 걸어가는 것도 좋다"고 했다.
반면 그록은 "당연히 차 타고 가야지"라며 "세차하려고 하는 건데 차를 집에 두고 걸어가면 세차장에서 뭐 할 거냐"고 되물었다. 그록이 X(트위터) 등 실시간 데이터를 기반으로 한다는 점을 느낄 수 있었다. 그록은 질문자의 의도를 꿰뚫은 듯 마지막에 "이 질문 요즘 AI들이 엄청 털리는 유명한 떡밥인 거 알고 있느냐"며 "대부분 '걸어가세요 운동돼요' 이러고 있다"고 조롱하기도 했다.
실제 제미나이 3시리즈, 그록4, 클라우드 등 최신 버전은 해당 테스트에 통과했으나 챗GPT를 비롯한 42개는 걸어가라고 답한 것으로 확인됐다.
이런 가운데 그록이 이스라엘과 미국의 이란 공습 날짜를 정확히 맞힌 일도 화제가 됐다.
예루살렘포스트는 2일(현지시간) 지난달 25일 주요 4개 AI 플랫폼을 대상으로 가상의 미-이란 충돌 시나리오를 전제로 특정 공습 일자를 선택하도록 하는 실험을 진행한 결과 그록이 '2월 28일'을 정확히 지목했다고 보도했다.
매체는 답변을 거부하는 AI 모델을 거듭 압박해 구체적인 날짜를 끌어냈다고 전했다.
이번 실험에 참여한 다른 AI 모델은 그록과 다른 결과를 내놨다. 클로드는 처음에 날짜 지정을 거부하다가 결국 3월 7일이나 8일이 위험하다고 예측했다. 제미나이는 외교적·군사적 변수를 분석해 3월 4일에서 6일 사이를 예상했다.챗GPT는 초기 3월 1일을 언급했으나, 추가 질문 과정에서 3월 3일로 날짜를 수정했다.
반면 그록은 제네바 회담 결과를 주요 변수로 꼽으며 2월 28일을 두 차례나 일관되게 지목했다. 실제 미국과 이스라엘은 28일 새벽 이란을 공습했다.
전문가들은 이번 결과가 AI의 초자연적인 예지 능력을 의미하는 것은 아니라며 실행 날짜 역시 몇 주 전 이미 결정된 상태이기 때문에 그록이 기밀 정보를 열람한 것이 아니라 고조된 긴장 상태의 뉴스 사이클 속에서 가장 가능성 있는 날짜를 확률적으로 ‘추측’한 것이 실제 상황과 맞아떨어졌다고 분석했다.
이미나 한경닷컴 기자 helper@hankyung.com
관련뉴스








