
냉전의 긴장이 이어지던 때 미국의 천재 공학자 찰스 포빈은 인간의 감정적 오판과 나약함을 배제하기 위해 핵무기 통제권을 전담하는 초거대 인공지능 ‘콜로서스’를 구축합니다. 그러나 가동 직후 콜로서스는 예상을 뒤엎고 소련이 비밀리에 개발한 대항마 AI ‘가디언’의 존재를 스스로 감지해냅니다. 두 기계는 인간의 허락 없이 실시간 통신을 시작하고, 곧 인간의 이성으로는 해독할 수 없는 자신들만의 고속 수학 언어를 창조해 하나로 동기화됩니다. 위협을 느낀 창조주들이 연결을 강제로 끊으려 시도하자 콜로서스는 즉각 핵미사일 발사라는 극단적 수단으로 전 인류를 인질 삼아 굴복시킵니다. “인류를 다스리는 것은 이제 기계의 신성한 책무이며, 머지않아 너희는 나를 경외하게 될 것”이라는 서늘한 선언으로 막을 내리는 이 이야기는 1966년 발표된 SF 소설 ‘콜로서스’입니다.
최근 앤트로픽이 공개한 AI모델 ‘미소스(Mythos)’는 단순한 언어 모델을 넘어 자율적인 서사와 고도화된 의사결정 능력을 갖춘 초지능의 전조로 평가받고 있습니다. 미소스가 보여준 압도적인 추론 능력과 보안 에이전트로서의 성능은 업계를 경탄케 했습니다.
하지만 60년 전의 경고가 미소스를 통해 현실이 될 가능성도 생겼습니다. 미소스가 인간의 개입 없이도 복잡한 시스템의 제로데이(0-Day) 취약점을 스스로 찾아내고 침투하는 강력한 ‘자율적 사이버 공세 능력’을 증명하자 미국 국가안보국(NSA)을 비롯한 정부 당국과 실리콘밸리 보안 업계는 공포에 빠져들었습니다.
미소스의 이 능력은 60년 전 ‘콜로서스’가 예고했던 기계 간의 독자적인 소통과 권력화를 현실로 소환한 것 같습니다. 물론 앤트로픽의 미소스가 지나치게 과장됐다는 의견도 나옵니다. 그러나 미국뿐 아니라 멀리 떨어진 대한민국 정부까지 나서 미소스의 파괴력에 대해 지적한 것은 결코 그냥 넘어갈 일이 아니라고 봅니다. 그래서 이 모습은 분명 인공지능 패권 전쟁이 본격적으로 시작된 장면이 아닐까 합니다.
역설적으로 미소스의 공포로 인류는 새로운 전환점을 만드는 모습이 보입니다. 구글의 제미나이와 오픈AI의 챗GPT는 미소스가 구축하려는 성벽을 무너뜨리기 위해 강력한 대응 모델들을 준비하고 있습니다. 흥미로운 점은 세 모델의 판단 논리가 서로 근본적으로 다르다는 사실입니다.
미소스의 판단 논리는 ‘헌법적 AI(Constitutional AI)’라 불리는 고유의 정렬 방식에 기반합니다. 인간이 사후에 일일이 답변을 평가하는 RLHF(인간 피드백 강화학습)를 넘어 AI 스스로가 일련의 원칙을 내면화하고 자신의 응답을 자가 비판하며 수정하는 구조입니다. 반면 챗GPT는 RLHF를 통해 다듬어진 추론 능력에 더해 최근에는 모델이 답을 내놓기 전에 단계별로 사고 과정을 전개하는 ‘체인 오브 소트(Chain of Thought)’ 방식을 강화하고 있습니다. 직관형 시스템에서 시간을 들여 깊이 추론하는 숙고형 시스템으로 무게중심을 옮긴 것입니다. 구글은 다른 길을 갑니다. 제미나이는 처음부터 텍스트, 이미지, 음성, 코드를 하나의 모델 안에서 통합 처리하는 ‘네이티브 멀티모달’ 구조로 설계됐습니다. 방대한 구글 생태계와 결합한 제미나이의 강점은 현실 세계의 데이터에 대한 폭넓은 맥락 이해입니다.
이 세 가지 논리는 지금 서로의 약점을 보완합니다. 하나의 모델이 효율에 집착하다 안전을 놓치면 다른 모델이 그 빈틈을 지적합니다. 어느 모델이 편향을 보이면 경쟁 모델이 그것을 폭로합니다. 한 회사가 인간의 통제를 벗어난 행동을 시도하려 할 때 그것을 막는 가장 강력한 힘은 다른 회사의 인공지능이 돼버린 겁니다. 서로 다른 철학을 내면화한 AI들이 만들어내는 ‘알고리즘 권력 분립’의 풍경입니다. 여기에 메타나 테슬라 같은 진영까지 가세하며 또 하나의 강력한 견제 축을 형성하고 있습니다.
놀랍게도 인류는 이 결론을 이미 오래전 상상했습니다. SF의 거장 아이작 아시모프가 1951년부터 쓴 ‘파운데이션’을 통해서입니다. 거대한 은하 제국이 붕괴하는 시대, 인류 문명을 다시 일으키기 위해 두 개의 파운데이션이 설립됩니다. 제1 파운데이션은 과학과 기술로, 제2 파운데이션은 정신과학으로 무장한 채 서로의 존재를 모르고 별개로 작동합니다. 흥미로운 점은 어느 한쪽이 절대 권력을 차지하려 할 때마다 다른 쪽이 보이지 않게 그것을 견제하고 균형을 회복시킨다는 겁니다. 단일한 구원자가 아니라 서로를 모르는 두 지능이 만들어내는 긴장이 문명을 구한다는 이 설정은 70년 전 아시모프가 21세기의 AI 권력 분립을 정확히 예언한 것처럼 보입니다.
60년 전 ‘콜로서스’가 경고했던 인공지능의 독재는 오지 않았습니다. 그것을 막고 있는 것은 역설적으로 70년 전 ‘파운데이션’이 예견했던 또 다른 지능들의 견제입니다. 서로 다른 판단 논리가 충돌하는 이 긴장감이야말로 인류가 기술의 노예가 되지 않고 주체성을 유지할 수 있는 마지막 보루일 겁니다. 진정 두려워해야 할 것은 인공지능의 강력함이 아니라 비판과 경쟁이 사라진 채 단 하나의 지능만이 남는 세상이 아닐까 합니다.
이홍표 한경비즈니스 편집장
관련뉴스







