
챗GPT 개발사 오픈AI와 마이크로소프트(MS)는 중국 인공지능(AI) 스타트업 딥시크가 AI 모델 훈련을 위해 오픈AI 데이터를 무단으로 수집했는지 밝혀내기 위해 조사에 착수했다.
딥시크는 오픈AI보다 훨씬 적은 비용만 들여 챗GPT에 맞먹는 성능의 AI 모델을 선보여 미국 테크 업계에 충격을 줬다. 그러나 이것이 오픈AI의 데이터를 도용해 가능했을 것이라는 의혹이 제기돼 왔다.
오픈AI의 데이터가 딥시크와 관련된 그룹에 의해 허가 없이 무단으로 획득됐는지 오픈AI와 MS가 조사하고 있다고 블룸버그 통신과 월스트리트저널(WSJ) 등은 소식통을 인용해 29일(현지시간) 보도했다.
오픈AI는 중국에 기반을 둔 기관들이 자사의 AI 도구에서 대량의 데이터를 빼내려고 하는 시도를 여러번 목격했다며 이는 '증류'(distillation)라고 불리는 기술적 과정을 통해 자체 모델을 훈련하기 위한 것으로 보인다고 설명했다.
'증류'는 AI 모델이 다른 모델의 출력 결과를 훈련 목적으로 사용해서 유사한 기능을 개발하는 것을 뜻한다.
MS 보안 연구원들도 지난해 가을 딥시크와 관련된 것으로 보이는 사람들이 오픈AI 애플리케이션 프로그래밍 인터페이스(API)를 사용해 대량의 데이터를 빼돌리는 것을 관찰했다고 밝혔다.
API는 소프트웨어 개발자들이 AI 기능을 자신들의 프로그램이나 앱에 넣을 수 있게 해주는 도구다. 이를 사용하기 위해서는 허가를 받아야 한다.
오픈AI는 자사 시스템에서 생성된 데이터를 사용해 동일한 시장에서 경쟁하는 기술을 구축하는 것을 금지하고 있다.
오픈AI는 자사의 모델을 증류하는 것으로 의심되는 계정을 금지했고, MS와 협력해 이런 시도의 배후를 파악했다고 설명했다. 또 딥시크가 자사의 "데이터를 무단으로 수집했을 가능성"이 있으며, 서비스 약관 위반 증거를 검토하고 있다고 전했다.
오픈AI는 "중국 기반 기업들이 주요 미국 AI 기업의 모델을 지속적으로 증류하려고 노력하고 있다"고 전했다.
(사진=연합뉴스)
한국경제TV 디지털뉴스부 박근아 기자
twilight1093@wowtv.co.kr관련뉴스






