이 회사는 지난 8월 파라미터가 60억 개와 130억 개인 LLM을 공개했다. 해외에서도 이용이 가능한 아마존웹서비스(AWS) 플랫폼에 공개하는 방식이었다. 파라미터는 AI가 신경망에서 받아들일 수 있는 입력값의 범위다. 이 수치가 클수록 더 많은 데이터를 활용해 연산할 수 있다. 범용 LLM인 챗GPT-4는 파라미터가 1조 개가 넘는 것으로 알려져 있다.
엔씨소프트는 범용 LLM 대신 파라미터가 300억 개 이하인 경량 LLM에 집중하는 전략을 택했다. LLM의 몸집이 커지면 여러 정보를 다룰 수 있지만 구동 비용이 늘어난다. 잦은 업데이트를 하기에도 부담이 따른다. 특정 분야에만 쓴다면 덩치가 작은 LLM이 효율적일 수 있다. 엔씨소프트는 경량 LLM으로 만든 게임·영상 제작용 도구로 매출을 내겠다는 구상이다. 이 업체 관계자는 “텍스트, 음성, 이미지 등의 생성 작업을 지원하는 서비스를 내놔 기업 간 거래(B2B) 시장을 공략하겠다”며 “이미 사내 테스트를 통해 성과를 충분히 확인했다”고 말했다.
KT도 지난 10월 공개한 LLM인 ‘믿음’을 파라미터 규모에 따라 네 가지로 나눴다. 경량 LLM을 시장에 풀어 기업의 생성 AI 도입 문턱을 낮추겠다는 전략이다. 파라미터가 가장 적은 70억 개 모델도 개별 기업이 사내 데이터를 관리하기에 충분한 수준이다. KT는 클라우드로 이용할 수 있는 생성 AI 서비스도 출시해 장비 구축에 부담을 느끼는 중소기업들이 종량제 요금으로 AI를 활용할 수 있도록 했다.
카카오는 연내 자체 LLM인 코GPT2.0을 출시하기로 했지만 일정이 불투명하다. 이 업체는 파라미터를 60억~650억 개 사이에서 조정하면서 경량 LLM을 내놓기 위한 과정을 거쳤다. 최근 생성 AI 1회 호출에 들이는 비용을 1원 이하로 낮추는 데 성공했다는 게 카카오의 설명이다.
이주현 기자 deep@hankyung.com
관련뉴스