‘인공지능(AI) 역량 6위, 운영환경 35위.’한국인공지능·소프트웨어산업협회(KOSA)가 최근 발간한 ‘AI 산업 전환을 위한 데이터 전략 보고서’에 나온 수치다. AI 기술 경쟁력은 뛰어나지만 국내 기업들은 여전히 개인정보 활용 제한과 저작권 규제 탓에 학습 데이터를 인공지능 전환(AX)에 제대로 활용하지 못하고 있다는 분석이다. 주요국이 데이터 인프라를 국가 경쟁력의 근간으로 삼은 것과 달리 한국은 제도적 뒷받침이 부족하다는 게 보고서의 핵심이다. 이대로 가면 기술력만 앞서고 산업화와 상용화에서는 경쟁국에 뒤처질 것이란 우려가 나온다.
보고서는 운영환경 점수가 낮은 원인으로 개인정보 비식별화의 불완전성, 저작권 검증 부담, 기관 간 데이터 공유 한계와 표준화 미비, 데이터 처리 비용 부담 등을 꼽았다. 특히 데이터 활용 가이드라인이 구체적 사례가 아니라 원칙 중심으로 구성돼 실제 적용 단계에서 해석이 엇갈린다. 이로 인해 기업들이 불확실성을 피하려 보수적으로 움직인다는 분석이다. 가명 정보와 익명 정보 간 경계가 불분명해 같은 데이터라도 개인정보보호위원회, 보건복지부, 금융위원회 등 유관기관마다 지침이 달라지는 사례도 잦다.이 때문에 AI 산업 현장 곳곳에서 사업 차질이 발생하고 있다. 한 스타트업은 생성형AI 콘텐츠 플랫폼을 제작하며 공공기관이 보유한 이미지와 음성 데이터를 활용하려고 했다. 하지만 기관마다 흩어져 있어 접근과 취득에 수개월이 걸렸고, 수집 및 저장에만 수억원이 들었다. 또 다른 의료 AI 스타트업은 방대한 의료 영상 데이터는 외부 반출이 불가능해 병원과의 협업이 무산됐다. 데이터 익명 처리 과정에서 전문가 투입에 따른 추가 비용까지 겹치며 사업이 흔들린 사례도 부지기수다.
이 같은 상황은 초기 스타트업에 큰 장벽으로 다가온다. 학습 데이터 수요는 기하급수적으로 늘고 있지만 스타트업들은 대기업에 비해 각종 데이터에 접근하기가 수월하지 않다.
유럽연합(EU)은 2019년 회원국 간 안전한 데이터 공유와 활용을 추진하는 동시에 글로벌 빅테크 의존을 줄이기 위해 독자 인프라인 ‘가이아-X 프로젝트’를 출범시켰다. 2023년에는 ‘데이터법’을 제정했다. 데이터법은 커넥티드 제품 사용자에게 데이터 활용 권리를 보장하고, 기업 간 불공정 계약을 제한한다. 자동차·의료·제조 분야에서는 기업끼리 데이터 공간을 조성해 산업 데이터를 공유할 수 있도록 제도화했다. 영국은 적극적으로 데이터 산업을 활성화하는 국가로 꼽힌다. 2010년대 초부터 ‘정보경제전략’ ‘오픈데이터 로드맵’ ‘디지털경제법’을 잇달아 제정하며 데이터 산업을 적극 육성해 왔다. 특히 규제 샌드박스를 통해 의료·교통 분야에서 데이터 기반 혁신을 지원하고 있으며, 최근엔 저작권자가 명시적으로 먼저 거부하지 않는 한 AI 학습에 콘텐츠를 자유롭게 활용할 수 있도록 하는 ‘옵트아웃’ 제도까지 검토 중으로 알려졌다. 중국은 2012년 빅데이터를 국가 전략 산업으로 육성하겠다고 선언하며 14차 5개년 계획에 3조 위안을 투입했다. 2023년에는 해외 기업의 투자 유인을 높이기 위해 국경 간 데이터 전송 규제안에 예외 사항을 도입했다.
특정 산업이나 업무 분야에 특화된 ‘버티컬 AI’는 의료·금융·제조 등에서 빠르게 확산 중이다. 다만 고품질 데이터 없이는 운영이 어렵다는 특성 때문에 제도적 기반이 뒷받침되지 않으면 경쟁력이 약화될 수 있다는 경고도 전했다.
최영총 기자 youngchoi@hankyung.com
관련뉴스








