한경 로앤비즈의 'Law Street' 칼럼은 기업과 개인에게 실용적인 법률 지식을 제공합니다. 전문 변호사들이 조세, 상속, 노동, 공정거래, M&A, 금융 등 다양한 분야의 법률 이슈를 다루며, 주요 판결 분석도 제공합니다.

수많은 주제별 카페가 모여 있는 네이버 카페, 혹은 온갖 유머와 깊이 있는 글이 공존하는 '디시인사이드'를 떠올려 보자. 만약 이 커뮤니티에 쌓인 지난 20년간의 모든 대화가 인공지능(AI)을 만드는 핵심 재료가 된다면 어떨까. 더 나아가 구글 같은 거대 기업이 그 '대화'를 사기 위해 매년 수백억 원을 지불한다면 어떨까.
이는 먼 미래의 상상이 아니다. 최근 미국 최대 온라인 커뮤니티인 '레딧(Reddit)'에서 실제로 벌어지고 있는 일이다.
데이터가 돈인 시대, 새로운 독점의 문제
과거 AI 기업들은 레딧의 방대한 데이터를 사실상 공짜로 학습에 사용했다. 하지만 레딧은 최근 구글과 연간 800억 원 규모의 데이터 제공 계약을 체결했다. 사용자가 만든 데이터가 곧 돈이 되는 '데이터 자산화' 시대를 선언한 셈이다. 이는 AI 시대의 경쟁 구도가 어떻게 재편되고 있는지를 보여준다. 이제 경쟁의 핵심은 AI 기술 그 자체가 아니라, AI를 학습시킬 양질의 데이터를 누가 지배하느냐에 달렸다.이 같은 데이터 독점은 경쟁법상 '시장지배적 지위 남용'의 새로운 형태로 평가될 수 있다. 시장조사기관 스태티스타에 따르면 전 세계 생성형 AI 시장의 70% 이상을 상위 4개 빅테크 기업(마이크로소프트·구글·메타·아마존)이 차지하고 있다.
특히 빅테크 기업이 전 세계 클라우드 데이터의 80% 이상을 저장·처리하고 있다는 사실은 데이터 독점의 현실을 여실히 보여준다. 이들이 독점한 데이터는 AI 시장 진입에 필수적인 '필수 설비(Essential Facility)'나 다름없다. 데이터가 없는 신생 기업은 경쟁의 출발선에 서지도 못하는 구조가 고착화되고 있는 것이다.
AI가 만드는 편견과 버블
데이터 독점의 더 큰 위험은 우리 사회 전반에 미치는 영향에 있다. 과거의 차별과 편견이 담긴 데이터를 그대로 학습한 AI는 왜곡된 결과를 마치 객관적 사실인 양 제시한다. AI에게 '의사' 이미지를 요구하면 남성을, '가사도우미' 이미지를 요구하면 여성을 보여주는 식이다. 성차별적 고정관념을 재생산하는 것이다.문제는 여기서 그치지 않는다. 특정 인종에 대한 부정적 데이터를 학습한 AI는 해당 인종을 범죄와 연관 짓는 편견을 드러낸다. 정보가 많은 서구 문화는 표준인 양 여기면서 다른 지역의 문화는 무시하거나 왜곡하기도 한다. AI가 제시하는 편향된 정보는 지능적으로 검증된 사실이라는 착각을 불러일으킨다. 결국 AI와 인간은 서로의 편견을 되비추고 증폭시키는 '거울의 방'에 갇히게 된다.
이 위험한 거울은 경제마저 뒤흔든다. 한국정보화진흥원(NIA)에 따르면 국내 개인투자자의 35%가 주식 거래에 AI 분석 서비스를 활용한 경험이 있다. 과거 전문가만 해석하던 복잡한 차트를 AI가 분석해 '강력 매수' 신호를 보내고, 그럴듯한 리포트까지 몇 초 만에 생성하니 투자자는 강한 심리적 확신을 얻는다.

문제는 다수의 투자자가 소수의 인기 AI 서비스에 몰린다는 점이다. 만약 특정 AI가 한 종목에 '강력 매수' 신호를 포착해 수십만 명에게 동시에 알렸다고 상상해 보자. AI를 신뢰하는 투자자들의 주문이 한꺼번에 몰리면서 주가는 기업의 실제 가치와 무관하게 급등한다. 주식시장에서는 거래량 급증 자체가 또 다른 매수 신호로 해석돼 추격 매수를 부른다. AI의 예측이 곧 현실이 되는, '알고리즘이 만든 자기실현적 예언'이 완성되는 순간이다.
이는 마치 광장에 모인 관광객이 한 AI 가이드가 가리키는 곳으로만 달려가는 '디지털 떼 현상(Digital Herding Behavior)'과 같다. 그러나 그 AI 가이드가 편향된 지도를 보고 있었거나, 모두가 몰려간다는 사실 자체가 그곳을 '맛집'으로 둔갑시킨 것이라면? 펀더멘털이 뒷받침되지 않은 버블은 결국 터지고, 그 피해는 뒤늦게 뛰어든 개인 투자자에게 돌아간다.
공정한 데이터 생태계를 향한 대안
그렇다면 대안은 무엇일까. '데이터를 강제로 공개하라'는 식의 재산권 침해 논란을 부를 해법보다, 데이터가 공정하게 흐를 수 있는 물길을 트는 현실적 접근이 필요하다.먼저 데이터 주권을 기업이 아닌 이용자에게 돌려주는 발상의 전환이 요구된다. 핵심은 '데이터 이동권(Data Portability)'의 실질적 보장이다. 과거 통신사들이 독점적 지위를 누리다 번호 이동성 제도가 도입되면서 경쟁 체제로 전환됐듯, 플랫폼에 묶인 데이터의 자유로운 이동을 보장해야 한다. 유럽연합(EU)의 디지털시장법(DMA)은 거대 플랫폼 기업에 이용자가 원하면 자신의 데이터를 경쟁 서비스로 실시간 이전할 수 있는 기술적 장치(API 등)를 의무적으로 제공하도록 규정한다. 이는 데이터 독점의 성벽을 허무는 가장 현실적인 대안이다.

다음으로 독점이 형성되기 전 단계에서 선제적으로 대응하는 예방적 규제가 중요하다. AI 기업의 인수·합병(M&A)에 대한 경쟁 당국의 심사가 그중 하나다. 현행법이 거래금액 기준으로 기업결합신고 대상을 확대한 것은 의미 있는 진전이지만, 진정한 과제는 그 내용을 채우는 것이다. 매출액 같은 전통적 지표를 넘어 피인수 기업이 보유한 데이터의 가치와 기술 잠재력이 미래 경쟁에 미칠 영향을 분석할 새로운 평가 모델을 마련하고, 핵심 인재가 소수 기업에 쏠리는 현상을 막는 정교한 심사 기준을 세워야 한다.
마지막으로 독점에 맞서는 새로운 기술 생태계를 조성해야 한다. 특정 기업에 종속되지 않는 '오픈소스 AI 모델 생태계’의 활성화가 핵심이다. 이는 AI의 '공개된 설계도' 혹은 '엔진'을 무료로 공유하는 개념으로, 스타트업들이 거인의 어깨 위에서 더 적은 비용으로 혁신적인 서비스를 개발할 토대가 된다. 정부와 산업계는 이런 오픈소스 커뮤니티를 적극 지원하는 한편, 인종·성별·지역 등 사회 곳곳의 다양한 목소리를 균형 있게 담은 양질의 공공 데이터를 개방해야 한다. 이는 AI 기술의 민주화를 촉진함과 동시에 편향된 상업 데이터의 '해독제' 역할을 할 것이다.
AI라는 거울이 우리의 편견이 아닌 지혜를 비추게 할지, 그 선택의 기로에 우리가 서 있다.
관련뉴스








