'고품질 데이터에 비용 지불' 정부 방침에 부응…데이터거래소서 매매

(베이징=연합뉴스) 정성조 특파원 = 중국에서 '잠자고 있던' 의료 데이터의 거래가 본격화하고 있다고 경제 매체 차이신이 20일 전했다.
보도에 따르면 최근 동부 산둥성 산둥제1의과대학 제1부속병원(첸포산의원)의 '간 질환 임상 계보와 이식 상태' 데이터세트가 3만위안(약 650만원)에 의료 업체 산둥산커즈신에 판매됐다. 이는 산둥성 최초의 의료 데이터 거래다.
이번 거래 데이터세트에는 비(非)식별 처리된 1천여건의 임상 사례가 포함됐고, 간 이식 여부 평가가 필요한 간 기능 부전 데이터들이 수록돼있다.
데이터세트를 사들인 산둥산커즈신은 이를 간 질환 보조 진단 모델에 활용할 계획이다.
중국 국가데이터국 등 17개 정부 부처는 지난 2024년 의료·건강 등 12개 분야에서 데이터 요소의 부가가치 창출을 독려하는 3개년계획을 내놓은 바 있다.
베이징시는 그해 공립병원 의료 데이터 거래를 처음 성공시켰고, 베이징 국제빅데이터교역소에서는 2천550여건의 데이터가 포함된 경동맥 스텐트 수술 데이터세트가 매매되기도 했다.
의료 데이터 거래는 올해 한층 활발해졌다.
류례훙 국가데이터국장은 지난달 기자회견에서 '고품질 데이터에 대한 대가 지불'이라는 시장 합의를 지속해서 만들어 나가고, 업계의 고품질 데이터세트가 데이터 거래소에 상장·거래되도록 하겠다는 입장을 확인했다.
지방 의료기관과 업체들도 적극적이다.
올해 1월에는 동남부 푸젠성 민칭현 종합병원의 신경내과·심장내과·노인과 데이터 자원이 베이징 국제빅데이터교역소에서 45만위안(약 9천700만원)에 거래됐다.
남부 광둥성 선전 데이터교역소의 의료·건강 파트에는 선전시 인민병원과 선전시 여성·아동보건원 등 공립병원 두 곳의 데이터 상품이 나와 있다. 선전시 인민병원의 상품은 2015녀부터 현재까지 노인 환자 임상 진료 데이터로 기본적인 인구통계학 정보와 진료 정보, 영상·실험실 검사 정보 등이 포함됐다. 병력·소견 등 텍스트 데이터는 인공지능(AI) 구조화 처리를 거친 데이터필드로 제공된다.
동부 저장성 원저우시가 연내 45건 이상의 의료 데이터 제품을 시장에 내놓고 10건 이상의 거래를 완수하겠다는 목표를 발표하는 등 지방정부 차원에서도 데이터 거래를 독려하는 움직임이 나오고 있다.
차이신은 현재 의료 데이터세트 거래 사례들을 종합하면 AI 영상 진단 보조 모델과 질병 진단 모델 훈련, 의약품·의료기기 연구·개발, 과학 연구 등이 주된 목적이고, 의료 AI 기업과 혁신 의약품·의료기기 개발 업체, 연구기관 등이 잠재적 구매자라고 설명했다.
의료 데이터 거래의 전제는 '품질'이다. 외부 업체가 활용 가능하도록 원 데이터를 가공해야 하는데, 여기에는 시간적 비용과 소프트웨어·하드웨어 투자가 필요하다고 차이신은 짚었다.
차이신 인터뷰에 응한 한 관계자는 "병원이 축적한 진료 데이터 대다수는 (업체들이) 곧장 사용할 수 없는 '더러운 데이터'로, 데이터 세척 및 라벨링 과정을 거쳐야 대형언어모델(LLM) 훈련에 사용하는 고품질 데이터가 될 수 있다"고 설명했다.
xing@yna.co.kr
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>
관련뉴스







