책을 가장 많이 읽는 ‘존재’는 무엇일까. 아마도 인공지능(AI)이지 싶다. 근거 없는 추측만은 아니다. 2023년 챗GPT 개발사인 오픈AI와 메타(페이스북)는 무단 복제 도서 데이터베이스인 ‘북 3’로 AI를 학습시켜 지식재산권을 침해했다는 혐의로 피소됐다.당시 학습 데이터로 지목된 것은 19만1000권의 전자책. 윌리엄 셰익스피어와 찰스 디킨스의 고전부터 애거사 크리스티, 스티븐 킹, 무라카미 하루키, 모옌 등 현대 인기 작가의 문제작까지 다양한 책이 망라됐다. 여행 가이드북과 음란소설, 각종 실용 서적도 학습 대상에 포함됐다. 문자 그대로 인간이 평생 읽어내지 못할 분량을 거침없이 머릿속에 집어넣는 ‘리딩 머신’이 등장한 것이다.
수불석권(手不釋卷)이란 표현은 하루 24시간을 독서로 보내는 AI에 딱 맞는 묘사가 됐다. 이처럼 AI가 쉼 없이 책장을 펴는 것은 성능을 높이기 위해서다. 고품질 AI를 개발하기 위해서는 가장 정제된 고품질 텍스트가 필요하다. ‘쓰레기를 넣으면 쓰레기가 나온다(Garbage in, Garbage out)’는 프로그래밍 격언에 충실하게 양질의 AI를 제작하는 작업은 기초 단계부터 더없이 신중하다.
AI와 달리 인간은 책과 거리가 점점 멀어지고 있다. 정교하게 논리적으로 구성된 텍스트를 처음부터 끝까지 머리를 싸매며 독파하는 글 읽기 방식은 시대착오적인 구시대 유산이 되고 있다. 책을 꽤 읽는다는 이들도 한 문장에서 다음 문장 넘어가는 도중에 수시로 스마트폰으로, 컴퓨터 화면으로 눈길이 옮겨간다. 독서는 어느새 책과 인터넷, 유튜브, 넷플릭스 사이를 오가는 분산적인 활동 중 하나가 됐다. 하긴 독서가 대중화한 것은 인쇄술 등장 이후 몇백년 되지 않은 현상이니 책과 멀어지는 것은 어쩌면 인간 본연의 특질로 돌아가는 것일 수도 있다.
그렇게 사람들이 책을 읽지 않고, 정보를 업데이트하지 않은 결과일까. ‘여당 간사가 벼슬이냐’는 비아냥에 “왜 닭에 비유하냐”며 직위와 동물의 신체 부위를 구분하지 못하고 발끈하는 정치인, “나라에서 (재벌에) 세율 90%를 적용하는 데 꼭 근거가 있어야 하나”라며 법치주의의 근간을 부정하는 국회의원 같은 ‘무식함’과 연관된 민망한 뉴스를 접하는 경험도 부쩍 늘었다.
하지만 아무리 AI가 방대한 독서를 하더라도 그것이 인간이 책을 읽는 것과 같은 것일까. 인간이 과거의 경험에서 교훈을 얻고, 새로운 것을 창조해 내듯 AI도 거대한 데이터베이스 더미에서 새로운 것을 만들 수 있을까. 이미 AI가 인간을 뛰어넘었다는 평이 적지 않지만, 온고지신(溫故知新)만은 여전히 AI에 버거워 보인다. 데이터베이스는 아무리 방대해도 과거의 기록일 뿐 미래를 말하지 않기 때문이다.
AI가 계산과 프로그래밍 영역에선 바둑의 신수(新手)처럼 새로운 길을 제시했다. 하지만 대부분 분야에서 AI가 제시하는 그럴듯한 ‘창조’는 알고리즘 속에 던져진 정보가 빚어낸 껍데기 같은 결과물일 가능성이 높다. 돌에 관한 수백만 개의 데이터를 AI가 분석한다고 미켈란젤로의 조각 같은 한 단계 ‘도약’하는 작품을 보장할 수는 없지 않나.
350만 권의 장서를 보유한 미국 하버드대 와이드너 도서관은 농담 반 진담 반 ‘책의 무덤’으로 불렸다. 나침반, 샌드위치, 호루라기를 꼭 챙겨야 한다는 그곳에서 종이책에 담긴 낡은 내용은 인간의 뇌와 심장을 거쳐 새로운 사상으로 부활하고는 했다. 초당 1.8테라바이트(TB) 정보가 오간다는 엔비디아의 ‘블랙웰’이 아무리 성능을 개선해도 감히 범접하기 어려운 인간 독서의 영역이다.
관련뉴스








