보르헤스 도서관: 디지털
출처: Dev.to
보르헤스의 ‘바벨의 Biblioteca’는 현대 인공지능에 대한 강력한 집착과 메타포가 되었다. 1941년 raccon는 무한히 많은 육각형 통로로 구성된 Biblioteca를 묘사한다. 여기서 각 책은 25개의 구문 기호 조합을 모두 포함하고 있다.
그 안에는 ‘미래의 미세한 역사, 아크앵젤라의 자서전, Biblioteca의 충실한 카탈로그, 수천 개의 가짜 카탈로그, 그 카탈로그들의 허위의 증명, 진정한 카탈로그의 허위의 증명’ — 그러나 거의 모든 볼륨은 의미 없는 소음일 뿐이다.
이 시나리오는 LLM(대형 언어 모델) 문제의 근본적인 문제를 정확히 예고한다. Léon Bottou는 완벽한 언어 모델이 단순히 첫 단어를 입력하는 것으로 무한히 많은 설득력 있는 텍스트를 탐색할 수 있게 한다고 지적했다. 하지만 ‘진짜와 거짓, 유용함과 오해, 정답과 오류가 구분될 수 없다’고 말했다.
Jonathan Basile, libraryofbabel.info 사이트의 창조자는 자신의 작품을 인공지능과 구분한다고 명시했다. “바벨은 비합리적이고 무관계한 형태의 전체 표현이다. 나는 이를 ‘무의식 인공지능’이라 부르고 싶다”고 말했다.
그러나 역설적으로 현대 인공지능은 우리가 전례 없이 빠르게 바벨의 Biblioteca를 구현하게 만들었다. 이제 그것은 물리적 책의 우주가 아니라 즉시 생성되는 디지털 텍스트의 우주이며, 진실은 무한히 많은 거짓 변형에 둘러싸여 있다.
보르헤그의 교훈은 두 가지다. 첫째, IA는 탐색 도구로 사용될 수 있다: Biblioteca의 ‘gibberish’(소음)에서 영단어를 추출하는 Natural Language Processing을 활용한다. 이는 Basile이 만든 ‘Anglishize’ 기능을 보여준다.
둘째, 윤리적 경고다: 만약 우리가 Biblioteca를 완전히 IA에게 맡긴다면, 탐색 자체의 가치를 잃게 될 것이다.
보르헤그의 도서관사들은 삶을 책들을 스크롤하며 보낸다. 그 기쁨은 수년의 노력 끝에 겨우 가독 가능한 텍스트 조각을 찾는 데 있다.
진실은 ‘완벽하게 포장된 답변’에 나타나지 않고, 혼란과 실패 속에서 단단해진다.
암 분야에서는 이 비유가 구체화되었다. 유전체 데이터 페타바이트, 임상 가이드라인, 시험 결과는 모두 바벨의 Biblioteca와 유사하며, IA는 소음을 지식을 전달하는 ‘인간 책’으로 여겨진다.
하지만 IBM Watson for Oncology의 실패는 — 의료 문헌을 소화하고 증거 기반 치료를 제안할 수 있다고 약속했으나, 부적합하고 너무 자명하거나 단순히 무관한 결과를 보여주었다 — 그조차 가장 고도한 IA도 ‘바벨의 Biblioteca에서 또 다른 목소리’가 될 위험이 있음을 증명한다. 즉, 유창하지만 신뢰할 수 없다.
보르헤그는 이야기로 끝맺으며 역설적인 희망의 제스처를 남긴다. Biblioteca는 ‘무한하고 순환적’이다. 영원한 여행자가 어느 방향으로 attravers한다면, 세기 후에 동일한 무질서 속에 반복되는 볼륨을 발견하게 되며, ‘반복되면 질서가 된다’는 말이다.
따라서 IA가 무한히 생성하는 콘텐츠에도 일관성은 기계 자체에서 비롯되지 않고 인간 판단과 알고리즘 정확도의 협력에서 나온다.
바벨의 Biblioteca는 위협이 아니라 탐색을 멈추지 말고 진실을 위임하지 않으며, 혼돈 속에서도 아름다움을 찾는 초대이다.