연구 논문 저장소 arXiv, AI가 전부 작업한 경우 저자를 1년간 차단.
출처: TechCrunch
ArXiv은 널리 사용되는 사전 인쇄 연구 저장소로, 과학 논문에서 대형 언어 모델(LLM)의 부주의한 사용을 단속하기 위해 더 강력한 조치를 취하고 있습니다.
논문이 동료 검토를 받기 전에 사이트에 게시되지만, arXiv(발음은 “archive”)는 컴퓨터 과학·수학 등 분야에서 연구가 유통되는 주요 경로 중 하나가 되었으며, 이 사이트 자체가 과학 연구 동향에 대한 데이터 소스가 되었습니다(관련 기사).
arXiv는 이미 저품질 AI 생성 논문의 급증에 대응하기 위해 조치를 취해 왔습니다. 예를 들어, 처음 논문을 올리는 사람은 기존 저자의 추천 endorsement을 받아야 합니다(Science 기사). 또한 20년 넘게 코넬 대학이 호스팅해 온 이 조직은 이제 독립 비영리 단체가 되어, AI 관련 문제 해결을 위한 자금 조달을 확대할 수 있게 되었습니다(관련 기사).
가장 최근의 움직임에서, arXiv 컴퓨터 과학 섹션 의장인 Thomas Dietterich는 목요일에 트위터에 다음과 같이 게시했습니다(트윗, 블루스카이):
“제출물에 LLM 생성 결과를 검증하지 않았다는 명백한 증거가 포함돼 있다면, 우리는 그 논문의 어떤 내용도 신뢰할 수 없습니다.”
그 명백한 증거에는 **‘허구의 참고문헌’**이나 LLM과 주고받은 주석 등이 포함될 수 있다고 Dietterich는 설명했습니다. 이러한 증거가 발견되면 해당 논문의 저자는 **‘1년간 arXiv 이용 금지’**와 함께, 이후 제출되는 모든 논문이 신뢰할 수 있는 동료 검토 저널에 먼저 게재 승인을 받아야 한다는 조건을 부과받게 됩니다.
이는 LLM 사용 자체를 금지하는 것이 아니라, **‘내용이 어떻게 생성되었든 간에 전적인 책임을 진다’**는 입장을 강조하는 것입니다. 즉, 연구자가 LLM에서 부적절한 언어, 표절된 내용, 편향된 내용, 오류, 잘못된 참고문헌, 오해를 불러일으키는 내용 등을 그대로 복사‑붙여넣기했다면, 그 책임은 전적으로 연구자에게 있습니다.
Dietterich는 404 Media와의 인터뷰에서 이번 규정이 ‘원 스트라이크(one‑strike)’ 규칙이라고 밝혔으며, 중재자는 문제를 신고하고 섹션 의장이 증거를 확인한 뒤 벌칙을 적용한다는 점을 강조했습니다. 또한 저자는 판정에 대해 항소할 수 있는 권리를 갖게 됩니다.
최근 동료 검토 연구에 따르면, 생성된 인용문이 증가하고 있으며 이는 주로 LLM 사용 때문이라고 합니다(Lancet 논문). 그러나 과학자들만이 AI가 만든 허위 인용을 사용해 적발되는 것은 아니라는 점도 지적되었습니다(TechCrunch 기사).
우리 기사에 포함된 링크를 통해 구매가 이루어질 경우, 소액의 커미션을 받을 수 있습니다. 이는 편집 독립성에 영향을 주지 않습니다.
Anthony Ha는 TechCrunch 주말 편집자입니다. 이전에는 Adweek에서 기술 기자, VentureBeat에서 수석 편집자, Hollister Free Lance에서 지방 정부 기자, 한 벤처 캐피털 회사에서 콘텐츠 부사장을 역임했습니다. 현재 뉴욕시에 거주하고 있습니다.
Anthony에게 연락하거나 그의 발언을 확인하려면 anthony.ha@techcrunch.com 으로 이메일을 보내 주세요.