[논문] 대형 언어 모델을 활용한 인용 오류 탐지 및 해석 분석

발행: (2026년 6월 7일 PM 09:01 GMT+9)
3 분 소요
원문: arXiv

출처: arXiv - 2606.08589v1

개요

Purpose - 인용 오류는 인용된 정보와 원본 출처 사이의 불일치를 의미한다. 이 현상은 원본 연구의 오해, 학계 공동의 관련 이슈에 대한 이해 저해, 인용 기반 학술 평가 시스템의 정확성과 공정성 약화 등 일련의 부정적 영향을 초래한다. 기존 연구에 따르면 인용 오류는 학계 전반에 널리 존재하며, 수동으로 인용 오류를 검증하는 것은 노동 집약적일 뿐만 아니라 비효율적이다. 따라서 본 논문은 ‘인용 오류 자동 탐지’ 작업을 제안한다.
방법론 - 대형 언어 모델(LLM) 기반 접근법을 채택하여, 기존 연구를 바탕으로 두 측면에서 탐지 성능을 향상시킨다: 첫째, LLM을 미세 조정(fine‑tuning)하여 인용 오류를 탐지하고; 둘째, 인용된 문헌의 전체 텍스트 데이터를 데이터셋 구축에 포함시키며, 세 가지 전체 텍스트 통합 방법을 비교하여 최적의 데이터셋 구축 방안을 탐색한다. 이를 바탕으로 본 논문은 TokenSHAP 도구를 활용해 모델 예측 결과에 대한 해석 가능성 실험 분석을 수행한다.
결과 - LLM에 대한 미세 조정 접근법은 인용 오류 탐지 성능을 향상시켰다. 전체 텍스트 정보를 통합하는 다양한 방법 중, 원문 초록을 활용한 접근법이 가장 높은 성능을 보였다.
독창성 - 대형 언어 모델(LLM)의 미세 조정 접근법을 인용 오류 자동 탐지 작업에 적용하고, 모델 출력 결과에 대한 해석 가능성 분석을 수행하였다.

주요 기여

이 논문은 다음 분야의 연구를 제시한다:

  • cs.CL
  • cs.DL
  • cs.IR

방법론

전체 논문을 참고하시어 자세한 방법론을 확인하십시오.

실용적 함의

이 연구는 cs.CL 분야의 발전에 기여합니다.

저자

  • Bei Huang
  • Yingyi Zhang
  • Shenghao Huang
  • Chengzhi Zhang

논문 정보

  • arXiv ID: 2606.08589v1
  • 분류: cs.CL, cs.DL, cs.IR
  • 출판일: 2026년 6월 7일
  • PDF: PDF 다운로드
0 조회
Back to Blog

관련 글

더 보기 »