[논문] 대형 언어 모델을 활용한 인용 오류 탐지 및 해석 분석

발행: 3일 전 (2026년 6월 7일 PM 09:01 GMT+9)

3 분 소요

원문: arXiv

출처: arXiv - 2606.08589v1

개요

Purpose - 인용 오류는 인용된 정보와 원본 출처 사이의 불일치를 의미한다. 이 현상은 원본 연구의 오해, 학계 공동의 관련 이슈에 대한 이해 저해, 인용 기반 학술 평가 시스템의 정확성과 공정성 약화 등 일련의 부정적 영향을 초래한다. 기존 연구에 따르면 인용 오류는 학계 전반에 널리 존재하며, 수동으로 인용 오류를 검증하는 것은 노동 집약적일 뿐만 아니라 비효율적이다. 따라서 본 논문은 ‘인용 오류 자동 탐지’ 작업을 제안한다.
방법론 - 대형 언어 모델(LLM) 기반 접근법을 채택하여, 기존 연구를 바탕으로 두 측면에서 탐지 성능을 향상시킨다: 첫째, LLM을 미세 조정(fine‑tuning)하여 인용 오류를 탐지하고; 둘째, 인용된 문헌의 전체 텍스트 데이터를 데이터셋 구축에 포함시키며, 세 가지 전체 텍스트 통합 방법을 비교하여 최적의 데이터셋 구축 방안을 탐색한다. 이를 바탕으로 본 논문은 TokenSHAP 도구를 활용해 모델 예측 결과에 대한 해석 가능성 실험 분석을 수행한다.
결과 - LLM에 대한 미세 조정 접근법은 인용 오류 탐지 성능을 향상시켰다. 전체 텍스트 정보를 통합하는 다양한 방법 중, 원문 초록을 활용한 접근법이 가장 높은 성능을 보였다.
독창성 - 대형 언어 모델(LLM)의 미세 조정 접근법을 인용 오류 자동 탐지 작업에 적용하고, 모델 출력 결과에 대한 해석 가능성 분석을 수행하였다.

주요 기여

이 논문은 다음 분야의 연구를 제시한다:

cs.CL
cs.DL
cs.IR

방법론

전체 논문을 참고하시어 자세한 방법론을 확인하십시오.

실용적 함의

이 연구는 cs.CL 분야의 발전에 기여합니다.

저자

Bei Huang
Yingyi Zhang
Shenghao Huang
Chengzhi Zhang

논문 정보

arXiv ID: 2606.08589v1
분류: cs.CL, cs.DL, cs.IR
출판일: 2026년 6월 7일
PDF: PDF 다운로드

[논문] 대형 언어 모델을 활용한 인용 오류 탐지 및 해석 분석

개요

주요 기여

방법론

실용적 함의

저자

논문 정보

관련 글

[논문] 추론이 정렬을 유지할까? 대규모 추론 모델의 신뢰성에 대하여

[논문] AuRA: 오디오 이해를 LoRA 방식으로 LLM에 내재화

[논문] 순차 추천을 위한 생성적 전형 기반 아이템 표현

[논문] 소셜 미디어 텍스트에서 인간 가치 표현 측정: 보정된 LLM 주석 및 인코더 전이