[Paper] 운영 가이드형 점진적 인간‑AI 텍스트 변환 벤치마크: 다중 세분성 AI‑텍스트 탐지를 위해
Source: arXiv - 2606.06481v1
Overview
AI 작문 보조 도구가 실제 초안 작성 및 수정 워크플로에 점점 더 통합됨에 따라, 많은 문서가 순수히 인간이 작성하거나 AI가 생성한 것이 아니라 인간‑AI 공동 편집을 거쳐 점진적으로 완성됩니다. 기존 AI‑텍스트 탐지 벤치마크는 주로 최종 결과물에 초점을 맞추고 있어, 수정 과정 전반에 걸쳐 AI 저작 신호가 어떻게 나타나고, 누적되며, 사라지는지에 대한 이해가 제한적입니다.
우리는 OpAI‑Bench를 소개합니다. 이는 문서, 문장, 토큰, 구간 수준의 점진적인 인간‑to‑AI 텍스트 변환을 연구하기 위한 운영‑가이드 벤치마크입니다. 인간이 작성한 문서를 시작점으로 삼아, OpAI‑Bench는 사전 정의된 AI 적용 비율과 다섯 가지 대표적인 AI 편집 작업을 기반으로 각 샘플에 대해 9개의 순차적인 수정 버전을 생성합니다. 네 개의 도메인을 포괄하면서 다중 수준에서 완전한 저작권 provenance을 보존합니다.
벤치마크는 다음과 같은 포괄적인 평가를 지원합니다:
- 문서 수준 탐지기 8개
- 문장 수준 탐지기 7개
- 세부 토큰/구간 수준 탐지기 2개
실험 결과, AI 텍스트 탐지 가능성은 AI 편집된 내용의 비율뿐만 아니라 편집 작업 종류, 도메인, 누적된 수정 이력에 의해 좌우된다는 것이 밝혀졌습니다. 특히, 중간 단계의 혼합 저작권 버전은 완전 인간 버전이나 대량 AI 편집 버전보다 탐지가 더 어려운 경우가 많아, 기존 벤치마크에서는 놓치기 쉬운 비단조적 탐지 패턴을 드러냅니다.
OpAI‑Bench는 현실적인 점진 편집 시나리오에서 AI‑보조 작문이 언제, 어떻게 탐지 가능한지를 분석하기 위한 통제된 테스트베드를 제공합니다. 우리의 코드와 벤치마크는 https://github.com/VILA-Lab/OpAI-Bench에서 확인할 수 있습니다.
Key Contributions
- cs.CL
- cs.AI
- cs.LG
Methodology
자세한 방법론은 전체 논문을 참고하십시오.
Practical Implications
이 연구는 cs.CL 분야의 발전에 기여합니다.
Authors
- Sondos Mahmoud Bsharat
- Jiacheng Liu
- Xiaohan Zhao
- Tianjun Yao
- Xinyi Shang
- Yi Tang
- Jiacheng Cui
- Ahmed Elhagry
- Salwa K. Al Khatib
- Hao Li
- Salman Khan
- Zhiqiang Shen
Paper Information
- arXiv ID: 2606.06481v1
- Categories: cs.CL, cs.AI, cs.LG
- Published: June 4, 2026
- PDF: Download PDF