[Paper] 운영 가이드형 점진적 인간‑AI 텍스트 변환 벤치마크: 다중 세분성 AI‑텍스트 탐지를 위해

발행: 6일 전 (2026년 6월 5일 AM 02:58 GMT+9)

4 분 소요

원문: arXiv

Source: arXiv - 2606.06481v1

Overview

AI 작문 보조 도구가 실제 초안 작성 및 수정 워크플로에 점점 더 통합됨에 따라, 많은 문서가 순수히 인간이 작성하거나 AI가 생성한 것이 아니라 인간‑AI 공동 편집을 거쳐 점진적으로 완성됩니다. 기존 AI‑텍스트 탐지 벤치마크는 주로 최종 결과물에 초점을 맞추고 있어, 수정 과정 전반에 걸쳐 AI 저작 신호가 어떻게 나타나고, 누적되며, 사라지는지에 대한 이해가 제한적입니다.

우리는 OpAI‑Bench를 소개합니다. 이는 문서, 문장, 토큰, 구간 수준의 점진적인 인간‑to‑AI 텍스트 변환을 연구하기 위한 운영‑가이드 벤치마크입니다. 인간이 작성한 문서를 시작점으로 삼아, OpAI‑Bench는 사전 정의된 AI 적용 비율과 다섯 가지 대표적인 AI 편집 작업을 기반으로 각 샘플에 대해 9개의 순차적인 수정 버전을 생성합니다. 네 개의 도메인을 포괄하면서 다중 수준에서 완전한 저작권 provenance을 보존합니다.

벤치마크는 다음과 같은 포괄적인 평가를 지원합니다:

문서 수준 탐지기 8개
문장 수준 탐지기 7개
세부 토큰/구간 수준 탐지기 2개

실험 결과, AI 텍스트 탐지 가능성은 AI 편집된 내용의 비율뿐만 아니라 편집 작업 종류, 도메인, 누적된 수정 이력에 의해 좌우된다는 것이 밝혀졌습니다. 특히, 중간 단계의 혼합 저작권 버전은 완전 인간 버전이나 대량 AI 편집 버전보다 탐지가 더 어려운 경우가 많아, 기존 벤치마크에서는 놓치기 쉬운 비단조적 탐지 패턴을 드러냅니다.

OpAI‑Bench는 현실적인 점진 편집 시나리오에서 AI‑보조 작문이 언제, 어떻게 탐지 가능한지를 분석하기 위한 통제된 테스트베드를 제공합니다. 우리의 코드와 벤치마크는 https://github.com/VILA-Lab/OpAI-Bench에서 확인할 수 있습니다.

Key Contributions

cs.CL
cs.AI
cs.LG

Methodology

자세한 방법론은 전체 논문을 참고하십시오.

Practical Implications

이 연구는 cs.CL 분야의 발전에 기여합니다.

Authors

Sondos Mahmoud Bsharat
Jiacheng Liu
Xiaohan Zhao
Tianjun Yao
Xinyi Shang
Yi Tang
Jiacheng Cui
Ahmed Elhagry
Salwa K. Al Khatib
Hao Li
Salman Khan
Zhiqiang Shen

Paper Information

arXiv ID: 2606.06481v1
Categories: cs.CL, cs.AI, cs.LG
Published: June 4, 2026
PDF: Download PDF

[Paper] 운영 가이드형 점진적 인간‑AI 텍스트 변환 벤치마크: 다중 세분성 AI‑텍스트 탐지를 위해

Overview

Key Contributions

Methodology

Practical Implications

Authors

Paper Information

관련 글

[논문] LLM은 주사위 굴리기에서 얼마나 신뢰할 수 있을까?

[논문] MemDreamer: 계층 그래프 메모리와 에이전트형 검색으로 긴 비디오 이해의 지각·추론 분리

[논문] 다중어 표현 분류: 감독 학습 vs 시연 기반 인컨텍스트 학습

[논문] TEVI: 희소 오토인코더를 활용한 텍스트 조건부 시각 표현 편집으로 비전‑언어 정렬 개선