[논문] SV-Detect: 스티어링 벡터를 활용한 AI 생성 텍스트 탐지

발행: (2026년 6월 5일 PM 11:34 GMT+9)
3 분 소요
원문: arXiv

출처: arXiv - 2606.07313v1

개요

기계가 생성한 텍스트를 탐지하는 일은 도메인 간 전이, 출처 모델 차이, 편집 공격과 같은 분포 변화 상황에서 특히 어렵습니다. 우리는 고정된 언어 모델의 은닉 표현에서 추출한 스티어링 벡터를 기반으로 하는 가짜 텍스트 탐지기를 제안합니다. 각 층마다 인간이 작성한 텍스트와 기계가 생성한 텍스트를 구분하는 방향을 구성하고, 입력을 이러한 방향과의 층별 정렬 정도로 표현합니다. 이러한 투영 특징을 이용해 학습된 경량 분류기가 최종 탐지 점수를 제공합니다. 우리의 방법은 도메인, 출처 모델, 그리고 다듬기·재작성과 같은 기계 편집 변환을 포함한 분포 변화 상황에서도 강력한 성능을 보입니다. 해석 분석을 통해 학습된 방향이 인식 가능한 스타일적 단서와 일치하면서도 표면적 특징을 넘어서는 상당한 추가 신호를 포착함을 확인했습니다. 이러한 결과는 가짜 텍스트 탐지를 표현 공간 탐색 문제로 위치시키며, 스티어링 벡터가 간단하면서도 효과적인 해결책임을 보여줍니다.

주요 기여

이 논문은 다음 분야의 연구를 다룹니다:

  • cs.CL
  • cs.AI

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 함의

이 연구는 cs.CL 분야의 발전에 기여합니다.

저자

  • Mikhail Vishnyakov
  • Tatiana Gaintseva

논문 정보

  • arXiv ID: 2606.07313v1
  • 분류: cs.CL, cs.AI
  • 발표일: 2026년 6월 5일
  • PDF: PDF 다운로드
0 조회
Back to Blog

관련 글

더 보기 »