[논문] 제3자 감사를 넘어: 사용자 중심 LLM 편향 연구를 위한 상황적 상호작용 감사

발행: 3일 전 (2026년 6월 11일 AM 12:48 GMT+9)

3 분 소요

원문: arXiv

Source: arXiv - 2606.12247v1

개요

대형 언어 모델(LLM)의 편향에 관한 연구는 주로 제3자 감사를 중심으로 진행되어 왔으며, 이는 모델이 인구통계학적 집단을 외부 주체로 어떻게 표현하거나 평가하는지를 조사합니다. 그러나 이러한 패러다임은 사용자가 감시에서 제외된다는 구조적 맹점을 간과합니다. 실제로 LLM은 개방형·개인화된 상호작용에서 사용되며, 이 과정에서 모델은 암묵적으로 사용자를 표현하고 그에 맞춰 응답을 조정합니다. 동일한 요청이 누가 묻느냐에 따라 다른 응답을 보일 때, 편향은 모델이 타인을 어떻게 묘사하는가가 아니라 대화 상대를 어떻게 대하는가에서 나타납니다. 우리는 사용자 중심 프레임워크인 상황적 상호작용 감사(Situated Interaction Auditing, SIA)를 제안합니다. 이는 사용자 프로필 신호—암묵적인 사회인구학적 표시, 글쓰기 스타일, 명시된 정체성—가 LLM의 응답 품질, 내용, 어조에 어떻게 체계적으로 영향을 미치는지를 연구합니다. 우리는 성별과 사회경제적 지위 신호가 여러 작업 영역에 교차하는 사례 연구를 통해 이 프레임워크를 시연하고, 자연어 처리 분야의 새로운 사명으로서 SIA를 위한 연구 과제를 제시합니다.

주요 기여

이 논문은 다음 분야의 연구를 제시합니다:

cs.CY
cs.CL

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 함의

이 연구는 cs.CY 분야의 발전에 기여합니다.

저자

Andrés Abeliuk
Cinthia Sanchez Macias
Valentina Alarcón
Álvaro Madariaga
Claudia Lopez

논문 정보

arXiv ID: 2606.12247v1
분류: cs.CY, cs.CL
발표일: 2026년 6월 10일
PDF: Download PDF

[논문] 제3자 감사를 넘어: 사용자 중심 LLM 편향 연구를 위한 상황적 상호작용 감사

개요

주요 기여

방법론

실용적 함의

저자

논문 정보

관련 글

[논문] 완전 무작위 마스킹을 넘어: 어텐션 기반 디노이징 및 최적화, 확산 언어 모델을 위한.

[논문] 폴란드 의학 시험에서 고성능 LLM 재평가: 진정한 실력인가, 편향에 의한 성과인가?

[논문] VIA‑SD: 추측 디코딩을 위한 모델 내부 라우팅 기반 검증

[논문] LLM 컨디셔닝의 효율성‑유창성 트레이드오프: 체계적 연구