[논문] 소셜 미디어 텍스트에서 인간 가치 표현 측정: 보정된 LLM 주석 및 인코더 전이
Source: arXiv - 2606.11018v1
Overview
자연 발생적인 소셜 미디어 텍스트에서 주관적 구성을 측정하려면 이론적으로 기반을 두고, 실증적으로 검증되며, 확장 가능한 예측을 위해 인코더 모델에 전이 가능한 주석 절차가 필요합니다. 기본 인간 가치에 대한 Schwartz 이론에 따라 주석된 비영어 소셜 미디어 게시물을 활용하여, 서로 다른 LLM, 프롬프트, 그리고 지시 언어가 텍스트에서 가치 표현을 어떻게 구체화하는지를 조사합니다. 텍스트는 여러 타당한 해석을 허용할 수 있지만, 이론 기반의 가치 정의가 해석을 제한하고 잘못된 가치 귀속을 감소시킬 수 있다고 주장합니다. 정밀도, 재현율, F1 외에도 가치 간 구조적 정렬, 오류 구조, 신뢰도‑모호성 관계, 그리고 주석 안정성을 평가합니다. 서로 다른 LLM이 서로 다른 가치 해석을 생성한다는 것을 보여줍니다. 오류 분석을 통한 반복적인 프롬프트 보정은 오귀속을 줄이고 전문가 주석과의 정렬을 향상시킵니다. 또한 반복되는 오류 구조에서 도출된 목표 전문가 검증 규칙을 만들고 이를 코퍼스 주석 과정에 적용합니다. 마지막으로, LLM 주석을 소프트 라벨 학습을 통해 인코더 모델에 전이시켜, 이론 기반 가치 해석과 가치 표현에 대한 불확실성 정보를 유지함을 입증합니다.
Key Contributions
이 논문은 다음 분야의 연구를 제시합니다.
- cs.CL
Methodology
자세한 방법론은 전체 논문을 참고하십시오.
Practical Implications
이 연구는 cs.CL 분야의 발전에 기여합니다.
Authors
- Maria Milkova
- Maksim Rudnev
Paper Information
- arXiv ID: 2606.11018v1
- Categories: cs.CL
- Published: 2026년 6월 9일
- PDF: Download PDF