[논문] 정확성을 넘어: 기계 번역에 대한 커뮤니티 관점
개요
기계 번역(MT)의 눈부신 발전에도 불구하고, 비AI 커뮤니티에서는 MT 시스템에 대한 우려가 커지고 있습니다. 이는 기술적 진보와 실제 사용자들의 요구 사이에 눈에 띄는 격차가 존재한다는 점을 시사합니다. 예를 들어, NLP 연구자들은 벤치마크 성능에 집중하는 반면, 최종 사용자는 윤리적 문제, 신뢰성, 안정성, 비용 등 다양한 요소를 중요하게 생각합니다. 우리는 다양한 사용자 커뮤니티의 목소리를 듣는 것이 필수적이며, 그래야 연구 노력이 실제 커뮤니티가 관심을 갖는 문제에 맞춰질 수 있다고 주장합니다. 이를 위해 우리는 처음으로 네 개의 이해관계자 커뮤니티(AI 개발자, 전문 번역가, 언어 학습자, 언어 서비스 제공업체)가 소셜 미디어에 올린 MT 기술에 관한 게시물을 대규모로 분석했습니다. 2019년부터 2025년까지 Reddit, Facebook, Bluesky, Mastodon에서 수집한 79,286개의 게시물 및 댓글 데이터셋을 구축하고, 이들 커뮤니티가 어디에서 의견이 갈리는지, 그리고 그 이유와 방식을 분석했습니다. 전반적으로 커뮤니티 간에 의견 차이가 자주 발생하며, 번역 품질, 효율성, 신뢰성 같은 주제에 대해 극단적인 감정 대립이 나타나는 것을 발견했습니다. 이는 각 커뮤니티가 해당 주제를 바라보는 관점이 다르기 때문입니다. AI 커뮤니티는 이를 기술적·계산적 문제로 프레이밍하는 반면, 비AI(사용자) 커뮤니티는 품질의 미세 차이, 시간 절감, 사용자 신뢰, 그리고 보다 넓은 사회적 이슈에 더 큰 관심을 갖습니다.
주요 기여
이 논문은 다음 분야의 연구를 제시합니다.
- cs.CL
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실용적 함의
본 연구는 cs.CL 분야의 발전에 기여합니다.
저자
- Yujun Wang
- Ehud Reiter
- Shimei Pan
- Steffen Eger
- Wei Zhao
논문 정보
- arXiv ID: 2606.09655v1
- 분류: cs.CL
- 발표일: 2026년 6월 8일
- PDF: PDF 다운로드