[논문] 분산 시스템에서 효율적이고 견고한 온라인 순위 학습

발행: 3일 전 (2026년 6월 11일 AM 12:48 GMT+9)

4 분 소요

원문: arXiv

출처: arXiv - 2606.12246v1

개요

온라인 학습 순위 매기기(Online Learning to Rank, OLTR)에서는 실시간 사용자 상호작용으로부터 직접 순위 모델을 학습하지만, 기존 시스템은 이러한 상호작용을 수집·처리하기 위해 신뢰할 수 있는 중앙 서버에 의존합니다. 이로 인해 운영자는 사용자 이익과 충돌하는 편향을 자유롭게 도입할 수 있습니다. 탈중앙화 학습은 매력적인 대안을 제공하는데, 중앙 권한 없이 사용자들이 서로 직접 모델 업데이트를 교환함으로써 공동으로 공유 순위 모델을 학습할 수 있게 합니다. 그러나 이러한 환경에서는 악의적인 노드가 독성 모델 업데이트를 전송해 정직한 노드의 순위 품질을 저하시킬 위험이 있습니다. 우리는 RankGuard를 소개합니다. RankGuard는 사용자가 순위 모델을 공동으로 학습하고 다른 노드와 직접 모델 업데이트를 교환하는 탈중앙화 OLTR 프레임워크입니다. RankGuard는 위치 편향을 보정한 사용자의 개인 클릭 기록과 비교해 들어오는 모델을 신중히 평가함으로써 독성 공격을 방어합니다. 들어온 모델은 현재 로컬 모델보다 사용자의 과거 상호작용을 더 잘 설명할 때만 집계되며, 이는 악의적인 노드가 테스트를 통과하면서도 실제로 사용자를 돕지 않는 업데이트를 만들기 어렵게 합니다. 우리는 RankGuard에 대한 이론적 수렴 보장을 도출했으며, 현재까지 알려진 바에 따르면 탈중앙화 OLTR 알고리즘에 대한 최초의 공식 수렴 분석입니다. 네 가지 독성 공격(강력한 적응형 공격 포함)을 네 개의 표준 벤치마크와 세 가지 클릭 모델을 사용해 평가한 결과, RankGuard는 대부분의 설정에서 모든 베이스라인을 능가했으며, 가장 근접한 경쟁자보다 최대 62배 더 효율적이었습니다.

주요 기여

이 논문은 다음 분야의 연구를 제시합니다.

cs.DC
cs.IR

방법론

자세한 방법론은 전체 논문을 참고하시기 바랍니다.

실용적 함의

본 연구는 cs.DC 분야의 발전에 기여합니다.

저자

Marcel Gregoriadis
Martijn de Vos
Sayan Biswas
Anne-Marie Kermarrec
Johan Pouwelse

논문 정보

arXiv ID: 2606.12246v1
분류: cs.DC, cs.IR
발표일: 2026년 6월 10일
PDF: PDF 다운로드

[논문] 분산 시스템에서 효율적이고 견고한 온라인 순위 학습

개요

주요 기여

방법론

실용적 함의

저자

논문 정보

관련 글

[논문] 이기종 엣지 클러스터에서 스케줄링 알고리즘의 공정한 비교: 연속 적응 벤치마크

‘인터넷에서 무작위로 가져오지 마세요’: 체인가드가 52,000개 오픈소스 패키지에서 발견한 내용

관측 스택이 클라우드 비용보다 더 비싼 이유

Anthropic, 개발자 반발에 숨겨진 AI 제한 정책을 뒤집다