[논문] 데이터셋 분류에 따른 추천 시스템 브래들리‑테리 순위
Source: arXiv - 2606.07492v1
Overview
추천 알고리즘의 순위 매기기는 데이터셋의 희소성, 순차 구조, 규모와 같은 특성에 따라 모델 성능이 크게 달라지기 때문에 어려운 문제입니다. 이는 알고리즘 간 공정한 비교를 위한 적절한 방법론에 대한 요구를 불러일으킵니다. 성능 지표를 단순히 집계(예: 여러 벤치마크에서 NDCG를 평균)하는 경우 오해를 불러일으키는 순위가 도출되어 실제 선택에 악영향을 미칠 수 있습니다. 이 문제를 해결하고자 우리는 Bradley‑Terry (BT) 모델에 기반한 새로운 데이터‑주도 순위 매기기 방법론을 제시합니다. 얻어진 순위가 핵심 데이터셋 통계에 의존한다는 것을 보여줍니다. 또한 순위 일관성을 평가하기 위한 새로운 지표를 제안하고, 불완전한 데이터에 대해서도 순위가 견고함을 입증합니다. 마지막으로, Bradley‑Terry 프레임워크의 확장인 BT 트리와 공변량을 포함한 BT 모델을 활용해 모델을 실제로 실행하지 않고도 미지의 데이터셋에 대한 알고리즘 순위를 예측하는 데이터셋‑특화 방법론을 소개합니다.
Key Contributions
이 논문은 다음 분야의 연구를 다룹니다:
- cs.IR
- cs.LG
- stat.ML
Methodology
자세한 방법론은 전체 논문을 참고하십시오.
Practical Implications
본 연구는 cs.IR 분야의 발전에 기여합니다.
Authors
- Ekaterina Grishina
- Stepan Kuznetsov
- Askar Tsyganov
- Ilya Ivanov
- Daria Korovaitceva
- Margarita Rusanova
- Uliana Parkina
- Alexander Derevyagin
- Evgeny Frolov
- Sergey Samsonov
- Anton Lysenko
Paper Information
- arXiv ID: 2606.07492v1
- Categories: cs.IR, cs.LG, stat.ML
- Published: 2026년 6월 5일
- PDF: Download PDF