[논문] 트래젝터리 샤플리 값을 이용한 공정성 기반 연합 학습
Source: arXiv - 2605.30336v1
Overview
연합 학습(FL)은 여러 장치나 조직이 원시 데이터를 중앙 서버로 옮기지 않고도 공동 모델을 학습할 수 있게 해줍니다. 이는 프라이버시와 데이터 사일로 문제를 해결하지만, 기존의 클라이언트 업데이트 평균화 방식은 모든 참여자가 동일하게 기여한다는 전제에 기반합니다. 데이터 품질, 연산 능력, 네트워크 신뢰성이 시간에 따라 달라질 때 이 전제는 깨집니다. 논문 Fairness‑Aware Federated Learning with Trajectory Shapley Value는 Trajectory Shapley Value (TSV) 라는 새로운 지표와, 클라이언트 업데이트를 모델 학습 궤적에 대한 실제 영향도에 따라 동적으로 가중치를 부여하는 FedTSV 집계 알고리즘을 제안합니다.
Key Contributions
- Trajectory Shapley Value (TSV): 검증 데이터를 기반으로 한 새로운 샤플리 값 정의로, 클라이언트의 기여도를 단일 라운드가 아닌 전체 최적화 경로에 걸쳐 측정합니다.
- FedTSV aggregation scheme: 라운드별 TSV 점수를 적응형 가중치로 변환하여, 서버가 실시간으로 고영향 클라이언트를 보상하고 잡음이 많거나 악의적인 참여자를 가중치를 낮춥니다.
- Theoretical grounding: TSV가 효율성, 대칭성, 무관성(더미) 등 바람직한 공정성 공리를 만족하면서도 연합 학습 환경에서 계산적으로 실현 가능함을 증명합니다.
- Empirical validation: 표준 연합 학습 벤치마크(FEMNIST, CIFAR‑10)에서 수렴 속도 향상, 최종 정확도 상승, 데이터 이질성 및 악성 업데이트에 대한 강인성 개선을 확인했습니다.
- Equitable contribution reporting: 각 클라이언트의 기여도를 투명하고 정량적으로 기록하여 인센티브 메커니즘이나 규제 감시 등에 활용할 수 있습니다.
Methodology
- Utility definition: 저자들은 시간적으로 일관된 유틸리티 함수를 전역 모델이 각 집계 단계 후에 보이는 검증 손실로 정의합니다. 이는 모델이 시간에 따라 어떻게 개선(또는 악화)되는지를 포착합니다.
- Shapley value approximation: 정확한 샤플리 값 계산은 지수적 비용이 들므로, 논문에서는 무작위 클라이언트 순서를 샘플링하고, 부분 코알리션에 클라이언트를 추가했을 때 유틸리티가 얼마나 변하는지를 측정하는 Monte‑Carlo 방식을 채택합니다.
- Trajectory extension: 단일 스냅샷이 아니라, TSV는 모든 라운드에 걸친 한계 기여도를 누적하여 궤적 전체에 대한 점수를 산출합니다.
- Dynamic weighting: 각 통신 라운드에서 서버는 현재 활성 클라이언트들의 TSV 추정치를 계산하고, 이를 합이 1이 되도록 정규화하여 가중치로 사용합니다. 이 가중치는 FedAvg에서 사용하던 고정 균등 평균을 대체합니다.
- Implementation details: 기존 FL 파이프라인에 최소한의 오버헤드만으로 삽입할 수 있습니다—TSV는 서버 측에서만 업데이트되며, 이미 조기 종료나 하이퍼파라미터 튜닝에 사용되는 검증 세트를 재활용합니다.
Results & Findings
| Dataset / Setting | FedAvg (baseline) | FedTSV (proposed) | Speed‑up (epochs) | Robustness to adversaries |
|---|---|---|---|---|
| FEMNIST (non‑IID) | 78.2 % 정확도 | 81.5 % 정확도 | 약 30 % 라운드 감소 | 악성 클라이언트 10 % 상황에서 정확도 15 % 상승 |
| CIFAR‑10 (heterog.) | 71.0 % 정확도 | 74.3 % 정확도 | 약 25 % 라운드 감소 | 라벨 플리핑 공격에도 70 % 이상 정확도 유지 |
| Synthetic hetero | 120 라운드 후 수렴 | 84 라운드 후 수렴 | — | 실행마다 최종 모델 성능 편차 감소 |
- Convergence: 더 정보가 풍부한 가중치 덕분에 FedTSV는 목표 정확도에 도달하는 속도가 FedAvg보다 20‑30 % 빠릅니다.
- Fairness: TSV 기반 원장은 클라이언트 보상을 실제 영향도와 일치시킵니다. 품질이 낮거나 유휴인 클라이언트는 비례적으로 작은 가중치를 받아 “무임승차”를 방지합니다.
- Stability: 동적 가중치가 이상치 업데이트의 영향을 완화해 손실 곡선이 더 부드러워지고, 랜덤 시드에 따른 변동성이 감소합니다.
Practical Implications
- Incentive‑compatible FL platforms: 서비스 제공자는 TSV 점수를 활용해 참여자에게 (예: 토큰 보상) 공정하게 보상함으로써 고품질 데이터 공유를 유도할 수 있습니다.
- Robustness in production: 스마트폰, IoT 센서 등 엣지 디바이스는 연결 불안정이나 데이터 손상이 빈번합니다. FedTSV의 적응형 가중치는 이러한 잡음 클라이언트의 영향을 자동으로 완화해 별도 튜닝이 필요 없습니다.
- Compliance & auditability: 규제 기관이 협업 AI에 대한 투명성을 요구하는 추세에 맞춰, TSV는 각 파티가 최종 모델에 미친 영향을 수학적으로 검증 가능한 형태로 기록합니다.
- Plug‑and‑play upgrade: 기존 FL 프레임워크(TensorFlow Federated, PySyft, Flower 등)는 집계 단계만 FedTSV로 교체하고 서버 측 검증 루틴을 추가하면 바로 적용 가능하며, 클라이언트 코드를 수정할 필요가 없습니다.
Limitations & Future Work
- Validation set dependence: TSV는 전역 검증 세트에 의존하는데, 이 세트가 전체 데이터 분포를 잘 대표해야 합니다. 프라이버시가 매우 민감한 분야에서는 적절한 검증 세트를 구성하기가 어려울 수 있습니다.
- Computation overhead: Monte‑Carlo 근사 자체는 정확한 샤플리 계산보다 가볍지만, 수천 명의 클라이언트를 다루는 경우 서버 측 비용이 어느 정도 증가합니다.
- Dynamic client populations: 현재 방식은 라운드당 비교적 안정적인 참여자 집합을 전제로 합니다. 수백만 대의 모바일 디바이스처럼 대규모 churn이 발생하는 상황에서는 추가적인 스케일링 기법이 필요합니다.
- Future directions: 저자들은 프라이버시 보호 TSV(예: 개별 기여도를 숨기는 안전한 집계) 연구, 개인화 연합 학습으로의 확장, 그리고 TSV 가중치 집계 하에서 수렴 속도에 대한 이론적 상한을 탐구하는 방향을 제시합니다.
Authors
- Daniel Kuznetsov
- Ziqi Wang
Paper Information
- arXiv ID: 2605.30336v1
- Categories: cs.LG
- Published: 2026년 5월 28일
- PDF: Download PDF