[논문] 라쇼몬 집합을 활용한 변형 테스트: 머신러닝 설명 신뢰성

발행: (2026년 6월 4일 PM 08:57 GMT+9)
3 분 소요
원문: arXiv

Source: arXiv - 2606.06056v1

개요

여러 머신러닝 모델이 동일한 과제에서 거의 동등한 예측 성능을 보이면서도 서로 다른 특징 기반 설명을 제공할 수 있습니다. 이를 설명 가능한 머신러닝의 라쇼몽 효과라고 부르며, 어떤 설명이 신뢰할 수 있는지에 대한 의문을 제기합니다. 우리는 메타모픽 테스트에 기반한 프레임워크를 제안합니다. 이 프레임워크는 사후 설명 방법으로부터 얻은 특징 중요도(attributed feature importance)를 탐색함으로써 정답 라벨 없이도 설명의 충실도를 평가합니다. 다섯 가지 메타모픽 관계를 통해 모델 행동과 특징 귀속 사이에 기대되는 일관성 속성을 공식화합니다. 우리는 이 일반 프레임워크를 두 개의 표형 회귀 데이터셋과 두 개의 사후 설명기(SHAP, LIME)에 적용하여 접근법을 시연했습니다. 이 프레임워크는 정확하고 신뢰할 수 있는 설명을 제공하는 모델을 선택하기 위한 실용적이며 모델에 독립적인 도구를 제공합니다.

주요 기여

본 논문은 다음 분야의 연구를 다룹니다:

  • cs.SE
  • cs.AI
  • cs.LG

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 함의

본 연구는 cs.SE 분야의 발전에 기여합니다.

저자

  • Helge Spieker
  • Jørn Eirik Betten
  • Arnaud Gotlieb

논문 정보

  • arXiv ID: 2606.06056v1
  • Categories: cs.SE, cs.AI, cs.LG
  • Published: 2026년 6월 4일
  • PDF: Download PDF
0 조회
Back to Blog

관련 글

더 보기 »