[논문] 유한 정밀도에서 tanh 신경망 학습의 한계

발행: 3일 전 (2026년 6월 10일 AM 02:02 GMT+9)

2 분 소요

원문: arXiv

출처: arXiv - 2606.11104v1

개요

우리는 유한 정밀도 연산과 $L^p$ 정확도 보장을 전제로 점 평가만으로 $\tanh$ 신경망을 학습하는 데 존재하는 한계를 조사한다. 이는 Berner, Grohs, Voigtländer (2023)의 연구를 기반으로 한다. 우리의 접근법은 반복적인 $\tanh$ 활성화를 이용해 매우 국소화된 범프 함수를 새롭게 구성하는 데 있다. 이 메커니즘을 활용하여, 유한 정밀도 환경에서는 $m$개의 샘플에 기반한 적응형 무작위 알고리즘이 $L^p$ 노름에서 Monte Carlo 속도 $O(m^{-1/p})$보다 높은 수렴 속도를 달성할 수 없으며, 이는 네트워크 파라미터와 구조의 크기에 대해 샘플 예산이 지수적으로 증가해야 함을 의미한다. 이 결과는 국소화된 범프 함수를 포함하는 클래스의 학습 가능성에 대해 유한 정밀도가 부과하는 근본적인 제한을 밝혀내며, 기존의 ReLU 네트워크에 대한 결과를 $\tanh$ 설정으로 확장한다.

주요 기여

이 논문은 다음 분야의 연구를 제시한다:

cs.LG
stat.ML

방법론

자세한 방법론은 전체 논문을 참고하시기 바란다.

실용적 함의

본 연구는 cs.LG 분야의 발전에 기여한다.

저자

Philipp Grohs
Matěj Trödler

논문 정보

arXiv ID: 2606.11104v1
카테고리: cs.LG, stat.ML
발표일: 2026년 6월 9일
PDF: PDF 다운로드

[논문] 유한 정밀도에서 tanh 신경망 학습의 한계

개요

주요 기여

방법론

실용적 함의

저자

논문 정보

관련 글

[논문] UniIntervene: 효율적인 실세계 강화학습을 위한 에이전트 기반 개입

[논문] Ambient Diffusion Policy: 로봇 분야 비최적 데이터로부터 모방 학습

[논문] 서브쿼드러틱 아키텍처: 응용에서 원리까지

[논문] 결손 모달리티가 있는 다중모달 학습을 위한 잠재 세계 복원