[논문] 정적 사전 가정 탈피: 대규모 개미 군집 최적화를 위한 동적 신경 가이드
개요
Neural-guided Ant Colony Optimization(ACO)은 근본적인 학습‑추론 불일치 문제를 안고 있습니다. 정책은 보통 정적 사전(예: 히트맵)을 생성하도록 학습되지만, 실제로는 반복적이고 장기적인 탐색 과정을 안내하는 데 사용됩니다. 본 논문에서는 페로몬 분포와 현재 최적 해를 주기적으로 관찰함으로써 동적 신경 가이드를 구현하는 새로운 프레임워크 DyNACO를 제시합니다. DyNACO를 대규모에 적용 가능하도록 만들기 위해, 정책을 교란 기반 ACO 백엔드와 범위가 제한된 정제 메커니즘과 결합하여 효율성과 안정적인 크레딧 할당을 동시에 보장합니다. TSP 실험에서 DyNACO는 100,000노드 규모까지 확장 가능하며, 신경 기반 베이스라인보다 우수한 성능을 보이고, 가이드가 없는 솔버에 비해 전체 실행 시간을 종종 단축합니다. 또한 용량을 고려한 백엔드를 통해 CVRP에 DyNACO를 확장했으며, 신경 오버헤드가 1% 미만인 상황에서도 가이드가 없는 베이스라인을 지속적으로 개선합니다. 모델의 일반화 능력을 검증하고 동적 가이드가 정적 사전보다 왜 더 좋은지 설명하는 심층 분석도 제공합니다. 우리의 연구는 학습‑가이드 최적화에서 신경망 학습과 반복 탐색 역학을 일치시키는 것이 필수적임을 강조합니다. 코드는 https://github.com/shoraaa/DyNACO 에서 확인할 수 있습니다.
주요 기여
이 논문은 다음 분야의 연구를 다룹니다:
- cs.NE
- cs.AI
- cs.LG
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실용적 시사점
이 연구는 cs.NE 분야의 발전에 기여합니다.
저자
- Dat Thanh Tran
- Van Khu Vu
- Yining Ma
논문 정보
- arXiv ID: 2606.04039v1
- Categories: cs.NE, cs.AI, cs.LG
- Published: 2026년 6월 2일
- PDF: Download PDF