[Paper] 학습된 동역학 모델에서 선형 보존을 강제하기 위한 Frobenius-Optimal 투영
우리는 데이터 기반 선형 동적 모델에서 선형 보존 법칙을 복원하는 문제를 고려한다. 학습된 연산자 widehat{A}와 풀랭크 제약이 주어졌을 때...
우리는 데이터 기반 선형 동적 모델에서 선형 보존 법칙을 복원하는 문제를 고려한다. 학습된 연산자 widehat{A}와 풀랭크 제약이 주어졌을 때...
Projected Gradient Descent (PGD)는 강력하고 널리 사용되는 1차 적대적 공격이지만, 모든 훈련 샘플을 사용해야 하므로 계산 비용이 비효율적으로 증가합니다.
에너지 소비는 대규모 언어 모델(Large Language Models) 배포의 비용과 환경 영향을 결정합니다. 이 논문은 온칩 SRAM 크기와 연산…에 미치는 영향을 조사합니다.
실시간 스트리밍 인터랙티브 아바타는 디지털 휴먼 연구에서 중요한 동시에 도전적인 목표를 나타냅니다. 비록 diffusion 기반 인간 아바타 생성은 …
자연어 처리(NLP) 시스템은 의료, 금융, 정부와 같은 민감한 분야에서 점점 더 많이 사용되고 있으며, 이들 분야에서 대량의 ...
현대 학습 시스템의 Stability analyses는 종종 ReLU-type nonlinearities에 의해 위배되는 smoothness assumptions 하에서 도출됩니다. 이 메모에서, w...
이 권은 2025년 6월 20일 프랑스 릴에서 개최된 Workshop on Adaptable Cloud Architectures (WACA 2025)의 post‑proceedings를 포함합니다, co‑located with…
GUI agents의 개발은 차세대 인간-컴퓨터 상호작용을 혁신시킬 수 있습니다. 이러한 비전에 고무되어, 우리는 MAI-UI, a family of fo...
프롬프트 기반 비디오 세그멘테이션 파운데이션 모델(VSFMs)인 SAM2와 같은 모델은 자율 주행 및 디지털 병리와 같은 응용 분야에 점점 더 많이 배치되고 있다,…
Binary program analysis는 시스템 보안에서 여전히 매우 중요합니다. 바이너리 코드 분석에서 많은 실용적인 성과가 있지만, 세밀한 분석은 ...
대규모 Mixture-of-Experts (MoE) 모델은 효율적인 학습 및 추론을 위해 expert parallelism에 의존하며, 이는 전문가들을 여러 디바이스에 분산시키고 필요로 한다.
Federated Fine-Tuning (FFT)은 서버와 클라이언트 측 데이터를 모두 활용하여 전역 모델의 일반화를 향상시키면서 …