[Paper] Olaf-World: 비디오 세계 모델링을 위한 잠재 행동 정렬
액션 라벨의 부족으로 인해 action-controllable world models의 확장이 제한됩니다. latent action learning은 제어 인터페이스를 u...
액션 라벨의 부족으로 인해 action-controllable world models의 확장이 제한됩니다. latent action learning은 제어 인터페이스를 u...
라벨이 없는 비디오 데이터에서 transferable knowledge를 학습하고 이를 새로운 환경에 적용하는 것은 intelligent agents의 기본적인 능력이다. This work prese...
Data privacy와 eXplainable Artificial Intelligence (XAI)는 현대 Machine Learning 시스템에 있어 두 가지 중요한 측면입니다. Data privacy를 강화하기 위해, 최근 ...
표현 인코더(representation encoders)를 활용한 생성 모델링(generative modeling)은 효율적이고 고충실도(high-fidelity) 합성을 위한 경로를 제공합니다. 그러나 표준 디퓨전 트랜스포머(diffusion transformers)는 …
인터넷 규모의 비디오에서 Vision‑Language‑Action (VLA) 정책을 사전 학습하는 것은 매력적이지만, 현재의 latent‑action 목표는 종종 잘못된 것을 학습한다: they r...
우리는 개별 학습 예제가 루프된 트랜스포머의 내부 연산을 어떻게 형성하는지 연구한다. 여기서 공유 블록이 τ 반복적인 반복에 적용되어 e…
Language models는 기술 논문을 요약하고 이론적 개념을 설명하는 등 양자 컴퓨팅 교육 및 연구에 실용적인 도구가 되었습니다.
우리는 Forensim이라는 attention‑based state‑space 프레임워크를 도입하여 이미지 위조 탐지에서 조작된(타깃) 영역과 소스 영역을 동시에 위치 지정한다....
Out-of-distribution (OOD) detection은 machine learning 시스템을 안전하게 배포하기 위해 중요합니다. 기존의 post-hoc detectors는 일반적으로 model confidence에 의존합니다.
대형 언어 모델(LLMs)은 종종 불필요하게 장황한 Chain-of-Thought (CoT) 추론을 생성하여 계산 비용과 지연 시간을 증가시키지만, ...
Artifact evaluation은 연구 결과의 재현성을 보장하기 위해 소프트웨어 엔지니어링 커뮤니티에서 표준 관행이 되었습니다. 그러나 현재 m...
효율적인 탐색은 특히 보상이 희소한 환경에서 강화학습(RL)의 중심 과제로 남아 있습니다. 우리는 Optimistic World Mode…