[Paper] AlignSAE: 개념 정렬된 희소 오토인코더
대형 언어 모델(LLM)은 숨겨진 파라메트릭 공간에 사실적 지식을 인코딩하는데, 이는 검사하거나 제어하기 어렵다. Sparse Autoencoders(SAE)…
대형 언어 모델(LLM)은 숨겨진 파라메트릭 공간에 사실적 지식을 인코딩하는데, 이는 검사하거나 제어하기 어렵다. Sparse Autoencoders(SAE)…
대규모 병렬 시뮬레이션은 로봇의 강화 학습(RL) 훈련 시간을 며칠에서 몇 분으로 단축시켰습니다. 그러나 빠르고 신뢰할 수 있는 sim-to…
자율 주행 정책은 일반적으로 인간 시연을 통한 open-loop behavior cloning으로 학습됩니다. 그러나 이러한 정책은 covariate shift 때문에 ...
우리는 LLM CHESS를 소개합니다, 이는 large language models에서 추론 및 지시 수행 능력의 일반화를 탐색하도록 설계된 평가 프레임워크입니다 (...
Offline Reinforcement Learning (RL)은 추가적인 상호작용 데이터를 수집하기 어려운 경우, 사전에 수집된 데이터셋으로부터 정책을 학습할 수 있는 유망한 방법을 제공합니다.
중국 인공지능 스타트업 DeepSeek는 일요일에 두 개의 강력한 새로운 AI 모델을 출시했으며, 회사는 이 모델들이 OpenAI의 능력에 맞먹거나 능가한다고 주장합니다.
Study Objectives: Wrist accelerometry는 수면‑각성 상태를 추정하는 데 널리 사용됩니다. 이전 연구들은 cross‑device 일반화 없이 깨어 있음 감지 성능이 낮음을 보여주었습니다.
리소스가 제한된 엣지 디바이스에서의 Federated Learning (FL)은 중요한 과제에 직면합니다: Deep Neural Networks (DN…을(를) 학습하는 데 필요한 계산 에너지.
GUI grounding은 자연어 명령을 복잡한 사용자 인터페이스의 정확한 영역과 맞추는 것을 목표로 합니다. 고급 멀티모달 대형 언어 모델은 강력한…
글로벌 capacity for mineral processing은 필수적인 clean energy technology를 구축하는 데 필요한 critical minerals에 대한 수요를 충족시키기 위해 빠르게 확대되어야 합니다.
RL이 reasoning capabilities에 기여하는 메커니즘—새로운 기술의 합성을 장려하는지, 아니면 기존 행동을 단순히 증폭시키는지—는 아직 남아 있다.
Atlas와 대부분의 현재 AI 기반 브라우저가 세 가지 측면—프라이버시, 보안, 검열—에서 어떻게 실패하는가 게시물: The Problem with AI Browsers: Security Flaws