[Paper] EfficientFlow: 효율적인 동변성 Flow 정책 학습을 위한 Embodied AI
Generative modeling은 최근 visuomotor policy learning에 있어 놀라운 가능성을 보여주었으며, 다양한 embodied AI 작업 전반에 걸쳐 유연하고 표현력 있는 제어를 가능하게 합니다.
3284 posts from this source
Generative modeling은 최근 visuomotor policy learning에 있어 놀라운 가능성을 보여주었으며, 다양한 embodied AI 작업 전반에 걸쳐 유연하고 표현력 있는 제어를 가능하게 합니다.
Diffusion 모델은 데이터 기반 학습과 복잡하고 정규화되지 않은 목표 분포에서의 샘플링에서 놀라운 성공을 거두었습니다. 이러한 진보를 바탕으로...
Self-driving laboratories는 노동 집약적이고 시간 소모가 크며 종종 재현이 어려운 생물학적 과학 워크플로우를 감소시키는 유망한 경로를 제공합니다.
오늘날 사람들은 콘서트, 스포츠 이벤트, 강연, 가족 모임, 생일 파티 등 다양한 기억에 남는 순간들을 쉽게 기록할 수 있습니다, 여러...
Video generators는 잠재적인 world models로서 점점 더 평가되고 있으며, 이는 physical laws를 인코딩하고 이해하도록 요구합니다. 우리는 그들의 표현을 조사합니다.
카메라와 객체 움직임은 비디오 내러티브의 핵심입니다. 그러나 캡처된 이러한 움직임을 정밀하게 편집하는 것은 특히 …
Unified multimodal models (UMMs)는 단일 프레임워크 내에서 멀티모달 이해와 생성을 동시에 수행하는 것을 목표로 합니다. 우리는 TUNA, 네이티브 UMM을 제시합니다, that bu...
MeanFlow (MF)는 최근에 일단계 생성 모델링을 위한 프레임워크로 확립되었습니다. 그러나 그 “fastforward” 특성은 핵심적인 도전을 야기합니다.
대형 언어 모델이 점점 커짐에 따라, NVFP4와 같은 저정밀 수치 형식이 속도와 메모리 이점 때문에 점점 더 인기를 얻고 있습니다 ...
360-degree omnidirectional understanding 분야는 공간 지능을 향상시키기 위해 점점 더 많은 관심을 받고 있습니다. 그러나 대규모 ...
Test-time scaling (TTS) — 추론 중에 컴퓨팅을 동적으로 할당하는 것 — 은 대형 언어 모델(LLMs)에서 추론 능력을 향상시키는 유망한 방향이다.
Multi-view camera systems는 복잡한 real-world 장면에 대한 풍부한 관측을 가능하게 하며, 멀티뷰 환경에서 dynamic objects를 이해하는 것이 중심이 되었다.
우리는 Audio-Visual Affordance Grounding (AV-AG)이라는 새로운 작업을 소개한다. 이 작업은 행동 소리에서 객체 상호작용 영역을 분할한다. 기존 접근 방식과 달리 ...
대형 언어 모델(LLM)은 숨겨진 파라메트릭 공간에 사실적 지식을 인코딩하는데, 이는 검사하거나 제어하기 어렵다. Sparse Autoencoders(SAE)…
대규모 병렬 시뮬레이션은 로봇의 강화 학습(RL) 훈련 시간을 며칠에서 몇 분으로 단축시켰습니다. 그러나 빠르고 신뢰할 수 있는 sim-to…
자율 주행 정책은 일반적으로 인간 시연을 통한 open-loop behavior cloning으로 학습됩니다. 그러나 이러한 정책은 covariate shift 때문에 ...
우리는 LLM CHESS를 소개합니다, 이는 large language models에서 추론 및 지시 수행 능력의 일반화를 탐색하도록 설계된 평가 프레임워크입니다 (...
Offline Reinforcement Learning (RL)은 추가적인 상호작용 데이터를 수집하기 어려운 경우, 사전에 수집된 데이터셋으로부터 정책을 학습할 수 있는 유망한 방법을 제공합니다.
Study Objectives: Wrist accelerometry는 수면‑각성 상태를 추정하는 데 널리 사용됩니다. 이전 연구들은 cross‑device 일반화 없이 깨어 있음 감지 성능이 낮음을 보여주었습니다.
리소스가 제한된 엣지 디바이스에서의 Federated Learning (FL)은 중요한 과제에 직면합니다: Deep Neural Networks (DN…을(를) 학습하는 데 필요한 계산 에너지.
GUI grounding은 자연어 명령을 복잡한 사용자 인터페이스의 정확한 영역과 맞추는 것을 목표로 합니다. 고급 멀티모달 대형 언어 모델은 강력한…
글로벌 capacity for mineral processing은 필수적인 clean energy technology를 구축하는 데 필요한 critical minerals에 대한 수요를 충족시키기 위해 빠르게 확대되어야 합니다.
RL이 reasoning capabilities에 기여하는 메커니즘—새로운 기술의 합성을 장려하는지, 아니면 기존 행동을 단순히 증폭시키는지—는 아직 남아 있다.
Deep Research Agents (DRAs)는 반복적인 정보 검색 및 합성을 통해 분석가 수준의 보고서를 자동으로 생성하는 것을 목표로 합니다. 그러나 대부분의 기존 DRA…
검증 가능한 보상을 이용한 강화 학습(RLVR)은 대형 언어 모델(LLM)의 추론 능력을 향상시켜, 자율 에이전트가 ...
대규모 언어 모델(LLMs)의 부상은 에이전트에 대한 관심 급증을 촉발했으며, 이는 에이전트 프레임워크의 빠른 성장으로 이어졌습니다. 에이전트 프레임워크는 소프트웨어...
최근 대형 언어 모델(LLMs)의 발전은 특히 긴 체인-오브-생각(Chain-of-Thought, CoT) 방식을 통한 emergent reasoning capabilities에 의해 주도되고 있습니다...
Large Language Models (LLMs)의 내부 사고 과정을 이해하고 환각의 원인을 파악하는 것은 여전히 주요 과제이다. 이를 위해 우리는 l...
Internet of Things의 성장으로 새로운 세대의 애플리케이션이 가능해졌으며, computation과 intelligence가 network edge 쪽으로 이동하고 있습니다. 이 추세는…
MPI 애플리케이션에 대한 상세한 트레이스 분석은 성능 엔지니어링에 필수적이지만, 트레이스 크기가 증가하고 복잡한 통신 동작이 종종 …
본 논문은 복잡한 최적화 과제를 해결하기 위해 인공지능(AI)과 혼합 정수 선형 계획법(MILP)의 통합을 분석한다.
Automated test generation은 특히 현대 API 기반 아키텍처에서 소프트웨어 품질을 보장하기 위한 핵심 기술이 되었습니다. 그러나 자동으로 생성…
내재된 시간적 역학이 없는 정적 이미지를 처리하는 것은 스파이킹 뉴럴 네트워크(SNNs)에 대한 근본적인 과제로 남아 있습니다. 직접 훈련된 SNN에서는 정적...
Symbolic Regression (SR)은 변수들 간의 관계를 설명하는 수학적 표현식을 발견하는 것을 목표로 하는 회귀 방법이며, 종종…
Graph Neural Networks (GNNs)는 불규칙하고 메모리 바인드된 그래프 탐색과 규칙적이며 연산 집약적인 밀집 연산을 결합함으로써 근본적인 하드웨어 과제를 제시한다.
Digital Twins (DTs)는 복잡한 사회기술 시스템에서 자율적인 의사결정자로 점점 더 많이 활용되고 있다. 이들의 수학적으로 최적의 결정은 종종 차이를 보인다.
소프트웨어는 복잡한 시스템 개발 및 프로토타이핑에서 점점 더 중요한 역할을 하고 있으며, 최근 몇 년간 MIT Lincoln Laboratory는 ...
현실 세계에서 발생하는 관계형 데이터는 종종 그래프로 구조화되며, 이는 분석적 도출을 단순하게 만드는 논리적 추상화를 제공합니다.
Software supply chain attacks는 기존 SCA 도구의 사각지대를 드러냈으며, 이러한 도구들은 종종 단일 생태계에 제한되고 소프트웨어 artifact만 평가한다...
고급 deep learning 아키텍처, 특히 recurrent neural networks (RNNs)는 audio, bioacoustic 및 biomedical signal 분석에 널리 적용되어 왔습니다.
이 논문은 MPI 기반 동기화 기술을 분산 퍼징 프레임워크에 통합하는 방식을 탐구하며, 가능한 상당한 성능 향상을 강조한다.
Fuzzing은 소프트웨어 취약점을 발견하는 데 매우 효과적인 방법이지만, 결과 데이터를 분석하는 데는 일반적으로 상당한 수동 작업이 필요합니다. Thi...
많은 학문 분야에서 소프트웨어는 연구 과정 중에 또는 연구 목적을 위해 만들어집니다. 연구를 위한 소프트웨어의 중요한 역할이 커지고 있습니다.
Federated Learning은 보안 및 계산상의 이점 때문에 distributed learning에 널리 사용되는 접근 방식입니다. 강력한 디바이스가 네트워크에 등장하면서...
Covid는 온라인 교육과 학습을 받아들일 수 있게 만들었고, 학생들, 교수진, 그리고 산업 전문가 모두가 이 방식을 편안하게 여기고 있습니다. 이러한 편안함은…
우리는 LibriBrain 2025 PNPL 대회를 위해 Conformer 기반 디코더를 제시하며, 두 가지 기본적인 MEG 작업인 Speech Detection과 Phoneme Classification을 목표로 합니다....
많은 현대 소프트웨어 프로젝트는 새로운 기능과 보안 패치를 통합하기 위해 빠르게 진화합니다. 사용자가 의존성을 보다 안전한 버전으로 업데이트하는 것이 중요합니다.
Serverless Large Language Models (LLMs)은 ‘pay-as-you-go’ 가격 모델을 가능하게 함으로써 AI 서비스를 배포하기 위한 비용 효율적인 솔루션으로 부상했습니다.