[Paper] Squint: 시뮬레이션-실제 로보틱스를 위한 빠른 비주얼 강화학습
시각 강화 학습은 로봇공학에 매력적이지만 비용이 많이 듭니다 — 오프-폴리시 방법은 샘플 효율적이지만 느리고, 온-폴리시 방법은 병렬화가 잘 되지만…
시각 강화 학습은 로봇공학에 매력적이지만 비용이 많이 듭니다 — 오프-폴리시 방법은 샘플 효율적이지만 느리고, 온-폴리시 방법은 병렬화가 잘 되지만…
우리는 모든 모달리티에서 late interaction을 위한 효율적인 multi-vector retrieval을 연구한다. late interaction은 정보 검색에서 지배적인 패러다임으로 부상했다.
Embodied LLMs는 로봇에 고수준 작업 추론 능력을 부여하지만, 무엇이 잘못됐는지 혹은 그 이유를 반성할 수 없으며, 이로 인해 배포가 일련의 독립적인 …
Transformer 모델을 사용하여 긴 시퀀스를 효율적으로 처리하려면 일반적으로 컨텍스트 병렬성을 통해 가속기들 간에 계산을 분할해야 합니다. The domin...
Cryo-electron tomography (cryo-ET)는 막과 membrane proteins를 포함한 생물학적 구조의 고해상도 three-dimensional reconstruction을 가능하게 한다.
대규모 언어 모델의 terminal capabilities에 대한 최근의 급속한 진전에도 불구하고, 최첨단 terminal agents 뒤에 있는 training data strategies는 여전히…
우리는 최근 ~cite{CKKMS24}에 의해 도입된 smoothed agnostic learning의 복잡성을 연구한다. 여기서 learner는 목표 …에서 가장 좋은 classifier와 경쟁한다.
Pass@k는 수학적 추론, 코드 생성, 짧은 답변 추론 등을 포함한 검증 가능한 대규모 언어 모델 작업에 널리 사용되는 성능 지표입니다.
Vision-Language Models (VLMs)는 뛰어난 2D 시각 이해를 보여주지만, 3D 공간을 이해하고 추론하는 능력—공간 인식의 핵심—은 아직 제한적이다.
Uniform-state discrete diffusion models는 자체 교정 능력 덕분에 few-step generation 및 guidance에서 뛰어나며, autoregressive 모델보다 선호됩니다.
그래프 기반 의료 영상 분할은 경계 그래프를 사용하여 해부학적 구조를 나타내며, 고정 토폴로지 랜드마크와 고유한 인구 수준…
Deep learning은 자동 뇌종양 진단을 크게 향상시켰지만, 임상 적용은 interpretability와 computational constraint 때문에 여전히 제한적이다.