[Paper] Rudder: LLM 에이전트를 활용한 분산 GNN 훈련에서 프리패칭 제어
대규모 그래프 신경망(GNN)은 일반적으로 정점의 이웃을 고정 거리까지 샘플링하여 학습됩니다. 대규모 입력 그래프가 분산되어 있기 때문에,…
대규모 그래프 신경망(GNN)은 일반적으로 정점의 이웃을 고정 거리까지 샘플링하여 학습됩니다. 대규모 입력 그래프가 분산되어 있기 때문에,…
Federated Learning (FL)은 개별 데이터를 공유하지 않고도 여러 클라이언트가 협업하여 모델을 학습할 수 있게 하지만, 클라이언트 데이터가 …
우리는 MediX‑R1을 소개합니다. 이는 의료 멀티모달 대형 언어 모델(MLLMs)을 위한 개방형 강화 학습(RL) 프레임워크로, 임상적으로 기반된…
우리는 오프라인 피드포워드 방식의 중요한 한계인 계산 및 메모리 요구사항을 해결하는 확장 가능한 3D 재구성 모델을 제시합니다.
수많은 라인들이 모델 불일치를 제어하는 것을 목표로 합니다 — 두 머신러닝 모델이 예측에서 얼마나 서로 다른지를 나타냅니다. 우리는 간단하고 stan...
우리는 occlusion reasoning을 3D layout‑conditioned generation에 있어 근본적이면서도 간과된 측면으로 규정한다. 이는 부분적으로 가려진…
바이오 영감을 받은 이벤트 카메라는 비동기식 및 저지연 특성 때문에 최근 큰 연구 관심을 끌고 있습니다. 이러한 특징은 높은 dy...
플라톤적 표현 가설은 서로 다른 모달리티에 대해 훈련된 신경망이 세계에 대한 공유된 통계 모델로 수렴한다는 것을 주장한다. Rece...
Vision‑Language Models (VLMs)에서 추론 능력의 부족은 연구 논의의 최전선에 남아 있습니다. 우리는 이 현상이 …에서 비롯된다고 가정합니다.
표준 mixed-precision training은 신경망의 각 model parameter마다 많은 바이트의 accelerator memory를 필요로 합니다. 이러한 바이트들은 단지 파라미터…
Coarse data는 학습자가 샘플에 대한 부분적인 정보만을 관찰할 때 발생합니다; 즉, 샘플 자체의 정확한 값이 아니라 샘플을 포함하는 집합을 관찰하는 경우입니다. This occurs nat...
Open-vocabulary segmentation (OVS)은 vision-language models (VLMs)의 zero-shot 인식 능력을 pixel-level prediction으로 확장하여 segmentation을 가능하게 합니다.