AI가 Sphere-Packing 퍼즐을 풀다: 밀도 극대화를 위한 새로운 접근
가능한 한 효율적으로 오렌지를 상자에 넣는다고 상상해 보세요. 이제 시각화가 불가능한 고차원으로 확장해 보세요. 질문은…
가능한 한 효율적으로 오렌지를 상자에 넣는다고 상상해 보세요. 이제 시각화가 불가능한 고차원으로 확장해 보세요. 질문은…
며칠 전, Bloomberg의 Mark Gurman은 OpenAI가 Apple 하드웨어 엔지니어들을 “좌우로” 빼가고 있다고 보도했습니다. 이제 새로운 WSJ 기사에서 더 자세히 살펴봅니다.
대형 언어 모델(LLM) 시대에, 검색 강화 생성(RAG) 아키텍처는 언어를 기반으로 하는 능력으로 인해 큰 주목을 받고 있습니다.
Instruction-based image editing은 눈에 띄는 연구 분야로 부상했으며, image generation foundation models의 혜택을 받아 높은 미학적…
Real-time chunking (RTC)은 vision-language-action models (VLAs)이 비동기적으로 action chunks를 예측함으로써 부드럽고 반응적인 robot trajectories를 생성하도록 합니다.
Reinforcement Learning (RL)은 추론을 포함하는 작업을 해결하기 위해 LLM을 튜닝하는 사실상의 표준이 되었습니다. 그러나 점점 더 많은 증거가 모델이 …
수중 이미지는 파장에 따라 달라지는 빛의 흡수와 산란 때문에 색 왜곡이 심하고, 대비가 낮으며, 흐릿한 외관을 자주 보입니다. Si...
비전-언어 모델(VLM)은 시각 질문 응답(VQA)에서 강력한 성능을 달성했지만, 여전히 정적인 학습 데이터에 제한을 받고 있습니다. Retrieva...
대규모 언어 모델(LLM)을 기반으로 한 생성형 검색 엔진이 전통적인 검색을 대체하고 있으며, 정보 제공자가 보상받는 방식을 근본적으로 변화시키고 있습니다.
본 연구에서는 RKHS 함수의 밴딧 최적화에서 커널 정규성 및 알고리즘 성능 간의 관계를 조사합니다. While reproduci...
Vision-Language Models (VLMs)는 놀라운 상식 및 의미론적 추론 능력을 보여줍니다. 그러나 이들은 물리적 역학에 대한 근거 있는 이해가 부족합니다…
우리는 15,045개의 대학 수준 물리 문제로 구성된 대규모 synthetic benchmark(90/10% train/test split)를 소개한다. 각 문제는 완전히 parameterized되어 있으며, …