[Paper] IDT: 물리적으로 기반한 Transformer를 이용한 Feed-Forward 멀티뷰 내재적 분해
Intrinsic image decomposition은 시각적 이해에 기본적이며, RGB 이미지가 물질 특성, 조명, 그리고 시점 의존 효과를 얽혀 있기 때문입니다. Rec...
Intrinsic image decomposition은 시각적 이해에 기본적이며, RGB 이미지가 물질 특성, 조명, 그리고 시점 의존 효과를 얽혀 있기 때문입니다. Rec...
이 논문의 주요 연구 질문은 관계를 조사할 때 필요한 및/또는 적절한 맥락의 양을 정의하는 데 초점을 맞추고 있다.
인간은 시각 관찰을 통해 보행을 학습하며, 먼저 시각적 내용을 해석한 뒤 행동을 모방합니다. 그러나 최첨단 인간형 로봇 보행 시스템은…
Information-seeking (IS) agents는 광범위하고 깊이 있는 검색 작업 전반에 걸쳐 강력한 성능을 달성했지만, 그들의 도구 사용은 여전히 크게 제한되어 있습니다...
Omnimodal large language models는 audio와 visual modalities를 통합하는 데 큰 진전을 이루었지만, 종종 세밀한 cross-modal 이해가 부족합니다.
우리는 score function과 그 도함수를 동시에 근사하는 이론을 제시하여, low-dimensional 데이터 분포를 처리할 수 있게 합니다.
건강 정보를 찾는 탐구는 웹을 소비자들의 건강 관련 질문으로 가득 채웠습니다. 일반적으로, 소비자들은 지나치게 서술적이고 주변적인…
Spatio-temporal alignment은 자율주행(AD)에서 end-to-end (E2E) 인식의 시간 모델링에 필수적이며, 귀중한 구조적 및 텍스처 정보를 제공합니다.
One-to-one tutoring은 personalized education의 gold standard로 널리 여겨지지만, 규모를 확장하는 데 비용이 지나치게 많이 듭니다. gene…
대규모 언어 모델(LLM)은 강력한 추론 및 코딩 능력을 보여주었지만, 실제 소프트웨어 엔지니어링(SWE) 문제에 일반화하는 데 어려움을 겪고 있습니다.
Generative models는 새로운 형태를 합성하기 위해 3D vision에서 점점 더 많이 사용되고 있지만, 그들의 생성이 훈련 s...에 의존하는지는 아직 명확하지 않다.
대부분의 causal discovery methods는 observational data로부터 Markov equivalence class를 나타내는 completed partially directed acyclic graph를 복원한다. Recent work …
우리는 디바이스 및 회로 시뮬레이션을 위한 물리 기반 신경망(PINN) 프레임워크인 NeuroSPICE를 제시한다. 기존의 SPICE와 달리, 이는 time-dis…에 의존한다.
Distribution shift는 실제 머신러닝에서 가장 중요한 도전 과제이다. 지배적인 패러다임인 Unsupervised Domain Adaptation (UDA)은 feature invariance를 강제한다.
대형 언어 모델(LLM)이 외부 도구를 신뢰성 있게 호출하도록 하는 것은 자율 에이전트에게 여전히 중요한 병목 현상입니다. 기존 접근 방식은 thr...
최근 몇 년간, 특히 급속히 발전하고 있는 자율주행 시스템 분야에서, 임베디드 시스템의 복잡성과 규모가 크게 증가했습니다.
대규모 언어 모델(LLMs)은 교육용 질문과 문제를 생성하는 데 큰 잠재력을 가지고 있어, 교육자들이 대규모 학습 자료를 만들 수 있게 합니다.
췌장 종양(pancreatic neoplasm)의 조기 발견은 주요 임상적 딜레마이며, 이는 주로 종양이 최소한의 대비 경계(minimal contrast margin)로 나타날 가능성이 높기 때문입니다.
적외선 야간 시야 카메라를 이용한 화재 감지 정확도 향상은 여전히 어려운 과제이다. 이전 연구들은 강력한 성능을 보고하였다...
foundation model 안전 프레임워크와 cloud scale에서의 formal verification부터 advanced robotics 및 multimodal AI reasoning에 이르기까지, 이것들은 가장 많이 조회된 …
양자 컴퓨팅의 돌파구와 로봇공학을 위한 파운데이션 모델부터 Amazon Aurora의 진화와 agentic AI의 발전에 이르기까지, 이것이 바로 …
최근 몇 년 동안, autonomous vehicles는 다양한 사회 문제에 대한 해결책 중 하나로 주목받고 있다. 그러나 autonomous driving software는 …
멀티모달 대형 언어 모델(MLLMs)을 화학에 통합하는 것은 과학적 발견을 혁신할 것을 약속하지만, 그들의 …
Lock sets는 데드락의 동적 분석에 일반적으로 사용됩니다. 표준 per‑thread lock set 구성은 동일한 스레드에서 획득된 잠금만 고려합니다, b...