[Paper] Saliency-Aware Multi-Route Thinking: Vision-Language Reasoning 재검토
Vision-language models (VLMs)는 시각 및 텍스트 모달리티를 공동으로 활용하여 추론하는 것을 목표로 합니다. 추가적인 inference-time computation을 할당하는 것이 ...
Vision-language models (VLMs)는 시각 및 텍스트 모달리티를 공동으로 활용하여 추론하는 것을 목표로 합니다. 추가적인 inference-time computation을 할당하는 것이 ...
Machine unlearning은 훈련된 모델에서 특정 데이터 포인트를 제거하는 것을 목표로 하며, 종종 ‘perfect retraining’을 모방하려고 합니다. 즉, …
Single-cell RNA sequencing (scRNA-seq) 데이터는 강력하고 재현 가능한 통계적 구조를 보여준다. 이는 대규모 foundation 모델 개발을 촉진하였다.
다중 가설 검정과 거짓 발견율(FDR) 제어는 통계적 추론에서 기본적인 문제이며, 유전체학, 약물 분야 등에 널리 적용됩니다.
본 연구에서는 공정 k‑center 문제의 근사 난이도를 연구한다. 여기서 데이터 포인트는 그룹으로 분할되며, 과제는 …
현재 audio language models는 대부분 text-first이며, 사전 학습된 pre-trained text LLM backbones를 확장하거나 semantic-only audio tokens에 의존하여, g...를 제한한다.
Matched molecular pairs (MMPs)는 약물 화학자들이 아날로그를 설계할 때 일상적으로 사용하는 국부적인 화학 편집을 포착하지만, 기존의 ML 접근법은 …
인간 인식의 핵심적인 측면은 situated awareness, 즉 주변 물리적 환경과 자신을 연결하고 가능한 행동을 추론하는 능력이다.
시계열 이상 탐지(TSAD)는 즉각적인 포인트 이상(Point Anomalies)과 장기적인 컨텍스트 이상(Context Anomalies)을 모두 식별해야 합니다. 그러나 기존 파운데이션 모델은 …
Clustering-based Approximate Nearest Neighbor Search (ANNS)는 점들의 집합을 파티션으로 조직하고, 그 중 일부만 검색하여 가장 가까운 이웃을 찾는다...
C에 대한 Automated unit test generation은 고수준 프로그램 의도와 엄격한 구문 제약 사이의 semantic gap 때문에 여전히 어려운 도전 과제이다.
High-definition (HD) maps는 자율 주행에 필수적이며, 네비게이션 및 플래닝을 지원하기 위해 도로 요소들의 구조화된 표현을 제공합니다. 그러나, ...