[Paper] 라벨을 넘어 생각하기: Reasoning-Augmented LMMs를 이용한 Vocabulary-Free Fine-Grained Recognition
Vocabulary-free fine-grained image recognition은 고정된 인간 정의 레이블 세트 없이 메타 클래스 내에서 시각적으로 유사한 카테고리를 구별하는 것을 목표로 합니다. Exi...
Vocabulary-free fine-grained image recognition은 고정된 인간 정의 레이블 세트 없이 메타 클래스 내에서 시각적으로 유사한 카테고리를 구별하는 것을 목표로 합니다. Exi...
High-performance computing (HPC) 워크로드는 점점 더 다양해지고 있으며 작업 특성에 큰 변동성을 보이고 있지만, cluster scheduling은 …
Deep neural networks는 종종 shortcuts을 이용한다. 이러한 shortcuts은 training data에서 output labels와 연관되어 있지만 task semantics와는 무관한 spurious cues이다.
고성능 컴퓨팅(HPC) 기반 시뮬레이션은 천체물리학 및 우주론(A&C)에서 매우 중요하며, 과학자들이 복잡한 현상을 조사하고 이해하는 데 도움을 줍니다.
항목(문제 또는 과제)의 난이도를 정확하게 추정하는 것은 교육 평가에 있어 매우 중요하지만, 콜드 스타트 문제에 시달립니다. 대형 언어 모델(Large Language Model)은…
손글씨 텍스트 인식 및 광학 문자 인식 솔루션은 현대 데이터 처리에서 뛰어난 결과를 보여주지만, 효율성은 La...
우리는 상태공간이 레이블이 붙은 잎을 가진 **binary rooted forests**인 **Hopf algebra Markov chain**의 동적 특성을 연구한다. 이 **Markovian** 동적 시스템…
Mixture-of-Experts (MoE)는 sparse expert activation을 통해 모델 용량을 확장할 수 있는 능력 때문에 대형 언어 모델(LLMs)에서 지배적인 아키텍처가 되었습니다.
Memory-augmented spiking neural networks (SNN)는 에너지 효율적인 neuromorphic computing을 약속하지만, 감각 modalities 전반에 걸친 일반화는 아직 충분히 탐구되지 않았다.
이 논문은 비용 최소화와 가용성 최대화를 목표로 하는 수리 가능한 시스템에 대한 bi-objective redundancy allocation problem (RAP)를 조사한다....
현대 잠재 확산 모델(LDM)은 일반적으로 픽셀 수준 재구성을 위해 주로 최적화된 저수준 변분 오토인코더(VAE) 잠재 공간에서 작동합니다.
단일 카메라 깊이 추정은 여전히 어려운 과제로, Depth Anything V2 (DA-V2)와 같은 최신 기반 모델들은 실제 세계 이미지에서 멀리 떨어진…