[Paper] Delta-LLaVA: 베이스-전-스페셜라이즈 정렬을 통한 토큰 효율적인 비전-언어 모델
멀티모달 대형 언어 모델(MLLMs)은 시각적 및 텍스트 표현을 결합하여 풍부한 추론 능력을 가능하게 합니다. 그러나 높은 계산 비용…
멀티모달 대형 언어 모델(MLLMs)은 시각적 및 텍스트 표현을 결합하여 풍부한 추론 능력을 가능하게 합니다. 그러나 높은 계산 비용…
수년 동안 자동 MT 메트릭은 벤치마크를 꾸준히 올려왔으며 인간 평가와 강력하고 때로는 인간 수준의 일치를 보여주었습니다. 그러나 그들은 여전히 bl...
우리는 Gabliteration을 소개한다. 이는 기존의 abliteration 방법을 넘어서는 새로운 neural weight modification 기법으로, 적응형 다중 방향…
Vocabulary-free fine-grained image recognition은 고정된 인간 정의 레이블 세트 없이 메타 클래스 내에서 시각적으로 유사한 카테고리를 구별하는 것을 목표로 합니다. Exi...
High-performance computing (HPC) 워크로드는 점점 더 다양해지고 있으며 작업 특성에 큰 변동성을 보이고 있지만, cluster scheduling은 …
Deep neural networks는 종종 shortcuts을 이용한다. 이러한 shortcuts은 training data에서 output labels와 연관되어 있지만 task semantics와는 무관한 spurious cues이다.
고성능 컴퓨팅(HPC) 기반 시뮬레이션은 천체물리학 및 우주론(A&C)에서 매우 중요하며, 과학자들이 복잡한 현상을 조사하고 이해하는 데 도움을 줍니다.
항목(문제 또는 과제)의 난이도를 정확하게 추정하는 것은 교육 평가에 있어 매우 중요하지만, 콜드 스타트 문제에 시달립니다. 대형 언어 모델(Large Language Model)은…
손글씨 텍스트 인식 및 광학 문자 인식 솔루션은 현대 데이터 처리에서 뛰어난 결과를 보여주지만, 효율성은 La...
우리는 상태공간이 레이블이 붙은 잎을 가진 **binary rooted forests**인 **Hopf algebra Markov chain**의 동적 특성을 연구한다. 이 **Markovian** 동적 시스템…
Mixture-of-Experts (MoE)는 sparse expert activation을 통해 모델 용량을 확장할 수 있는 능력 때문에 대형 언어 모델(LLMs)에서 지배적인 아키텍처가 되었습니다.
Memory-augmented spiking neural networks (SNN)는 에너지 효율적인 neuromorphic computing을 약속하지만, 감각 modalities 전반에 걸친 일반화는 아직 충분히 탐구되지 않았다.