[Paper] 크면 언제나 더 좋을까? 자원 제한이 있는 소형 객체 탐지에서 효율성 분석
스케일링 법칙은 더 많은 데이터로 훈련된 대형 모델이 일관되게 소형 모델보다 성능이 우수하다고 가정합니다—이는 컴퓨터 비전에서 모델 선택을 주도하는 가정이지만 …
스케일링 법칙은 더 많은 데이터로 훈련된 대형 모델이 일관되게 소형 모델보다 성능이 우수하다고 가정합니다—이는 컴퓨터 비전에서 모델 선택을 주도하는 가정이지만 …
현대 언어 모델은 제한된 컨텍스트 내에서 추론하며, 이는 장기 추론에 대한 근본적인 장벽이 되는 고유한 제약입니다. 우리는 재귀를 ...
Think-Answer 리저버와 같은 DeepSeek‑R1은 해석 가능한 내부 추론을 활용하여 눈에 띄는 진전을 이루었습니다. 그러나 빈번하게 존재하는 ...
멀티모달 검색은 이질적인 모달리티에 걸친 쿼리에서 정보를 집계하여 원하는 타깃을 검색하는 작업이다. 최첨단 멀티모달…
최첨단 대형 언어 모델(LLM)인 GPT-5와 Gemini-2.5에 대한 접근은 종종 높은 가격, 결제 장벽 및 지역 제한으로 인해 방해받습니다. T...
우리는 시간 전반에 걸쳐, 높은 확률로, stochastic gradient 로 훈련된 two-layer neural network 의 예측 간 불일치를 정량화한다.
도구 사용 에이전트를 훈련하는 것은 일반적으로 결과 기반 필터링에 의존한다: 성공적인 궤적에 대한 Supervised Fine-Tuning (SFT)과 Reinforcement Learning (RL) …
우리는 Legal RAG Bench를 소개한다. 이는 법률 RAG 시스템의 엔드‑투‑엔드 성능을 평가하기 위한 벤치마크 및 평가 방법론이다. 벤치마크로서 Legal RAG Bench는…
밀집된 바이오메디컬 임베딩은 강력한 성능을 달성하지만, 그 블랙박스 특성은 임상 의사결정에서의 활용도를 제한합니다. 최근 질문 기반 인…
Speculative Decoding (SD)는 토큰 생성을 빠른 초안으로 분리함으로써 대형 언어 모델 (Large Language Model, LLM) 추론을 가속화하는 주요 기술로 부상했습니다.
제한된 예산 하에서 능동적인 pairwise comparisons를 사용해 아이템 집합 중 승자를 결정하는 것은 preference-based learning에서 도전적인 문제입니다. The go...
Autonomous Networks – 텔레콤 분야의 차세대 프론티어인 Autonomous networks – 지능형, 자체 관리형 통신 운영 –이 미래에서 전환하고 있다.