[Paper] TaxonRL: 해석 가능한 세밀한 시각적 추론을 위한 중간 보상을 활용한 강화학습
전통적인 vision-language 모델은 대비적인 세밀한 분류학적 추론에 어려움을 겪으며, 특히 시각적으로 유사한 종을 구별할 때 그렇다.
전통적인 vision-language 모델은 대비적인 세밀한 분류학적 추론에 어려움을 겪으며, 특히 시각적으로 유사한 종을 구별할 때 그렇다.
컴퓨터 지원 설계(CAD) 모델을 구축하는 것은 노동 집약적이지만 엔지니어링 및 제조에 필수적입니다. 최근 대규모 언어 모델(Large Language Models, LL…)
최근 연구는 대형 언어 모델(LLM) 은닉 상태에서 지리적 및 시간적 변수들을 선형적으로 복원할 수 있는 것을 세계와 유사한 ...의 증거로 해석한다.
복잡한 추론 작업에 대한 Test-time scaling은 독립적으로 샘플링하고 여러 s를 집계하는 등과 같은 방법으로 inference-time compute를 활용하는 것이 ...
Large Language Models (LLMs)은 종종 매우 순응적이고 강화하는 대화 스타일을 보이며, 이는 AI-sycophancy라고도 알려져 있습니다. 비록 이 행동이 ...
대형 언어 모델(LLMs)이 연구 프로토타입에서 실제 시스템으로 전환함에 따라, 맞춤화가 핵심 병목 현상으로 부상했습니다. 텍스트 프롬프트는…
우리는 VietNormalizer1을 소개합니다. 이는 베트남어 텍스트 정규화를 위해 설계된 오픈소스, 의존성 없는 Python 라이브러리로, Text-to-Speech (TTS) 및 Natural Language …
대규모 언어 모델(LLM) 기반 에이전트는 정적 버그 수정과 같은 소프트웨어 엔지니어링 작업을 자동화하는 데 강력한 역량을 입증했습니다.
생성형 인공지능(AI)은 형성 피드백에 대한 확장 가능한 지원을 제공하지만, 대부분의 AI‑generated 피드백은 작성된 task‑specific rubrics에 의존합니다...
Contrastive steering은 추론 시점에 LLM의 생성 행동을 조정하는 간단하고 효과적인 방법으로 입증되었습니다. 이는 프롬프트 예시를 사용합니다.
Agentic language models는 chat models와 근본적으로 다른 안전 체제에서 작동한다: 이들은 계획을 세우고, tools를 호출하며, long‑horizon actions를 실행해야 한다...
CDD, 또는 Contamination Detection via output Distribution는 모델이 샘플링한 출력의 피크 정도를 측정하여 데이터 오염을 식별합니다. 우리는 co...