[Paper] SEALing the Gap: 다중 벤치마크 기반 구현을 통한 LLM 추론 탄소 추정용 레퍼런스 프레임워크
대규모 언어 모델(Large Language Models)은 소프트웨어 엔지니어링 분야에서 빠르게 주목받고 있지만, 이들의 증가하는 탄소 발자국은 시급한 지속 가능성 문제를 제기합니다. While tr...
대규모 언어 모델(Large Language Models)은 소프트웨어 엔지니어링 분야에서 빠르게 주목받고 있지만, 이들의 증가하는 탄소 발자국은 시급한 지속 가능성 문제를 제기합니다. While tr...
sequential에서 parallel computing으로의 전환은 현대 high‑performance applications에 필수적이지만, 동시성의 가파른 learning curve 때문에 방해받는다.
인간과 제품이 결합된 모습을 보여주는 인간‑제품 이미지(Human‑product images)는 광고, 전자상거래(e‑commerce), 디지털 마케팅에서 중요한 역할을 합니다. 필수적인 …
검증 가능한 상징 데이터에 대한 학습은 표준 사전 학습 코퍼스가 제공하는 것보다 언어 모델의 추론 한계를 확장하는 유망한 방법이다. Y...
Selective conformal prediction은 테스트 예시와 교환 가능(exchangeable)한 보정 예시(calibration examples)를 식별할 수 있을 때, 훨씬 더 타이트한 불확실성 집합(uncertainty sets)을 제공할 수 있다.
테스트 시 강화 학습(TTRL)은 자체 진화하는 대규모 추론 모델(LRMs)을 위한 유망한 패러다임으로 부상했으며, 라벨이 없는 데이터에 대한 온라인 적응을 가능하게 합니다.
Sudoku와 ARC-AGI와 같은 추론 문제는 신경망에게 여전히 도전 과제이다. 구조화된 문제 해결 아키텍처 패밀리인 Recurrent Reasoning …
우리는 Sketch2Colab을 소개한다. 이는 스토리보드 스타일 2D 스케치를 일관된 객체 인식이 가능한 3D 다중 인간 모션으로 변환하며, 에이전트와 관절에 대한 세밀한 제어를 제공한다.
대규모 언어 모델에서 장기 컨텍스트 추론은 디코딩 단계에서 Key--Value (KV) 캐시 로딩에 의해 병목 현상이 발생합니다. 여기서 순차적인 특성 때문에 …
멀티 어트리뷰션 러닝(MAL)은 여러 attribution 메커니즘에서 생성된 conversion 라벨을 학습함으로써 모델 성능을 향상시키며, …으로 부상하고 있다.
Reservoir expansion은 비선형 혼합 하에서 온라인 독립 성분 분석(ICA)을 개선할 수 있지만, top‑n whitening은 주입된 특징을 버릴 수 있습니다. We formal…
Claude 에이전트 스킬의 급속한 확산은 에이전트 스킬 생태계를 효과적으로 활용하고 관리하며 확장하는 방법에 대한 핵심 질문을 제기했습니다. In t...