[Paper] ProbeLLM: LLM 실패에 대한 원칙적인 진단 자동화
대형 언어 모델(LLMs)이 어떻게 그리고 왜 실패하는지를 이해하는 것이 모델이 빠르게 진화하고 정적 평가가 뒤처지는 상황에서 핵심 과제가 되고 있다. While a...
3058 posts from this source
대형 언어 모델(LLMs)이 어떻게 그리고 왜 실패하는지를 이해하는 것이 모델이 빠르게 진화하고 정적 평가가 뒤처지는 상황에서 핵심 과제가 되고 있다. While a...
코드 불안정성을 유발하는 요인을 이해하는 것은 효과적인 소프트웨어 유지보수에 필수적이며, 불안정한 클래스는 더 크거나 더 빈번한 편집이 필요하고 증가...
자율주행 기술이 광범위한 채택을 향해 발전함에 따라, 다양한 환경 조건에서 안전한 운영 임계값을 결정하는 것이 중요해지고 있다.
모바일 애플리케이션(app) 기능이 점점 복잡해지고 반복 주기가 가속화됨에 따라, 높은 신뢰성을 보장하는 것은 큰 과제가 됩니다.
설명 가능한 AI (XAI) 연구 커뮤니티는 수많은 기술적 방법을 제안했지만, 설명 가능성을 시스템으로 배포하는 것은 여전히 어려운 과제입니다: Interactive ex...
이 논문은 통합 모델링 언어(UML)를 사용하여 비즈니스 모델 캔버스(BMC)의 메타모델을 소개하고, 전용 도메인 특화 모델링을 함께 제시한다.
Homomorphic encryption (HE)는 암호화된 데이터에 대한 연산을 가능하게 하여 기밀 클라우드 컴퓨팅을 위한 유망한 기술입니다. 그러나 HE는 계산적으로 …
범용 로봇에 대한 오랜 비전은 자연어 지시를 이해하고 실행하는 능력에 달려 있습니다. Vision-Language-Action (VLA...
Visual illusions은 전통적으로 multi-view consistency와 같은 spatial manipulations에 의존합니다. 이번 연구에서는 새로운 Progressive Semantic Illusions, a novel …
통합 모델은 단일 아키텍처 내에서 멀티모달 이해와 생성을 모두 처리할 수 있지만, 일반적으로 반복 없이 단일 패스로 작동합니다…
Context distillation은 언어 모델이 인-컨텍스트 지식을 파라미터에 내재화하도록 합니다. 우리 연구에서는 On-Policy Context Distillation을 제안합니다 (...).
Diffusion Transformers를 이용한 실시간 비디오 생성은 3D self-attention의 2차 비용 때문에 병목 현상이 발생하며, 특히 실시간 환경에서…
Self-supervised learning (SSL)은 라벨이 없는 시계열 데이터로부터 학습하기 위한 강력한 패러다임이다. 그러나 masked autoencoders (MAEs)와 같은 인기 있는 방법들은 …
Diffusion large language models (DLLMs)은 여러 토큰을 병렬로 디코딩함으로써 빠른 텍스트 생성을 가능하게 할 잠재력을 가지고 있습니다. 그러나 실제로는, 그들의 i...
관찰된 현상을 상징적이고 해석 가능한 공식으로 설명하는 것은 과학의 근본적인 목표이다. 최근 대형 언어 모델(LLMs)이 등장했다.
우리는 등거리 군 작용에 수직인 방향으로 투사된 잡음이 포함된 Langevin dynamics를 연구한다. 이 수학적 모델은 새로운 통찰을 제공하기 위해 도입되었다.
표준 벤치마크에서 낮은 word error rates를 달성한 speech recognition systems라도, 실제 배포 환경에서 짧고 high-stakes utterances에 대해서는 종종 실패한다.
데이터 믹싱 — 서로 다른 도메인의 데이터를 어떤 비율로 섞을지 결정하는 것 — 은 언어 모델(LMs) 훈련에서 일차적인 관심사이다. 기존의 믹싱 방법...
Supervised fine-tuning (SFT)은 계산 효율성이 높지만 강화 학습(RL)에 비해 일반화 성능이 종종 떨어집니다. 이 차이는 주로…
AI 모델은 textual reasoning에서 state-of-the-art 결과를 달성했지만, spatial 및 relational structures에 대한 추론 능력은 여전히 중요한 문제로 남아 있다.
사이버 공격의 급속한 진화는 알려지지 않은 (zero-day) 위협의 등장을 지속적으로 촉진하고 있으며, 이는 네트워크 침입 탐지에 상당한 도전을 제기합니다.
고품질 3D 텍스처 생성은 현재 주류 멀티‑뷰 디퓨전 파이프라인에 내재된 뷰‑불일치(view‑inconsistency) 때문에 근본적인 과제로 남아 있습니다. ...
Large Language Models (LLMs)를 서비스하는 것은 모델과 입력 요청을 여러 장치에 걸쳐 병렬 처리함으로써 엄청난 이점을 얻을 수 있지만, 들어오는 워크로드는 …
AI coding agents는 소프트웨어 개발에 점점 더 기여하고 있지만, 모바일 개발에 대한 그들의 영향은 실증적인 주목을 거의 받지 못했습니다. 이 ...