[Paper] 레드팀을 넘어: LLM Guardrail Classifiers의 형식적 보증
Guardrail Classifiers는 production language models를 유해한 행동으로부터 방어하지만, 테스트에서는 결과가 유망해 보이지만, formal guarant...
Guardrail Classifiers는 production language models를 유해한 행동으로부터 방어하지만, 테스트에서는 결과가 유망해 보이지만, formal guarant...
Deep research agents, 즉 계획을 세우고, 검색하고, 증거를 평가하며, 장문 보고서를 종합하는 시스템을 훈련시키는 것은 reinforcement learning을 그 …
대형 vision-language 모델은 visual ungroundedness 문제를 겪습니다: 이들은 언어 priors에 전적으로 의존하여 유창하고 자신감 있으며 때로는 정확한 응답을 생성할 수 있습니다.
성능 버그의 자동 수리에 대한 최근의 진전은 현실적이고 실행 가능한 벤치마크를 요구합니다. 그러나 기존 C++ 성능 벤치마크는 대부분 …
On-policy distillation은 추론 모델을 훈련하기 위해 밀도 높은 per-token 감독을 제공하지만, 이 신호가 언제 유익한지는 아직 명확하지 않다.
Shielding은 자율 에이전트의 안전을 보장하기 위한 대표적인 모델 기반 기법입니다. Classical shielding은 나쁜 일이 절대 일어나지 않도록 보장하는 것을 목표로 하며…
오픈 월드 객체 카운팅은 여전히 취약합니다: 비전-언어 모델(VLMs)의 급속한 발전에도 불구하고, 사용자가 의도하는 객체를 신뢰성 있게 세는 것은 아직 멀었습니다.
최근 GPU 세대는 FP8과 같은 저정밀 연산을 사용하여 훨씬 높은 FLOPs를 제공한다. 이는 대형 언어 모델(LL…에 성공적으로 적용되었다.
Cross-domain few-shot medical image segmentation (CD-FSMIS)은 모델이 새로운 해부학적 카테고리와 보지 못한 영상 도메인에 동시에 일반화할 수 있도록 요구한다.
전자 건강 기록(EHRs)에서 Automated question answering (QA)은 정확한 evidence retrieval, 충실한 answer generation, 그리고 explicit grounding을 요구한다.
최근 machine learning과 large-scale biological data collections의 발전은 가상 세포(virtual cell), 즉 세포의 computational model을 구축한다는 전망을 다시 부활시켰다.
효율적인 LLM 추론 연구는 주로 각 디코딩 단계의 비용을 줄이는 데 초점을 맞춰 왔으며(예: quantization, pruning, sparse attention 사용), 일반적으로…
이미지나 3D 관찰에서 편집 가능한 CAD 프로그램을 복구하는 것은 AI‑assisted design의 핵심이지만, 기존 평가 방법 때문에 진행 상황을 측정하기가 어렵다.
비록 대형 언어 모델(Large Language Models, LLMs)이 눈부신 진전을 이루었지만, 현재의 preference optimization methods는 방향 일관성을 맞추는 데 여전히 어려움을 겪고 있다.
이 논문은 RUBEN이라는 인터랙티브 도구를 시연하여, 검색 보강된 대형 언어 모델(LLM)의 출력 결과를 설명하기 위한 최소 규칙을 발견한다.
RISC-V Vector Extension (RVV)은 과학 및 머신러닝 워크로드에서 전반적인 연산을 지원하는 핵심 요소입니다. 그러나 컴파일러 지원 및 perf…
맥락. 소프트웨어 스타트업은 자원이 제한되고 경험이 부족한 초기 단계에서 최소 실행 가능 제품(minimum viable product)을 구축하는 데 상당한 어려움에 직면합니다.
현재 LLM 에이전트는 고립된 API 호출에 능숙하지만 상업용 소프트웨어 자동화의 ‘라스트 마일’에서는 어려움을 겪습니다. 실제 시나리오에서는 도구가…
우리는 Unitaria라는 Python 라이브러리를 소개합니다. 이 라이브러리는 NumPy와 SciPy와 같은 고전 선형대수 툴킷의 단순성을 양자 구현에 가져옵니다.
메모리 안전 오류는 저수준 소프트웨어에서 제로데이 취약점의 지속적인 원인으로 남아 있습니다. 이 문제는 특히 임베디드 시스템에서 심각한데, 여기서 ha...
빠르게 성장하고 있는 연구 분야가 LLM이 개발자들이 코딩할 때 어떤 영향을 미치는지 조사하고 있습니다. 현재까지 이 연구는 주로 생산성 및 코딩에 초점을 맞춰 왔습니다.
스파이킹 신경망(SNN)은 스파이킹 활동이 희소하고 전통적인 인공 신경망(ANN)과 비교할 때 에너지 소비를 줄일 수 있다.
Rejection Fine-Tuning (RFT)은 LLM 에이전트를 훈련시키는 표준 방법으로, 성공하지 못한 트래젝터리를 훈련 세트에서 제외합니다. In the context of...
Mixture-of-Experts (MoE) 서빙은 넓은 expert parallelism (EP)을 활용하여 하나의 추론 인스턴스 내에서 다수의 GPU가 제공하는 메모리 용량과 대역폭을 집계한다.
인공지능(AI)과 분산 원장 기술(DLT)의 통합은 성장하는 연구 분야가 되었지만, 기여는 …
전통적인 연합 학습(Federated Learning, FL)은 중앙 집계 서버에 의존하는데, 이는 성능 병목 현상과 프라이버시 위험을 초래할 수 있습니다. 분산형 mix-and-for...
Edge computing은 device architectures 전반에 걸친 multi‑dimensional heterogeneity와 diverse task requirements로 인해 전례 없는 resource orchestration 과제에 직면하고 있다.
클라우드 데이터베이스 시스템, 특히 미들웨어와 query execution 레이어는 sorting을 query processing, indexing 및 join execution의 핵심 작업으로 사용합니다.
기존 Meta-Black-Box Optimization (MetaBBO) 방법은 최적화기를 제어할 때 **어떻게** 탐색할지에 초점을 맞추지만, **어디를** 탐색할지는 크게 간과하고 있다. 우리는 Meta...
Adaptive behavior는 뇌가 서로 다른 contexts 사이를 전환하면서 prior experience의 representations를 유지하도록 요구한다. 재구성 능력은 n...
프로그램 합성에서 핵심 과제는 online library learning이다: 미래 작업 수요에 대한 불확실성 하에서 reusable abstractions를 점진적으로 획득하는 것.
밀리미터파(mmWave) 센싱은 프라이버시를 보호하면서 항상 켜져 있는 엣지 인식을 가능하게 하지만, 그 측정값은 종종 희소하고 시간적으로 불규칙하며 손상될 수 있습니다...
대형 언어 모델은 모드 붕괴(mode collapse)를 나타내어, 유효한 솔루션 공간을 탐색하지 못하고 동질적인 출력을 생성합니다. 우리는 QD-LLM이라는 프레임워크를 제시합니다, ...
대규모 언어 모델(LLM) 정렬을 위한 Gradient-based preference optimization 방법은 preference collapse가 발생하여, 좁은 행동 모드로 수렴한다 w...
Spike-based encodings은 sparse하고 energy‑efficient하지만, 대부분 probabilistically하게 공식화되어 signal processing 문헌과는 크게 단절되어 있다. ...
Test-time scaling (TTS)은 추론 중에 추가 연산을 할당함으로써 대형 언어 모델의 성능을 향상시키는 효과적인 접근법이 되었습니다. H...
Diffusion 기반 모델은 샘플링을 많은 작은 Gaussian 디노이징 단계로 분해합니다 — 생성이 몇 개의 coar... 로 압축될 때 이 가정은 깨집니다.
비침습 뇌 기록으로부터 상상된 말을 디코딩하는 것은 상상 데이터셋이 부족하고 피험자 간에 시간적으로 정렬하기 어려워 도전적이다.
Conformal prediction (CP)은 distribution‑free 접근법으로, finite‑sample guarantees를 갖는 uncertainty quantification을 제공합니다. 그러나 CP를 graph neural networks에 적용하는 것은…
추론 시간 추론을 확장하기 위한 표준 기법은 Self-Consistency이며, LLM에서 여러 후보 답변을 샘플링하고 가장 흔한 …
시각-언어 모델(VLM)에서의 공간 지능은 3D 세계에서 추론해야 하는 실용적인 요구와 함께 연구 관심을 끌고 있습니다. 유망한 결과에도 불구하고, ...
기존 Flow Matching (FM) 텍스트‑투‑이미지 모델은 다중 작업 정렬에서 두 가지 중요한 병목 현상을 겪는다: 스칼라 값 보상으로 인해 발생하는 보상 희소성…
우리는 보상을 가중된 검증 가능한 기준으로 분해하고 LLM judge를 사용해 이를 점수화하는 것이 부분‑credit 최적화 신호를 제공한다고 주장한다: 대신 …
Context window 확장은 종종 LLM의 단순한 기능 업그레이드로 간주되지만, 우리는 이것이 다중 에이전트 social dilemmas에서 체계적으로 실패한다는 것을 발견했습니다.
최근 추론 시 학습(inference-time learning)의 발전으로 LLM이 Text-to-SQL 작업에서 추론 능력이 향상되었지만, 현재 솔루션은 여전히 m...에 대해 좋은 성능을 내는 데 어려움을 겪고 있다.
맞춤형 zero-shot 목표 함수를 만족하는 인간 동작을 생성하여, 제어 가능한 캐릭터 애니메이션 및 행동 합성 등과 같은 응용을 가능하게 합니다.
할인된 마코프 결정 과정(MDPs)에서 지수 효용 최적화를 위한 강화 학습(RL)은 원칙적인 가치 기반 알고리즘이 부족합니다. 우리는 ...
Talking-head generation은 identity, head pose, facial expression, 그리고 mouth dynamics의 공동 모델링을 필요로 합니다. 기존 방법들은 일반적으로 그 중 일부만을 다룹니다.