[Paper] (How) Large Language Models가 High-Level Message Sequence Charts를 이해할 수 있을까?
대규모 언어 모델(Large Language Models, LLMs)은 소프트웨어 개발 라이프사이클 전반에 걸쳐 작업을 자동화하는 데 널리 활용되고 있습니다. 그러나 이러한 작업들이…
대규모 언어 모델(Large Language Models, LLMs)은 소프트웨어 개발 라이프사이클 전반에 걸쳐 작업을 자동화하는 데 널리 활용되고 있습니다. 그러나 이러한 작업들이…
Large language models는 다단계 추론 과정에서 hallucinate하지만, 대부분의 기존 detectors는 trace level에서 작동합니다: they assign one confidence score to a ful...
자율주행 시스템(ADSs)의 신뢰할 수 있는 안전 보증을 확립하려면, 실패가 피할 수 있는 시스템 결함에서 비롯된다는 증거가 필요합니다...
오므니모달 대형 언어 모델이 실제로 보고 듣는 것과 텍스트 전제가 모순되는 질문을 받아들일 때, 그 실패는 인식에 있는가…
LLM은 생산 환경에서 널리 채택되어 추론 시스템을 한계까지 밀어붙이고 있습니다. 분산된 LLM 서빙(예: PD 분리 및 KV 상태 분산)은 …
Large language model agents는 다단계 작업을 위해 skill libraries에 점점 더 의존하고 있지만, skill이 추가될수록 이러한 라이브러리는 persistent defects를 누적시킬 수 있습니다.
본 연구는 새로운 학습 방법론을 도입하여 견고한 …을 가능하게 함으로써 Neural Cellular Automata(NCAs)를 활용한 다중 텍스처 합성을 크게 진전시켰다.
이 논문은 배열과 행렬에서 동작하는 데이터 레벨 프로그램의 연역적 검증(deductive verification) 확장성을 향상시키는 여러 기술을 소개합니다. 첫째...
Simulative 및 scenario-based testing은 automated driving systems의 안전 보증에 필수적인 방법입니다. 시뮬레이션 결과가 신뢰할 수 있도록 하기 위해서는, ...
대규모 언어 모델(LLMs)은 AI 기반 소비자 및 기업 서비스의 도입으로 인해 클라우드 기반 플랫폼에서 점점 더 널리 사용되고 있습니다.
자동화된 fault localization은 관찰된 test failure를 수천 개의 candidates 중 책임 있는 method와 연결해야 하며—순수히 statistic...
그래프 분석은 스마트 시티, 사이버‑물리 인프라, IoT 보안, 대규모 소셜 네트워크와 같은 현대 지능형 시스템에 동력을 제공합니다. 이러한 w...
비스무스 집합-그라디언트 상승 방법은 다목적 최적화에서 유한 근사 집합을 파레토 프론트(Pareto front) 쪽으로 이동시키기 위해 개발되었습니다. 이 방법은 …
비동기 확률적 경사 하강법(ASGD)은 분산 학습에서 이기종 컴퓨팅 자원을 활용하는 표준적인 방법입니다: 빠른 워커를 강제로 …
Generative recommendation(GR)은 파편화되고 시나리오별로 설계된 아키텍처를 통합된 Transformer 기반 모델로 대체하는 유망한 패러다임으로 부상하고 있다.
많은 실제 최적화 문제는 자연스럽게 동질적인 벡터가 아니라 이질적인 매개변수를 가진 복합 설계 객체이다: 정수, 실수 값, B...
대규모 multi-objective optimization은 고차원 의사결정 공간, 복잡한 변수 상호작용, 제한된 함수 평가 등 때문에 여전히 도전적인 과제입니다.
대형 언어 모델(Large Language Models, LLMs)이 소프트웨어 개발을 혁신함에 따라, 생성된 코드의 기능적 품질이 핵심 초점이 되었고, 가독성은…
Mutation analysis는 오래전부터 classical software testing에 사용되어 왔으며, 최근에는 quantum software testing 기술의 견고성을 평가하기 위해 채택되었습니다.
대형 언어 모델(LLMs)의 발전은 최근 small-molecule drug discovery를 위한 새롭고 유망한 길을 열었습니다. 그러나 기존의 LLM 기반 접근법은…
컴퓨터 사용 에이전트(CUAs)는 GPT-5.4와 Claude가 보여주듯 화면상의 작업을 자동화합니다. 그러나 복잡하고 저빈도 상호작용에 대한 신뢰성은 아직 …
최근 대형 비전-언어 모델(VLMs)은 근본적으로 지속되는 이분법에 의해 제한됩니다: 이해와 생성이 별개의 문제로 취급됩니다.
사용자의 시점에서 단일 헤드 마운트 카메라를 사용하여 손의 절대 3D 포즈와 형태를 재구성하는 것은 실용적인 egocentric 인터...
Autoregressive 비디오 생성은 실시간, 오픈엔드(open‑ended) 합성을 목표로 합니다. 그러나 시네마틱 스토리텔링은 단일 장면을 끝없이 확장하는 것만은 아니며…
시각 인지는 고수준 의미 이해를 픽셀 수준 인식과 연결하지만, 대부분의 기존 설정은 식별에 결정적인 증거를...
본 논문에서는 Group Relative Policy Optimization (GRPO)를 AR-Diffusion Unified Multimodal Models (UMMs)에 적용하는 새로운 프레임워크인 AlphaGRPO를 제안한다.
차분 가능한 렌더링을 이용한 표면 재구성은 최근 몇 년간 인상적인 성능을 달성했지만, 널리 퍼진 photometric ambiguities는 엄격하게…
장기 기억은 특화된 웹 환경에서 에이전트에게 매우 중요합니다. 성공은 인터페이스 어포던스, 상태 역학, 워크플로우 등을 기억하는 데 달려 있습니다…
우리는 직교 동등 변환에 기반한 대규모 언어 모델(LLM) 훈련을 위한 스펙트럼 보존 옵티마이저인 Pion을 소개합니다. Unlike additive optim...
Vision Transformers (ViTs)는 전체-전체 self-attention을 활용하여 강력한 데이터 기반 스케일링을 달성합니다. 그러나 이러한 유연성은 계산 비용을 초래합니다…
우리는 LLM-guided query refinement paradigm이 임베딩 모델의 사용성을 도전적인 zero-shot 검색 및 분류에 확장하는 효과를 탐구합니다.
Large language models (LLMs)는 downstream tasks를 위해 파라미터를 업데이트(예: RL)하면서 훈련됩니다. 그러나 파라미터를 업데이트하면 그들이 …
라벨이 지정된 검증 가능한 훈련 데이터(labeled verifiable training data)가 제약 조건(binding constraint)인 상황에서는, 각 확인된 예시(checked example)를 신중하게 할당해야 합니다. 표준 관행은 …
Computer Use Agents (CUAs)는 클릭 및 입력과 같은 원자적인 GUI 동작과 API 기반 파일 작업과 같은 고수준 툴 호출을 모두 통해 작동할 수 있지만, ...
최근 오디오-비디오 공동 생성 분야의 발전은 눈부셨지만, 실제 응용에서는 강력한 per-modality fidelity와 cross-modal alignment가 요구됩니다.
LLM-based agents는 지속적인 환경에서 점점 더 많이 작동하며, 여러 세션에 걸쳐 정보를 저장하고 업데이트하며 추론해야 합니다. 이전에는 …
Sparse Mixture-of-Experts (SMoE) 모델은 언어 모델을 효율적으로 확장할 수 있게 해주지만, 학습은 여전히 어려운데 라우팅이 소수의 전문가에게만 집중될 수 있기 때문이다.
검증 가능한 보상을 활용한 Reinforcement learning은 수학 및 코딩과 같은 분야에서 강력한 post‑training gains를 가능하게 했지만, 많은 open‑ended settings는 …
우리는 KV-Fold를 소개한다. 이는 training-free인 간단한 long-context inference protocol로, key-value (KV) cache를 시퀀스에 대한 left fold의 accumulator로 취급한다.
Looped Transformers는 잠재 표현을 반복적으로 정제함으로써 순수한 feed-forward 연산에 대한 유망한 대안을 제공하며, language modeling을 향상시킵니다.
극심한 기후와 변동성이 큰 도매 전력 시장은 주거용 소비자를 재앙적인 재정 위험에 노출시키지만, 배전 단계에서의 demand response는…
언어 모델 능력의 지속적인 향상이 코딩이나 컴퓨터 사용 등에서 자율 에이전트의 구동 요소로서 그 활용을 널리 가능하게 했습니다.
우리는 TextSeal을 소개합니다, 대형 언어 모델을 위한 최첨단 워터마크입니다. Gumbel-max 샘플링을 기반으로, TextSeal은 dual-key generation을 도입하여 resto...
고속 5G 사용 사례에서 특히 사용자 장비(UE) 이동성에 따른 높은 중단 시간 및 측정 보고 오버헤드 문제를 해결하기 위해 ...
대규모 언어 모델(LLMs)은 대량의 유창한 정치 텍스트를 생성할 수 있어, 위기 상황과 사회 갈등 시 synthetic discourse에 대한 우려를 불러일으킵니다. 기존…
Continual Panoptic Segmentation (CPS)은 시간이 지남에 따라 새로운 카테고리에 빠르게 적응할 수 있는 방법을 필요로 합니다. 이와 같은 밀집 예측 작업의 특성상 t...
대형 언어 모델(LLMs)은 종종 틀린 경우에도 높은 확신을 가지고 답변을 생성하므로, 신뢰할 수 있는 confidence estimation이 배포에 필수적이다.
Basilisk는 오픈소스 astrodynamics 시뮬레이션 프레임워크로, spacecraft guidance, navigation, and control (GN&C) 연구 및 개발에 널리 사용됩니다.