[Paper] 설득적 및 서사적 LLM 설명을 활용한 인간 의사결정
대형 언어 모델(LLMs)은 분류 작업에서 인간의 의사결정을 돕고 향상시킬 잠재력이 있습니다. 이는 비교적 정확한 예측을 제공하는 것뿐만 아니라…
1354 posts from this source
대형 언어 모델(LLMs)은 분류 작업에서 인간의 의사결정을 돕고 향상시킬 잠재력이 있습니다. 이는 비교적 정확한 예측을 제공하는 것뿐만 아니라…
인과 생성 모델링은 반사실적 추론이 가능한 신뢰할 수 있고 투명한 AI 시스템을 개발하는 데 필수적입니다. 기존 접근 방식은 …
Knowledge distillation은 일반적으로 강한 teacher가 약한 teacher보다 더 나은 student를 만든다는 강‑약 관계를 전제로 합니다. 본 연구에서는 이 가정을 검토합니다.
Bradley-Terry-Luce (BTL) 모델 추정은 pairwise comparisons 데이터셋이 주어졌을 때 아이템 컬렉션을 순위 매기는 잘 확립된 전략이다. 비록 ...
고성능 컴퓨팅(HPC) 환경에서 과학 워크플로우의 복잡성과 규모가 증가함에 따라 에너지 관리에 상당한 도전 과제가 발생하고 있습니다.
Keyframe selection은 긴 동영상 질문 응답(QA)을 위해 검증 가능한 시각적 증거를 제공하는 직접적인 방법입니다. 질의는 요구하는 바가 다르며, findin...
우리는 하이퍼넘미—일반 개념과 구체 개념 사이의 “is-a” 관계—가 언어 표현에서 어떻게 기하학적으로 인코딩되는지에 대한 분포론적 이론을 제안한다.
SDN과 유사한 중앙 집중식 제어 아키텍처는 점점 인기를 얻고 있으며, 제조업, ...와 같은 사이버‑물리 시스템(CPS)에서 널리 탐구되고 있습니다.
Learned indexes have emerged as a promising alternative to traditional index structures, offering higher throughput and lower memory usage by approximating the ...
많은 코어를 가진 뉴로모픽 시스템은 스파이킹 신경망(SNN)을 가속화하지만, 패킷 기반 스파이크 통신은 상당한 트래픽과 에너지를 소비할 수 있다.
Agentic systems have recently emerged as state-of-the-art approaches for automated theorem proving in formal mathematics. To assess how far these capabilities e...
현대의 Mixture-of-Experts (MoE) 모델은 효율적인 학습을 위해 대규모 AI accelerator 클러스터에 점점 더 의존하고 있습니다. Ascend NPUs는 이기종(on-chip) 자원을 공개합니다.
자연어 생성(NLG) 평가는 1990년 이후 크게 변했으며, 앞으로도 계속 발전할 것입니다. 1990년, NLG가 밀접한 연관을 가졌을 때…
명사와 그 맥락 사이의 의미 유형 불일치는 coercion 현상의 핵심이다. 이 논문은 graph-based method를 도입하여 어휘와 …
온라인 서비스는 트래픽이 예측할 수 없고 변동이 심할 때에도 애플리케이션 응답성을 유지하려고 노력합니다. 오늘날 온라인 서비스는 일반적으로 배포됩니다…
우리는 약한 라벨 벤치마크에 대한 protocol-level test를 연구한다: 제공된 evidence가 개입될 때 benchmark outputs가 변하는지 여부. Metadata-only shortcut c...
차트 설명은 접근성, 교차 모달 검색, 그리고 복잡한 시각화에서 독자가 인사이트를 추출하도록 돕는 데 필수적입니다. 멀티모달…
금융 거래를 정산하는 블록체인 시스템은 구조적 긴장에 직면합니다: 각 블록을 조립하는 단일 validator가 거래에 대해 일방적인 권한을 가지고 있습니다.
거래 순서 공격은 Maximal Extractable Value (MEV) 형태로 매년 수십억 달러를 탈중앙화 금융 사용자들로부터 추출합니다. Byzantine Fau...
우리는 클래식한 Preisach 히스테리시스 연산자를 기반으로 한 새로운 시퀀스 모델링 아키텍처인 Preisach Attention Layer (PAL)를 소개합니다.
Long-horizon language agents는 많은 설득력 있는 로컬 툴 호출을 할 수 있지만, 실제로 요청된 카운트가 완료될 때까지 지속하지 못합니다. 우리는 이 격차를 Qua…로 연구합니다.
개발자들은 종종 마이크로벤치마크를 사용하여 메서드나 클래스의 가장 성능이 좋은 구현을 선택합니다. Java Virtual Machine (JVM)에서는 이것이 일반적으로 …
클라우드 기반 디지털 트윈(DT) 플랫폼은 실시간 모니터링, 시뮬레이션 및 분산된 클라이언트 간 협업 의사결정을 가능하게 합니다. 그러나, 보장하기 위해...
Java Stream API는 계산을 표현하기 위한 읽기 쉬운 선언적 구문 덕분에 개발자 생산성을 높이는 것을 목표로 합니다. 또한 병렬 처리를 단순화합니다.
Rust 프로그래밍 언어는 안전이 중요한 시스템 개발에 점점 더 고려되고 있습니다. 그러나 ISO 26262와 같은 기존 안전 표준은 …
엔터프라이즈 AI 시스템은 대형 언어 모델, 검색 파이프라인 및 자율 에이전트를 기반으로 구축되며, 전통적인 소프트웨어 품질…
컴파일러 단계 순서는 프로그램 성능에 큰 영향을 미칩니다. 효과적인 패스 순서를 찾는 일은 여전히 어려운 작업이며, 탐색 공간이 ...
Directed acyclic graph (DAG) 기반 Byzantine Fault-Tolerant (BFT) 프로토콜은 전파와 합의를 분리하고 다수를 허용함으로써 높은 처리량을 달성한다.
High-throughput inference serving은 대형 언어 모델(LLMs) 기반 애플리케이션에 필수적입니다. 기존 serving frameworks는 request-level 및 batch...
Spiking Neural Networks (SNNs)는 시각 인식을 위한 에너지 효율적인 패러다임을 제공합니다. 우리는 spike-driven Transformer를 통합한 SpikingMoE를 제시합니다, …
AI coding assistants는 최근 몇 년간 급증했습니다. 장기적인 mixed‑methods 조사 를 통해, 우리는 전문 소프트웨어 엔지니어들이 …
AI 지원 코드 리뷰 도구는 일반적으로 '전문 리뷰어' 에이전트와 같이 작동하여, 필요한 분석 유형에 관계없이 동일한 결과를 도출합니다. We p...
대다수의 소프트웨어 개발자들은 개발 프로세스에서 인공지능(AI) 도구를 사용하고 있거나 사용할 계획입니다. 그들의 주요 이유에는 impr...
Tokenisation은 현재 NLP 파이프라인의 필수 요소입니다. BPE와 Unigram과 같은 현재의 tokenisation 알고리즘은 탐욕적인 알고리즘으로, 지역적으로…
비디오 대형 언어 모델(Video-LLMs)은 시간적 비디오 이해에서 빠른 진전을 이루었지만, 많은 모델이 기본적인 지각 원시인 서명된 이미지-p에서 실패한다.
Camera pose matters. The position and orientation of each viewpoint define a shared spatial coordinate frame that relates observations across video frames. Yet ...
Current motion-controlled image-to-video generation models rigidly follow user-provided trajectories that are often sparse, imprecise, and causally incomplete. ...
언어 모델은 이제 새로운 환경에 즉시 일반화하고, AlphaEvolve와 같은 inference-scaling 검색 절차 내에서 작동해야 하며, r…
Vision-and-Language Navigation (VLN) requires an agent to ground language instructions to its own movement within a visual environment. While state-of-the-art m...
Exploration is a prerequisite for learning useful behaviors in sparse-reward, long-horizon tasks, particularly within 3D environments. Curiosity-driven reinforc...
Vision-Language-Action (VLA) models have shown strong potential for general-purpose robot manipulation by unifying perception and action. However, existing VLA ...
Robust training and validation of Autonomous Driving Systems (ADS) require massive, diverse datasets. Proprietary data collected by Autonomous Vehicle (AV) flee...
Robustness, domain adaptation, photometric 및 occlusion invariance, compositional generalisation, temporal robustness, alignment safety, 그리고 classical anisotropy...
We propose and analyze a conservative drifting method for one-step generative modeling. The method replaces the original displacement-based drifting velocity by...
Autonomous agentic systems are largely static after deployment: they do not learn from user interactions, and recurring failures persist until the next human-dr...
Linear attention replaces the unbounded cache of softmax attention with a fixed-size recurrent state, reducing sequence mixing to linear time and decoding to co...
LLM-powered AI agents require high-frequency state exploration (e.g., test-time tree search and reinforcement learning), relying on rapid checkpoint and rollbac...
Production systems generate millions of log lines daily, yet most anomaly detectors operate at the session or window-level, flagging groups of lines rather than...