[논문] 병렬 웨이크업 문제와 다중실 조명 스위치 전략
The wakeup problem in distributed computing asks for a symmetric protocol that enables one of several processors to eventually guarantee that all (or, in a more...
1354 posts from this source
The wakeup problem in distributed computing asks for a symmetric protocol that enables one of several processors to eventually guarantee that all (or, in a more...
Driver fatigue is a critical safety concern in advanced driver assistance systems. Driver monitoring models trained off-site on static datasets adapt poorly to ...
AI가 생성한 시각 매체의 급속한 확산은 효율적이고 신뢰할 수 있는 딥페이크 탐지 시스템에 대한 긴급한 필요성을 만들었습니다. 그러나 기존 딥…
Physical computing systems는 하드웨어 네이티브 머신 러닝을 향한 유망한 경로를 제공하지만, 그들의 계산 능력은 여전히 파악하기 어렵다.
기존 신경 조합 최적화 솔버는 솔루션 탐색을 최적 결정의 모방으로 프레임화하여 본질적으로 그 효용을 단일 목표에만 제한한다…
Multiview 3D evaluation은 평가되는 이미지들이 하나의 정적인 3D 장면을 관찰한 것이라고 가정합니다. 이 가정은 NVS 및 sparse-view reconstruction에서 실패할 수 있습니다.
Current hierarchical attention methods, such as NSA and InfLLMv2, select the top-k relevant key-value (KV) blocks based on coarse attention scores and subsequen...
현대 오디오 생성은 주로 latent-space compression에 의존하며, 이는 추가적인 복잡성과 잠재적인 정보 손실을 초래합니다. 이 연구에서 우리는 cha...
최근 비디오 편집 모델들은 통합된 컨디셔닝 디자인으로 수렴했다: 단일 diffusion transformer가 텍스트, 원본 비디오, 그리고 레퍼런스 i...
Recent large language models (LLMs) have demonstrated strong capabilities in understanding and generating code, from competitive programming to repository-level...
Spatial intelligence unfolds through a perception-action loop: agents act to acquire observations, and reason about how observations vary as a function of actio...
Diffusion 기반 생성 모델은 점점 더 inference-time guidance에 의존하며, drift term을 추가하거나 mixture of experts를 reweighting하여 샘플 품질을 향상시킨다...
Inspired by the emergent behaviors in large language models that generalized human intelligence, the research community is pursuing similar emergent capabilitie...
Multimodal Large Language Models (MLLMs)은 여전히 세밀한 시각적 이해에 어려움을 겪고 있으며, 답변은 종종 작지만 결정적인 증거에 의존한다…
우리는 LongLive-2.0을 소개한다. 이는 NVFP4 기반의 병렬 인프라스트럭처로, 긴 비디오 생성의 전체 학습 및 추론 워크플로우 전반에 걸쳐 속도를 개선한다.
의학은 본질적으로 다원주의적이다. autonomy, beneficence, nonmaleficence, justice와 같은 원칙들은 일상적으로 충돌하며, 이러한 윤리적 딜레마는 종종 …
Diffusion models는 시각 콘텐츠를 frequency domain에서 autoregressively하게 암묵적으로 생성하는 것으로 나타났으며, low-frequency components가 각각 생성됩니다.
우리는 물리적으로 제어 가능한 단일 이미지 리라이트를 위한 피드포워드 접근법인 PIXLRelight를 제시합니다. 기존 방법들은 제한된 조명 제어만 제공하거나(e...
Egocentric memory is widely used in embodied intelligence, but it may be insufficient for comprehensive spatial-temporal reasoning. Inspired by human recall fro...
Autoregressive video generation has improved rapidly in visual fidelity and interactivity, but it still suffers from long-term inconsistency and memory degradat...
스케일링 법칙이 집합적인 large language model 성능을 지배하지만, factual recall를 model size와 training-data composition 모두와 연결하는 스케일링 법칙은 아직 없습니다....
Evaluating embodied systems on real dexterous hardware requires more than isolated primitive skills: an agent must perceive a changing tabletop scene, choose a ...
Post-training has split large language model (LLM) alignment into two largely disconnected tracks. Online reinforcement learning (RL) with verifiable rewards dr...
Unified multimodal models (UMMs)는 시각적 이해와 시각적 생성을 하나의 아키텍처 안에서 통합하려고 노력합니다. 그러나 기존의 훈련 패러다임은…
멀티모달 모델(MMs)이 실제 시나리오에서 널리 채택됨에 따라, 점점 더 복잡해지는 신흥 MMs를 효율적으로 학습하는 것이 중요합니다.
Population protocols는 n개의 에이전트가 각각 단순한 유한 상태 기계(finite-state machine)로 구성되어, 쌍으로 상호작용하며 공통 과제(common task)를 해결하는 분산 컴퓨팅(distributed computing) 모델이다. against a...
동적 환경에서 Unmanned Aerial Vehicles는 telemetry outages, structural vibrations, 그리고 regime-dependent noise에 직면하며, 이는 stationary covariance를 무효화한다.
Equipping LLMs with tool-use capabilities via Agentic Reinforcement Learning (Agentic RL) is bottlenecked by two challenges: the lack of scalable, robust execut...
Tabular foundation models (TFMs) achieve strong performance on health datasets, but their inference cost and infrastructure requirements limit practical use. We...
복합 AI 애플리케이션은 Python과 같은 범용 프로그래밍 언어를 사용해 ML 모델에 대한 호출을 구성하며, 다양한 사용자‑대면 ...
레거시 시스템은 비즈니스 규칙, 아키텍처 결정, 그리고 운영 예외를 집중시켜, 이들은 종종 코드, 데이터, 구성 및 main...에 암묵적으로 남아 있습니다.
In-Network Collective (INC) 가속은 AI 학습 및 추론을 최적화하는 데 엄청난 잠재력을 가지고 있지만, 그 교차 계층적 특성은 역사적으로 …
Major deployed generative AI advertising systems preserve a visible boundary between commercial content and AI-generated responses. Yet empirical research shows...
As LLM benchmarks saturate, the evaluation community has pursued two strategies to increase difficulty: escalating knowledge demands (GPQA, HLE) or removing kno...
Central to human-aligned AI is understanding the benefits of human-elicited labels over synthetic alternatives. While human soft-labels improve calibration by c...
분산 설정에서의 Saddle Problems (SPs)는 최근 머신러닝 및 다중 에이전트 시스템의 다양한 현대적 응용을 위한 프레임워크로 부상하고 있습니다.
코딩 에이전트는 이제 셸, 파일 및 네트워크 권한을 가지고 자율적으로 실행됩니다. 사용자가 무해한 요청을 하면, 에이전트는 때때로 요청한 것보다 더 많은 일을 합니다: it d...
검색 기반 코딩에서는, 관련 파일이 검색된 컨텍스트에 없을 때 실패가 종종 시작됩니다. 고정된 일반 토크나이제이션 하에서, BM25...
뇌는 high-dimensional 감각 입력의 추상적 표현을 학습하지만, 이러한 학습을 가능하게 하는 plasticity 규칙은 알려져 있지 않다. 우리는 biological...
Sparse matrix-vector multiplication (SpMV) is crucial in computational science, engineering, and machine learning. Despite substantial efforts to improve SpMV p...
AI tools는 엔지니어가 이전에 cross-functional squads에 걸쳐 분산되었던 역할을 흡수하도록 하고 있지만, 이를 설계하는 방법에 대한 구조화된 증거는 거의 없습니다.
본 연구는 데이터 클러스터링을 위해 Firefly Algorithm (FA)의 새로운 변형을 제시하며, K-Means와 같은 전통적인 방법들이 겪는 한계를 해결한다.
Vehicular edge computing (VEC)은 근처 엣지 서버에 computation-intensive 작업을 오프로드함으로써 latency-sensitive 차량 애플리케이션을 가능하게 합니다. 그러나 real-
이 논문은 추가적인 modulus를 사용하여 Residue Number System (RNS)에서 두 숫자를 비교하는 새로운 방법을 제시한다. 이 modulus는 종종 이미 사용 가능하기 때문이다.
Multimodal optimization은 다양한 개체군을 유지하는 것만으로는 충분하지 않고, 다수의 optima를 찾아야 합니다. 그러나 대부분의 niching-based evolutionary algorithms는 …
LLM 기반 소프트웨어 엔지니어링 에이전트에 대한 행동 연구는 어떤 궤적 형태가 더 높은 해결률과 상관관계가 있는지에 대한 운영 규칙을 추출한다: that...
소프트웨어 리포지토리는 커밋 메시지, 풀‑리퀘스트 토론, 이슈 스레드에 비구조화된 방대한 지식을 축적하지만, 개발자와 AI는 …
실시간 자기공명영상(rtMRI)을 이용한 언어 생성은 비침습적으로 동적인 성도 움직임을 시각화할 수 있게 하며, 언어 sc...