[논문] 가상 에이전트의 인지공포증: Lenia에서의 행동 및 동역학 구조
All embodied agents are fundamentally patterns in physiological or other excitable media, blurring the distinction between objects and processes. Emergent patte...
1354 posts from this source
All embodied agents are fundamentally patterns in physiological or other excitable media, blurring the distinction between objects and processes. Emergent patte...
The System-Theoretic Process Analysis (STPA) is a well-established hazard analysis technique that has been applied to a wide range of safety-critical systems. D...
Physical AI systems, including robots, autonomous vehicles, embodied agents and edge copilots, often run a different inference workload from cloud LLM serving: ...
We study the aggregation problem in synchronous multi-hop radio networks with O(log n)-bit messages and no collision detection. Each node initially holds a valu...
This paper investigates scheduling strategies for wireless sensor-actuator networks (WSANs) in Industry 4.0 scenarios. In particular, we address the problem of ...
This work introduces a self-optimizing virtual processor (VP) for numerical array programs that shifts parallelization from a manual developer task to a coopera...
AI 에이전트는 도구인가, 공동 저자인가, 아니면 연구자인가? 우리는 정량화된 사례 연구(N=1)를 제시한다: 물리학자가 AI 코딩 에이전트(Claude Code, Sonnet 및 O…)를 감독한다.
Moving Object Segmentation (MOS) aims to discover, segment, and track objects that move independently of the camera. Current MOS methods, however, exhibit two f...
Long-rollout causal video diffusion은 고정 크기의 슬라이딩 윈도우 KV 캐시로 수렴했으며, 최근의 진전은 이 레이아웃 내에서 어떤 것을 변경함으로써 혁신을 이루고 있다.
Autoregressive video diffusion models generate streaming video by producing frames sequentially, conditioning each chunk on previously generated content. These ...
로봇 조작은 장면의 action‑relevant 측면을 보존하는 perception에 크게 의존합니다. 그러나 대부분의 robot learning pipelines는 visual…
대규모 언어 모델(Large Language Models, LLMs)의 사전 학습 데이터 혼합은 그들의 ‘digital DNA’를 구성하며, 모델의 행동, 능력 및 실패 모드를 형성합니다. 그러나 이것은…
데이터 기반 접근 방식은 3D 비전을 혁신시켜, 트랜스포머가 정적 3D 객체를 효과적으로 재구성하고 생성할 수 있게 했습니다. 그러나, 시뮬...
비디오 확산 모델(VDMs)이 세계 모델로 발전함에 따라, 핵심적인 질문이 제기됩니다: 이 모델들이 인과 관계를 진정으로 이해하고 있는가, 아니면 단지 통계적 시간적 패턴에 과적합하고 있는가?
Printed circuit board (PCB) 회로도 설계는 거의 모든 전자 하드웨어를 정의하지만, 여전히 수동적이며 전문 지식이 많이 필요합니다. While generative AI has adva...
최근 Vision-Language Models (VLMs)의 발전은 많은 작업에서 인상적인 성능을 달성했지만, 이전 연구들은 만족스럽지 못한 성능을 보고했습니다.
대형 언어 모델의 추론 능력을 향상시키기 위해, test-time compute는 일반적으로 final answer 전에 intermediate tokens를 생성함으로써 확장됩니다....
우리는 Gaussian Splatting Anisotropic Visibility Field (GAVIS)를 제시한다, 이는 3DGS에서 불확실성 정량화와 능동 매핑을 위한 새로운 프레임워크이다. 우리의 핵심 통찰은…
시각 생성 모델링을 위한 확장 가능한 방법을 연구하려면 크고 접근 가능하며 안정적인 데이터셋이 필요합니다. 우리는 GPIC, 즉 Giant Permissive Image Corpus를 소개합니다.
Generative video-to-audio (V2A) models produce highly plausible soundtracks, but it remains unclear whether they capture the underlying physical processes. Exis...
Test-time finetuning (TTFT)은 각 프롬프트에 대해 관련 시퀀스를 검색하고 모델을 업데이트함으로써 언어 모델을 적응시키는 빠르게 진화하는 패러다임입니다.
단일 RGB 이미지에서 물리적으로 안정적인 3D 장면을 재구성하면 일상적인 이미지를 시뮬레이션에 바로 사용할 수 있는 디지털 자산으로 변환할 수 있어, 응용 프로그램을 위해 …
Federated learning is an emerging distributed paradigm that addresses the challenges posed by heterogeneous, privacy-sensitive data. It enables multiple clients...
다중 구성 요소 LLM 에이전트는 공동 문제의 일부만 보는 각 구성 요소로부터 확률적 주장을 조합합니다; 이러한 조합은 기본 확률을 위반할 수 있습니다…
Large Language Models (LLMs) have revolutionized various fields, yet their training efficiency is heavily reliant on effective data curation. While data selecti...
A plausible future mathematical claim must satisfy two constraints: it should follow the direction of prior work and respect the formal dependencies that constr...
Diffusion models achieve state-of-the-art image synthesis, with their generative trajectories fundamentally exhibiting a spectral bias, resolving low-frequency ...
Diffusion models는 자연 데이터의 복잡한 분포를 모델링하는 뛰어난 능력을 가지고 있어, posterior sampling에 있어 인기 있고 효과적인 선택이 되었습니다.
Autonomous AI research agents는 가설 생성부터 동료 검토까지 연구 파이프라인을 자동화함으로써 과학적 발견을 가속화하는 것을 목표로 합니다. 그러나 ex...
Frontier reasoning models는 posttraining된 base language models에 reinforcement learning을 적용하여 생성됩니다. 최근 연구는 샘플링…
우리는 bounded memory 하에서 limit에 따른 language generation을 연구한다. 이 작업에서 learner는 unknown target language의 예시를 하나씩 관찰하고 must...
Reinforcement Learning from Human Feedback (RLHF)는 일반적으로 정적 보상 모델에 의존하여 대형 언어 모델(Large Language Models)을 인간 선호에 맞추도록 합니다. 그러나 인간…
두 개의 공개 LLM leaderboards 전반에 걸쳐, 실제 paired evaluation에서 많은 표시된 pairwise rankings가 기존의 paired-test resolution target을 충족하지 못합니다.
대형 언어 모델(LLMs)은 임상 추론 및 의사결정 지원에 대한 가능성을 보여주지만, 현실적인 전자 건강 기록에 부합하는 환경에서의 평가가 필요합니다...
We present RaFI, a CUDA and MPI based software framework that simplifies the task of building GPU-enabled data-parallel software where rays or similar work item...
AI-assisted coding tools have altered software production. At Meta, significant lines of code per human-landed diff grew by 105.9% year over year and per-develo...
우리는 디지털 마이크로미러 장치(DMD)의 초고속 이진 광 변조와 광 산란을 기반으로 한 딥 포토닉 신경망 아키텍처를 제시한다.
Survival analysis는 사건이 발생할 때까지의 시간을 예측하는 작업과 관련됩니다. 주로 의료 분야에서 사용되는 Survival analysis는 불완전한 데이터(예: 검열된 데이터)를 다룹니다.
Large Language Models (LLMs) have shown promise for automated vulnerability repair (AVR), but they still face several limitations, including the lack of intra-v...
Quantum Federated Learning (QFL) offers a promising framework to train quantum models across distributed clients while keeping data strictly local. Due to its s...
대형 언어 모델(LLM)은 많은 소프트웨어 엔지니어링(SE) 작업에서 소프트웨어 아티팩트를 생성하는 데 점점 더 많이 사용되고 있지만, 의미적 타당성을 보장하는 것은…
One-shot Program-of-Thought (PoT)는 원시 행동 계획을 출력하는 Python 프로그램을 생성합니다; 하나의 잘못된 행동이 트래젝터리를 조용히 무효화합니다. 우리는 …
Software-Defined Vehicles (SDVs)로의 전환은 차량 설계에서 주요 패러다임 전환을 의미하며, 기존의 하드웨어 중심 시스템을 변혁하고 있습니다…
We present and show how to implement a non-trivial all-to-all communication algorithm for arbitrary d-dimensional tori effectively in MPI. Given a factorization...
Random Gradient 하이퍼휴리스틱은 최근 Rand…를 통해 LeadingOnes 벤치마크를 최적화할 때 최적의 neighbourhood size를 학습할 수 있음이 보여졌다.
Consensus protocols form the backbone of distributed systems and blockchains, where implementation bugs can cause data corruption and financial losses. While LL...
QEM is widely regarded as a plausible bridge from NISQ devices to FTQC. Yet the empirical studies used to assess the effectiveness of QEM techniques on concrete...
Context: Technical debt (TD) is a widely studied metaphor that helps to explain how sub-optimal decisions that can harm software maintainability over time. Alth...