[논문] 바이오 영감 요격 작업을 위한 멤리스터 기반 스파이킹 신경망 가속기
Spiking neural networks (SNNs) provide event-driven and low-power computation inspired by biological neural systems, but current implementations rely on von Neu...
1080 posts from this source
Spiking neural networks (SNNs) provide event-driven and low-power computation inspired by biological neural systems, but current implementations rely on von Neu...
The Charlson Comorbidities Index (CCI) is a weighted additive index widely used to estimate ten-year mortality risk, but its original weights may not reflect co...
The misuse of Java security APIs is a serious security problem in software development. Research in 2024 has shown that this problem is widespread in LLM-genera...
Reinforcement Learning with Verifiable Rewards (RLVR) has recently emerged as the cornerstone for shaping the remarkable coding abilities of Large Language Mode...
The Linear Ordering Problem (LOP) is a fundamental combinatorial optimization problem with important applications in areas such as economics, social choice, and...
GP-GOMEA is a state-of-the-art evolutionary algorithm for symbolic regression, known for discovering small and interpretable models. However, its computational ...
Automated formal verification remains challenging for large language models because data for proof assistants and verification-aware languages is scarce, and co...
We present BlueFin, a benchmark that tasks large language model (LLM) agents with synthesis, manipulation, and comprehension tasks over spreadsheet workbooks in...
Federated Learning (FL) offers a privacy-preserving pathway for aligning Large Language Models (LLMs); however, existing frameworks typically enforce a monolith...
Autonomous coding agents built on large language models (LLMs) are rapidly being integrated into development workflows, yet their operational safety properties ...
Machine learning (ML) training and inference often process data sets far exceeding GPU memory capacity, forcing them to rely on PCIe for on-demand tensor transf...
All embodied agents are fundamentally patterns in physiological or other excitable media, blurring the distinction between objects and processes. Emergent patte...
The System-Theoretic Process Analysis (STPA) is a well-established hazard analysis technique that has been applied to a wide range of safety-critical systems. D...
Physical AI systems, including robots, autonomous vehicles, embodied agents and edge copilots, often run a different inference workload from cloud LLM serving: ...
We study the aggregation problem in synchronous multi-hop radio networks with O(log n)-bit messages and no collision detection. Each node initially holds a valu...
This paper investigates scheduling strategies for wireless sensor-actuator networks (WSANs) in Industry 4.0 scenarios. In particular, we address the problem of ...
This work introduces a self-optimizing virtual processor (VP) for numerical array programs that shifts parallelization from a manual developer task to a coopera...
AI 에이전트는 도구인가, 공동 저자인가, 아니면 연구자인가? 우리는 정량화된 사례 연구(N=1)를 제시한다: 물리학자가 AI 코딩 에이전트(Claude Code, Sonnet 및 O…)를 감독한다.
Moving Object Segmentation (MOS) aims to discover, segment, and track objects that move independently of the camera. Current MOS methods, however, exhibit two f...
Long-rollout causal video diffusion은 고정 크기의 슬라이딩 윈도우 KV 캐시로 수렴했으며, 최근의 진전은 이 레이아웃 내에서 어떤 것을 변경함으로써 혁신을 이루고 있다.
Autoregressive video diffusion models generate streaming video by producing frames sequentially, conditioning each chunk on previously generated content. These ...
로봇 조작은 장면의 action‑relevant 측면을 보존하는 perception에 크게 의존합니다. 그러나 대부분의 robot learning pipelines는 visual…
대규모 언어 모델(Large Language Models, LLMs)의 사전 학습 데이터 혼합은 그들의 ‘digital DNA’를 구성하며, 모델의 행동, 능력 및 실패 모드를 형성합니다. 그러나 이것은…
데이터 기반 접근 방식은 3D 비전을 혁신시켜, 트랜스포머가 정적 3D 객체를 효과적으로 재구성하고 생성할 수 있게 했습니다. 그러나, 시뮬...
비디오 확산 모델(VDMs)이 세계 모델로 발전함에 따라, 핵심적인 질문이 제기됩니다: 이 모델들이 인과 관계를 진정으로 이해하고 있는가, 아니면 단지 통계적 시간적 패턴에 과적합하고 있는가?
Printed circuit board (PCB) 회로도 설계는 거의 모든 전자 하드웨어를 정의하지만, 여전히 수동적이며 전문 지식이 많이 필요합니다. While generative AI has adva...
최근 Vision-Language Models (VLMs)의 발전은 많은 작업에서 인상적인 성능을 달성했지만, 이전 연구들은 만족스럽지 못한 성능을 보고했습니다.
대형 언어 모델의 추론 능력을 향상시키기 위해, test-time compute는 일반적으로 final answer 전에 intermediate tokens를 생성함으로써 확장됩니다....
우리는 Gaussian Splatting Anisotropic Visibility Field (GAVIS)를 제시한다, 이는 3DGS에서 불확실성 정량화와 능동 매핑을 위한 새로운 프레임워크이다. 우리의 핵심 통찰은…
시각 생성 모델링을 위한 확장 가능한 방법을 연구하려면 크고 접근 가능하며 안정적인 데이터셋이 필요합니다. 우리는 GPIC, 즉 Giant Permissive Image Corpus를 소개합니다.
Generative video-to-audio (V2A) models produce highly plausible soundtracks, but it remains unclear whether they capture the underlying physical processes. Exis...
Test-time finetuning (TTFT)은 각 프롬프트에 대해 관련 시퀀스를 검색하고 모델을 업데이트함으로써 언어 모델을 적응시키는 빠르게 진화하는 패러다임입니다.
단일 RGB 이미지에서 물리적으로 안정적인 3D 장면을 재구성하면 일상적인 이미지를 시뮬레이션에 바로 사용할 수 있는 디지털 자산으로 변환할 수 있어, 응용 프로그램을 위해 …
Federated learning is an emerging distributed paradigm that addresses the challenges posed by heterogeneous, privacy-sensitive data. It enables multiple clients...
다중 구성 요소 LLM 에이전트는 공동 문제의 일부만 보는 각 구성 요소로부터 확률적 주장을 조합합니다; 이러한 조합은 기본 확률을 위반할 수 있습니다…
Large Language Models (LLMs) have revolutionized various fields, yet their training efficiency is heavily reliant on effective data curation. While data selecti...
A plausible future mathematical claim must satisfy two constraints: it should follow the direction of prior work and respect the formal dependencies that constr...
Diffusion models achieve state-of-the-art image synthesis, with their generative trajectories fundamentally exhibiting a spectral bias, resolving low-frequency ...
Diffusion models는 자연 데이터의 복잡한 분포를 모델링하는 뛰어난 능력을 가지고 있어, posterior sampling에 있어 인기 있고 효과적인 선택이 되었습니다.
Autonomous AI research agents는 가설 생성부터 동료 검토까지 연구 파이프라인을 자동화함으로써 과학적 발견을 가속화하는 것을 목표로 합니다. 그러나 ex...
Frontier reasoning models는 posttraining된 base language models에 reinforcement learning을 적용하여 생성됩니다. 최근 연구는 샘플링…
우리는 bounded memory 하에서 limit에 따른 language generation을 연구한다. 이 작업에서 learner는 unknown target language의 예시를 하나씩 관찰하고 must...
Reinforcement Learning from Human Feedback (RLHF)는 일반적으로 정적 보상 모델에 의존하여 대형 언어 모델(Large Language Models)을 인간 선호에 맞추도록 합니다. 그러나 인간…
두 개의 공개 LLM leaderboards 전반에 걸쳐, 실제 paired evaluation에서 많은 표시된 pairwise rankings가 기존의 paired-test resolution target을 충족하지 못합니다.
대형 언어 모델(LLMs)은 임상 추론 및 의사결정 지원에 대한 가능성을 보여주지만, 현실적인 전자 건강 기록에 부합하는 환경에서의 평가가 필요합니다...
We present RaFI, a CUDA and MPI based software framework that simplifies the task of building GPU-enabled data-parallel software where rays or similar work item...
AI-assisted coding tools have altered software production. At Meta, significant lines of code per human-landed diff grew by 105.9% year over year and per-develo...
우리는 디지털 마이크로미러 장치(DMD)의 초고속 이진 광 변조와 광 산란을 기반으로 한 딥 포토닉 신경망 아키텍처를 제시한다.