[Paper] 에너지 효율적인 Human Activity Recognition을 위한 Channel Responses의 Sparse Spike Encoding
ISAC는 광범위한 모니터링을 가능하게 하지만, 최신 센싱 알고리즘은 에너지 제한이 있는 엣지 디바이스에 비해 종종 너무 복잡합니다. 이는 le...
3058 posts from this source
ISAC는 광범위한 모니터링을 가능하게 하지만, 최신 센싱 알고리즘은 에너지 제한이 있는 엣지 디바이스에 비해 종종 너무 복잡합니다. 이는 le...
구조적 편향(Structural bias, SB)은 최적화 알고리즘이 탐색 공간의 특정 영역에 대해 체계적인 선호를 보이는 현상으로, 목표와는 독립적으로 발생한다.
CI/CD 파이프라인 실패 관리는 수동으로 수행할 경우 시간이 많이 소요됩니다. 이 프로세스를 자동화하는 것은 비단순한 작업이며, 효과적인 …에 필요한 정보가 …
Fixpoint iteration은 정적 분석기의 알고리즘 핵심을 구성합니다. Fixpoint 엔진을 병렬화하면 분석 시간을 크게 줄일 수 있습니다. Previous app...
우리는 서버리스 플랫폼에서 구조화된 병렬 처리 스켈레톤의 동적 관리를 위한 프레임워크를 제시합니다. 우리의 목표는 HPC‑like 성능을 제공하는 것입니다.
AI coding agents의 급속한 부상으로, software engineer가 된다는 근본적인 전제가 의문시되고 있습니다. 이 vision paper에서 우리는 재검토합니다 …
대규모 분산 시스템의 모바일 애플리케이션은 백엔드 서비스 장애에 취약하지만, 기존의 카오스 엔지니어링 접근 방식은 확장성이 부족합니다.
Moore‑Penrose Pseudo‑inverse (PInv)는 선형 시스템에 대한 근본적인 해법으로 작용한다. 본 논문에서는 PInv의 자연스러운 일반화를 제안한다.
대규모 사전학습 모델을 새로운 작업에 효율적이고 지속적으로 적용하는 것은 실제 환경 배포에 필수적이지만, catastrophic forgetting 때문에 여전히 어려운 과제이다.
다중 이미지 공간 추론은 현재 멀티모달 대형 언어 모델(MLLMs)에게 여전히 도전 과제입니다. 단일 시점 인식은 본질적으로 2D이며, 추론…
프롬프트된 대형 언어 모델을 기반으로 구축된 다중 에이전트 시스템은 다중 라운드 추론을 개선할 수 있지만, 대부분의 기존 파이프라인은 고정된, 궤적 전체에 걸친 커…
멀티모달 대형 언어 모델(MLLMs)은 시각과 언어를 연결함으로써 멀티모달 인식 및 추론에서 눈에 띄는 진전을 이루었습니다. 그러나 대부분의 기존…
인간이 자연어로 제공하는 과제를 완수하기 위해 로봇은 명령을 해석하고, 장면 이해를 위한 관련 질문을 생성하고 답변해야 합니다, ...
최근 멀티모달 대형 언어 모델(Multimodal Large Language Models, MLLMs)을 활용한 공간 추론의 진전은 3D 인코더로부터의 기하학적 사전지식을 점점 더 많이 활용하고 있다. 그러나 대부분은 ...
Autoregressive large language models (LLMs)은 강력한 성능을 제공하지만 본질적으로 순차적인 디코딩이 필요하여 추론 지연이 높고 GPU 활용도가 낮다.
인간은 명시적인 whole-body movements 수준에서 물체와의 whole-body interactions를 계획하는 경우가 드물다. affordance와 같은 고수준 의도는 목표를 정의한다.
멀티모달 대형 언어 모델(MLLMs)은 최근 보편적인 멀티모달 검색에 적용되었으며, 여기서 체인오브쏘트(Chain-of-Thought, CoT) 추론이 후보...
Pre-trained vision language models는 물리적 세계에 대한 직관이 좋지 않습니다. 최근 연구에 따르면, supervised fine-tuning을 통해 모델의 ...
Vision Foundation Models (VFMs)는 다양한 다운스트림 2D 작업에 적용될 때 눈에 띄는 성공을 거두었습니다. 그 효과에도 불구하고, 종종 …
아웃-오브-디스트리뷰션(OOD) 탐지는 고차원 데이터를 스칼라 OOD 점수로 매핑하며, 머신러닝 모델을 신뢰성 있게 배포하기 위해 필수적입니다.
대규모 언어 모델(LLM) 기반 멀티에이전트 시스템은 표현력 있는 에이전트 추론을 가능하게 하지만, 확장 비용이 많이 들고 타임스텝 정렬된 sta에 대해 보정이 미흡합니다.
Active inference (AIF)는 Expected Free Energy (EFE)를 최소화함으로써 탐색과 활용을 통합하고, epistemic value(정보 획득)와 pragmatic value(실용적 가치)를 균형 있게 맞춥니다.
실시간 장시간 비디오 생성에 대한 최근 접근 방식은 일반적으로 스트리밍 튜닝 전략을 사용하며, 짧은 컨텍스트를 이용해 롱‑컨텍스트 학생을 학습시키려고 시도합니다.
메모리는 단일 컨텍스트 윈도우를 넘어 작동하는 대규모 언어 모델(LLM) 에이전트에서 점점 더 중심적인 역할을 차지하고 있지만, 대부분의 기존 시스템은 오프라인, 쿼리‑응답 방식에 의존하고 있다.