[Paper] DyTopo: 시맨틱 매칭을 통한 다중 에이전트 추론을 위한 동적 토폴로지 라우팅
프롬프트된 대형 언어 모델을 기반으로 구축된 다중 에이전트 시스템은 다중 라운드 추론을 개선할 수 있지만, 대부분의 기존 파이프라인은 고정된, 궤적 전체에 걸친 커…
4536 posts from this source
프롬프트된 대형 언어 모델을 기반으로 구축된 다중 에이전트 시스템은 다중 라운드 추론을 개선할 수 있지만, 대부분의 기존 파이프라인은 고정된, 궤적 전체에 걸친 커…
멀티모달 대형 언어 모델(MLLMs)은 시각과 언어를 연결함으로써 멀티모달 인식 및 추론에서 눈에 띄는 진전을 이루었습니다. 그러나 대부분의 기존…
인간이 자연어로 제공하는 과제를 완수하기 위해 로봇은 명령을 해석하고, 장면 이해를 위한 관련 질문을 생성하고 답변해야 합니다, ...
최근 멀티모달 대형 언어 모델(Multimodal Large Language Models, MLLMs)을 활용한 공간 추론의 진전은 3D 인코더로부터의 기하학적 사전지식을 점점 더 많이 활용하고 있다. 그러나 대부분은 ...
Autoregressive large language models (LLMs)은 강력한 성능을 제공하지만 본질적으로 순차적인 디코딩이 필요하여 추론 지연이 높고 GPU 활용도가 낮다.
인간은 명시적인 whole-body movements 수준에서 물체와의 whole-body interactions를 계획하는 경우가 드물다. affordance와 같은 고수준 의도는 목표를 정의한다.
멀티모달 대형 언어 모델(MLLMs)은 최근 보편적인 멀티모달 검색에 적용되었으며, 여기서 체인오브쏘트(Chain-of-Thought, CoT) 추론이 후보...
Pre-trained vision language models는 물리적 세계에 대한 직관이 좋지 않습니다. 최근 연구에 따르면, supervised fine-tuning을 통해 모델의 ...
Vision Foundation Models (VFMs)는 다양한 다운스트림 2D 작업에 적용될 때 눈에 띄는 성공을 거두었습니다. 그 효과에도 불구하고, 종종 …
아웃-오브-디스트리뷰션(OOD) 탐지는 고차원 데이터를 스칼라 OOD 점수로 매핑하며, 머신러닝 모델을 신뢰성 있게 배포하기 위해 필수적입니다.
대규모 언어 모델(LLM) 기반 멀티에이전트 시스템은 표현력 있는 에이전트 추론을 가능하게 하지만, 확장 비용이 많이 들고 타임스텝 정렬된 sta에 대해 보정이 미흡합니다.
Active inference (AIF)는 Expected Free Energy (EFE)를 최소화함으로써 탐색과 활용을 통합하고, epistemic value(정보 획득)와 pragmatic value(실용적 가치)를 균형 있게 맞춥니다.
실시간 장시간 비디오 생성에 대한 최근 접근 방식은 일반적으로 스트리밍 튜닝 전략을 사용하며, 짧은 컨텍스트를 이용해 롱‑컨텍스트 학생을 학습시키려고 시도합니다.
메모리는 단일 컨텍스트 윈도우를 넘어 작동하는 대규모 언어 모델(LLM) 에이전트에서 점점 더 중심적인 역할을 차지하고 있지만, 대부분의 기존 시스템은 오프라인, 쿼리‑응답 방식에 의존하고 있다.
가상현실(VR)은 학교 총격 사건과 같은 고위험 시나리오에서 학교 보안 조치를 평가하는 강력한 도구로 부상했으며, 실험적인 접근을 제공한다.
대규모 언어 모델(LLMs)은 특히 instruction tuning과 preference alignment 후에 지속적인 miscalibration을 나타낸다. 수정된 training objectives는 i...
diffusion model이 training data set을 기억하고 있지 않을 때, 정확히 어떻게 일반화되는가? 그것이 생성하는 distribution에 대한 정량적 이해는 …
추론을 가속화하기 위한 기존 기술들, 예를 들어 speculative decoding과 같은 방법들은 보조 speculator 모델을 훈련하고 구축 및 배포를 필요로 합니다.
대규모 언어 모델(LLMs)은 zero-shot 방식으로 정신 건강 상태를 평가하는 데 점점 더 많이 사용되고 있지만, 우리는 어떤 요인에 대해 제한된 지식만 가지고 있다…
Thompson sampling (TS)은 확률적 다중 팔 밴딧에 널리 사용되지만, 적응형 데이터 수집 하에서의 추론적 특성은 미묘합니다. 고전적인 …
시각 생성 모델의 급속한 발전은 전통적인 평가 접근 방식을 앞서고 있어, Vision-Language Models를 대체 수단으로 채택할 필요가 있다.
GitHub Security Advisories (GHSA)는 open-source 취약점 공개의 핵심 구성 요소가 되었으며, 개발자와 보안 도구에서 널리 사용됩니다.
대규모 언어 모델(LLM) 기반 에이전트는 점점 더 자율적으로 협상하고, 조정하며, 거래를 수행할 것으로 기대되고 있지만, 기존 벤치마크는 원칙적인 …
Speech Emotion Recognition (SER) 연구는 표준적이고 충분히 큰 데이터셋이 부족하여 제한에 직면해 왔습니다. 최근 연구들은 사전 훈련된 모델을 활용했습니다.
Diffusion large language models (dLLMs)는 텍스트 생성에 대한 유망한 대안으로 부상했으며, 병렬 디코딩에 대한 네이티브 지원이 특징입니다.
Deep research agents는 복잡한 질의를 해결하기 위한 강력한 시스템으로 등장했습니다. 한편, LLM 기반 리트리버는 fol...에서 강력한 역량을 입증했습니다.
Semantic representations는 인간이 의미를 검색하고 조작하기 위해 탐색하는 구조화된, 동적인 knowledge space로 구성될 수 있다. 이를 조사하기 위해…
잘 연구된 DISPERSION 문제는 분산 로보틱스에서 기본적인 협조 문제이며, 이동 로봇 집합이 재배치되어 각 ...
Long reasoning 모델은 다국어 환경에서 종종 어려움을 겪습니다: 비영어 질문에 대해 영어로 추론하는 경향이 있으며, when constrained to reasoning in the qu...
다지선다형 질문(MCQs)은 대형 언어 모델(LLMs)에 인코딩된 지식, 추론 능력, 그리고 심지어 가치까지 평가하는 데 자주 사용됩니다. 효율성은…
대형 언어 모델(LLMs)이 복잡한 추론에서 돌파구를 이루면서, Codeforces 기반 Elo 레이팅은 경쟁을 평가하기 위한 주요 지표로 부상했습니다.
DARWIN은 진화형 GPT 모델로, 유전 알고리즘과 유사한 최적화 구조를 활용하고 여러 독립적인 GPT 에이전트를 개별적으로 훈련시킵니다.
우리는 노드들이 네트워크 전체에 대한 초기 지식을 갖춘 조언(advice)이 포함된 분산 wake‑up 문제를 고려한다. 적(adversary)이 깨운 후…
Code completion (CC)은 개발자들이 LLM 기반 프로그래밍 어시스턴트와 협업할 때 자주 사용하는 작업입니다. 성능이 향상됨에도 불구하고...
이 연구는 자동 AI 에이전트 최적화 방법을 실제 에이전트에 적용할 수 있는지를 형식 검증 환경에서 조사하며, 자동 이론...
양자 위협이 사이버 보안을 위협하면서 포스트-양자 암호(Post-Quantum Cryptography, PQC)의 표준화가 가속화되었습니다. 레거시 소프트웨어를 이러한 양자 안전 알고리즘으로 마이그레이션하는...
Pipeline parallelism은 단일 디바이스 메모리를 초과하는 모델 훈련을 가능하게 하지만, 실제 처리량은 파이프라인 버블에 의해 제한됩니다. 비록 parameter …
비침입형 부하 모니터링(NILM)은 흔히 에너지 분해(energy disaggregation)라고 알려져 있으며, 가정의 전체 전력 신호를 분석하여 개별 가전제품의 전력 소비를 추정하는 것을 목표로 합니다.
본 논문에서는 물리적 구현체로서 in vitro cultured cortical neurons 네트워크를 활용한 신경 영감 기반 reservoir computing (RC) 접근법을 제시한다.
CVE 설명으로부터 자동화된 취약점 재현은 실행 가능한 Proof-of-Concept (PoC) 익스플로잇을 생성하고 이를 대상 환경에서 검증하는 것을 필요로 합니다.
맥락: AI-assisted tools가 소프트웨어 개발 워크플로에 점점 더 통합되고 있지만, 대형 언어 모델(LLMs)에 대한 의존은 근본적인…
SEAL은 무한한 연결 데이터 구조를 조작하는 프로그램의 검증을 위한 정적 분석기입니다. 이는 분리 논리를 기반으로 하여 추상화를 표현합니다.
Federated Learning은 프라이버시를 보호하는 분산형 접근 방식으로, Machine Learning 작업에 사용됩니다. 제한된 수의 엔터티가 특징인 산업 배포에서…
본 논문은 smoothed aggregation algebraic multigrid 방법을 위한 material-aware strength-of-connection 측정 방식을 소개하며, 이는 sc에 대한 견고성을 향상시키는 것을 목표로 합니다.
지난 20년간, 진화적 다목적 최적화에 대한 연구는 주로 연속 영역에 초점을 맞추었으며, 비교적 제한된 …
ArkTS는 OpenHarmony 생태계의 핵심 프로그래밍 언어이지만, ArkTS 코드 인텔리전스에 대한 연구는 공개 데이터셋과 평가가 부족하여 제약을 받고 있다.
Digital sovereignty는 비주권 클라우드 인프라의 지배에 의해 촉발되어 현대의 software-intensive systems에 있어 핵심적인 관심사로 부상했습니다, …
Black-box optimization은 시뮬레이션 기반 평가가 비용이 많이 들고 gradients를 사용할 수 없는 엔지니어링 설계 문제에서 점점 더 많이 사용되고 있습니다. In this ...