Source

arXiv

4536 posts from this source

정렬:

2개월 전 · ai · - · -

[Paper] DyTopo: 시맨틱 매칭을 통한 다중 에이전트 추론을 위한 동적 토폴로지 라우팅

프롬프트된 대형 언어 모델을 기반으로 구축된 다중 에이전트 시스템은 다중 라운드 추론을 개선할 수 있지만, 대부분의 기존 파이프라인은 고정된, 궤적 전체에 걸친 커…

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] SwimBird: 하이브리드 자동회귀 MLLMs에서 전환 가능한 추론 모드 유도

멀티모달 대형 언어 모델(MLLMs)은 시각과 언어를 연결함으로써 멀티모달 인식 및 추론에서 눈에 띄는 진전을 이루었습니다. 그러나 대부분의 기존…

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] CommCP: 효율적인 다중 에이전트 협조를 위한 LLM 기반 커뮤니케이션과 컨포멀 프레딕션

인간이 자연어로 제공하는 과제를 완수하기 위해 로봇은 명령을 해석하고, 장면 이해를 위한 관련 질문을 생성하고 답변해야 합니다, ...

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] 기하학으로 사고하기: 공간 추론을 위한 Active Geometry Integration

최근 멀티모달 대형 언어 모델(Multimodal Large Language Models, MLLMs)을 활용한 공간 추론의 진전은 3D 인코더로부터의 기하학적 사전지식을 점점 더 많이 활용하고 있다. 그러나 대부분은 ...

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] DFlash: 블록 디퓨전 for Flash Speculative Decoding

Autoregressive large language models (LLMs)은 강력한 성능을 제공하지만 본질적으로 순차적인 디코딩이 필요하여 추론 지연이 높고 GPU 활용도가 낮다.

#research #paper #ai #nlp
2개월 전 · ai · - · -

[Paper] InterPrior: 물리 기반 인간-객체 상호작용을 위한 Generative Control 스케일링

인간은 명시적인 whole-body movements 수준에서 물체와의 whole-body interactions를 계획하는 경우가 드물다. affordance와 같은 고수준 의도는 목표를 정의한다.

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] V-Retrver: 증거 기반 에이전트적 추론을 통한 범용 멀티모달 검색

멀티모달 대형 언어 모델(MLLMs)은 최근 보편적인 멀티모달 검색에 적용되었으며, 여기서 체인오브쏘트(Chain-of-Thought, CoT) 추론이 후보...

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] Vision language models가 상호작용을 통해 intuitive physics를 학습할 수 있을까?

Pre-trained vision language models는 물리적 세계에 대한 직관이 좋지 않습니다. 최근 연구에 따르면, supervised fine-tuning을 통해 모델의 ...

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] Splat and Distill: Feed-Forward 3D Reconstruction을 활용한 교사 모델 강화 및 3D-Aware Distillation

Vision Foundation Models (VFMs)는 다양한 다운스트림 2D 작업에 적용될 때 눈에 띄는 성공을 거두었습니다. 그 효과에도 불구하고, 종종 …

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] AP-OOD: Attention Pooling을 이용한 Out-of-Distribution 탐지

아웃-오브-디스트리뷰션(OOD) 탐지는 고차원 데이터를 스칼라 OOD 점수로 매핑하며, 머신러닝 모델을 신뢰성 있게 배포하기 위해 필수적입니다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] PhysicsAgentABM: Physics-Guided 생성형 에이전트 기반 모델링

대규모 언어 모델(LLM) 기반 멀티에이전트 시스템은 표현력 있는 에이전트 추론을 가능하게 하지만, 확장 비용이 많이 들고 타임스텝 정렬된 sta에 대해 보정이 미흡합니다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] 호기심은 지식이다: 자기 일관 학습 및 No-Regret 최적화와 Active Inference

Active inference (AIF)는 Expected Free Energy (EFE)를 최소화함으로써 탐색과 활용을 통합하고, epistemic value(정보 획득)와 pragmatic value(실용적 가치)를 균형 있게 맞춥니다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] Context Forcing: 긴 컨텍스트를 활용한 일관된 Autoregressive 비디오 생성

실시간 장시간 비디오 생성에 대한 최근 접근 방식은 일반적으로 스트리밍 튜닝 전략을 사용하며, 짧은 컨텍스트를 이용해 롱‑컨텍스트 학생을 학습시키려고 시도합니다.

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] 쿼리 인식 예산-계층 라우팅 학습 for Runtime Agent Memory

메모리는 단일 컨텍스트 윈도우를 넘어 작동하는 대규모 언어 모델(LLM) 에이전트에서 점점 더 중심적인 역할을 차지하고 있지만, 대부분의 기존 시스템은 오프라인, 쿼리‑응답 방식에 의존하고 있다.

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] 가상현실 실험을 통한 Event-Based Shooter 모델 학습

가상현실(VR)은 학교 총격 사건과 같은 고위험 시나리오에서 학교 보안 조치를 평가하는 강력한 도구로 부상했으며, 실험적인 접근을 제공한다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] 정확성 최적화 잔여 활성화 렌즈 (CORAL): 전이 가능하고 보정 인식 추론 시점 스티어링

대규모 언어 모델(LLMs)은 특히 instruction tuning과 preference alignment 후에 지속적인 miscalibration을 나타낸다. 수정된 training objectives는 i...

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] Diffusion Model의 Generalization은 Data-Dependent Ridge Manifold에 대한 Inductive Biases로 특징지어질 수 있다

diffusion model이 training data set을 기억하고 있지 않을 때, 정확히 어떻게 일반화되는가? 그것이 생성하는 distribution에 대한 정량적 이해는 …

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] Self-Distillation을 통한 멀티 토큰 예측

추론을 가속화하기 위한 기존 기술들, 예를 들어 speculative decoding과 같은 방법들은 보조 speculator 모델을 훈련하고 구축 및 배포를 필요로 합니다.

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] Large Language Models를 이용한 PTSD 심각도 추정에 대한 체계적 평가: Contextual Knowledge와 Modeling Strategies의 역할

대규모 언어 모델(LLMs)은 zero-shot 방식으로 정신 건강 상태를 평가하는 데 점점 더 많이 사용되고 있지만, 우리는 어떤 요인에 대해 제한된 지식만 가지고 있다…

#research #paper #ai #nlp
2개월 전 · ai · - · -

[Paper] 낙관주의가 적응 추론을 위한 Thompson 샘플링을 안정화한다

Thompson sampling (TS)은 확률적 다중 팔 밴딧에 널리 사용되지만, 적응형 데이터 수집 하에서의 추론적 특성은 미묘합니다. 고전적인 …

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] GenArena: 시각 생성 작업을 위한 인간 정렬 평가를 어떻게 달성할 수 있을까?

시각 생성 모델의 급속한 발전은 전통적인 평가 접근 방식을 앞서고 있어, Vision-Language Models를 대체 수단으로 채택할 필요가 있다.

#research #paper #ai #machine-learning #computer-vision
2개월 전 · software · - · -

[Paper] GitHub Security Advisories 검토 파이프라인 특성화 및 모델링

GitHub Security Advisories (GHSA)는 open-source 취약점 공개의 핵심 구성 요소가 되었으며, 개발자와 보안 도구에서 널리 사용됩니다.

#research #paper #software
2개월 전 · ai · - · -

[Paper] AgenticPay: 구매자-판매자 거래를 위한 멀티에이전트 LLM 협상 시스템

대규모 언어 모델(LLM) 기반 에이전트는 점점 더 자율적으로 협상하고, 조정하며, 거래를 수행할 것으로 기대되고 있지만, 기존 벤치마크는 원칙적인 …

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] OpenAI의 Whisper 표현과 어텐티브 풀링 방법을 활용한 음성 감정 인식

Speech Emotion Recognition (SER) 연구는 표준적이고 충분히 큰 데이터셋이 부족하여 제한에 직면해 왔습니다. 최근 연구들은 사전 훈련된 모델을 활용했습니다.

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] DSB: Diffusion LLMs를 위한 동적 슬라이딩 블록 스케줄링

Diffusion large language models (dLLMs)는 텍스트 생성에 대한 유망한 대안으로 부상했으며, 병렬 디코딩에 대한 네이티브 지원이 특징입니다.

#research #paper #ai #nlp
2개월 전 · ai · - · -

[Paper] SAGE: 딥 리서치 에이전트를 위한 벤치마킹 및 검색 개선

Deep research agents는 복잡한 질의를 해결하기 위한 강력한 시스템으로 등장했습니다. 한편, LLM 기반 리트리버는 fol...에서 강력한 역량을 입증했습니다.

#research #paper #ai #nlp
2개월 전 · ai · - · -

[Paper] 인간 Semantic Navigation in Concept Production을 Embedding Space의 Trajectories로 특성화

Semantic representations는 인간이 의미를 검색하고 조작하기 위해 탐색하는 구조화된, 동적인 knowledge space로 구성될 수 있다. 이를 조사하기 위해…

#research #paper #ai #machine-learning #nlp
2개월 전 · devops · - · -

[Paper] 익명 그래프에서 Location-Aware Dispersion

잘 연구된 DISPERSION 문제는 분산 로보틱스에서 기본적인 협조 문제이며, 이동 로봇 집합이 재배치되어 각 ...

#research #paper #devops
2개월 전 · ai · - · -

[Paper] 자기 개선 다국어 장기 추론을 위한 번역‑추론 통합 훈련

Long reasoning 모델은 다국어 환경에서 종종 어려움을 겪습니다: 비영어 질문에 대해 영어로 추론하는 경향이 있으며, when constrained to reasoning in the qu...

#research #paper #ai #nlp
2개월 전 · ai · - · -

[Paper] 폴리글롯 혹은 다중성? 다국어 LLM이 가치가 담긴 Multiple-Choice 질문에 대한 답변

다지선다형 질문(MCQs)은 대형 언어 모델(LLMs)에 인코딩된 지식, 추론 능력, 그리고 심지어 가치까지 평가하는 데 자주 사용됩니다. 효율성은…

#research #paper #ai #nlp
2개월 전 · software · - · -

[Paper] Elo가 거짓말을 할 때: 대규모 언어 모델의 Codeforces 기반 평가에 숨겨진 편향

대형 언어 모델(LLMs)이 복잡한 추론에서 돌파구를 이루면서, Codeforces 기반 Elo 레이팅은 경쟁을 평가하기 위한 주요 지표로 부상했습니다.

#research #paper #software
2개월 전 · ai · - · -

[Paper] DARWIN: 동적 에이전트 방식 재작성 자기 개선 네트워크

DARWIN은 진화형 GPT 모델로, 유전 알고리즘과 유사한 최적화 구조를 활용하고 여러 독립적인 GPT 에이전트를 개별적으로 훈련시킵니다.

#research #paper #ai #machine-learning #nlp
2개월 전 · devops · - · -

[Paper] 조언이 있는 분산 웨이크업의 양자 메시지 복잡도

우리는 노드들이 네트워크 전체에 대한 초기 지식을 갖춘 조언(advice)이 포함된 분산 wake‑up 문제를 고려한다. 적(adversary)이 깨운 후…

#research #paper #devops
2개월 전 · ai · - · -

[Paper] 시맨틱 스코프를 활용한 엔터프라이즈 코드 레포지토리용 LLM 자동 맞춤화

Code completion (CC)은 개발자들이 LLM 기반 프로그래밍 어시스턴트와 협업할 때 자주 사용하는 작업입니다. 성능이 향상됨에도 불구하고...

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] RocqSmith: 자동 최적화가 더 나은 Proof Agents를 만들 수 있을까?

이 연구는 자동 AI 에이전트 최적화 방법을 실제 에이전트에 적용할 수 있는지를 형식 검증 환경에서 조사하며, 자동 이론...

#research #paper #ai #machine-learning
2개월 전 · software · - · -

[Paper] 양자 안전 소프트웨어 엔지니어링을 향하여: 포스트-양자 암호학 마이그레이션을 위한 비전

양자 위협이 사이버 보안을 위협하면서 포스트-양자 암호(Post-Quantum Cryptography, PQC)의 표준화가 가속화되었습니다. 레거시 소프트웨어를 이러한 양자 안전 알고리즘으로 마이그레이션하는...

#research #paper #software
2개월 전 · ai · - · -

[Paper] TimelyFreeze: 파이프라인 병렬성을 위한 적응형 파라미터 프리징 메커니즘

Pipeline parallelism은 단일 디바이스 메모리를 초과하는 모델 훈련을 가능하게 하지만, 실제 처리량은 파이프라인 버블에 의해 제한됩니다. 비록 parameter …

#research #paper #ai #machine-learning
2개월 전 · software · - · -

[Paper] 비침입식 부하 모니터링을 위한 베이지안 최적화 기반 AutoML 프레임워크

비침입형 부하 모니터링(NILM)은 흔히 에너지 분해(energy disaggregation)라고 알려져 있으며, 가정의 전체 전력 신호를 분석하여 개별 가전제품의 전력 소비를 추정하는 것을 목표로 합니다.

#research #paper #software
2개월 전 · ai · - · -

[Paper] 신경 영감 기반 시각 패턴 인식: Biological Reservoir Computing을 이용한

본 논문에서는 물리적 구현체로서 in vitro cultured cortical neurons 네트워크를 활용한 신경 영감 기반 reservoir computing (RC) 접근법을 제시한다.

#research #paper #ai #computer-vision
2개월 전 · software · - · -

[Paper] 자동 취약점 재현을 위한 Dual-Loop 에이전트 프레임워크

CVE 설명으로부터 자동화된 취약점 재현은 실행 가능한 Proof-of-Concept (PoC) 익스플로잇을 생성하고 이를 대상 환경에서 검증하는 것을 필요로 합니다.

#research #paper #software
2개월 전 · ai · - · -

[Paper] 그린 AI를 향해: 소프트웨어 개발에서 LLM 추론의 에너지 디코딩

맥락: AI-assisted tools가 소프트웨어 개발 워크플로에 점점 더 통합되고 있지만, 대형 언어 모델(LLMs)에 대한 의존은 근본적인…

#research #paper #ai #machine-learning
2개월 전 · software · - · -

[논문] SEAL: Symbolic Execution with Separation Logic (대회 기여)

SEAL은 무한한 연결 데이터 구조를 조작하는 프로그램의 검증을 위한 정적 분석기입니다. 이는 분리 논리를 기반으로 하여 추상화를 표현합니다.

#research #paper #software
2개월 전 · ai · - · -

[Paper] FedRandom: 연합 학습에서 샘플링 일관성 및 정확한 기여값

Federated Learning은 프라이버시를 보호하는 분산형 접근 방식으로, Machine Learning 작업에 사용됩니다. 제한된 수의 엔터티가 특징인 산업 배포에서…

#research #paper #ai #machine-learning
2개월 전 · devops · - · -

[Paper] 이질적·이방성 재료 문제를 위한 Smoothed aggregation algebraic multigrid

본 논문은 smoothed aggregation algebraic multigrid 방법을 위한 material-aware strength-of-connection 측정 방식을 소개하며, 이는 sc에 대한 견고성을 향상시키는 것을 목표로 합니다.

#research #paper #devops
2개월 전 · ai · - · -

[Paper] 다목적 조합 최적화에서 무작위 지역 탐색을 위한 가변 탐색 단계 크기

지난 20년간, 진화적 다목적 최적화에 대한 연구는 주로 연속 영역에 초점을 맞추었으며, 비교적 제한된 …

#research #paper #ai
2개월 전 · ai · - · -

[Paper] ArkTS-CodeSearch: 오픈소스 ArkTS 데이터셋, 코드 검색용

ArkTS는 OpenHarmony 생태계의 핵심 프로그래밍 언어이지만, ArkTS 코드 인텔리전스에 대한 연구는 공개 데이터셋과 평가가 부족하여 제약을 받고 있다.

#research #paper #ai #nlp
2개월 전 · ai · - · -

[Paper] Sovereign-by-Design AI 및 블록체인 기반 시스템을 위한 레퍼런스 아키텍처

Digital sovereignty는 비주권 클라우드 인프라의 지배에 의해 촉발되어 현대의 software-intensive systems에 있어 핵심적인 관심사로 부상했습니다, …

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] 최적화만으로는 충분하지 않다: 왜 문제 정의가 동등한 주의를 받아야 하는가

Black-box optimization은 시뮬레이션 기반 평가가 비용이 많이 들고 gradients를 사용할 수 없는 엔지니어링 설계 문제에서 점점 더 많이 사용되고 있습니다. In this ...

#research #paper #ai

Newer posts

Older posts