[Paper] VideoAuto‑R1: 한 번 생각하고 두 번 답하기를 통한 Video Auto Reasoning
Chain-of-thought (CoT) reasoning은 비디오 이해 작업에서 멀티모달 대형 언어 모델을 위한 강력한 도구로 부상했습니다. 그러나 그 필요성과 …
Chain-of-thought (CoT) reasoning은 비디오 이해 작업에서 멀티모달 대형 언어 모델을 위한 강력한 도구로 부상했습니다. 그러나 그 필요성과 …
3D 환경에서의 Embodied question answering (EQA)은 종종 여러 시점에 걸쳐 분산되고 부분적으로 가려진 컨텍스트를 수집해야 합니다. Ho...
기존의 long-term personalized dialogue systems는 무한한 interaction streams와 제한된 context constraints를 조화시키는 데 어려움을 겪으며, 종종 memory에 굴복한다.
Natural Language Inference (NLI)은 자연어 이해를 위한 언어 모델을 평가하는 중요한 작업이었지만, 논리적 특성은…
복잡한 추론을 위한 대형 언어 모델(LLMs)은 높은 계산 비용과 지연 시간 때문에 종종 제한을 받으며, 자원 효율적인 소형 언어 모델(SL...
Document Question Answering (DocQA)는 주어진 문서에 근거한 질문에 답하는 데 초점을 맞추지만, 기존 DocQA 에이전트는 효과적인 도구 활용과 라…
작물 질병 분석을 위한 Visual Question Answering은 정확한 시각 이해와 신뢰할 수 있는 language generation이 필요합니다. 이 작업은 lightweight vi...
LLM 기반 에이전트 애플리케이션은 복잡하고 다단계 작업을 점점 더 자동화하고 있지만, 이들을 효율적으로 제공하는 것은 이질적인 구성 요소 때문에 여전히 어려운 과제입니다...
과학 장비를 설계할 때는 종종 계산 비용이 많이 드는 physics simulations를 사용하여 크고 매우 제한된 설계 공간을 탐색해야 합니다. 이러한...
Epilepsy는 재발성 비자극성 발작을 특징으로 하는 만성 신경학적 장애로, 전 세계적으로 5천만 명 이상에게 영향을 미치며, 상당한 위험을 초래합니다.
Epilepsy는 재발하는 비자극성 발작을 특징으로 하는 만성 신경학적 장애이며, 전 세계적으로 5천만 명 이상에게 영향을 미치고, 상당한 위험을 초래합니다.
프라이버시 보호 연합 평균화는 연합 학습에서 클라이언트 프라이버시를 보호하기 위한 핵심 접근 방식입니다. 본 논문에서는 이 문제를 비동기 환경에서 연구합니다.
다양한 구성에 대한 벤치마크가 제안되어 AVX / NEON intrinsic functions의 능력과 한계를 일반적인 개발 프로젝트 맥락에서 탐구합니다.
Moore's Law에 의해 트랜지스터의 차원이 나노미터 규모까지 축소되었습니다. 고급 quantum transport (QT) solvers가 정확히 …
AI 코딩 에이전트가 생성한 Pull request (PR) 설명은 코드 변경 사항을 인간 리뷰어에게 전달하는 주요 채널입니다. 그러나 정렬 b...
본 논문은 배지, 스트릭, 그리고 소셜 기능을 통해 맥주 소비를 게임화하는 소셜 음주 애플리케이션인 Untappd에 대한 종단적 윤리 분석을 제시한다.
Permissionless 합의 프로토콜은 리더 선출을 조정하고 Sybil 저항성을 제공하기 위해 희소한 자원을 필요로 합니다. 기존 패러다임인 Proof of Work …
Neural-Symbolic (NeSy) Artificial Intelligence는 신경망의 학습 능력과 해석…
이 작업은 DCIM 3.0을 제시하며, 의미론적 추론, 예측 분석, 자율 오케스트레이션 및 통합 연결성을 통합한 통합 프레임워크를 제공합니다.
딥러닝은 시각 데이터 분석을 혁신했으며, 컨볼루션 신경망(CNN)이 의미 있는 특징 표현을 학습하는 데 매우 효과적이게 되었습니다.
광범위한 'memory wall' 병목 현상이 현대 대규모 Mixture-of-Experts (MoE) 아키텍처에서 크게 증폭됩니다. MoE의 고유한 아키텍처적 spa...
그래프 신경망(GNNs)은 그래프 구조 데이터를 학습하기 위한 강력한 도구이지만, 비효율적인 미니배치 생성, 데이터...
이 논문은 DDMIN-LOC라는 기법을 소개한다. 이 기법은 Delta Debugging Minimization (DDMIN)과 Spectrum-Based Fault Localization (SBFL)을 결합한다. 이것은 적용될 수 있다...
클라우드 환경에서 리소스 자동 스케일링 메커니즘은 최적의 프로비저닝 결정을 내리기 위해 정확한 성능 메트릭에 의존합니다. 인프라스트럭처 장애가 발생하면 ...