[Paper] CompanionCast: 사회적 공동 시청 경험을 위한 공간 오디오를 갖춘 다중 에이전트 대화형 AI 프레임워크
Social presence는 함께 콘텐츠를 시청하는 즐거움의 핵심이며, 현대의 미디어 소비는 점점 더 개인화되고 있습니다. 우리는 multi‑agent…
3272 posts from this source
Social presence는 함께 콘텐츠를 시청하는 즐거움의 핵심이며, 현대의 미디어 소비는 점점 더 개인화되고 있습니다. 우리는 multi‑agent…
감정은 정치의 중심에 있으며, 정치 커뮤니케이션에서 감정의 역할을 분석하는 것은 오랜 전통을 가지고 있습니다. 연구가 점점 더 audio‑visual material을 활용함에 따라...
이 연구는 J. R. R. Tolkien의 《The Hobbit》(1937)에서 대화의 감정적 어조를 컴퓨테이셔널 텍스트 분석을 이용해 분석한다. 대화는 정규 표현식으로 추출되었다.
현대 LLM 사전 학습은 방대한 양의 compute와 training data를 소비하며, 다양한 모델의 scaling behavior, 혹은 scaling laws가 핵심 구분 요소가 된다.
Transport 기반 방법은 대규모의 깨끗한 데이터셋으로부터 생성 모델을 구축하는 주요 패러다임으로 부상했습니다. 그러나 많은 과학 및 엔지니어링…
Symbolic regression은 데이터를 직접 사용하여 지배 방정식을 발견하는 강력한 도구이지만, 잡음에 대한 민감성 때문에 그 적용 범위가 제한됩니다. Thi...
본 논문은 인간 게임플레이 데이터를 사용하지 않고도 제어 가능하고 다양한 플레이어 행동을 가능하게 하는 reinforcement learning 프레임워크를 소개한다. 기존...
우리는 무한 노름에서 (mathbb{R}^d)의 (좌표별) 최대 함수의 스무딩 설계를 고려한다. LogSumExp 함수 (f(x)=ln!left(sum_{i=1}^{d}exp(x_i)right)) ...
Go의 핵심 인프라 채택이 증가함에 따라 체계적인 취약점 탐지의 필요성이 커지고 있지만, 기존의 symbolic execution 도구들은 Go 바이너리에서 어려움을 겪고 있다.
LabelFusion은 텍스트 분류를 위한 퓨전 앙상블로, 전통적인 트랜스포머 기반 분류기(예: RoBERTa)와 하나 이상의 Larg...
우리는 FACTS Leaderboard를 소개합니다. 이는 온라인 리더보드 스위트와 연관된 일련의 벤치마크로, 언어 모델의 능력을 포괄적으로 평가합니다.
Retrieval-Augmented Generation (RAG) 시스템은 초기 검색에서 연결 사실(bridge fact)을 놓칠 경우 다중 홉 쿼리에서 종종 실패합니다. 기존의 교정 접근 방식은 …
대형 언어 모델(LLMs)은 인도에서 고위험 임상 응용 분야에 점점 더 많이 배치되고 있습니다. 많은 이러한 환경에서, 인도 언어 사용자는 freque...
시간이 흐르는 것을 정확하게 측정하는 것은 많은 애플리케이션에 필수적입니다. 그러나 Intel SGX와 같은 Trusted Execution Environments (TEEs)에서는 시간 소스가 …
대규모 언어 모델(LLM) 기반 코드 어시스턴트는 생성 AI의 강력한 응용 분야로 부상했으며, 코드 생성에서 인상적인 역량을 보여주고 있습니다...
싱글-브리지 블록체인 솔루션은 크로스체인 커뮤니케이션을 가능하게 합니다. 그러나 이들은 중앙집중화와 단일 장애 지점 위험과 연관되어 있습니다. 이…
Bayesian inference는 자연 에이전트의 정보 처리에 대한 원칙적인 설명을 제공합니다. 그러나 신경 메커니즘이 이를 어떻게 수행하는지는 아직 해결되지 않은 질문으로 남아 있습니다.
맥락: 프라이버시 법률은 소프트웨어 시스템이 개발되는 방식을 변화시켜 실무자들이 구현을 업데이트하도록 요구하고 있습니다. 구체적으로, EU ...
Data center (DC) 인프라스트럭처는 컴퓨팅 용량에 대한 증가하는 수요를 지원하는 백본 역할을 합니다. 인간을 결합하는 전통적인 설계 방법론...
데이터 센터(DC) 인프라는 컴퓨팅 용량에 대한 증가하는 수요를 지원하는 백본 역할을 합니다. 인간을 결합한 전통적인 설계 방법론은…
DeepSeek-V3.2-Exp는 긴 컨텍스트 시나리오에서 추론 지연 시간을 크게 줄이는 sparse attention 메커니즘을 도입합니다. 전체 throughput은…
대형 언어 모델(LLMs)은 점점 더 동적인 conversational 인터페이스 역할을 하며, 인간과 같은 대화를 모방하는 multi-turn interactions를 지원합니다.
딥러닝(DL) 기반 취약점 탐지 방법은 벤치마크 데이터셋에서 강력한 성능을 보여왔지만, 실제 현장에서의 효과는 아직 충분히 검증되지 않았다.
우리 연구에서는 인간이 빠르게 학습한다는 생각이 오해라는 것을 명시적으로 암시하지 않는다. 학습 과정은 시간이 걸린다. 아기들은 움직이는 것을 배우기 시작한다.
Effective code retrieval는 필수적이며, natural language와 code snippets를 모두 이용한 하이브리드 방식으로 코드를 검색하는 중요한 패러다임이 되었습니다. N...
Clustered Federated Learning (CFL)은 데이터 이질성을 해결하고 대규모 분산 IoT 환경에서 프라이버시를 보장하는 강력한 접근법으로 부상했습니다.
헬스케어는 매우 정교해졌으며, wearables와 connected medical devices가 원격 환자 모니터링, 응급 대응 등을 혁신하고 있습니다,…
와이드 스트라이프를 활용한 Erasure coding은 대규모 스토리지 시스템에서 저장 오버헤드를 줄이기 위해 점점 더 많이 채택되고 있습니다. 그러나 기존의 Locally Repairable Codes(...
대규모 언어 모델(Large Language Models, LLMs)을 코드 평가를 위한 자동 채점자로 사용하는 것이 학술 환경에서 점점 더 보편화되고 있습니다. 그러나 그들의 신뢰성...
실제 AI 소프트웨어 엔지니어링은 대규모 저장소를 논리적으로 탐색하고, 긴 세션 전후 및 세션 내에서 지속적인 메모리를 유지할 수 있는 코딩 에이전트를 요구한다, 그리고…
LLM-agent 기반 binary code analysis는 취약점 탐지를 포함한 다양한 소프트웨어 보안 시나리오에서 상당한 잠재력을 보여주었습니다.
협업 머신러닝 및 데이터 분석에 대한 수요가 증가함에 따라 프라이버시와 신뢰를 균형 있게 유지하는 보안 및 탈중앙화된 데이터 공유 프레임워크가 필요합니다.
Serverless computing은 효율적이고 비용 효율적인 방법을 제공함으로써 사용자가 애플리케이션을 개발하고 배포할 수 있게 하여 cloud computing에 혁신을 일으켰습니다, ...
이 문서는 빅 데이터 과정에서 구현된 실습 및 방법론의 순서를 보고합니다. 이는 처리부터 시작하는 워크플로우를 상세히 설명합니다...
현대 클라우드 플랫폼은 대규모 딥러닝(DL) 워크로드를 점점 더 많이 호스팅하고 있으며, 높은 처리량과 낮은 지연 시간의 GPU 스케줄링을 요구합니다. 그러나, 증가하는 h...
효과적인 이슈 해결은 소프트웨어 품질을 유지하는 데 필수적입니다. 그러나 개발자들은 종종 저품질 이슈 보고서, 제한된 …
최적화와 탐색 과정의 효율성은 여전히 도전 과제 중 하나이며, 이는 최적화 알고리즘의 성능과 사용에 영향을 미칩니다. Utilisin...
현대 머신 인텔리전스의 효율성은 최소한의 계산 비용으로 높은 정확도에 달려 있습니다. 스파이킹 뉴럴 네트워크(SNNs)에서는 시냅스 지연이 c...
표현은 일상 경험 전반에 스며들어 있습니다. 소리를 나타내는 문자부터 디지털 파일을 인코딩하는 비트 문자열까지. 이러한 표현은 외부…
World models와 model predictive control (MPC)를 결합하면 전문가 궤적의 대규모 데이터셋을 오프라인으로 학습할 수 있으며, 넓은 범위에 대한 일반화를 가능하게 합니다.
최근 Gaussian Splatting 기반 역렌더링의 발전은 Gaussian 프리미티브에 쉐이딩 파라미터와 물리적으로 기반한 라이트 트랜스포트(light transport)를 확장하여…
Video unified models는 이해와 생성에서 강력한 능력을 보여주지만, 추론 기반 시각 편집에는 장비가 갖추어져 있더라도 어려움을 겪는다.
Radiance field 표현은 최근 diffusion 모델에서 일반적으로 사용되는 VAE의 latent space에서 탐구되었습니다. 이 접근은 효율성을 제공합니다.
human-robot coexistence를 향해, socially aware navigation은 mobile robots에게 중요합니다. 그러나 이 분야에 대한 기존 연구들은 주로 path efficiency에 초점을 맞추고 있습니다.
열역학적 평형 상태에서 분자 상태를 확장 가능하게 샘플링하는 것은 통계 물리학에서 오래된 도전 과제입니다. Boltzmann Generators가 이 문제에 접근합니다.
우리는 노르웨이의 지리공간 AI를 위한 세밀한 벤치마크 데이터셋인 NordFKB를 제시한다. 이 데이터셋은 권위 있고 매우 정확한 국가 Felles KartdataBase에서 파생되었다.
In-context learning with attention은 대규모 신경망이 관련 예시들에 선택적으로 집중함으로써 상황에 맞는 예측을 가능하게 합니다. 여기서 우리는 …
Neural Machine Translation(NMT)에서 지속 학습은 재앙적 망각(catastrophic forgetting)과 재학습에 드는 높은 계산 비용이라는 두 가지 과제에 직면한다. 이것은 …