ai — Page 129 | EUNO.NEWS

1개월 전 · it

Raspberry Pi, AI 덕분에 가격 인상

Raspberry Pi가 많은 싱글보드 컴퓨터의 가격을 인상하고 있으며, 인상은 즉시 적용됩니다. Raspberry Pi 4와 5 모듈의 가격이 급격히 상승하고 있습니다…

#Raspberry Pi #price increase #single-board computers #AI #hardware
1개월 전 · ai

[Paper] MagicQuillV2: 정밀하고 인터랙티브한 이미지 편집, 레이어형 시각 단서

우리는 MagicQuill V2를 제안한다. 이는 생성 이미지 편집에 레이어드 컴포지션 패러다임을 도입하는 새로운 시스템으로, 의미론적…

#research #paper #ai #computer-vision
1개월 전 · ai

[Paper] CAMEO: Correspondence-Attention 정렬을 위한 다중 뷰 확산 모델

Multi-view diffusion models는 최근 새로운 시점 합성을 위한 강력한 패러다임으로 부상했지만, 그들의 view-consistency를 가능하게 하는 근본 메커니즘은 아직 충분히 밝혀지지 않았다.

#research #paper #ai #computer-vision
1개월 전 · ai

[Paper] OneThinker: 이미지와 비디오를 위한 올인원 추론 모델

강화 학습(RL)은 최근 멀티모달 대형 언어 모델(MLLMs) 내에서 시각적 추론을 이끌어내는 데 눈에 띄는 성공을 거두었습니다. 그러나, exi...

#research #paper #ai #computer-vision
1개월 전 · ai

[Paper] PPTArena: 에이전트형 파워포인트 편집을 위한 벤치마크

우리는 PPTArena를 소개합니다. 이는 실제 슬라이드에 대한 신뢰할 수 있는 수정 작업을 자연어 지시 하에 측정하는 PowerPoint 편집 벤치마크입니다. 대조적으로 t...

#research #paper #ai #machine-learning #computer-vision
1개월 전 · ai

[Paper] MultiShotMaster: 제어 가능한 멀티샷 비디오 생성 프레임워크

현재 video generation techniques는 single-shot 클립에서는 뛰어나지만, 유연한 샷 배열과 일관된 narrative를 필요로 하는 multi-shot 비디오를 제작하는 데 어려움을 겪는다.

#research #paper #ai #computer-vision
1개월 전 · ai

[Paper] Video4Spatial: 시공간 인텔리전스를 향한 컨텍스트 기반 비디오 생성

우리는 video generative models가 인간 인지의 핵심 능력인 visuospatial intelligence를 시각 데이터만을 사용하여 나타낼 수 있는지를 조사한다.

#research #paper #ai #machine-learning #computer-vision
1개월 전 · ai

[Paper] ViSAudio: 엔드투엔드 비디오 기반 바이노럴 공간 오디오 생성

비디오-투-오디오 생성 분야가 진전을 이루었음에도 불구하고, 이 분야는 주로 모노 출력에 초점을 맞추고 있어 공간적 몰입감이 부족합니다. 기존의 바이노럴 접근 방식은 여전히 co...

#research #paper #ai #machine-learning #computer-vision
1개월 전 · ai

[Paper] 가속도 측정 없이 물리적으로 일관된 라그랑지안 제어 모델 학습

이 기사에서는 비보존 힘을 포함하는 Lagrangian 시스템의 모델링 및 제어를 가속도를 필요로 하지 않는 하이브리드 방법을 사용하여 조사한다.

#research #paper #ai #machine-learning
1개월 전 · ai

[Paper] MAViD: 오디오-비주얼 대화 이해 및 생성을 위한 멀티모달 프레임워크

우리는 MAViD, 새로운 멀티모달 프레임워크를 제안한다. 이는 오디오-비주얼 대화 이해 및 생성을 위한 것이다. 기존 접근 방식은 주로 비상호작용적인 sy...

#research #paper #ai #computer-vision
1개월 전 · ai

[Paper] SMP: 재사용 가능한 Score-Matching Motion Priors for Physics-Based Character Control

데이터 기반 모션 프라이어는 에이전트가 자연스러운 행동을 생성하도록 안내하며, 생동감 있는 가상 캐릭터를 만드는 데 핵심적인 역할을 합니다. Adversaria...

#research #paper #ai #machine-learning #computer-vision
1개월 전 · ai

[Paper] 도덕 일관성 파이프라인: Large Language Models를 위한 지속적인 윤리 평가

대규모 언어 모델(LLM)의 급속한 발전과 적응력은 도덕적 일관성, 즉 윤리적으로 일관된 추론을 유지하는 능력의 필요성을 강조한다.

#research #paper #ai #machine-learning #nlp

Newer posts

Older posts