EUNO.NEWS EUNO.NEWS
  • All (2356) +198
  • AI (547) +17
  • DevOps (141) +2
  • Software (990) +123
  • IT (672) +55
  • Education (5) +1
  • Notice (1)
  • All (2356) +198
    • AI (547) +17
    • DevOps (141) +2
    • Software (990) +123
    • IT (672) +55
    • Education (5) +1
  • Notice (1)
  • All (2356) +198
  • AI (547) +17
  • DevOps (141) +2
  • Software (990) +123
  • IT (672) +55
  • Education (5) +1
  • Notice (1)
Sources Tags Search
한국어 English 中文
  • 1일 전 · ai

    [Paper] PSA: Pyramid Sparse Attention을 이용한 효율적인 비디오 이해 및 생성

    Attention mechanisms는 foundation models의 핵심이지만, 그들의 quadratic complexity는 스케일링을 위한 중요한 bottleneck으로 남아 있습니다. 이 도전 과제는 …

    #research #paper #ai #machine-learning #computer-vision
  • 1일 전 · ai

    [Paper] 스케치 표현 학습을 위한 시간성에 관하여

    스케치는 복잡한 장면과 실제 객체를 인간이 손으로 그린 단순한 추상화입니다. 비록 스케치 표현 학습 분야가 크게 발전했지만...

    #research #paper #ai #machine-learning #computer-vision
  • 2일 전 · ai

    [Paper] MagicQuillV2: 정밀하고 인터랙티브한 이미지 편집, 레이어형 시각 단서

    우리는 MagicQuill V2를 제안한다. 이는 생성 이미지 편집에 레이어드 컴포지션 패러다임을 도입하는 새로운 시스템으로, 의미론적…

    #research #paper #ai #computer-vision
  • 2일 전 · ai

    [Paper] CAMEO: Correspondence-Attention 정렬을 위한 다중 뷰 확산 모델

    Multi-view diffusion models는 최근 새로운 시점 합성을 위한 강력한 패러다임으로 부상했지만, 그들의 view-consistency를 가능하게 하는 근본 메커니즘은 아직 충분히 밝혀지지 않았다.

    #research #paper #ai #computer-vision
  • 2일 전 · ai

    [Paper] OneThinker: 이미지와 비디오를 위한 올인원 추론 모델

    강화 학습(RL)은 최근 멀티모달 대형 언어 모델(MLLMs) 내에서 시각적 추론을 이끌어내는 데 눈에 띄는 성공을 거두었습니다. 그러나, exi...

    #research #paper #ai #computer-vision
  • 2일 전 · ai

    [Paper] PPTArena: 에이전트형 파워포인트 편집을 위한 벤치마크

    우리는 PPTArena를 소개합니다. 이는 실제 슬라이드에 대한 신뢰할 수 있는 수정 작업을 자연어 지시 하에 측정하는 PowerPoint 편집 벤치마크입니다. 대조적으로 t...

    #research #paper #ai #machine-learning #computer-vision
  • 2일 전 · ai

    [Paper] MultiShotMaster: 제어 가능한 멀티샷 비디오 생성 프레임워크

    현재 video generation techniques는 single-shot 클립에서는 뛰어나지만, 유연한 샷 배열과 일관된 narrative를 필요로 하는 multi-shot 비디오를 제작하는 데 어려움을 겪는다.

    #research #paper #ai #computer-vision
  • 2일 전 · ai

    [Paper] Video4Spatial: 시공간 인텔리전스를 향한 컨텍스트 기반 비디오 생성

    우리는 video generative models가 인간 인지의 핵심 능력인 visuospatial intelligence를 시각 데이터만을 사용하여 나타낼 수 있는지를 조사한다.

    #research #paper #ai #machine-learning #computer-vision
  • 2일 전 · ai

    [Paper] ViSAudio: 엔드투엔드 비디오 기반 바이노럴 공간 오디오 생성

    비디오-투-오디오 생성 분야가 진전을 이루었음에도 불구하고, 이 분야는 주로 모노 출력에 초점을 맞추고 있어 공간적 몰입감이 부족합니다. 기존의 바이노럴 접근 방식은 여전히 co...

    #research #paper #ai #machine-learning #computer-vision
  • 2일 전 · ai

    [Paper] MAViD: 오디오-비주얼 대화 이해 및 생성을 위한 멀티모달 프레임워크

    우리는 MAViD, 새로운 멀티모달 프레임워크를 제안한다. 이는 오디오-비주얼 대화 이해 및 생성을 위한 것이다. 기존 접근 방식은 주로 비상호작용적인 sy...

    #research #paper #ai #computer-vision
  • 2일 전 · ai

    [Paper] SMP: 재사용 가능한 Score-Matching Motion Priors for Physics-Based Character Control

    데이터 기반 모션 프라이어는 에이전트가 자연스러운 행동을 생성하도록 안내하며, 생동감 있는 가상 캐릭터를 만드는 데 핵심적인 역할을 합니다. Adversaria...

    #research #paper #ai #machine-learning #computer-vision
  • 2일 전 · ai

    [Paper] Unrolled Networks는 MRI Reconstruction에서 Conditional Probability Flows이다

    Magnetic Resonance Imaging (MRI)은 이온화 방사선 없이 뛰어난 연부 조직 대비를 제공하지만, 긴 촬영 시간 때문에 임상 활용이 제한됩니다. 최근…

    #research #paper #ai #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2025