EUNO.NEWS EUNO.NEWS
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
  • All (20543) +144
    • AI (3117) +9
    • DevOps (914) +5
    • Software (10652) +105
    • IT (5812) +25
    • Education (48)
  • Notice
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
Sources Tags Search
한국어 English 中文
  • 1个月前 · ai

    【论文】循环视频掩码自编码器

    我们提出了循环视频掩码自编码器(Recurrent Video Masked‑Autoencoders,RVM):一种新颖的视频表示学习方法,使用 transformer‑based 循环神经网络来……

    #research #paper #ai #computer-vision
  • 1个月前 · ai

    [Paper] I-Scene:3D 实例模型是隐式可泛化空间学习者

    泛化仍然是 interactive 3D scene generation 的核心挑战。现有的 learning-based 方法将 spatial understanding 建立在有限的场景上。

    #research #paper #ai #computer-vision
  • 1个月前 · ai

    [Paper] LASER:用于无训练流式4D重建的层级尺度对齐

    近期的前馈重建模型,如 VGGT 和 π^3,取得了令人印象深刻的重建质量,但由于二次内存开销,它们无法处理流式视频。

    #research #paper #ai #computer-vision
  • 1个月前 · ai

    [Paper] 前馈 3D 编辑通过 Text-Steerable Image-to-3D

    近期在 image-to-3D 领域的进展为设计、AR/VR 和机器人技术打开了巨大的可能性。然而,要在实际应用中使用 AI 生成的 3D 资产,……

    #research #paper #ai #machine-learning #computer-vision
  • 1个月前 · ai

    [Paper] JoVA:统一多模态学习用于联合视频-音频生成

    在本文中,我们提出了 JoVA,一个用于联合 video‑audio 生成的统一框架。尽管最近取得了令人鼓舞的进展,现有方法仍面临两个关键的限制……

    #research #paper #ai #computer-vision
  • 1个月前 · ai

    [Paper] 迈向数字人类的交互智能

    我们引入了 Interactive Intelligence,这是一种新颖的数字人范式,能够实现与人格对齐的表达、自适应交互以及自我进化……

    #research #paper #ai #nlp #computer-vision
  • 1个月前 · ai

    [论文] 面向个性化文本到图像生成的方向性 Textual Inversion

    Textual Inversion(TI)是一种高效的 text-to-image 个性化方法,但在复杂提示下常常失败。我们将这些失败归因于 embedding norm。

    #research #paper #ai #machine-learning #computer-vision
  • 1个月前 · ai

    [论文] World Models 可利用人类视频实现灵巧操作

    灵巧的操作具有挑战性,因为它需要理解细微的手部运动如何通过与物体的接触影响环境。我们介绍…

    #research #paper #ai #machine-learning #computer-vision
  • 1个月前 · ai

    [论文] 从代码到现场:评估卷积神经网络在芒果叶疾病诊断中的鲁棒性

    通过鲁棒性评估对人工智能(AI)模型进行验证和确认,对于保证其在集成中的可靠性能至关重要……

    #research #paper #ai #machine-learning #computer-vision
  • 1个月前 · ai

    [Paper] Do-Undo:在视觉语言模型中生成与逆转物理动作

    我们引入 Do-Undo 任务和基准,以填补视觉语言模型中的关键空白:理解和生成物理上合理的场景转换……

    #research #paper #ai #machine-learning #computer-vision
  • 1个月前 · ai

    [Paper] DA-SSL:自监督域适配器,以在 turbt 病理切片中利用基础模型

    近期在组织病理学中的深度学习框架,特别是与病理基础模型(PFMs)相结合的多实例学习(MIL),已经显示出……

    #research #paper #ai #machine-learning #computer-vision
  • 1个月前 · ai

    AI 图像生成器通过变得更糟而变得更好

    真正的玩家会知道这张图中的雷尼尔山看起来太大了,但这张 AI 图像中对 Washington State 渡轮的再现令人毛骨悚然。这是 The Ste...

    #AI image generation #diffusion models #generative AI #computer vision #deep learning #stable diffusion #AI art

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026