EUNO.NEWS EUNO.NEWS
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
  • All (20543) +144
    • AI (3117) +9
    • DevOps (914) +5
    • Software (10652) +105
    • IT (5812) +25
    • Education (48)
  • Notice
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
Sources Tags Search
한국어 English 中文
  • 3天前 · ai

    从 RGB 到 Lab:解决 AI 图像合成中的颜色伪影

    一种多层次的分割、颜色校正和特定领域增强方法。文章《从RGB到Lab:解决AI图像合成中的颜色伪影》

    #image compositing #color correction #RGB #Lab color space #segmentation #computer vision #deep learning #AI image processing
  • 4天前 · ai

    [Paper] WildRayZer:自监督大视角合成在动态环境中

    我们提出了 WildRayZer,一个用于新视角合成(NVS)的自监督框架,适用于相机和物体同时移动的动态环境。动态内容…

    #research #paper #ai #computer-vision
  • 4天前 · ai

    [Paper] Alterbute: 编辑图像中对象的内在属性

    我们介绍了 Alterbute,这是一种基于 diffusion 的方法,用于编辑图像中对象的内在属性。我们可以改变颜色、纹理、材料,甚至……

    #research #paper #ai #computer-vision
  • 4天前 · ai

    [Paper] 从一对一到多对多:动态跨层注入用于深度视觉-语言融合

    Vision-Language Models (VLMs) 通过使用一种粗糙、非对称的连接,仅将 vision encoder 的输出链接起来,造成了严重的视觉特征瓶颈……

    #research #paper #ai #computer-vision
  • 4天前 · ai

    [Paper] 少看,多开:通过 Foundation Models 的随机补丁选择实现可推广的端到端自动驾驶

    近期在端到端自动驾驶方面的进展表明,从基础模型中提取的补丁对齐特征训练的策略在对 Out-... 的泛化能力更强。

    #research #paper #ai #machine-learning #computer-vision
  • 4天前 · ai

    [Paper] CURVE:文化与多语言长视频推理基准

    最近在视频模型方面取得了巨大的进展,尤其是在长视频理解方面。然而,当前的基准测试主要呈现……

    #research #paper #ai #computer-vision
  • 4天前 · ai

    [Paper] CoMoVi:3D 人体动作与真实视频的协同生成

    在本文中,我们发现3D人体动作和2D人体视频的生成本质上是耦合的。3D动作为合理性提供结构先验……

    #research #paper #ai #computer-vision
  • 4天前 · ai

    [Paper] Molmo2:开放权重和数据用于具备视频理解与定位的视觉-语言模型

    当今最强的视频语言模型(VLM)仍然是专有的。最强的开源权重模型要么依赖于来自专有 VLM 的合成数据,有效地……

    #research #paper #ai #machine-learning #computer-vision
  • 4天前 · ai

    [论文] 多目标Pareto前沿优化用于高效自适应VVC流媒体

    自适应视频流在过去几年中促进了视频流的改进。需要在比特率、视频质量等编码性能目标之间取得平衡……

    #research #paper #ai #computer-vision
  • 4天前 · ai

    [Paper] RSATalker:面向多轮对话的真实社交感知 Talking Head 生成

    Talking head generation 在虚拟现实(VR)中变得日益重要,尤其是在涉及多轮对话的社交场景中。现有方法……

    #research #paper #ai #computer-vision
  • 4天前 · ai

    [Paper] Action100M: 大规模视频动作数据集

    从视觉观察中推断物理动作是推动 machine intelligence 在物理世界中发展的基本能力。实现这一点需要…

    #research #paper #ai #computer-vision
  • 5天前 · ai

    [Paper] MHub.ai:简洁、标准化且可复现的医学影像AI模型平台

    人工智能(AI)有潜力通过自动化图像分析和加速临床研究来改变医学影像。然而,研究 a...

    #research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026