· ai
从 RGB 到 Lab:解决 AI 图像合成中的颜色伪影
一种多层次的分割、颜色校正和特定领域增强方法。文章《从RGB到Lab:解决AI图像合成中的颜色伪影》
一种多层次的分割、颜色校正和特定领域增强方法。文章《从RGB到Lab:解决AI图像合成中的颜色伪影》
我们提出了 WildRayZer,一个用于新视角合成(NVS)的自监督框架,适用于相机和物体同时移动的动态环境。动态内容…
我们介绍了 Alterbute,这是一种基于 diffusion 的方法,用于编辑图像中对象的内在属性。我们可以改变颜色、纹理、材料,甚至……
Vision-Language Models (VLMs) 通过使用一种粗糙、非对称的连接,仅将 vision encoder 的输出链接起来,造成了严重的视觉特征瓶颈……
近期在端到端自动驾驶方面的进展表明,从基础模型中提取的补丁对齐特征训练的策略在对 Out-... 的泛化能力更强。
最近在视频模型方面取得了巨大的进展,尤其是在长视频理解方面。然而,当前的基准测试主要呈现……
在本文中,我们发现3D人体动作和2D人体视频的生成本质上是耦合的。3D动作为合理性提供结构先验……
当今最强的视频语言模型(VLM)仍然是专有的。最强的开源权重模型要么依赖于来自专有 VLM 的合成数据,有效地……
自适应视频流在过去几年中促进了视频流的改进。需要在比特率、视频质量等编码性能目标之间取得平衡……
Talking head generation 在虚拟现实(VR)中变得日益重要,尤其是在涉及多轮对话的社交场景中。现有方法……
从视觉观察中推断物理动作是推动 machine intelligence 在物理世界中发展的基本能力。实现这一点需要…
人工智能(AI)有潜力通过自动化图像分析和加速临床研究来改变医学影像。然而,研究 a...