EUNO.NEWS EUNO.NEWS
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
  • All (20543) +144
    • AI (3117) +9
    • DevOps (914) +5
    • Software (10652) +105
    • IT (5812) +25
    • Education (48)
  • Notice
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
Sources Tags Search
한국어 English 中文
  • 3周前 · ai

    [Paper] 使用衍射解码器的快照3D图像投影

    3D图像显示对于下一代体积成像至关重要;然而,密集深度复用用于3D图像投影仍然具有挑战性,因为diff…

    #research #paper #ai #computer-vision
  • 3周前 · ai

    [Paper] 生成式数字孪生:视觉‑语言仿真模型用于可执行工业系统

    我们提出了一种视觉-语言仿真模型(VLSM),它统一了视觉和文本理解,以从布局草图中合成可执行的FlexScript……

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 0个月前 · ai

    [Paper] 棱镜假设:通过统一自编码协调语义与像素表示

    跨模态的深度表征本质上是交织在一起的。在本文中,我们系统地分析了各种语义和……的光谱特性。

    #research #paper #ai #computer-vision
  • 0个月前 · ai

    [Paper] Interact2Ar:通过自回归扩散模型实现全身人对人交互生成

    生成逼真的 human-human 交互是一项具有挑战性的任务,它不仅需要高质量的单体身体和手部动作,还需要连贯的……

    #research #paper #ai #computer-vision
  • 0个月前 · ai

    [Paper] 推动视听感知前沿:大规模多模态对应学习

    我们引入 Perception Encoder Audiovisual(PE-AV),一种用于音频和视频理解的新型编码器家族,采用缩放对比学习进行训练。构建于...

    #research #paper #ai #machine-learning #computer-vision
  • 0个月前 · ai

    [论文] Visual-Aware CoT:在统一模型中实现高保真视觉一致性

    最近,Chain-of-Thought(CoT)的引入在很大程度上提升了统一模型的生成能力。然而,观察到当前的...

    #research #paper #ai #computer-vision
  • 0个月前 · ai

    [Paper] Zero-shot 重建视频中的场景内对象操作

    我们构建了首个系统来解决从单目 RGB 视频中重建场景内对象操作的问题。由于该问题本质上是病态的……

    #research #paper #ai #computer-vision
  • 0个月前 · ai

    [Paper] 从室内到开放世界:揭示 MLLMs 中的空间推理差距

    虽然多模态大语言模型(MLLMs)已经在语义任务上取得了令人印象深刻的表现,但它们的空间智能——对稳健和...

    #research #paper #ai #computer-vision
  • 0个月前 · ai

    [论文] WorldWarp: 使用异步视频扩散传播3D几何

    生成长距离、几何一致性的视频面临一个根本性的困境:虽然一致性要求在像素空间严格遵守3D geometry,……

    #research #paper #ai #machine-learning #computer-vision
  • 0个月前 · ai

    [Paper] 高效 Vision Mamba 用于 MRI 超分辨率的混合选择扫描

    背景:高分辨率 MRI 对诊断至关重要,但长时间的采集限制了临床使用。超分辨率(SR)可以在扫描后提升分辨率……

    #research #paper #ai #computer-vision
  • 0个月前 · ai

    [Paper] 多模态 LLMs 用于从档案图像扫描构建历史数据集:德国专利(1877-1918)

    我们利用多模态大型语言模型(LLMs),从 9,562 张档案图像扫描中构建了一个包含 306,070 项德国专利(1875‑1918)的数据集,使用我们的 LLM‑b…

    #research #paper #ai #computer-vision
  • 0个月前 · ai

    [Paper] 超越 CLIP:知识增强的多模态Transformer用于糖尿病视网膜病变诊断中的跨模态对齐

    糖尿病视网膜病变(DR)是全球可预防失明的主要原因之一,需要准确的自动化诊断系统。虽然通用领域的视觉‑​la…

    #research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026