EUNO.NEWS EUNO.NEWS
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
  • All (20543) +144
    • AI (3117) +9
    • DevOps (914) +5
    • Software (10652) +105
    • IT (5812) +25
    • Education (48)
  • Notice
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
Sources Tags Search
한국어 English 中文
  • 3周前 · ai

    [Paper] 扩散了解透明性:重新利用 Video Diffusion 进行透明物体深度和法线估计

    透明物体仍然是感知系统的顽疾:折射、反射和透射破坏了立体视觉、ToF 以及纯粹……的假设。

    #research #paper #ai #computer-vision
  • 3周前 · ai

    【论文】Web World Models

    语言代理日益需要持久的世界,在其中它们可以行动、记忆和学习。现有方法位于两个极端:传统的网络 fra...

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 3周前 · ai

    [Paper] IDT:一种基于物理的 Transformer 用于前馈多视角固有分解

    内在图像分解是视觉理解的基础,因为 RGB 图像将材料属性、光照和视角相关效应交织在一起。Rec...

    #research #paper #ai #computer-vision
  • 3周前 · ai

    [Paper] RoboMirror: 先理解再模仿——从视频到类人机器人行走

    人类通过视觉观察学习运动,先解释视觉内容再模仿动作。然而,state-of-the-art humanoid locomotion sy...

    #research #paper #ai #computer-vision
  • 3周前 · ai

    [Paper] OmniAgent:音频引导的主动感知代理用于全模态音视频理解

    Omnimodal 大语言模型在统一音频和视觉模态方面取得了显著进展;然而,它们往往缺乏细粒度的跨模态理解……

    #research #paper #ai #computer-vision
  • 3周前 · ai

    [Paper] 重新思考端到端 3D 感知的时空对齐

    时空对齐对于自动驾驶(AD)中端到端(E2E)感知的时间建模至关重要,能够提供有价值的结构和纹理……

    #research #paper #ai #computer-vision
  • 3周前 · ai

    [Paper] 3D形状生成中的记忆:实证研究

    生成模型正日益被用于3D视觉,以合成新形状,但仍不清楚它们的生成是否依赖于记忆训练数据。

    #research #paper #ai #machine-learning #computer-vision
  • 3周前 · ai

    [Paper] 可扩展残差特征聚合框架与混合元启发式优化用于多模态CT成像的稳健早期胰腺肿瘤检测

    胰腺肿瘤的早期检测是一个主要的临床难题,主要原因在于肿瘤往往在对比度极低的边缘出现。

    #research #paper #ai #computer-vision
  • 3周前 · ai

    [Paper] 摄像头 RGB‑NIR 火灾检测

    提高使用红外夜视摄像机进行火灾检测的准确性仍然是一项具有挑战性的任务。先前的研究报告了强大的性能……

    #research #paper #ai #computer-vision
  • 3周前 · ai

    [Paper] RxnBench:一个用于评估大语言模型在科学文献中对化学反应理解的多模态基准

    将多模态大语言模型(MLLMs)整合到化学领域有望彻底改变科学发现的方式,但它们理解 d...

    #research #paper #ai #machine-learning #computer-vision
  • 3周前 · ai

    [Paper] CubeBench: 诊断交互式、长时程空间推理在部分观测下

    大型语言模型(LLM)代理虽然在数字领域表现出色,但由于在形成……方面的挑战,它们在物理世界部署方面存在显著差距。

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 3周前 · ai

    [Paper] MedGemma vs GPT-4:开源与专有 Zero-shot 医学疾病分类(基于图像)

    多模态大型语言模型(LLMs)通过借助广泛的临床知识来解释扫描图像,为医学影像引入了一种新兴范式……

    #research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026