EUNO.NEWS EUNO.NEWS
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
  • All (20543) +144
    • AI (3117) +9
    • DevOps (914) +5
    • Software (10652) +105
    • IT (5812) +25
    • Education (48)
  • Notice
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
Sources Tags Search
한국어 English 中文
  • 1个月前 · ai

    [Paper] 语义与重建同等重要:让表示编码器准备好用于文本到图像生成与编辑

    现代潜在扩散模型(LDM)通常在低层次的变分自编码器(VAE)潜在空间中运行,这些空间主要针对像素级的重建进行优化。

    #research #paper #ai #computer-vision
  • 1个月前 · ai

    [Paper] Re-Depth Anything: 测试时深度细化通过自监督再照明

    单目深度估计仍然具有挑战性,因为最近的基础模型,如 Depth Anything V2 (DA-V2),在处理与真实世界图像相差甚远的情况时表现不佳。

    #research #paper #ai #machine-learning #computer-vision
  • 1个月前 · ai

    [Paper] 灵巧的世界模型

    近期在 3D reconstruction 方面的进展使得从日常环境中轻松创建逼真的 digital twins 成为可能。然而,当前的 digital twins 仍然规模庞大...

    #research #paper #ai #computer-vision
  • 1个月前 · ai

    [Paper] 开放基础模型中视觉的对抗鲁棒性

    随着深度学习的提升,理解 AI 系统能够识别对象的模型变得越来越困难。因此,对手可能会……

    #research #paper #ai #machine-learning #computer-vision
  • 1个月前 · ai

    [论文] 用于多智能体交互序列建模的 Diffusion Forcing

    理解和生成 multi-person interactions 是一个根本性的挑战,对 robotics 和 social computing 具有广泛的影响。虽然人类自然…

    #research #paper #ai #computer-vision
  • 1个月前 · ai

    [Paper] RadarGen:从摄像头生成汽车雷达点云

    我们提出了 RadarGen,这是一种扩散模型,用于从多视角相机图像合成逼真的汽车雷达点云。RadarGen 采用 efficient image-

    #research #paper #ai #machine-learning #computer-vision
  • 1个月前 · ai

    [Paper] 关键点计数分类器:将 Vision Transformers 转换为无需训练的自解释模型

    当前用于设计自解释模型(SEMs)的方法需要复杂的训练过程和特定的架构,这使得它们不切实际……

    #research #paper #ai #computer-vision
  • 1个月前 · ai

    [Paper] 视觉提示基准出乎意料地脆弱

    在评估 VLMs 时,一个关键挑战是测试模型在不依赖文本先验的情况下分析视觉内容的能力。最近的基准测试如 BLINK……

    #research #paper #ai #machine-learning #computer-vision
  • 1个月前 · ai

    [Paper] InSPECT: 扩散模型的不可变光谱特征保持

    现代扩散模型(DMs)已经实现了最先进的图像生成。然而,将数据完全扩散至白噪声的根本设计选择……

    #research #paper #ai #computer-vision
  • 1个月前 · ai

    [Paper] 可解释的植物叶片病害检测 使用 Attention-Enhanced CNN

    植物疾病对全球粮食安全构成重大威胁,需要准确且可解释的疾病检测方法。本研究介绍了一种 i...

    #research #paper #ai #machine-learning #computer-vision
  • 1个月前 · ai

    [Paper] InfSplign:推理时空间对齐的文本到图像扩散模型

    文本到图像(Text-to-image,T2I)扩散模型能够生成高质量的图像,但往往未能捕捉文本提示中指定的空间关系。这一限制可以……

    #research #paper #ai #machine-learning #computer-vision
  • 1个月前 · ai

    [Paper] PathBench-MIL:用于组织病理学中多实例学习的综合 AutoML 与基准评估框架

    我们推出 PathBench-MIL,一个用于组织病理学中多实例学习(MIL)的开源 AutoML 与基准测试框架。该系统实现了端到端的自动化。

    #research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026