EUNO.NEWS EUNO.NEWS
  • All (2467) +274
  • AI (559) +22
  • DevOps (146) +3
  • Software (1034) +151
  • IT (723) +97
  • Education (5) +1
  • Notice
  • All (2467) +274
    • AI (559) +22
    • DevOps (146) +3
    • Software (1034) +151
    • IT (723) +97
    • Education (5) +1
  • Notice
  • All (2467) +274
  • AI (559) +22
  • DevOps (146) +3
  • Software (1034) +151
  • IT (723) +97
  • Education (5) +1
  • Notice
Sources Tags Search
한국어 English 中文
  • 4天前 · ai

    [Paper] 重新审视直接编码:可学习的时间动态用于静态图像脉冲神经网络

    处理缺乏固有时间动态的静态图像仍然是脉冲神经网络(SNN)的一项根本性挑战。在直接训练的SNN中,静态...

    #research #paper #ai #computer-vision
  • 6天前 · ai

    [Paper] Video‑R2:强化多模态语言模型中的一致且有根基的推理

    对动态视觉内容进行推理仍然是多模态大型语言模型的核心挑战。最近的思考模型生成显式的推理轨迹。

    #research #paper #ai #computer-vision
  • 6天前 · ai

    [Paper] Video-CoM:通过操作链进行交互式视频推理

    近期的多模态大语言模型(MLLMs)在视频理解方面取得了进展,但大多数仍然是“思考视频”,即一旦视频被编码,推理……

    #research #paper #ai #computer-vision
  • 6天前 · ai

    [Paper] AnyTalker:通过交互细化实现多人物说话视频生成的规模化

    最近,多人视频生成开始受到关注。虽然已有少数初步工作探索了音频驱动的多人说话视频生成……

    #research #paper #ai #computer-vision
  • 6天前 · ai

    [Paper] 视觉生成调优

    大型视觉语言模型(VLMs)通过广泛的预训练,有效弥合模态差距,获取与视觉表示相匹配的复杂特征……

    #research #paper #ai #computer-vision
  • 6天前 · ai

    [Paper] 面向对象的数据合成用于类别级目标检测

    Deep learning 方法在 object detection 方面已经实现了对图像中特定目标类别的可靠检测。然而,扩展模型的检测能力…

    #research #paper #ai #computer-vision
  • 6天前 · ai

    [Paper] Physics-Informed Neural Networks 用于热物性属性检索

    Inverse heat problems 指的是在已观测或已知的热扩散行为下,对材料热物理属性进行估计。Inverse heat problems 已经…

    #research #paper #ai #machine-learning #computer-vision
  • 6天前 · ai

    [Paper] Hunyuan-GameCraft-2: 指令跟随的交互式游戏世界模型

    近期在 generative world models 方面的进展,使得在创建 open-ended game environments 上取得了显著进展,已从 static scene synthesis 向……发展。

    #research #paper #ai #computer-vision
  • 6天前 · ai

    [Paper] DisMo:解耦运动表示用于开放世界运动迁移

    最近在 text-to-video (T2V) 和 image-to-video (I2V) 模型方面的进展,使得从简单的文本创建视觉上引人注目且动态的视频成为可能……

    #research #paper #ai #computer-vision
  • 1周前 · ai

    [Paper] MANTA: 基于物理的通用水下目标跟踪

    水下目标跟踪具有挑战性,因为波长相关的衰减和散射会严重扭曲不同深度和水体条件下的外观……

    #research #paper #ai #computer-vision
  • 1周前 · ai

    [论文] VQRAE:Representation Quantization Autoencoders 用于多模态理解、生成与重建

    在单一 tokenizer 中统一多模态的理解、生成和重建表示仍然是构建统一模型的关键挑战。此前...

    #research #paper #ai #computer-vision
  • 1周前 · ai

    [Paper] 通过基于注意力的可解释性优化多模态语言模型

    现代的大型语言模型变得多模态,能够分析文本和图像等各种数据格式。虽然微调在适应这些多模态……

    #research #paper #ai #nlp #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2025