EUNO.NEWS EUNO.NEWS
  • All (2487) +286
  • AI (562) +24
  • DevOps (148) +5
  • Software (1040) +156
  • IT (732) +100
  • Education (5) +1
  • Notice
  • All (2487) +286
    • AI (562) +24
    • DevOps (148) +5
    • Software (1040) +156
    • IT (732) +100
    • Education (5) +1
  • Notice
  • All (2487) +286
  • AI (562) +24
  • DevOps (148) +5
  • Software (1040) +156
  • IT (732) +100
  • Education (5) +1
  • Notice
Sources Tags Search
한국어 English 中文
  • 1周前 · ai

    [Paper] 面向自动安全驾驶指令:大规模视觉语言模型方法

    大规模视觉语言模型(LVLMs)在需要视觉信息的任务中展现出先进的能力,包括目标检测。这些能力……

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 1周前 · ai

    [Paper] Canvas-to-Image: 使用多模态控制的组合图像生成

    虽然现代扩散模型在生成高质量且多样化的图像方面表现出色,但它们仍然在高保真组合和多模态控制方面存在困难,...

    #image generation #diffusion models #multimodal control #computer vision #research
  • 1周前 · ai

    [Paper] TraceGen:在 3D 轨迹空间中的世界建模实现跨体态视频学习

    学习在新平台和新场景中仅通过少量示例来学习新的机器人任务仍然具有挑战性。虽然其他形态——人类…(后文保持不变)

    #research #paper #ai #machine-learning #computer-vision
  • 1周前 · ai

    [论文] G$^2$VLM: 基于几何的视觉语言模型,具备统一的 3D 重建与空间推理

    Vision-Language Models (VLMs) 仍然缺乏空间智能方面的鲁棒性,在空间理解和推理任务上表现不佳。我们...

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 1周前 · ai

    [Paper] 无像素的视觉:来自相机轨迹的感知

    是否可以仅凭相机轨迹——它在空间中划出的路径——而不观看像素来感知视频的内容?本文首次系统地探讨了这一问题……

    #research #paper #ai #computer-vision
  • 1周前 · ai

    [Paper] 革新胶质瘤分割与分级:使用 3D MRI 的引导混合深度学习模型

    Gliomas 是一种脑肿瘤类型,具有高死亡率,这意味着早期且准确的诊断对于肿瘤的治疗干预至关重要……

    #research #paper #ai #computer-vision
  • 1周前 · ai

    [Paper] 不确定性量化用于视觉对象姿态估计

    量化对象姿态估计的不确定性对于稳健的控制和规划至关重要。尽管姿态估计是一个研究成熟的机器人问题……

    #research #paper #ai #computer-vision
  • 1周前 · ai

    [论文] Multi-Crit:在多元标准遵循上的多模态评审基准

    大型多模态模型(LMM)因其强大的指令遵循能力和一致性,正日益被用作多模态评估系统中的评审者。本文提出 Multi-Crit 基准,用于测试 LMM 能否充当可靠的评审...

    #research #paper #ai #computer-vision
  • 1周前 · ai

    [Paper] CaFlow:提升长期动作质量评估的 Causal Counterfactual Flow

    动作质量评估(AQA)从动作视频中预测细粒度的执行分数,已广泛应用于体育、康复和技能评估……

    #action-quality-assessment #causal-inference #video-analysis #computer-vision #long-term-temporal-modeling
  • 1周前 · ai

    [Paper] 视觉Transformer中非单调缩放机制

    更深的视觉Transformer往往表现不如较浅的模型,这挑战了常见的尺度假设。通过对ViT-...的系统性实证分析,...

    #research #paper #ai #machine-learning #computer-vision
  • 1周前 · ai

    [Paper] Qwen3-VL 技术报告

    我们推出 Qwen3-VL,这是截至目前 Qwen 系列中最强大的视觉语言模型,在广泛的多模态基准上实现了卓越的性能……

    #research #paper #ai #machine-learning #computer-vision
  • 1周前 · ai

    [Paper] 基于GCN的动作识别的主动学习

    尽管图卷积网络(GCNs)在基于骨架的动作识别中取得了显著成功,但它们的性能往往依赖于大量的实验室…

    #active learning #graph convolutional networks #action recognition #skeleton-based vision #computer vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2025