[Paper] NavAI:一种可泛化的 LLM 框架,用于虚拟现实环境中的导航任务
导航是虚拟现实(VR)中自动探索的基本任务之一。现有技术主要关注 360- 中的路径优化。
导航是虚拟现实(VR)中自动探索的基本任务之一。现有技术主要关注 360- 中的路径优化。
随着 AIGC(AI 生成内容)技术的进步,越来越多的生成模型正在革新视频编辑、音乐等领域。
本卷收录了第十六届国际 Graph Computation Models 研讨会(GCM 2025)的后期论文集。研讨会在德国科布伦茨举行,...
Spatio-temporal reasoning in time series 涉及对 temporal dynamics、spatial dependencies 和 textual context 的显式综合。This capability is vit...
许多科学和工程中的重要问题涉及在已知观测过程的情况下,从噪声和/或不完整的观测中推断信号……
基础视觉、音频和语言模型通过其 latent representations 实现对 downstream tasks 的 zero-shot 性能。最近,unsupervised learning…
Memory-Augmented Generation(MAG)通过外部记忆扩展大型语言模型,以支持长上下文推理,但现有方法在很大程度上依赖于 …
量子计算长期以来被寄予在数据分析方面实现变革性进步的期待,然而由于根本性的障碍,实用的量子机器学习仍然难以实现。
近期的 text-to-video diffusion 模型能够生成引人入胜的视频序列,但它们仍然是无声的——缺失语义、情感和氛围线索……
背景:报告与数据系统(RADS)规范放射学风险沟通,但从叙述性报告中自动分配RADS仍具挑战性,因为……
Geo-localization 旨在推断给定信号的地理来源。在计算机视觉中,Geo-localization 已成为一个苛刻的 benchmark,用于 composition……
随着对话式 AI 系统日益融入日常生活,它们引发了关于用户自主性、信任以及商业利益的紧迫关注。