[论文] SAM 引导的语义与运动变化区域挖掘用于遥感变化标题生成
遥感变化描述是一个新兴且受欢迎的研究任务,旨在用自然语言描述已发生变化的感兴趣内容……
遥感变化描述是一个新兴且受欢迎的研究任务,旨在用自然语言描述已发生变化的感兴趣内容……
文本属性图需要模型能够有效地将强大的文本理解与结构化推理相结合。现有方法要么依赖 …
深度神经网络(DNN)和 Kolmogorov‑Arnold 网络(KAN)因其灵活性和表达能力而成为函数逼近的热门方法。然而……
在标准 Transformer(TF)架构中,刚性且统一的计算分配可能限制其效率和可扩展性,尤其是在大规模……
最近的分而治之推理方法,尤其是基于思路链(Chain-of-Thought,CoT)的方式,显著提升了 Text-to-SQL 的能力……
Lindsey(2025)通过四项实验研究语言模型的内省意识,发现模型有时能够检测并识别注入的……
Web 自动化利用智能代理通过模仿人类与网页界面的交互来执行高级任务。尽管最近的 La...
‘以图像思考’已成为推进视觉推理的有效范式,通过注入视觉证据,超越仅文本的思考链……
时空视频定位(STVG)需要根据自然语言描述,在未剪辑的视频中同时在时间和空间上定位目标对象。
估计点的法线需要构建局部补丁以提供中心‑周围的上下文,但确定合适的邻域大小是……
对抗逆向强化学习(AIRL)已显示出在通过推断密集奖励函数来解决强化学习(RL)中的稀疏奖励问题方面的潜力。
Recent advances in multimodal large language models (LLMs) have highlighted their potential for medical and surgical applications. However, existing surgical da... 近期在多模态大型语言模型(LLMs)方面的进展凸显了它们在医学和外科应用中的潜力。然而,现有的外科数据……