· ai
[Paper] Map2Thought:通过度量认知地图进行显式3D空间推理
我们提出了 Map2Thought,一个能够为 3D VLM 提供显式且可解释的空间推理的框架。该框架基于两个关键组件:Metr...
我们提出了 Map2Thought,一个能够为 3D VLM 提供显式且可解释的空间推理的框架。该框架基于两个关键组件:Metr...
大型语言模型(LLMs)在各个领域表现出卓越的性能,但它们面临着关键的安全问题。模型编辑已经成为一种有效的…
PubMed-OCR 是一个以 OCR 为中心的科学文章语料库,来源于 PubMed Central Open Access PDFs。每页图像都使用 Google Cloud Vision 进行标注……
脉冲神经网络(SNN)采用受神经可塑性启发的无监督学习方法,有望成为人工智能的新框架。
1️⃣ 什么是回归?回归的含义是:使用过去的信息来预测未来的数值。示例 | 问题 | 类型 |
大型语言模型(LLMs)向自主代理的演进已经将 AI 编码的范围从局部代码生成扩展到复杂的、仓库级…
我们提出了一种新颖的可微分网格表示,用于高效求解微分方程(DEs)。广泛使用的神经求解器架构,……
工具集成推理(Tool-Integrated Reasoning,TIR)使大型语言模型(LLMs)能够通过将推理步骤与外部工具交互交错进行,来处理复杂任务。H...
Diffusion models 已经在从丰富的多模态分布中采样方面展示了显著的经验成功。它们的推断依赖于数值求解某种…
近期在端到端自动驾驶方面的进展表明,从基础模型中提取的补丁对齐特征训练的策略在对 Out-... 的泛化能力更强。
我们研究一种半异步的客户端‑服务器感知器,通过迭代参数混合(IPM‑style averaging)进行训练:客户端执行本地感知器更新,并且 …
在长期、目标导向的交互中部署大型语言模型仍然具有挑战性,因为相似的实体和事实会在不同的潜在 …