[Paper] 核 Hopfield 网络中吸引子边界的几何分析及存储容量极限
基于核逻辑回归(KLR)的高容量关联记忆表现出强大的存储能力,但其动力学和几何机制仍未被完全阐明。
基于核逻辑回归(KLR)的高容量关联记忆表现出强大的存储能力,但其动力学和几何机制仍未被完全阐明。
公共推理基准在模型和提供商层面对 AI 系统进行比较,但实际做出部署决策的单位是端点:th...
约翰·劳伦森 – 商业记者,巴黎
Runpod Flash:加速 AI 开发的无服务器 GPU 基础设施。Runpod 是为 AI 开发构建的高性能云计算和 GPU 平台。
驾驶 world models 作为自动驾驶的关键技术,通过模拟环境动态来实现。然而,现有方法主要侧重于……
Human-robot collaboration 主要在 dyadic 或 sequential 场景中进行研究。然而,真实的家庭需要 multiadic 协作,其中多个 human……
从稀疏、未配准的图像重建3D场景在现实条件下仍然具有挑战性,因为光照变化和瞬时遮挡。现有…
Vision-Language-Action (VLA) 模型越来越多地加入了用于复杂机器人操作的推理机制。然而,现有方法共享一个 c...
我们展示了弗雷歇距离(FD),长期被认为在训练目标上不切实际,实际上可以在表征空间中有效优化。我们的 i...
大多数熟悉的均衡概念,如 Nash 均衡和相关均衡,只保证没有单个玩家通过单方面偏离能够提升自己的效用。
近期的 visual generation models 在 photorealism、typography、instruction following 和 interactive editing 方面取得了重大进展,但它们仍然在…
强化学习(RL)已成为对大型语言模型(LLMs)进行后训练,以实现推理、代理能力和对齐的关键。成功……
现实的长期生产力工作在很大程度上受用户特定的计算机环境的影响,其中大量工作上下文被存储和组织……
支气管镜导航依赖于将内镜视频与术前 CT 扫描进行配准,但呼吸运动会使气道变形 5‑20 mm,导致 CT‑to‑…
脑电图(EEG)信号对自动癫痫发作检测至关重要,但其固有噪声使得稳健的表征学习具有挑战性。现有…
我们介绍AEGIS,一个用于评估AI生成学术图像取证分析的整体benchmark。与现有benchmark相比,AEGIS具备三个……
机器学习模型可以从数据样本中学习,以高效地执行各种任务。当数据样本被对抗性地操纵时,例如通过插入……
机器学习(ML)推理服务系统托管深度神经网络(DNN)模型,并在已部署的 GPU 上调度传入的推理请求。然而,li...
现代视频扩散模型在外观合成方面表现出色,但仍在物理一致性上存在困难:对象漂移,碰撞缺乏真实的反弹,……
在本研究中,我们使用 machine learning 对 Vicsek flocking model 的 phase structure 进行分类和插值,遍历 three-dimensional parameter space。
能够且高效的机器学习(ML)模型的激增标志着信号处理(SP)领域近乎最强的 方法论转变之一。
现有的研究基础设施本质上是以文档为中心的,提供论文之间的引用链接,但缺乏对方法论的明确表示……
我们提出了 FlexiTac,一种低成本、开源且可扩展的压阻式触觉传感解决方案,专为机器人末端执行器设计。FlexiTac 是一种实用的 …
Surprisal theory 将人类处理努力与即将出现的语言单位的可预测性联系起来,但实证研究常常对单位的概念阐述不足……
LLM agents 被期望在软件工具、业务服务和本地工作空间中完成端到端的工作单元。然而,许多 agent benchmarks 冻结了……
自主代理通过 sandboxed containers 和 microVMs 运行,其状态跨越 filesystems、processes 和 runtime artifacts。Checkpoint and restore (C/R) …
多轮提示注入遵循已知的攻击路径——信任构建、枢纽、升级,但文本层面的防御会错过隐藏的攻击,其中单个 tur...
手语,无论其地理或口音差异,理所当然地在口头记录和音频等持续流行的背景下,受到持续的审视。
大型多模态模型(LMM)标准的后训练方案是在精心挑选的示例上进行监督微调(SFT),随后进行强化学习(RL)……
Transformer 模型被广泛部署在关键的 AI 应用中,然而其注意力机制、投影以及其他内部组件中的故障常常导致……
关于课堂互动的研究长期以来在大规模观察和深入的民族志工作之间划分。我们提出一个框架来映射这种方法……
大型语言模型(LLMs)已经推动了表格问答的进展,在这种情况下,大多数查询可以通过提取信息或简单聚合来回答。然而……
最近的研究表明,将庞大的 English web corpora 过滤为高质量子集可以显著提升训练效率。然而,对于高分辨率…
大量的元科学研究和其他倡议已经开始监测开放科学实践的普及程度,当更重要的是理解“d...”时。
大型语言模型(LLMs)在城市分析中日益被用作人类感知的代理,但尚不清楚 persona prompting 是否会产生 …
句子的句法结构可以表示为一棵树,树的边表示词与词之间的句法依存关系。当这种结构呈星形时,它……
多模态大型语言模型(MLLMs)正日益被用于将视觉产物转换为代码,从 UI 原型转换为 HTML,到将科学图表转换为 Python……
在本文中,创建、测试并分析了一个吸引子 FCM。该 FCM 既不是基于 Hebbian 的,也不是代理式的,也不是混合型的;它更像是一种 gradient descent 方法。
基础模型是深度神经网络(例如 GPT-5、Gemini~3 和 Opus~4),在大规模数据集上进行训练,能够执行多样的下游任务——文本和……
AI inference 正在成为一种持续且地理分布广泛的电力需求来源。与许多传统电负荷不同,inference workloads……
开发可靠的 AI 工具用于医疗保健 2023年7月 了解更多 /blog/codoc-developing-reliable-ai-tools-for-healthcare/ !Healthcare AI illustration https://lh3...
为了保留先前学习的表征,持续学习系统必须在可塑性(获取新知识的能力)和稳定性(保持旧知识的能力)之间取得平衡,...
对侵入式神经脉冲数据进行建模是推动高性能脑机接口(BCIs)发展的基础。然而,现有方法面临关键的挑战……
当我来到MIT时,真正让我震惊并且每天都让我震惊的,是这里正在进行的事物令人惊叹。科学、工程……
本文提出了 RCMAES,这是一种针对 CEC 基准优化的协方差矩阵适应进化策略 (CMA-ES) 的新变体。RCMAES 集成了 …
具有有限容量的持续学习代理必须在获取新知识和保留旧知识之间取得平衡。这需要对知识进行受控的遗忘……
Diffusion large language models (dLLMs) 提供并行解码和双向上下文,但最先进的 dLLMs 需要数十亿参数才能竞争……