[Paper] 可推广的 Sparse-View 3D 重建来自无约束图像
从稀疏、未配准的图像重建3D场景在现实条件下仍然具有挑战性,因为光照变化和瞬时遮挡。现有…
从稀疏、未配准的图像重建3D场景在现实条件下仍然具有挑战性,因为光照变化和瞬时遮挡。现有…
Vision-Language-Action (VLA) 模型越来越多地加入了用于复杂机器人操作的推理机制。然而,现有方法共享一个 c...
我们展示了弗雷歇距离(FD),长期被认为在训练目标上不切实际,实际上可以在表征空间中有效优化。我们的 i...
大多数熟悉的均衡概念,如 Nash 均衡和相关均衡,只保证没有单个玩家通过单方面偏离能够提升自己的效用。
近期的 visual generation models 在 photorealism、typography、instruction following 和 interactive editing 方面取得了重大进展,但它们仍然在…
强化学习(RL)已成为对大型语言模型(LLMs)进行后训练,以实现推理、代理能力和对齐的关键。成功……
现实的长期生产力工作在很大程度上受用户特定的计算机环境的影响,其中大量工作上下文被存储和组织……
支气管镜导航依赖于将内镜视频与术前 CT 扫描进行配准,但呼吸运动会使气道变形 5‑20 mm,导致 CT‑to‑…
脑电图(EEG)信号对自动癫痫发作检测至关重要,但其固有噪声使得稳健的表征学习具有挑战性。现有…
我们介绍AEGIS,一个用于评估AI生成学术图像取证分析的整体benchmark。与现有benchmark相比,AEGIS具备三个……
机器学习模型可以从数据样本中学习,以高效地执行各种任务。当数据样本被对抗性地操纵时,例如通过插入……
机器学习(ML)推理服务系统托管深度神经网络(DNN)模型,并在已部署的 GPU 上调度传入的推理请求。然而,li...
现代视频扩散模型在外观合成方面表现出色,但仍在物理一致性上存在困难:对象漂移,碰撞缺乏真实的反弹,……
在本研究中,我们使用 machine learning 对 Vicsek flocking model 的 phase structure 进行分类和插值,遍历 three-dimensional parameter space。
能够且高效的机器学习(ML)模型的激增标志着信号处理(SP)领域近乎最强的 方法论转变之一。
现有的研究基础设施本质上是以文档为中心的,提供论文之间的引用链接,但缺乏对方法论的明确表示……
我们提出了 FlexiTac,一种低成本、开源且可扩展的压阻式触觉传感解决方案,专为机器人末端执行器设计。FlexiTac 是一种实用的 …
Surprisal theory 将人类处理努力与即将出现的语言单位的可预测性联系起来,但实证研究常常对单位的概念阐述不足……
LLM agents 被期望在软件工具、业务服务和本地工作空间中完成端到端的工作单元。然而,许多 agent benchmarks 冻结了……
自主代理通过 sandboxed containers 和 microVMs 运行,其状态跨越 filesystems、processes 和 runtime artifacts。Checkpoint and restore (C/R) …
多轮提示注入遵循已知的攻击路径——信任构建、枢纽、升级,但文本层面的防御会错过隐藏的攻击,其中单个 tur...
手语,无论其地理或口音差异,理所当然地在口头记录和音频等持续流行的背景下,受到持续的审视。
大型多模态模型(LMM)标准的后训练方案是在精心挑选的示例上进行监督微调(SFT),随后进行强化学习(RL)……
AI 不仅仅是一项技术——它是魔法。 不相信吗? 那么,为什么该领域的领先公司之一 OpenAI 会发布完整的官方、公司……
Transformer 模型被广泛部署在关键的 AI 应用中,然而其注意力机制、投影以及其他内部组件中的故障常常导致……
关于课堂互动的研究长期以来在大规模观察和深入的民族志工作之间划分。我们提出一个框架来映射这种方法……
OpenAI 的 GPT‑5.5 对 ChatGPT 和 Codex 的升级
大型语言模型(LLMs)已经推动了表格问答的进展,在这种情况下,大多数查询可以通过提取信息或简单聚合来回答。然而……
最近的研究表明,将庞大的 English web corpora 过滤为高质量子集可以显著提升训练效率。然而,对于高分辨率…
大量的元科学研究和其他倡议已经开始监测开放科学实践的普及程度,当更重要的是理解“d...”时。
大型语言模型(LLMs)在城市分析中日益被用作人类感知的代理,但尚不清楚 persona prompting 是否会产生 …
句子的句法结构可以表示为一棵树,树的边表示词与词之间的句法依存关系。当这种结构呈星形时,它……
问题:Summarization APIs 泄露 Reasoning Traces 我发现我的生产 Summarization API 向用户暴露了其内部的 chain‑of‑thought。当我发送 th...
多模态大型语言模型(MLLMs)正日益被用于将视觉产物转换为代码,从 UI 原型转换为 HTML,到将科学图表转换为 Python……
背景 匿名读者引用了 Ars Technica 的一篇报告:OpenAI 的 Codex CLI 的系统提示包含了一个令人困惑且重复的关于 m 的警告……
在本文中,创建、测试并分析了一个吸引子 FCM。该 FCM 既不是基于 Hebbian 的,也不是代理式的,也不是混合型的;它更像是一种 gradient descent 方法。
自硅谷开始积极推广基于大语言模型的聊天机器人(如ChatGPT)作为所谓不可避免的未来以来,已经快三年了……
基础模型是深度神经网络(例如 GPT-5、Gemini~3 和 Opus~4),在大规模数据集上进行训练,能够执行多样的下游任务——文本和……
像素能否成为训练有用代理的关键?扩展语言模型的竞争——以及围绕它们的代理生态系统——正炙手可热。编码代理,……
OpenAI的妖怪问题 OpenAI 正在公开其妖怪问题。继《Wired》的一篇报道披露了对 OpenAI 编码模型的指令,要求“永不谈论…”。
AI inference 正在成为一种持续且地理分布广泛的电力需求来源。与许多传统电负荷不同,inference workloads……
OpenAI 已指示其部分 AI 工具停止提及 goblins,因为该词开始在回复中随机出现。在星期四的博客文章中,公司…
开发可靠的 AI 工具用于医疗保健 2023年7月 了解更多 /blog/codoc-developing-reliable-ai-tools-for-healthcare/ !Healthcare AI illustration https://lh3...
Meta 在当下关于顶级 AI 产品的讨论中并不常被提及,但它的产品仍然受益于对这项技术日益增长的兴趣。
Unsupervised Machine Learning Unsupervised machine learning 是机器学习的一个分支,模型在没有标记结果的数据上进行训练。Unlike…
自硅谷开始积极推广基于 large language model 的聊天机器人(如 ChatGPT),并将其视为所谓不可避免的未来以来,已经快三年了……
为了保留先前学习的表征,持续学习系统必须在可塑性(获取新知识的能力)和稳定性(保持旧知识的能力)之间取得平衡,...
对侵入式神经脉冲数据进行建模是推动高性能脑机接口(BCIs)发展的基础。然而,现有方法面临关键的挑战……