[Paper] X-SYS:交互式解释系统的参考架构
可解释人工智能(XAI)研究社区已经提出了众多技术方法,但将可解释性部署为系统仍然具有挑战性:交互式…
可解释人工智能(XAI)研究社区已经提出了众多技术方法,但将可解释性部署为系统仍然具有挑战性:交互式…
!Apple AI 研究插图https://9to5mac.com/wp-content/uploads/sites/6/2025/07/machine-learning-research.jpg?quality=82&strip=all&w=1600 一个团队……
Dynamic Memory Sparsification DMS(动态内存稀疏化)是 NVIDIA 的研究人员推出的一项技术,能够削减大规模模型的内存成本。
请提供您希望翻译的文章摘录或摘要文本,我才能为您进行翻译。
Tim Spencer 在运营电商初创公司 Markai 时,深刻体会到制造采购的复杂性。
Max Pooling 在上一篇文章 https://dev.to/rijultp/image-classification-with-convolutional-neural-networks-part-2-creating-a-feature-map-gd0 中,我们创建了…
!Anthropic 融资图片 https://techcrunch.com/wp-content/uploads/2026/01/GettyImages-2256664479.jpg?w=1024 简要:Anthropic 刚刚完成了一笔 $30 账单……
大多数针对 LLM 的护栏系统就像酒吧的保镖:它们在门口检查每个请求,决定通过或拒绝,然后就把它忘掉。我想要……
通用机器人长期以来的愿景依赖于它们理解并执行自然语言指令的能力。Vision‑Language‑Action(VLA)……
视觉错觉传统上依赖于空间操作,例如多视图一致性。在本工作中,我们引入了 Progressive Semantic Illusions,这是一种新颖的……
统一模型能够在单一架构中同时处理多模态理解和生成,但它们通常在一次前向传播中完成,而不进行迭代……
Context distillation 使语言模型能够将上下文中的知识内化到其参数中。在我们的工作中,我们提出了 On-Policy Context Distillation(...)。
使用 Diffusion Transformers 进行实时视频生成时,受到 3D self-attention 二次成本的瓶颈限制,尤其在实时模式下……
Self-supervised learning(SSL)是一种从未标记的时间序列数据中学习的强大范式。然而,像masked autoencoders(MAEs)这样的流行方法……
Diffusion large language models (DLLMs) 有潜力通过并行解码多个 token 来实现快速文本生成。然而,在实践中,它们的 i...
通过 symbolic, interpretable formulas 解释观测到的现象是科学的根本目标。最近,large language models (LLMs) 已经出现作为…
我们研究噪声投影到等距群作用的正交方向上的 Langevin dynamics。引入此数学模型是为了提供新的 …
尽管 speech recognition systems 在 standard benchmarks 上实现了低 word error rates,但它们在实际部署中的短小、高风险 utterances 往往会失败。
延迟敏感的语音应用(例如实时转录、语音指令和实时翻译)需要低的 time-to-first-token (TTFT) 和高的 transc...
数据混合——确定来自不同领域的数据比例——是训练语言模型(LMs)的首要关注点。虽然现有的混合方法……
高效的长上下文处理仍然是当代大型语言模型(LLMs)的关键挑战,尤其在资源受限的环境中。因此……
监督微调(SFT)在计算上高效,但相比强化学习(RL)通常会导致较差的泛化能力。这一差距主要是…
当前用于图像生成和编辑的统一多模态模型通常依赖于大规模参数(例如 >10B),导致训练成本高昂……
AI模型在文本推理方面已经取得了state-of-the-art的成果;然而,它们在对空间和关系结构进行推理的能力仍然是一个关键的……
高质量的3D纹理生成仍然是一个根本性的挑战,因为当前主流的 multi-view diffusion pipelines 所固有的视角不一致性。...
AI coding agents 正日益为软件开发做出贡献,但它们对移动开发的影响却很少得到实证关注。在这…
Tokenomics:降低每次 AI 交互的成本——在医疗保健中的诊断洞察、互动游戏中角色的对话,以及自主 r……
TLA+ 中的模型检查提供了强大的正确性保证,但从业者在解释 counterexamples 时仍然面临重大挑战,unders...
NVIDIA DGX Spark:面向 AI 研究的桌面超级计算机 在全球领先的机构中,NVIDIA DGX Spark https://www.nvidia.com/en-us/products/workstatio...
多智能体系统正日益协调多个专门的语言模型来解决复杂的现实问题,通常在共享的上下文中调用它们……
GeForce NOW 将屏幕变成游戏机器 2026年2月12日 — 作者:GeForce NOW Community https://blogs.nvidia.com/blog/author/geforcenowcommunity/ !Amazon F...
markdown - 第1部分:理解主机与设备范式 — 本文 - 第2部分:点对点与集合操作 — 敬请期待 - 第3部分:GPU的…
背景:Apple 在 2024 年推出了重新设计的、AI 驱动的 Siri,承诺具备诸如查找特定照片、跟踪细节、添加信息等功能……
研究预览:GPT‑5.3‑Codex‑Spark > 一个更小的实时编码模型,由 Cerebras 合作构建。
在 binary classification 系统中,decision thresholds 将 model scores 转换为 actions。选择合适的 thresholds 依赖于 t 的具体分布……
免费 British Accent Generator,逼真的 AI text‑to‑speech,在线创建真实的英式声音。免费生成并下载 MP3 音频。使用方法…
边缘设备的激增迫切需要能够在严格的计算约束下实时检测恶意软件的安全解决方案。
报告摘要:一位匿名读者分享了一份报告:一名 Anthropic 安全研究员辞职,称“世界正处于危险之中”,部分原因是 AI 的进步。来源 https://...
也许你是 AI 构建者,或者你是 CISO。你刚刚批准让你的 dev team 使用 AI agents。你了解风险——data exfiltration、prompt……
2026年1月29日
中国人工智能创业公司 Zhupai z.ai 宣布推出 GLM‑5。GLM‑5 是 Zhupai 的 GLM 系列中最新的大型语言模型(LLM),并在 MIT 开源许可证下发布。
Read more about OpenEnv 实践:评估工具使用代理在真实世界环境中的表现
引言:AI agents 在当今技术领域变得日益突出,其发展势头没有放缓的迹象。它们现在已成为不可或缺的一部分……
LLM 成本的真正驱动因素 1. 你调用模型的频率 听起来很显而易见,但频率会快速累积。循环中的一次额外调用,一个不必要的…
令人沮丧的消失:Claude 会话为何失去上下文以及如何修复 我最近花了一个沮丧的下午与 Claude 纠缠,试图构建一个 comp…
当前对神经系统中记忆的研究方法依赖于基于相似性的检索:给定一个 query,找到最具表征相似性的存储状态。这…
两相流中的界面动力学支配动量、热和质量传递,但在实验上仍然难以测量。传统技术面临……
近期在机器人学习方面的进展引起了人们对能够最终接近人类水平能力的平台的极大兴趣。这种兴趣,c...