[Paper] 动态拓扑优化用于去中心化学习中的非IID数据
去中心化学习(DL)使一组节点能够在没有中心协调的情况下协作训练模型,提供了隐私和可扩展性方面的优势……
去中心化学习(DL)使一组节点能够在没有中心协调的情况下协作训练模型,提供了隐私和可扩展性方面的优势……
上一篇文章聚焦于 failure modes:agents 失效的地方,以及我们在审查它们的 output 时的失误。此次跟进从 diagnosis 转向 design。Sa...
首尔市的首尔 AI 中心主任朴찬진在 1 月 30 日于首尔 COEX 大礼堂举办的 AI 大会 “AI SEOUL 2026” 上明确指出,人工智能技术竞争的下一阶段不是性能提升,而是“如何设计在现实中运行的结构”的问题。此次活动是 A...
大型语言模型(LLM)辅助的算法发现是一种迭代的、黑箱的程序优化过程,用于近似求解目标任务,……
在人类历史的大部分时间里,证据很简单:如果你亲眼看到某件事,它很可能是真的。如果你听到熟悉的声音,那声音属于……
2026年1月29日
请提供您希望翻译的具体摘录或摘要文本,我才能为您进行翻译。
一组来自 Apple 和特拉维夫大学的研究人员找到了在不牺牲可懂度的前提下加速 AI‑based text‑to‑speech 生成的方法。这里…
高级持续性威胁(APTs)是复杂的、长期的网络攻击,由于其隐蔽操作且常常融入…
探索 Sora feed 理念——旨在激发创造力、促进联系,并通过个性化推荐、家长控制等方式确保体验安全,...
在高度不平衡的数据集中检测稀有且多样的异常——例如网络安全中的高级持续性威胁(APTs)——仍然是一个根本性的挑战 f...
请提供您希望翻译的具体摘录或摘要文本,我才能为您进行简体中文翻译。
这段视频全力聚焦Suno,这个AI音乐生成器,并编织出它可能正在塑造的相当阴暗的未来故事。它挑起棘手的问题,剖析为什么A...
引言 在上一篇文章中,我们回顾了处理 cross‑entropy 导数所需的关键思想。 在本文中,我们设置导数步骤……
推动 AI 需要的不仅是突破性模型。它取决于构建者和研究者社区,这些人进行实验、检验假设并分享他们的……
直接对齐方法正日益用于将大型语言模型(LLMs)与人类偏好对齐。然而,许多现实中的对齐问题涉及……
临床 brain-to-text 接口旨在为无法提供大量训练录音的瘫痪患者设计。预训练提升了数据高效的生成……
Pixel diffusion 直接在像素空间中端到端生成图像,避免了在两阶段潜在空间中由 VAE 引入的伪影和瓶颈……
我们提出 RLAnything,一个通过闭环优化动态锻造环境、策略和奖励模型的强化学习框架,...
基于LLM的深度研究代理主要构建在ReAct框架上。这种线性设计使得重新访问早期状态、分支到替代方案变得困难,...
RL 在 LLM 后训练中的成功源于一种极其信息不足的来源:每次 rollout 只提供一个二进制奖励或偏好的单比特信息……
Likelihood-based policy gradient 方法是从奖励训练机器人控制策略的主流方法。这些方法依赖于可微分的动作……
大型语言模型(LLMs)已经通过逐步的思考链(CoT)推理展示了强大的推理能力。然而,在极限……
AI agents 经常以难以定位的方式失败,因为执行具有 probabilistic、long-horizon、multi-agent 的特性,并且受 noisy tool outputs 的影响……
大多数大型语言模型(LLM)代理记忆系统依赖于一小套静态、手工设计的操作来提取记忆。这些固定的过程硬-...
使 humanoid robots 执行灵活且自适应的交互任务长期以来一直是 robotics 的核心挑战。当前的方法受到 eith... 的瓶颈限制。
渐进学习(Progressive Learning,PL)通过逐步扩大模型规模来降低预训练的计算开销。虽然之前的工作已经广泛探讨了深度扩展……
基于 deep learning 的 auto segmentation 正在放射治疗中日益广泛使用,但传统模型常常产生解剖上不合理的假阳性,或 h...
自回归大型语言模型(LLMs)在许多复杂任务中取得了显著成功,但它们在非常简单的逻辑推理方面仍可能失败,例如……
大型语言模型(LLMs)的快速进展引发了这些模型是否具备某种形式的意识的疑问。为了解决这一挑战,...
前沿模型正从仅仅摄取视觉信息的多模态大语言模型(MLLMs)转向统一多模态模型(UMMs),具备……
Activation decomposition methods 在语言模型中与关于概念在 activation space 中如何实现的几何假设紧密耦合。Existing appr...
随着 Large Language Models 转向 autonomous agents,用户输入经常违反合作假设(例如,隐式意图、缺失参数、错误……)。
重新排序是现代检索系统的关键组成部分,这类系统通常将高效的第一阶段检索器与更具表达能力的模型配对,以细化检索结果……
边缘AI应用对 ultra‑low‑power、low‑latency 推理的需求日益增长。基于 event‑driven spiking neural networks (SNNs) 的 Neuromorphic computing ……
统一的多模态模型在需要深度推理的复杂合成任务上常常表现不佳,且通常将 text-to-image generation 和 image editing 视为……
OpenAI 刚刚推出了一款全新的 Mac 应用:Codex,官方称其是“使用 agents 构建的最佳方式”。以下是详细信息。更多……
热带森林拥有地球上大多数树木的生物多样性,对全球生态平衡至关重要。Canopy trees 尤其发挥了不成比例的作用……
图形用户界面(GUI)对齐旨在将自然语言指令转换为可执行的屏幕坐标,从而实现自动化的 GUI 交互....
OpenAI 已发布了一款针对 Codex 的全新 MacOS 应用,整合了自去年 Codex 推出以来流行的众多 agentic coding practices……
OpenAI 已发布了一个新的 MacOS 应用程序用于 Codex,整合了自去年 Codex 推出以来变得流行的许多 agentic coding practices……
AI agents 通常不是因为模型“差”而失败。它们失败是因为现实世界是混乱的: - API 超时 - 工具返回部分或格式错误的响应…
Out-of-distribution(OOD)检测对于深度神经网络的安全部署至关重要。最先进的后置(post-hoc)方法通常会推导 OOD 分数 f...
Model editing 旨在纠正大型、预训练模型中的错误,而不改变无关的行为。虽然一些近期工作已经编辑了 vision-language model……
在丰富交互下模拟可变形对象仍然是 real-to-sim 机器人操作的根本挑战,其动力学由环境等因素共同驱动。
人类动作分析任务,如 temporal 3D pose estimation、motion prediction 和 motion in‑betweening,在计算机视觉中发挥着关键作用。然而...
我们提出了 SWE-Universe,一个可扩展且高效的框架,用于自动构建来自 Gi… 的真实世界软件工程(SWE)可验证环境。
Hierarchical federated learning(HFL)已成为大规模无线和物联网系统的关键架构,设备在其中与 …