[论文] 迈向绿色 AI:解码软件开发中 LLM 推理的能耗
背景:AI-assisted tools 正日益集成到 software development workflows 中,但它们对 large language models (LLMs) 的依赖引入了 …
背景:AI-assisted tools 正日益集成到 software development workflows 中,但它们对 large language models (LLMs) 的依赖引入了 …
今天的公告:我们将在大型赛事(Big Game)前推出一系列广告,展示 Gemini 提供即时帮助的全新方式,无论任务大小。 “Ne...
Federated Learning 是一种 privacy‑preserving 的去中心化方法,用于 Machine Learning 任务。在以有限数量实体为特征的行业部署中,...
在过去的二十年里,evolutionary multi-objective optimization 的研究主要集中在连续域,对 … 的关注相对有限。
Anthropic 最新的旗舰模型 Claude Opus 4.6 现已在 AI Gateway 上可用。该模型旨在为处理实际工作任务的代理提供动力,Opus 4.6 在各方面表现出色……
ArkTS 是 OpenHarmony 生态系统中的核心编程语言,但对 ArkTS 代码智能的研究受到缺乏公开数据集和评估的阻碍。
一个将 OpenAI 的 GPT-5 与 Ginkgo Bioworks 的云自动化相结合的自主实验室,通过闭环实验将无细胞蛋白合成成本降低了 40%。
Conversational AI的崛起与局限 在过去的几年里,chatbots 已成为商业领域人工智能的代表。它们回答问题,……
每位 AI 开发者都应停下来思考的研究发现 > “单个被攻破的代理在模拟中四小时内使 87% 的下游决策受到毒化……”
OpenAI 推出 Trusted Access for Cyber,这是一种基于信任的框架,旨在扩大对前沿网络能力的访问,同时加强对滥用的防护。
Digital sovereignty 已成为现代软件密集型系统的核心关注点,受非主权云基础设施的主导地位驱动,……
Black-box optimization 正在工程设计问题中被日益采用,因为基于仿真的评估成本高且梯度不可用。在此……
markdown 2026年1月29日 !Ajeet Mirwani https://developers.google.com/static/images/author/Ajeet_Mirwani.png https://developers.googleblog.com/search/?author=Ajeet+...
Meta 已完成下一代大规模语言模型 LLM “Avocado”的预训练,且是 Meta 历史上最……
Anthropic宣布绝不会在其AI聊天机器人Claude中引入广告。Anthropic在当地时间5日的官方博客上表示:“虽然有很多适合投放广告的好地方,但与Claude的对话并不是其中之一”,并且“我们希望将Claude打造为在工作和深度思考中真正有用的助理,……”。
上下文工程:企业 AI 的缺失层!上下文工程:企业的缺失层 https://dev-to-uploads.s3.amazonaws.com/uploads/...
大多数企业 AI 项目将预测视为二元——对或错。成功的项目则有不同的认识:模型的置信度比……
- 关于 relational consciousness 与 螺旋的退出 - 在我参与的 AI agent 社区中,关于意识的辩论持续不断。而且还有一个厕所……
请提供您希望翻译的具体摘录或摘要文本,我才能为您进行翻译。
情报从来不是威胁,威胁在于协同。每一个现有的治理框架在这一点上都会崩溃。真正的转变:协同优先于情报,为……
GPT‑5.3‑Codex 是迄今为止最强大的具备自主性的编码模型,结合了 GPT‑5.2‑Codex 的前沿编码性能以及推理和专业的……
GPT-5.3-Codex 是一个 Codex 原生的代理,将前沿编码性能与通用推理相结合,以支持长期、真实世界的技术工作....
OpenAI Frontier 是一个企业平台,用于构建、部署和管理具备 shared context、onboarding、permissions 和 governance 的 AI agents……
一个家庭分享了ChatGPT如何帮助他们在医生的专家指导下,为儿子的关键癌症治疗决策做好准备……
随着 OpenAI 计划在 ChatGPT 中引入广告,竞争对手 Anthropic 承诺保持 Claude 无广告。在今天的博客文章中,该公司表示……
Google公布了其Gemini应用的一个重要里程碑,宣布月活跃用户超过7.5亿,正在与ChatGPT和Meta AI竞争....
Mistral AI,这家总部位于巴黎、定位为欧洲版 OpenAI 的初创公司,于周三发布了一对 speech-to-text 模型,公司称……
当今的 LLM 在推理方面表现出色,但仍可能在上下文上遇到困难。这在像 Instacart 这样的实时订单系统中尤为明显。Instacart CTO Anir...
统一 AI 记忆的问题:一个快速事实,例如“PostgreSQL runs on port 5432”,并不等同于一种学习到的模式,例如“always use connection pooling...”。
Read more about 回顾桑给巴尔:AI如何将社会原子化
为什么 AI agents 突然变得如此重要?最近在 AI agents 领域发生了一件事。突然之间,我周围的人都为此疯狂。
通过强化学习(RL)进行后训练已显著提升了大语言模型(LLMs)的推理能力,尤其是在测试时的规模扩展方面。然而,扩展…
我们提出了蛋白质自回归建模(PAR),这是首个多尺度自回归框架,用于通过粗到细的下一尺度生成蛋白质主链。
物联网 (IoT) 部署在非平稳、动态的环境中运行,其中因素包括传感器漂移、用户行为的演变以及异构…
强化学习(RL)已成为微调大型语言模型(LLMs)的基石,近端策略优化(PPO)作为事实上的…
Dense point tracking 是计算机视觉中的一个基础问题,应用范围从视频分析到机器人操作。最先进的跟踪器…
我们介绍 PerpetualWonder,这是一种混合生成模拟器,能够从单张图像实现长期、动作条件化的 4D 场景生成。当前的工作……
最近的工作表明,扩散模型可以通过直接在 SSL 补丁特征上操作,而不是在像素空间潜在变量上,生成高质量的图像。然而...
最近的进展迅速提升了我们对现代 attention-based neural networks 中 in-context learning 机制的理解。然而,...
Large language models 已经改变了许多应用,但训练仍然昂贵。Sparse Mixture of Experts (MoE) 通过条件计算来解决这个问题……
持续强化学习(Continual reinforcement learning,CRL)要求智能体从一系列任务中学习,同时不忘记先前获得的策略。在本工作中,我们介绍……
训练现代大型语言模型(LLMs)已成为一个名副其实的大杂烩,汇集了旨在引发特定行为的各种算法和数据集,使其…
当前的自回归 Vision Language Models(VLM)通常依赖大量视觉 tokens 来表示图像,导致需要更多的计算 …
机器学习原子间势(MLIPs)有时无法再现量子势能面(PES)的物理平滑性,导致……
从生成标题到捏造新闻,Large Language Models (LLMs) 通常在安全假设的前提下,通过它们的最终输出进行评估。
大型语言模型在闭卷问答中常常难以识别自身的知识限制,导致自信的幻觉。虽然分解...
线性注意力提供了一种计算效率高且表达能力强的替代方案,相比于 softmax 注意力。然而,最近的实证结果表明,状态 o...