re:Invent25,第1天:“boom”
Source: Dev.to

我几乎每天都在关注 AWS 的 “What’s new”,已经超过 7 年。我发现有些 re:Invent 版块令人兴奋,有些则令人失望……但我很少感到被当天大量公告淹没的感觉。
AI:自主代理
Matt Garman 主旨演讲中最重要的宣布[↗️]大概是即时可用的 三个长期运行的代理。
迄今为止,代理式 AI 依赖于每次任务都需要重新发现上下文(项目结构、可用的 CLI 配置文件、访问权限、架构选择)。需要频繁与“驾驶员”交互以保持“在轨”。 自主 Kiro 代理 [↗️] 提出通过在后台运行代理并利用已完成的所有任务来解决此限制。别再对我们的代理进行保姆式管理,开始真正管理它们!
另外还有两个代理加入:
- Agent DevOps [↗️]:在事故情况下,它主动分析日志、指标,确定原因,并提出解决和纠正措施。
- Agent de Sécurité [↗️]:它在每次 PR 时评估代码并进行渗透测试。
这些代理是上一次 AWS Poitiers 用户组中展示的技术的大规模部署:
- 像 Strands 这样的代理框架为大语言模型提供“眼睛”和“手”。
- Bedrock AgentCore,代理托管服务,现在可以评估代理 [↗️](它们是否完成任务?是否使用了正确的工具?),并通过自然语言策略(转化为 Cedar)来控制其执行。
AI:AWS 的模型、第三方模型…以及你的模型?
要运行这些代理,首先需要一个大语言模型(LLM)。
- AWS 为 Bedrock 添加了 20 种 “open‑weight” 模型(DeepSeek、GPT 等)。
- 西雅图公司发布了 Nova 系列模型 v2:
- Nova Omni [↗️]:具备高级推理能力的多模态模型。
- Nova Sonic v2 [↗️]:低延迟的语音到语音模型,现已集成到 Amazon Connect [↗️]。
- Nova Lite 和 Nova Pro 完善了产品线。
Nova Forge [↗️] 允许基于这些模型并使用您自己的数据(加上 AWS 数据)进行训练,以获得真正的业务理解,超越单纯的 RAG。
Nova Act [↗️] 能够在无需第三方工具的情况下浏览网页或执行代码。
此外,AWS Transform 提供专用于遗留系统改造的代理(从 VMware、Oracle、Windows 等迁移)。其他服务也集成了升级代理:EMR 可以升级旧的 Spark 代码 [↗️],预计在接下来的几天内 Lambda 也会出现类似功能。
“AI‑ready” 基础设施
- API Gateway(参见 Pre:Invent 帖子):Bedrock AgentCore 运行时现在支持 双向流式传输 [↗️]。
- S3 Vector [↗️] 正式发布,可与 Bedrock 知识库集成,并在数十亿向量上实现 100 ms(频繁查询)到 1 s(稀疏查询)的检索。
- AWS Support 宣布了计划 [↗️],首层由 AI 响应,可以更低成本在生产事故中在 30 分钟内获得人工操作员。
其他服务呢?
Lambda
- Lambda Durable Functions [↗️]:允许中断执行并在最长一年后恢复(在“sleep”或收到回调后),暂停期间无需费用。
- Lambda Managed Instances [↗️]:适用于稳定工作负载或特定硬件需求(尚未支持 GPU,但即将推出),提供 EC2 计费却拥有 Lambda 的运维简易性。
存储 & 数据库
- S3 Tables 提供 “Intelligent‑tiering” 存储类别 [↗️]:大幅降低 Iceberg 表的成本。
- 数据库现在提供 Savings Plans [↗️]:可实现巨额节省。

- S3 Storage Lens [↗️] 添加了性能指标,并支持对数十亿前缀进行导出。
