AWS 2025:Agentic AI、定制芯片和多云桥接
Source: Dev.to
2025 AWS 年度回顾
我全年都在跟踪 AWS 的发布,老实说,2025 年感觉与往年不同。不再只是“又一个托管服务”,而是从根本上 “我们正在改变你构建软件的方式”。 在 re:Invent 以及全年持续不断的更新中,有很多值得消化的内容。
本文是我对每个主要类别关键公告的总结。我不会覆盖所有内容——AWS 公布了数百项更新——但我会挑出对大多数开发者和架构师真正重要的部分。
2025 年的三大主题
| 主题 | 含义 |
|---|---|
| 无处不在的代理式 AI | AWS 全面投入能够代表你行动的自主代理。 |
| 大规模定制硅芯片 | Graviton 5、Trainium 3 以及运行它们的基础设施。 |
| 多云已成现实 | AWS 与 Google 的合作并未出现在我的 bingo 卡上。 |
共同点: AWS 正在将自身定位为不仅仅是基础设施,而是 AI 代理居住和运行的平台。无论你是否认同这一愿景,这显然是他们的前进方向。
2025 年全球足迹
新区域上线
- 墨西哥(中部) – AWS 在墨西哥的首个区域,已于 2025 年 1 月 上线。
- 承诺:50 亿美元,为期 15 年。
- 泰国(亚太) – 于 2025 年 1 月 上线,拥有三个可用区(AZ)。
2025 年其他上线
| 区域 | 上线日期 | 可用区 | 投资额 |
|---|---|---|---|
| 台湾(亚太 – 台北) | 2025 年 6 月 | 3 | 50 亿美元 |
| 新西兰(亚太 – ap‑southeast‑6) | 2025 年 9 月 2 日 | 3 | 75 亿新西兰元 |
即将推出
- 沙特阿拉伯 – 预计 2026 年。
- AWS 欧洲主权云 – 将于 2025 年 12 月 在德国勃兰登堡上线,投资 78 亿欧元。
注意: 截至 2025 年 12 月,AWS 在 38 个地理区域 中运营 120 个可用区。请记住——您不需要为 AWS 账户付费,只为您运行的资源付费。区域可用性仍然影响延迟和数据驻留要求。
计算 – 重磅胜利
Graviton 5 处理器
- EC2 M9g 实例:相较于上一代,性能提升最高可达 25 %,且能耗更低。
- 如果您尚未在兼容工作负载上使用 Graviton,性价比差距已经进一步 扩大。
Trainium 3 超级服务器
- 每台服务器可容纳最高 144 块 Trainium 3 芯片。
- 提供最高 362 MXFP8 PFLOPs 的计算能力。
- 声称比前一代 能效提升 40 %。
Lambda 增强功能
| 功能 | 功能说明 |
|---|---|
| Durable Functions | 协调持续时间从几秒到 一年 的多步骤工作流,无需为闲置计算付费。适用于人工审批循环或周期性轮询。 |
| Managed Instances | 在 EC2 硬件上运行 Lambda 风格的函数——具备无服务器的简易性,同时拥有 EC2 的控制权。 |
新 EC2 实例类型
- 由 第 5 代 AMD EPYC 处理器驱动的 内存优化 实例。
- 时钟速度最高可达 5 GHz,内存高达 3 TiB——面向大型数据库、EDA 工具及类似工作负载。
AI 服务与模型
Amazon Nova 2 系列
| 模型 | 焦点 | 状态 |
|---|---|---|
| Nova 2 Lite | 快速且具成本效益的推理,适用于日常工作负载 | GA |
| Nova 2 Pro | 最强大的模型,适用于复杂的多步骤任务 | Preview |
| Nova 2 Sonic | 语音到语音,支持 七种语言 | GA |
| Nova 2 Omni | 首个能够处理 文本、图像、视频和语音 并生成文本和图像的推理模型 | GA |
所有 Nova 2 模型均支持 可调强度级别(在需要时提升推理深度,简单查询时保持轻量)。
Amazon Nova Forge
- “构建您自己的前沿模型”。
- 从 Nova 检查点开始,将专有数据与 Nova 的训练数据混合,获得一个将 Nova 能力与您的领域知识相结合的定制模型。
- 据报道,Reddit 使用 Forge 构建了自己的模型。
Nova Act
- 由定制的 Nova 2 Lite 模型驱动的浏览器自动化代理。
- 声称在基于浏览器的任务上具有 ≈ 90 % 的可靠性——对网页爬虫和自动化工具有用。
Amazon Bedrock 更新
- > 100 个基础模型,其中包括在十二月新增的 18 个开源权重模型。
- 强化微调:基于反馈的训练,可在无需大规模标注数据集的情况下实现 ≈ 66 % 的准确率提升。
Amazon Bedrock AgentCore
| 里程碑 | 日期 |
|---|---|
| 预览 | 2025年7月 |
| GA | 2025年10月 |
| 功能丰富的发布 | 2025年12月 |
- SDK 下载量:前 5 个月超过 200 万次。
核心组件
- 运行时 – 会话隔离,面向语音代理的双向流。
- 记忆 – 包含用于从经验中学习的 情景记忆。
- 网关 – 将现有 API 转换为兼容 MCP 的工具。
- 身份 – OAuth 集成和安全令牌存储。
- 可观测性 – 用于代理监控的 CloudWatch 仪表板。
- 策略 – 使用 Cedar 策略进行实时工具调用拦截。
- 评估 – 13 个内置评估器用于自动化测试。
结论
2025 年是 AWS 的转型之年:
- AI 代理 现在已成为平台上的一等公民。
- 定制硅片(Graviton 5、Trainium 3)将性能和效率提升到新高度。
- 多云 能力正被内置到核心产品中。
如果你是开发者或架构师,最实用的收获是 Lambda Durable Functions、Managed Instances 和 Nova 2 模型系列——这些最有可能对日常工作负载产生影响。请关注正在成熟的 AgentCore;它有可能成为在 AWS 上构建生产级 AI 代理的事实标准框架。
Amazon Q Developer
- 语言: C#、C++,以及 11 种可自定义的语言。
- GitLab Duo 集成: GA。
- GitHub 集成: 预览版 – 无需 AWS 账户。
- CLI 中的 MCP 支持。
- 对话历史: 在会话之间持久保存。
- Pro 版: 在法兰克福提供,以实现欧盟数据驻留。
Kiro IDE
AWS 发布了 Kiro,这是一款 Amazon 现在内部使用的具备代理功能的 AI IDE。基于 VS Code 构建,具备规范驱动开发,你可以在 markdown 中编写需求,代理会自动搭建所有内容。
- 据报道,一个内部项目从 30 位开发者、18 个月 缩减至 6 位开发者、76 天。
- 初步迹象令人鼓舞,尽管我仍在评估中。
数据库节省计划
一种适用于 RDS、Aurora、DynamoDB、ElastiCache、Neptune 和 DocumentDB 的单一灵活承诺。无需再为每种引擎单独管理预留实例组合。
- 通过一年承诺,可实现最高 35 % 成本降低。
Aurora DSQL
- Cluster creation 现在只需 几秒而不是几分钟 – 非常适合快速原型设计和测试。
RDS 存储扩展
- SQL Server 和 Oracle 现在支持最高 256 TiB 的存储(从 64 TiB 提升)。
- IOPS 和 I/O 带宽提升 4 倍。
- 使从大型本地数据库的迁移更容易。
OpenSearch 增强
- GPU‑accelerated vector indexing – 速度提升 10 倍,成本仅为原来的四分之一。
- Auto‑optimised vector indexes 自动评估不同的 KNN 算法,以在召回质量和查询性能之间取得平衡。
AWS Interconnect
与 Google Cloud 的合作,提供受管的高速专用连接,连接两个平台。
- 按需提供专用带宽,几分钟即可建立连接。
- 包含 四重冗余 和 MACsec 加密。
- Microsoft Azure 支持计划在 2026 年推出。
“多云大多是营销,但这实际上很有用。” – 我的看法
Route 53 全局解析器(预览)
安全的 anycast DNS 解析,简化混合 DNS 管理——只需一个服务,而不是在每个 VPC 中管理解析器。
Amazon S3 Vectors (GA)
- 原生支持存储和查询向量嵌入。
- 单索引可扩展至 20 亿向量(是预览容量的 40 倍)。
- 单存储桶可支持最高 20 万亿向量。
- 与专用向量数据库相比,成本降低最高可达 90 %。
非常适用于 RAG、语义搜索和代理工作负载——消除对独立向量数据库(如 Pinecone)的需求。
S3 表
- 内置对 Intelligent‑Tiering 的支持以及对 Apache Iceberg‑native 表 的复制。
- 简化在 S3 上的分析,无需复杂的 ETL 流程。
FSx for NetApp ONTAP
- 现在集成了 S3,允许通过 S3 API 访问文件系统数据。
- 对于在不复制数据的情况下将现有存储接入分析和机器学习服务非常有用。
Amazon EKS 功能
提供用于工作负载编排和云资源管理的全托管平台功能。
- 旨在消除基础设施维护,同时保持企业级可靠性。
如果您正在使用原生 Kubernetes 并在集群管理上花费了太多时间,这可能会有所帮助。
ECS 快速模式
简化的 ECS 容器部署。
我还没有尝试过这个,但它在我的清单上。
产品生命周期页面 (2025)
AWS 推出了一个整合的页面,汇集所有服务可用性信息——终于。
需要注意的关键弃用
| Service | Deprecation Detail |
|---|---|
| AWS Cloud9 | 不再接受新客户。AWS 推荐使用带远程扩展的 VS Code。 |
| AWS WAF Classic | 2025年3月31日 之后不再创建新的 WebACL。2025年9月30日 完全退役。 |
| AWS Proton | 支持于 2026年10月7日 结束。2025年10月7日 之后阻止新客户。 |
| AWS SDK for JavaScript v2 | 支持于 2025年9月8日 结束。迁移至 v3。 |
| Amazon Linux 2 | 支持延长至 2026年6月30日。请在此之前迁移至 Amazon Linux 2023。 |
如果您正在使用上述任何服务,现在是规划迁移的时机。
CodeCommit 逆转
在一次罕见的举措中,AWS 在 2025 年 11 月逆转了 CodeCommit 的废弃计划,此举源于对客户反馈的倾听。
- CodeCommit 已恢复全面通用可用性,并计划推出新功能:
- Git Large File Storage(2026 年初)
- 区域扩展至更多地区,始于 2026 年第三季度
此逆转承认了 CodeCommit 与 IAM 的深度集成、VPC 端点支持以及与 CodePipeline 的无缝连接——这些对受监管行业尤为重要。AWS 明确为已开始迁移规划的客户所造成的不便致歉。
2025 – 模式与要点
-
AI 代理是新的计算原语
- 从服务器 → 容器 → 函数 → 代理。
- AWS 正在大力押注自主系统将代表我们行动。
-
定制硅芯片很重要
- 持续投资 Graviton 和 Trainium,以在特定工作负载上实现比通用硬件更低的价格和更好的性能。
-
多云正变得实用
- 与 Google 的合作表明 AWS 认识到合法的多云需求。预计在 2026 会有更多互操作性公告。
-
开发者体验是重点
- Q Developer、Kiro 以及各种 IDE 集成展示了 AWS 对 AI‑辅助开发工具的承诺,而不仅仅是基础设施。
无论你是对变化的速度感到兴奋还是感到疲惫,2025 年无疑是 AWS 的重要一年。如果路线图公告是任何指示,2026 年将 …(原文在此处截断)。
哪些公告对你最重要?我很想听听你打算先尝试什么。