AWS re:Invent 2025:无服务器和存储获得 AI 驱动的全面改造!

发布: (2025年12月17日 GMT+8 19:48)
13 min read
原文: Dev.to

I’m happy to help translate the article, but I don’t see the text you’d like translated—only the source link is provided. Could you please paste the content you want translated (excluding any code blocks or URLs you want to keep unchanged)? Once I have the text, I’ll translate it into Simplified Chinese while preserving the original formatting.

服务器无状态工作流与更智能存储的新时代

另一次 AWS re:Invent 已经落幕,发布的内容堪称创新旋风。作为 DataFormatHub 的科技记者,我对正在重塑 AWS LambdaAmazon S3 的最新进展感到尤为兴奋。2025 年,AWS 正在推动无服务器计算和对象存储的边界,让构建者和数据处理者的工作更轻松、更有趣。

Lambda 亮点

  • Lambda Durable Functions – 里程碑式的转变。

    • 使 Lambda 能够 检查点保存进度挂起执行最长一年,并 自动从故障中恢复
    • 不再需要 Step Functions 或自定义状态管理代码。
    • 适用于订单处理、用户入职、以及涉及人工审查或长时间计算的 AI 辅助工作流。
    • 已在 Python 3.13/3.14 和 Node.js 22/24 运行时上线
  • Lambda Managed Instances – 两全其美。

    • 在专用的 EC2 背靠基础设施(Graviton4、GPU 等)上运行 Lambda 函数。
    • 通过 Savings Plans 或 Reserved Instances 为稳定工作负载提供最高 72 % 的成本节省
    • AWS 负责打补丁、负载均衡、自动扩展以及通过路由流量到预置环境来缓解冷启动。

S3 亮点

  • S3 Vectors(GA) – 直接内置于 S3 的大规模向量搜索。

    • 支持 每个索引最高 20 亿向量,查询延迟约 100 ms
    • 与专用向量数据库相比,成本 降低最高 90 %
    • 可无缝集成 Amazon Bedrock Knowledge BasesAmazon OpenSearch Service
  • 其他值得关注的增强

    • 支持 50 TB 对象,满足超大数据集需求。
    • S3 Batch Operations 提速 10 倍,新增 “无清单” 选项——只需指向桶或前缀即可处理数十亿对象。
    • S3 Tables 现已包含自动 Intelligent‑Tiering(可节省最高 80 % 成本)以及简化的 跨账户 / 跨区域复制
    • 基于标签的访问控制,让安全管理更直观,降低对复杂桶策略的依赖。

形势转变:AI 原生云已来临

These announcements aren’t isolated features; they signal a clear trend: the cloud is becoming inherently AI‑native. AWS is no longer just providing building blocks—it’s embedding AI capabilities directly into the core services we use every day.

  • S3 evolves from a simple object store into an AI‑aware data substrate, handling petabyte‑scale vector indexes and tabular data with intelligent cost optimization.
  • Lambda Durable Functions recognize that modern AI workflows often require orchestration, human‑feedback loops, and long‑running processes. By making Lambda “durable,” AWS lets developers use the serverless model for complex, stateful applications without sacrificing managed‑compute benefits.

In short, data storage, processing, and AI inference are converging into a seamless, interconnected fabric.

深入技术细节

Lambda Durable Functions 非常引人注目。能够在保持状态的情况下暂停执行长达一年,这一特性是巨大的差异化优势。底层,AWS 可能使用了强大的内部状态机和持久化层,抽象掉了协调多个 Lambda 调用或外部存储机制(例如 DynamoDB、SQS)所带来的复杂性——这些以前是开发者必须自行拼接的。这直接与传统的基于 Step Functions 的编排竞争,同时保留了 Lambda 的低延迟、按使用付费模型。

随着我们获取 SDK 和真实世界基准测试,后续会有更深入的技术探讨。

Lambda Durable Functions

使用 – 在许多更简单的场景中,它简化了 – 你可能原本会使用 AWS Step Functions 的工作,提供了更原生的 Lambda 开发者体验,适用于某些编排模式。对开发者而言,这意味着更少的样板代码、更少的可管理部件,以及对复杂流程更统一的编程模型。

Lambda Managed Instances

其底层机制类似于 AWS 为你的 Lambda 函数供应和管理一池 EC2 实例(可能包括 Graviton 4 或 GPU 等专用硬件)。这允许每个执行环境处理多个并发请求,能够显著提升资源利用率并降低计算消耗——尤其是对高调用率和稳定流量的函数而言。它有效地弥合了无服务器弹性与预置实例的成本可预测性及专用硬件访问之间的鸿沟,提供了 兼顾两者优势 的场景,正是许多企业用户一直渴望的。

S3 Vectors

S3 Vectors 是分布式系统工程的杰作。在如此规模的对象存储服务中直接构建高性能向量搜索并非易事。这表明在 S3 庞大基础设施上实现了高度优化的索引和检索机制,使向量搜索成为数据存储的基本原语,而非附加功能。

S3 Tables

S3 Tables 的增强——尤其是 Intelligent‑Tiering——对数据湖效率至关重要。通过根据访问模式自动将 Iceberg‑table 数据迁移到更便宜的存储类别,AWS 提供了切实的成本优化,能够在长期内节省大量资本。

  • 基于标签的访问控制 – 在规模化安全简化方面取得了巨大胜利,将复杂度从对象级别提升到资源级别的清晰度。

对开发者意味着什么(以及对你的 DataFormatHub 工作流的影响!)

好了,直接说重点。这些公告会如何影响你作为开发者的日常工作,尤其是当你深耕数据格式转换和管道编排时?

Lambda Durable Functions

Lambda Durable Functions 为你打开了全新的可能性。想象一下一个复杂的数据转换管道,其中一个 Lambda 函数:

  1. 启动一个长时间运行的外部进程(例如大规模数据清洗任务或 AI 模型训练)。
  2. 等待其完成。

不需要轮询或依赖其他编排器,Lambda 只需暂停,在外部事件触发时恢复执行。这大大简化了许多 DataFormatHub 用户面对的数据集成和 AI 推理管道的架构,使得长时间运行、带状态的无服务器应用成为可能。告别手动状态管理的头疼事。

Lambda Managed Instances

Lambda Managed Instances 对成本优化和性能一致性是极大的福音。如果你有稳定的 数据处理任务——夜间 ETL 作业、持续的数据校验,或始终在线的 API 后端——这些在标准 Lambda 上感觉尴尬(或昂贵)的工作负载,现在可以使用受管实例作为有力的替代方案。你将获得:

  • 熟悉的 Lambda 编程模型。
  • 专用计算的可预测性能和成本特性。
  • 无需 EC2 运维负担。

这可能会成为将更多工作负载完全迁移到类无服务器范式的游戏规则改变者。

S3 Vectors

对于 S3,影响更为深远。S3 Vectors 意味着如果你在构建任何依赖向量嵌入的数据丰富、搜索或推荐系统,S3 现在已经成为这些数据的一等公民。你可以:

  • 将向量化数据直接与原始数据一起存储。
  • 在不部署单独、昂贵的向量数据库的情况下执行语义搜索。

这简化了你的数据架构,加速了在应用中开发 AI 驱动特性的进程。如果你在 DataFormatHub 工作流中生成嵌入,S3 Vectors 将成为你的新伙伴。

S3 Tables

S3 Tables 的增强对数据湖而言堪称金子:

  • 自动分层 —— 在无需人工干预的情况下显著降低不常访问数据的存储费用。
  • 简化复制 —— 提供更强大、全球分布式的数据湖。
  • 基于标签的访问控制 —— 让在庞大的 S3 存储库中保护敏感数据的管理和审计更为轻松。

这些改进让 S3 成为构建强大、成本效益高的数据湖仓的更具吸引力的基础,能够支撑下一代分析和 AI。

判决:AWS持续突破极限

我的真实看法?在 re:Invent 2025 上,AWS 真正超越了自我。这些公告并非仅仅是迭代改进;它们代表了简化复杂模式并将前沿能力直接嵌入基础服务的战略举措。主题十分明确:

  • AI 正在变得无处不在
  • Serverless 正在成长,以处理更复杂的工作负载
  • 存储正变得更智能且更具成本效益

我尤其对 Lambda Durable Functions 感到兴奋,因为它们解决了 serverless 开发中长期存在的挑战,有效地将 Lambda 的实用性扩展到以前被认为过于复杂或有状态的工作流中。再加上 Lambda Managed Instances,AWS 为 任何 类型的 serverless 工作负载提供了前所未有的灵活性,以优化性能和成本。

S3 Vectors?这简直是天才之作。将向量搜索作为 S3 的原生能力,是一项划时代的创新,将加速全行业的 AI 驱动应用。

加速 AI 采用并简化整体数据架构。
S3 Tables 的增强进一步巩固了 S3 作为领先数据湖解决方案的地位,使其更加稳健、智能且具成本效益。

这些发展意味着,作为构建者,我们可以更加专注于编写创新代码,而不是与基础设施纠缠。AWS 正在抽象掉更多复杂性,提供强大的新原语,并从根本上改变云平台的可能性。如果你最近还没有重新审视你的架构,现在绝对是时候。受 AI 深度影响的云开发未来已经在 2025 到来,而且看起来极其令人振奋!

来源

🛠️ 相关工具

📚 您可能也感兴趣

最初发表于 DataFormatHub.

Back to Blog

相关文章

阅读更多 »

AWS 第3模块:Lambda 与 Go

在不离开我的 Mac 的情况下为 Linux 编译,花费 $0.06 系列:AWS Zero to Architect - 第 3 章节 阅读时间:20 分钟 实施时间:120 分钟