面向 AI 卓越的架构设计:探索 AWS 在 re:Invent 2025 上宣布的三款全新 Well-Architected 视角

发布: (2026年1月16日 GMT+8 23:13)
11 min read
原文: Dev.to

Source: Dev.to

人工智能不再是 AWS 中的实验性工作负载——它正迅速成为生产架构的核心部分。从生成式 AI 应用到大规模机器学习流水线,架构师现在需要设计不仅强大,而且安全、可靠、成本高效且负责任的 AI 系统。

AWS re:Invent 2025 上,AWS 通过在Well‑Architected Framework中引入一个新镜头和两个专为 AI 工作负载设计的重大更新,扩展了其 AI 指南:

镜头关注点
Responsible AI Lens信任、公平、透明
Machine Learning (ML) Lens坚实的机器学习基础
Generative AI Lens生成式工作负载的实用指南

这些镜头共同为组织在 AI 旅程的各个阶段提供实用的端到端架构指南——无论团队是刚开始探索机器学习,还是在大规模运行复杂的生产级 AI 系统。

AWS Well‑Architected Framework 定义了在云中构建和运行工作负载的成熟架构最佳实践,这些实践安全、可靠、性能高效、成本优化且可持续。通过使用面向 AI 的镜头扩展该框架,AWS 使架构师能够将这些核心原则应用于现代 AI 和机器学习工作负载的独特挑战。

Source: https://docs.aws.amazon.com/wellarchitected/latest/responsible-ai-lens/responsible-ai-lens.html

负责 AI 视角:以信任、公平和透明度设计 AI 系统

Responsible AI Lens 提供了一个结构化框架,帮助团队 评估、跟踪并持续改进 其 AI 工作负载,以符合已制定的最佳实践。它使架构师和开发人员能够识别 AI 实现中的潜在缺口,并提供可操作的指导,以提升系统质量,同时遵循负责 AI 的原则。

关键要点

  • 每个 AI 系统都涉及负责 AI 的考量 —— 无论是有意设计还是无意产生,所有 AI 系统都会带来负责 AI 的影响。这些影响必须在系统生命周期的各个阶段主动处理,而不能随意应付。
  • AI 系统可能被用于超出原始意图的场景 —— 应用往往会以开发者最初未预料的方式被采用。结合 AI 的概率性特征,这可能导致意外结果——即使在预期使用范围内也是如此——因此在早期就做出有意识的负责 AI 决策至关重要。
  • 负责 AI 能推动创新并建立信任 —— 负责 AI 实践并非限制进步,而是通过建立利益相关者的信心、增强客户信任、降低长期运营和声誉风险,成为创新的催化剂。

Responsible AI Lens 是 AWS 上 AI 开发的基础指南,提供核心原则,为机器学习视角(Machine Learning Lens)和生成式 AI 视角(Generative AI Lens)的实现提供信息和支持。

机器学习视角:在 AWS 上构建坚实的机器学习基础

Machine Learning Lens 为在 AWS 上设计和运行机器学习工作负载的团队提供了实用的基础。它将经过验证的、与云平台无关的最佳实践映射到 Well‑Architected 框架的各支柱,覆盖机器学习生命周期的每个阶段。无论您是正在尝试第一个模型,还是在生产环境中运营复杂的 AI 系统,更新后的 ML Lens 都提供了一种一致的方式来思考架构、运营和扩展。

新增内容(更新的 ML Lens)

  • 使用 Amazon SageMaker Unified Studio 实现数据团队与 AI 团队的协作流畅化
  • 借助 Amazon Q 的 AI 辅助开发提升开发者生产力
  • 利用 Amazon SageMaker HyperPod 对基础模型进行可扩展的分布式训练和微调
  • 使用 Amazon Bedrock、Kiro 和 Amazon Q Developer 实现灵活的模型定制(微调、知识蒸馏)
  • 通过 Amazon SageMaker Canvas 实现无代码机器学习工作流,现已增强 Amazon Q
  • 在 Amazon SageMaker Clarify 中加入改进的公平性指标,实现更强的偏差检测和负责任的 AI 实践
  • 通过 Amazon QuickSight 的自动化仪表盘更快获取业务洞察
  • 使用推理组件(Inference Components)构建模块化推理架构,简化部署和扩展
  • 在整个机器学习生命周期中提供更深入的可观测性,改进调试和监控
  • 通过 SageMaker Training Plans、Savings Plans 和 Spot Instances 实现更好的成本控制

ML Lens 的优势之一在于其灵活性。您可以在架构设计的早期阶段应用它,也可以在后期对已有的生产工作负载进行审查和改进。无论您处于云计算或机器学习旅程的哪个阶段,ML Lens——由 Amazon SageMaker Unified Studio、Amazon Q、Amazon SageMaker HyperPod 和 Amazon Bedrock 等服务提供支持——都帮助团队构建 可扩展、高效且可直接投产的机器学习系统

生成式 AI 视角:生成工作负载的实用指南

生成式 AI 视角部分的内容续写于此…

所有链接和引用均截至 2025 年 AWS re:Invent 公告时为最新。

Source:

基础模型架构指南

Generative AI Lens 帮助架构师和构建者采用结构化、可重复的方法来设计使用大语言模型(LLM)和其他基础模型的系统,以实现真实的业务价值。它聚焦于团队在构建生成式 AI 应用时最常面临的架构决策,例如:

  • 选择合适的模型
  • 设计有效的提示词
  • 定制模型
  • 集成工作负载
  • 持续改进系统性能

与更广泛的 Machine Learning Lens(适用于整个机器学习全谱)不同,Generative AI Lens 专注于基础模型和生成式 AI 工作负载的独特需求。它提炼了 AWS 与数千家客户合作的最佳实践,并将其与 Well‑Architected Framework 对齐,帮助团队自信地从实验阶段迈向生产阶段。

更新的 Generative AI Lens 有哪些新内容

  • 扩展的指导,用于使用 Amazon SageMaker HyperPod 编排复杂、长期运行的生成式 AI 工作流
  • 更强大的负责任 AI 基础,包括对 AWS 八大负责任 AI 维度的详细拆解
  • 全新的 agentic‑AI 前言,介绍用于构建 AI 代理和多步骤推理系统的架构模式

在 ML Lens 提供的基础上,Generative AI Lens 为在 AWS 上处理生成式 AI 与基础模型应用的独特挑战和机遇的团队提供了聚焦且实用的指导。

实施良好架构的 AI/ML 指南

这三个全新的 AI 关注视角——负责任的 AI机器学习生成式 AI——旨在作为一个统一的指导模型协同工作,而不是作为独立的框架。每个视角都有其特定作用,但它们共同帮助团队构建可投入生产、值得信赖且可扩展的 AI 系统。

  • 负责任的 AI 视角 – 通过关注安全、公平和安全的 AI 开发来设定基准。它帮助团队在业务目标与技术、伦理要求之间取得平衡,使从概念验证实验向生产环境的转移更加顺畅。
  • 机器学习视角 – 为传统机器学习和现代 AI 工作负载提供更广泛的指导。最新更新提升了数据与 AI 团队之间的协作,引入 AI 辅助开发,支持大规模基础设施供应,并实现更灵活的模型部署。
  • 生成式 AI 视角 – 在上述基础上进一步构建,专注于基于大语言模型(LLM)的架构。新指南涵盖 Amazon SageMaker HyperPod、新兴的代理式 AI 模式,以及针对常见生成式 AI 应用的更新架构场景。

接下来是什么?

随着这些镜头在 re:Invent 2025 的发布,AWS 为组织提供了一条清晰的路径,以构建不仅强大且负责任、值得信赖的 AI 系统。通过覆盖完整的 AI 工作负载范围——从传统机器学习到生成式 AI——这些镜头帮助团队在加速创新的同时,保持坚实的架构和负责任 AI 标准。

Back to Blog

相关文章

阅读更多 »

我这周做了什么

SlideNote 发布 昨天,我发布了 SlideNote,这是一款 Chrome 浏览器侧边面板记笔记扩展。这个想法是在星期三早上产生的,当时我在……