你无法治理那些你无法在纸巾上解释的事

发布: (2025年12月22日 GMT+8 18:58)
6 min read
原文: Dev.to

Source: Dev.to

请提供您希望翻译的具体文本内容,我将为您翻译成简体中文并保留原始的格式、Markdown 语法以及技术术语。谢谢!

问题

每个平台团队最终都会被问到同一个问题:

“为什么云费用这么高?”

如果你的回答以“让我拉个仪表盘”开头,那你已经输了。

CFO 带着一张打印稿走进你的办公室:

“本季度 Azure 为什么花了 230 万美元?”

你已经在使用 Azure Policy 强制合规,拥有完美架构的落地区,给每个资源打上标签,工作簿展示指标,仪表盘上还有漂亮的图表……但你仍然无法在 30 秒内、白板上或餐巾纸上回答这个问题。这就是没人谈论的治理失败。

典型的 Azure 治理堆栈

组件
1 – Azure 策略SKU 限制、必需标签、安全基线、审计发现
2 – 着陆区管理组、订阅设计、网络拓扑、身份层级
3 – 标签标准成本中心、所有者、环境、应用程序
4 – 报告工具Azure Monitor 工作簿、Power BI 仪表板、成本管理导出、自定义查询

该堆栈提供的内容

  • ✅ 合规
  • ✅ 安全控制
  • ✅ 资源清单
  • ✅ 成本可视化

该堆栈未提供的内容

  • ❌ 防御性

合规性 vs. 可辩护性

合规 means: “Our resources follow the rules we wrote.”

可辩护性 means: “I can explain why this costs what it costs — and justify it to someone who doesn’t trust me.”

示例

合规的 Azure 账单

所有资源均已正确标记。已强制执行策略。已遵循落地区域。以下是报告。

可辩护的 Azure 账单

Application X 每月费用为 180 千美元,因为它在 12 个地区为 2,400 名用户提供服务,SLA 为 99.95%。存储费用为 40 千美元,原因是为满足 SOX 合规性而保留 7 年。网络费用为 25 千美元,用于双重 ExpressRoute。计算费用根据使用情况在 95 千美元–140 千美元之间波动。

大多数 Azure 环境只能给出第一个答案。

你能在纸巾上解释你的 Azure 成本吗?

不是“这是仪表板”。
不是“让我拉一份报告”。

现在。用纸巾。60 秒内。

一个简单的练习

  1. 画三个框: 生产、预发布、开发。
  2. 在每个框中写下月度成本。
  3. 将生产拆分为: 应用、数据、网络、安全。
  4. 针对最大应用: 它的功能是什么?有多少用户?SLA 是多少?

如果你不能在不查资料的情况下完成此操作,你的治理就失效了。无论你的策略多好,落地区多干净,标签多一致,都无济于事。如果负责人不能简单解释,那就不是治理——只是合规。

为什么标签、登陆区和策略还不够

  • 标签 告诉你 什么 是资源(CostCenter、Environment、Owner、Application),但不说明它每月花费 34 万美元的 原因,这笔费用是否合理,或者如果削减 30% 会导致什么破坏。
  • 登陆区 提供了漂亮的结构,但不解释为什么一个订阅的费用是另一个的三倍,哪些决策导致了成本上升,或者实际的 ROI 是多少。
  • Azure Policy 显示哪些不合规,但不说明资源是否应该存在、它解决了什么业务问题,或者该规则是否仍然合理。

没有叙事的结构只是有序的混乱。

可辩护的云成本是什么样的

  • 每美元的业务背景 – 将成本与用户、地区、服务水平协议(SLA)和合规要求关联。
  • 决策历史 – 记录资源为何被配置以及它们如何变化。
  • 权衡意识 – 了解成本削减对功能的影响。
  • 明确的所有者责任 – 谁能为每笔支出提供正当理由。

这并不是更多的仪表盘、更多的标签或更多的政策,而是能够经受 CFO 严格审查的清晰叙述。

结论

如果你无法在一张餐巾纸上——用 60 秒、用业务语言、向不信任你的人解释你的 Azure 成本——那么你对它们的了解还不够,无法进行治理。在你能够做到之前,治理不过是带有额外步骤的昂贵基础设施。

Back to Blog

相关文章

阅读更多 »