你无法治理那些你无法在纸巾上解释的事
Source: Dev.to
请提供您希望翻译的具体文本内容,我将为您翻译成简体中文并保留原始的格式、Markdown 语法以及技术术语。谢谢!
问题
每个平台团队最终都会被问到同一个问题:
“为什么云费用这么高?”
如果你的回答以“让我拉个仪表盘”开头,那你已经输了。
CFO 带着一张打印稿走进你的办公室:
“本季度 Azure 为什么花了 230 万美元?”
你已经在使用 Azure Policy 强制合规,拥有完美架构的落地区,给每个资源打上标签,工作簿展示指标,仪表盘上还有漂亮的图表……但你仍然无法在 30 秒内、白板上或餐巾纸上回答这个问题。这就是没人谈论的治理失败。
典型的 Azure 治理堆栈
| 层 | 组件 |
|---|---|
| 1 – Azure 策略 | SKU 限制、必需标签、安全基线、审计发现 |
| 2 – 着陆区 | 管理组、订阅设计、网络拓扑、身份层级 |
| 3 – 标签标准 | 成本中心、所有者、环境、应用程序 |
| 4 – 报告工具 | Azure Monitor 工作簿、Power BI 仪表板、成本管理导出、自定义查询 |
该堆栈提供的内容
- ✅ 合规
- ✅ 安全控制
- ✅ 资源清单
- ✅ 成本可视化
该堆栈未提供的内容
- ❌ 防御性
合规性 vs. 可辩护性
合规 means: “Our resources follow the rules we wrote.”
可辩护性 means: “I can explain why this costs what it costs — and justify it to someone who doesn’t trust me.”
示例
合规的 Azure 账单
所有资源均已正确标记。已强制执行策略。已遵循落地区域。以下是报告。
可辩护的 Azure 账单
Application X 每月费用为 180 千美元,因为它在 12 个地区为 2,400 名用户提供服务,SLA 为 99.95%。存储费用为 40 千美元,原因是为满足 SOX 合规性而保留 7 年。网络费用为 25 千美元,用于双重 ExpressRoute。计算费用根据使用情况在 95 千美元–140 千美元之间波动。
大多数 Azure 环境只能给出第一个答案。
你能在纸巾上解释你的 Azure 成本吗?
不是“这是仪表板”。
不是“让我拉一份报告”。
现在。用纸巾。60 秒内。
一个简单的练习
- 画三个框: 生产、预发布、开发。
- 在每个框中写下月度成本。
- 将生产拆分为: 应用、数据、网络、安全。
- 针对最大应用: 它的功能是什么?有多少用户?SLA 是多少?
如果你不能在不查资料的情况下完成此操作,你的治理就失效了。无论你的策略多好,落地区多干净,标签多一致,都无济于事。如果负责人不能简单解释,那就不是治理——只是合规。
为什么标签、登陆区和策略还不够
- 标签 告诉你 什么 是资源(CostCenter、Environment、Owner、Application),但不说明它每月花费 34 万美元的 原因,这笔费用是否合理,或者如果削减 30% 会导致什么破坏。
- 登陆区 提供了漂亮的结构,但不解释为什么一个订阅的费用是另一个的三倍,哪些决策导致了成本上升,或者实际的 ROI 是多少。
- Azure Policy 显示哪些不合规,但不说明资源是否应该存在、它解决了什么业务问题,或者该规则是否仍然合理。
没有叙事的结构只是有序的混乱。
可辩护的云成本是什么样的
- 每美元的业务背景 – 将成本与用户、地区、服务水平协议(SLA)和合规要求关联。
- 决策历史 – 记录资源为何被配置以及它们如何变化。
- 权衡意识 – 了解成本削减对功能的影响。
- 明确的所有者责任 – 谁能为每笔支出提供正当理由。
这并不是更多的仪表盘、更多的标签或更多的政策,而是能够经受 CFO 严格审查的清晰叙述。
结论
如果你无法在一张餐巾纸上——用 60 秒、用业务语言、向不信任你的人解释你的 Azure 成本——那么你对它们的了解还不够,无法进行治理。在你能够做到之前,治理不过是带有额外步骤的昂贵基础设施。