当 Kubernetes 遗忘时:90秒证据缺口
发布: (2026年2月18日 GMT+8 20:00)
1 分钟阅读
原文: DZone DevOps
Source: DZone DevOps
矛盾
凌晨 3:47,您的监控仪表盘显示 Kubernetes 集群健康——可用性为 99.97%。而您的客户却报告出现了完整的宕机。
九十秒后,Pod 已自行恢复。指标看起来正常。重启计数显示为 “1”。但它为何重启——到底发生了什么——已经消失不见。这并不是工具失效,而是系统恢复得比人类观察的速度还要快。