SRE 周刊 第506期
在 sreweekly.com 上查看 我们赞助商 Costory 的一条信息:您并没有报名参加 FinOps。Costory 自动解释您的云成本为何变化,并报告……
在 sreweekly.com 上查看 我们赞助商 Costory 的一条信息:您并没有报名参加 FinOps。Costory 自动解释您的云成本为何变化,并报告……
理解 Kubernetes 中的身份 初学者层面 认证 vs 授权 - 认证 – 你是谁? - 授权 – 你能做什么? Kubernetes…
概述 如果你是平台工程师或 SRE,你会知道管理基础设施和高效管理它是完全不同的两件事。你已经能够...
在 sreweekly.com 查看 我们的赞助商 Hopp 的信息:凌晨 2 点被呼叫?🚨 让 incident triage 感觉就像你和 Hopp 在同一键盘上操作。简洁、易读……
我曾经以为容量规划只是设置 CloudWatch 警报,并希望它们在系统出问题之前触发。剧透:这并不是容量规划——那是…
凌晨2:07,核心生产节点宕机。CPU使用率飙升,延迟急剧增加,整个集群的请求开始超时。监控工具捕获到……
10个 AWS 生产事故——到底出了什么问题以及我如何修复它们 在处理了数百起 AWS 生产事故后,我发现教科书式的解决方案往往……
封面图片:您的30分钟晨间监测例程?问题不在于数据太多。https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,...
传统的 DevOps 运作良好……直到组织规模扩大。 在小规模时,一个集中式的 DevOps 团队负责部署、修复和处理所有问题,感觉很高效……
在 sreweekly.com 上查看 在一堆 Salt 中寻找一粒沙子 Salt 是 Cloudflare 的配置管理工具。 如何找到配置的根本原因……
AWS DevOps Agent – 最佳实践指南 在2025年 AWS re:Invent 大会上,关键发布之一是全新前沿自主代理的推出: - AWS DevOps Agent - AWS…
随着 Kubernetes 的采用不断增长,运维复杂性也随之提升。最初只运行少量服务的小型集群,可能会迅速演变成包含数十个 app……