SRE 주간 호 #506
sreweekly.com에서 보기 스폰서인 Costory의 메시지: 당신은 FinOps를 하려고 등록한 것이 아닙니다. Costory는 클라우드 비용이 변동하는 이유를 자동으로 설명하고, 보고서를…
sreweekly.com에서 보기 스폰서인 Costory의 메시지: 당신은 FinOps를 하려고 등록한 것이 아닙니다. Costory는 클라우드 비용이 변동하는 이유를 자동으로 설명하고, 보고서를…
쿠버네티스에서 아이덴티티 이해하기 – 초급 수준 인증 vs 인가 - 인증 – 당신은 누구인가? - 인가 – 무엇을 할 수 있는가? 쿠버네티스…
개요 플랫폼 엔지니어나 SRE라면 인프라를 관리하는 것과 효율적으로 관리하는 것이 매우 다른 일이라는 것을 알고 있습니다. 당신은…
sreweekly.com에서 보기 스폰서인 Hopp의 메시지: 새벽 2시에 Paging? 🚨 Hopp와 함께 incident triage를 같은 키보드에서 하는 느낌으로 만들어 보세요. 간결하고 읽기 쉬움.
저는 예전에는 capacity planning이 CloudWatch 알람을 설정하고 문제가 발생하기 전에 알람이 울리길 바라는 것이라고 생각했습니다. 스포일러: 그게 capacity planning이 아닙니다—
오전 2시 7분에 핵심 프로덕션 노드가 다운되었습니다. CPU 사용량이 급증하고, 지연 시간이 크게 늘어나며, 클러스터 전체에서 요청이 시간 초과되기 시작했습니다. 모니터링 도구가 포착했습니다...
10 AWS Production Incidents — 실제로 무엇이 고장났고 어떻게 해결했는가 수백 건의 AWS 프로덕션 인시던트를 처리하면서, 교과서적인 해결책이 …
!Your 30‑Minute Morning Monitoring Routine의 표지 이미지? 문제는 데이터가 너무 많아서가 아니다. https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,...
전통적인 DevOps는 조직이 성장할 때까지는 잘 작동합니다. 소규모에서는 모든 배포, 수정, 그리고 문제 해결을 담당하는 중앙 DevOps 팀이 효율적으로 느껴집니다…
sreweekly.com에서 보기: Salt 더미 속에서 모래알 하나 찾기. Salt는 Cloudflare의 구성 관리 도구입니다. 구성 문제의 근본 원인을 어떻게 찾을 수 있을까요...
AWS DevOps Agent – 모범 사례 가이드 AWS re:Invent 2025에서 발표된 주요 릴리스 중 하나는 새로운 최전선 자율 에이전트의 출시였습니다: - AWS DevOps Agent - AWS…
Kubernetes 채택이 증가함에 따라 운영 복잡성도 증가합니다. 소수의 services를 실행하는 작은 cluster에서 시작한 것이 금세 수십 개의 app으로 빠르게 진화할 수 있습니다.