SRE 주간 이슈 #511
Source: SRE Weekly
Highlights
“인시던트는 엔지니어가 만들어지는 곳이다”. – J. Paul Reed 인용 Vanessa Huerta Granda
Stuart Rimell — Uptime Labs
Etsy는 1,000개의 테이블과 1,000개의 샤드(각각 자체 커스텀 ORM을 사용)로 구성된 DB를 Vitess로 마이그레이션했으며, 특히 트랜잭션 처리 방식에 많은 주의를 기울여야 했습니다.
Ella Yarmo‑Gray — Etsy
와, 이번 이야기는 정말 강렬하네요.
Kenneth Eversole
디버깅 스토리 끝부분에 있는 교훈 정리 부분은 보물창고와 같습니다.
Lokesh Soni
접근할 수 없는 시스템에서 신뢰성을 어떻게 보장하나요? 메트릭 없이 SLIs/SLOs를 어떻게 모니터링하나요?
Alex Ewerlöf
저는 좋은 디버깅 이야기를 좋아하는데, 이번 이야기는 복잡한 문제와 모두가 배울 수 있는 교훈이 한데 모여 있어 훌륭합니다.
James Sawyer — Phantom Tide
오우, 이번 인시던트의 핵심 API 호출에 숨겨진 교묘한 함정이 있네요.
David Tuber and Dzevad Trumic — Cloudflare
Lorin’s Law이 다시 나타났습니다!
신뢰성을 향상시키려던 시스템이 오히려 인시던트를 유발함 — Lorin Hochstein