· devops
시스템은 작동하지만 아무도 깨어나지 않을 때: 모니터링과 인간 반응 사이의 실패
오전 2시 7분에 핵심 프로덕션 노드가 다운되었습니다. CPU 사용량이 급증하고, 지연 시간이 크게 늘어나며, 클러스터 전체에서 요청이 시간 초과되기 시작했습니다. 모니터링 도구가 포착했습니다...
오전 2시 7분에 핵심 프로덕션 노드가 다운되었습니다. CPU 사용량이 급증하고, 지연 시간이 크게 늘어나며, 클러스터 전체에서 요청이 시간 초과되기 시작했습니다. 모니터링 도구가 포착했습니다...