EUNO.NEWS EUNO.NEWS
  • All (23017) +41
  • AI (3535) +4
  • DevOps (1022) +1
  • Software (11823) +31
  • IT (6586) +5
  • Education (50)
  • Notice (1)
  • All (23017) +41
    • AI (3535) +4
    • DevOps (1022) +1
    • Software (11823) +31
    • IT (6586) +5
    • Education (50)
  • Notice (1)
  • All (23017) +41
  • AI (3535) +4
  • DevOps (1022) +1
  • Software (11823) +31
  • IT (6586) +5
  • Education (50)
  • Notice (1)
Sources Tags Search
한국어 English 中文
  • 0개월 전 · devops

    엔터프라이즈 Kubernetes 장애: Guardon이 중단 전에 포착한 20가지 치명적인 잘못된 구성

    대규모 조직에서 발생하는 Kubernetes 사고는 이국적인 제로데이 때문이 아니라, 개발자들이 연간 수천 번이나 저지르는 기본적인 YAML 실수 때문입니다. u...

    #Kubernetes #misconfigurations #enterprise #outage prevention #DevOps #infrastructure #YAML errors
  • 1개월 전 · devops

    Code Orange: Fail Small — 최근 사고에 따른 우리의 회복력 계획

    우리는 “Code Orange: Fail Small”을 선언하여 Cloudflare의 모든 구성원이 하나의 간단한 목표를 가진 고우선순위 workstreams에 집중하도록 했습니다: 원인을 보장하기 위해…

    #cloudflare #incident-response #site-reliability #outage-prevention #fail-small #resilience #infrastructure
  • 1개월 전 · devops

    Code Orange: Fail Small — 최근 사고에 따른 우리의 복원력 계획

    우리는 “Code Orange: Fail Small”을 선언하여 Cloudflare 전 직원이 고우선순위 작업 스트림에 집중하도록 하고, 단 하나의 간단한 목표를 가지고 있습니다: 원인의 …을 보장하는 것.

    #Cloudflare #incident response #resilience #SRE #outage prevention #fail small
  • 1개월 전 · devops

    실패를 설계하기: 장애를 지루하게 만드는 4가지 Resilience 실천

    지난 겨울, 내 도시인 버지니아 주 리치몬드에서는 눈보라가 지나간 뒤 며칠 동안 water distribution outages가 발생했습니다. 이는 하나의 큰 고장 때문이 아니라, backup pumps가 고장났기 때문이었습니다,...

    #resilience #outage prevention #incident management #reliability engineering #postmortem #disaster recovery #monitoring
EUNO.NEWS
RSS GitHub © 2026