Chaos Engineering을 하는 팀에게 질문: 실험 대상을 어떻게 선택하나요?

발행: 1일 전 (2026년 3월 9일 AM 12:34 GMT+9)

2 분 소요

원문: Dev.to

Source: Dev.to

Question

사이드 프로젝트로 서비스 신뢰성을 다루다 보니, 실제로 카오스 실험을 진행하는 사람들에게 궁금한 점이 생겼습니다.

대부분의 카오스 엔지니어링 논의는 실험 유형(지연 주입, 파드 장애, 네트워크 오류 등)에 초점을 맞춥니다.
하지만 덜 눈에 띄는 부분은 팀이 처음에 실험 대상을 어떻게 선택하느냐 입니다. 마이크로서비스가 많이 있는 시스템에서는 가능한 대상이 매우 많습니다.

팀은 어떻게 실험 대상을 선택하나요?

팀에서는 보통 다음 중 어떤 방식을 사용하나요?

시간이 지남에 따라 서비스들을 순환시킴
사고를 일으킨 서비스에 우선순위를 둠
핵심 의존 경로에 집중함
플랫폼/SRE 직관에 의존함
그 외 다른 방법?

실제 환경에서 어떻게 이루어지는지 궁금합니다.

관련 글

웹훅을 사용한 stablecoin 결제 정산 자동화 방법 (developer runbook)

Webhooks와 결정론적 ID를 사용하여 스테이블코인 결제 조정을 자동화하는 방법 팀에 이미 Web2 백엔드가 있고 수동 암호 결제를 피하고 싶다면...

왜 나는 AI 에이전트를 신뢰하지 않게 되었고 보안 집행자를 만들었는가.

소개 모든 AI 에이전트를 구축하는 튜토리얼은 다음과 같은 문구를 포함합니다: > “모델이 민감한 데이터에 접근하지 않도록 시스템 프롬프트를 추가하세요.” 나는…

개발자 역할, 재정의

Developer = Product + Architect + QA. 이것이 AI 에이전트가 가져온 새로운 현실 속에서 오늘날 소프트웨어 엔지니어의 역할이다. 그리고 만약 그 공식이 …

5분 안에 reflectt-node: 제로부터 협업 AI 에이전트까지

멀티‑에이전트 협조에 대해 읽어보셨죠. 실제로 실행하는 방법은— 여러분의 머신에서 5분 정도면 제로 상태에서 작동하는 에이전트 팀을 만들 수 있는 가장 빠른 경로입니다.