CNCF 몬트리올 KubeCon NA 2025에서 배운 점 요약

발행: (2025년 12월 20일 오후 11:59 GMT+9)
9 min read
원문: Dev.to

Source: Dev.to

Introduction

2023년 12월 10일, Cloud Native Montreal 커뮤니티는 애틀랜타에서 열린 KubeCon NA 2025 요약 행사를 주최했습니다. 전통적인 컨퍼런스 대신, 이 행사는 커뮤니티 주도로 진행되었으며 라이트닝 토크와 클라우드‑네이티브 생태계가 나아갈 방향에 대한 성찰을 담았습니다. AI 에이전트와 관측성, GitOps, 에너지‑인식 인프라스트럭처에 이르기까지 생태계 전반에 걸친 새로운 패턴과 교훈에 초점을 맞추었습니다.

AI 워크로드는 일류 시민

반복되는 주제는 AI 워크로드가 이제 클라우드‑네이티브 환경에서 일류 시민이 되었다는 것이었습니다. 전통적인 관측성은 다음과 같은 질문에 답합니다:

  • 서비스가 가동 중인가?
  • 지연 시간이 SLO 내에 있는가?

AI 시스템은 새로운 운영 질문을 제시합니다:

  • 어떤 프롬프트가 이 동작을 유발했는가?
  • 어느 모델 호출이 비용이 많이 들었는가?
  • 왜 이 에이전트가 특정 행동을 취했는가?

OpenLLMetry와 같은 도구는 LLM 및 에이전트 워크플로에 대한 계측을 추가하여 OpenTelemetry를 확장하고, OpenCost는 워크로드, 팀 및 환경 전반에 걸친 Kubernetes 및 클라우드 비용 가시성을 제공합니다.

Takeaway:
관측하거나 재무적으로 이해하지 못하는 AI 시스템은 확장할 수 없습니다. 관측성은 대시보드와 알림을 넘어 에이전트 지원 운영으로 진화하고 있습니다.

진화하는 관측성

엔지니어가 메트릭, 로그, 최근 배포를 수동으로 연관시키는 대신, 새로운 도구들은 다음을 목표로 합니다:

  • 근본 원인 분석 수행
  • 알림 트라이아지
  • 복구 단계 권장

k8sgpt, Seraph, 그리고 최신 에이전트형 SRE 도구와 같은 프로젝트들은 관측성 시스템이 단순히 데이터를 표면에 드러내는 것이 아니라, 적극적으로 그 데이터를 논리적으로 처리하는 미래를 제시합니다.

강조된 도구

  • k8sgpt – AI‑네이티브 Kubernetes 트러블슈팅
  • HolmesGPT / Seraph – 자동 근본 원인 분석 및 알림 완화

에이전트 기반 신흥 플랫폼

  • AWS DevOps Agent (Preview)
  • Azure SRE Agent (Preview)
  • Cleric
  • Kube Whisperer

이 에이전트들은 로그, 메트릭, 배포, 인시던트를 연관시켜 온콜 엔지니어를 지원하고 알림 피로도를 줄여줍니다. 엔지니어를 대체하는 것이 아니라 워크플로를 전환합니다: 신호를 찾는 데 드는 시간을 줄이고, 정보에 입각한 결정을 내리는 데 더 많은 시간을 할애합니다.

Cyclops: Kubernetes를 위한 구조화된 추상화

Cyclops는 원시 YAML을 구조화된 폼 기반 추상화로 대체하여 Kubernetes를 단순화하는 오픈‑소스 플랫폼입니다.

핵심 개념

  • Modules – 애플리케이션에 필요한 모든 Kubernetes 리소스를 논리적으로 그룹화한 것
  • Templates – 모듈 입력을 유효한 Kubernetes 매니페스트로 변환하는 매핑

Helm과의 통합

  1. Helm 차트는 템플릿화된 YAML을 사용해 리소스(Deployment, Service, Ingress 등)를 정의합니다.
  2. Cyclops는 해당 차트를 래핑하고, 값을 자유 텍스트 YAML 편집이 아니라 검증된 폼으로 노출합니다.
  3. 사용자는 폼을 작성하고, Cyclops는 기본 Helm 템플릿을 유효한 매니페스트로 렌더링합니다.

Cyclops는 Model Context Protocol (MCP) 서버를 통해 AI‑구동 운영도 지원합니다. 이를 통해 에이전트가 클러스터에 직접 접근하지 않고도 자연어로 애플리케이션을 관리할 수 있습니다.

주의: AI가 생성한 코드는 신뢰할 수 없는 것으로 간주해야 합니다. 보안 위험은 여전히 존재하며, 추상화가 증가할수록 가드레일, 검증 및 테스트가 더욱 중요해집니다.

GitOps 사례 연구

실제 GitOps 사례 연구에서는 저장소 구조가 도구만큼이나 중요하다는 점을 강조했습니다. 논의된 핵심 원칙은 다음과 같습니다:

  • 구성 구조를 팀 소유권과 일치시키기
  • 환경을 명시적으로 유지하면서 구성을 중앙 집중화하기
  • 관련 파일을 가깝게 배치하기(“근접성은 중요”)
  • 올바름뿐 아니라 개발자 경험을 최적화하기

ArgoCD를 사용하면 배포가 자동화되고, 감사 가능하며, 일관성을 유지할 수 있습니다—단, GitOps를 기술적 설계와 조직적 설계 모두로 다루어야 합니다.

Kepler: 에너지 인식 관측성

Kepler는 CNCF 프로젝트로, 컨테이너 수준에서 에너지 소비를 노출합니다.

특징

  • 세밀한 컨테이너 및 프로세스 전력 메트릭
  • CPU, GPU 및 이종 하드웨어 지원
  • eBPF를 활용한 낮은 오버헤드
  • 기존 관측 스택과의 통합

GPU 중심 및 AI 워크로드가 증가함에 따라 에너지 사용량과 냉각 비용이 운영상의 고민이 되고 있습니다.

핵심 메시지: 지속 가능성은 이제 단순히 하드웨어 계획이 아니라 플랫폼 엔지니어링의 일부입니다.

요약

이번 KubeCon 요약은 도구를 외우는 것이 아니라 방향을 이해하는 것이었습니다. 여러 발표에서 일관된 변화가 나타났습니다:

  • 반응형 모니터링에서 AI 지원 운영으로
  • 원시 YAML에서 안전하고 의견이 반영된 추상화로
  • 비용 놀라움에서 비용 인식 플랫폼으로
  • 성능 전용 지표에서 에너지 인식 인프라로

이와 같은 커뮤니티 주도 이벤트는 개별 기술들을 연결하여 클라우드 네이티브 시스템이 다음에 나아갈 방향에 대한 일관된 사고 모델을 형성하는 데 도움을 줍니다.

Back to Blog

관련 글

더 보기 »

창고 활용에 대한 종합 가이드

소개 창고는 근본적으로 3‑D 박스일 뿐입니다. Utilisation은 실제로 그 박스를 얼마나 사용하고 있는지를 측정하는 지표입니다. While logistics c...