从故障到稳定:我的交互式 DevOps 作品集(在 Cloud Run 上)

发布: (2026年1月31日 GMT+8 22:00)
3 min read
原文: Dev.to

Source: Dev.to

Introduction

我是 Noor Halabi,一名专注于 DevOps 的工程师,拥有全栈开发背景,对系统可靠性、自动化和云架构有浓厚兴趣。在全职转向 DevOps 之前,我曾在应用层面工作,这塑造了我如今对基础设施的思考方式:它们不是孤立的工具,而是为真实用户和真实软件提供支持的系统。

Portfolio Overview

我没有做传统的作品集,而是构建了一个 交互式 DevOps 系统模拟。体验从一次流量激增的事故开始:

  • 出现警报。
  • 系统自动扩容。
  • 稳定性恢复。

只有在事故解决后,作品集才会打开(返回访客可使用跳过按钮)。

随后,作品集以运行中的生产系统呈现,包含多个运营视图:

  • 系统概览
  • 交付(CI/CD)
  • 事故与经验教训
  • 我构建并运营的系统
  • 运维人员简介
  • 升级流程

🔗 Live Portfolio (Google Cloud Run):
(link to be added)

Technical Stack

  • Front‑end: React(现代单页应用)
  • Back‑end: Node.js 与 Express
  • Containerization: Docker
  • Hosting: Google Cloud Run(无服务器、基于容器)
  • Challenge label: dev-tutorial=devnewyear2026

Google AI Tools

  • Antigravity: 负责系统架构设计、用户流程和组件结构。
  • Gemini: 协助进行 UX 推理、故事叙述以及技术解释的完善。

Design Decisions

  • 单页应用,包含多个运营视图;避免长篇滚动。
  • 导航方式类似切换仪表盘。
  • 对非 DevOps 人员友好;技术深度通过交互逐步展现。
  • 在初始的混乱(事故)后,界面保持平静、稳定。
  • 支持暗色和亮色模式,以匹配用户偏好。

Project Goals

  • 让非 DevOps 观众也能理解作品集,同时向工程师传递真实的 DevOps 思维。
  • 将作品集转变为你运营的系统,而不是仅供阅读的页面。
  • 用通俗语言解释 DevOps 概念,避免行话。
  • 直观展示事故、恢复和交付的过程。
  • 演示在 Google Cloud Run 上成功部署和调试真实生产容器。
  • 展示 Google AI 工具在系统推理中的使用,而不仅是代码生成。

Personal Statement

这个项目体现了我作为工程师的工作方式:

  • 在压力下保持冷静
  • 面向系统
  • 持续改进

感谢阅读!欢迎在评论中留下你的想法或问题。

Back to Blog

相关文章

阅读更多 »