工程管理要点 #6:从灭火到架构
Source: Dev.to
问题:消防 vs. 架构
团队用于消防——响应事件、修复紧急问题以及应对临时升级的时间比例,是工程经理(EM)的一个重要信号。虽然一定程度的消防是不可避免的,但长期处于这种模式通常意味着系统存在更深层次的缺口。
消防常常让人觉得很有成效,因为问题被快速解决,似乎拯救了局面。然而,它会把精力从计划工作中抽走,并逐渐形成一种英雄主义文化。随着时间推移,持续的消防会掩盖根本原因,例如:
- 需求和期望不明确
- 所有权薄弱
- 缺乏深入的系统知识
- 流程缺失或脆弱
其代价最终表现为倦怠、交付脆弱以及问题重复。
影响局面的方式
EM 可以通过对系统进行架构设计来将消防保持在最低水平。这包括:
- 明确的所有权和责任边界
- 可预测的计划和评审周期
- 明确的决策框架
- 共享的“完成”定义和质量标准
- 防止常见失效模式的护栏
目标不是消除所有问题,而是让问题更早显现并更容易处理。
实际操作方式
- 跟踪重复出现的事件并追问 为什么 会重复。
- 投入时间预防下一个故障,而不仅仅是修复当前的故障。
- 使用回顾会议来调整系统,而不是归咎于个人。
- 逐步将时间从紧急任务转向结构性改进。
要点
消防解决的是今天的问题。随着通过深思熟虑的架构设计让系统不断改进,紧急情况会减少——即使发生,也能更有效地利用时间和精力。