GitHub 可用性报告:2026年3月
Source: GitHub Blog
3 月事件概览
在 3 月,我们经历了四起导致 GitHub 服务性能下降的事件。
3 月 03 日 18:59 UTC (持续 1 小时 10 分钟)
时间范围: 18:46 – 20:09 UTC(2026 年 3 月 3 日)
影响: 可用性下降,影响以下服务:
github.com- GitHub API
- GitHub Actions
- Git 操作(仅 HTTP;SSH 未受影响)
- GitHub Copilot
- 其他依赖服务
峰值关键指标:
| 服务 | 错误 / 失败率 |
|---|---|
github.com 请求 | ~40 % |
| GitHub API 请求 | ~43 % |
| Git over HTTP | ~6 % |
| Git over SSH | 0 % |
| GitHub Copilot 请求 | ~21 % |
| GitHub Actions | < 1 % |
根本原因: 在部署一次用于降低用户设置缓存机制负载的更改时引入了一个 bug。该 bug 导致每个用户的缓存全部失效、重新计算并写回,产生了巨大的写入量。复制延迟随之蔓延至所有依赖服务。
缓解措施: 立即回滚有问题的部署。
后续步骤:
- 添加了紧急关闭开关,并改进了缓存机制的监控,以在影响用户之前检测问题。
- 将缓存机制迁移到专用主机,确保未来的问题仅限于依赖该缓存的服务。
3 月 05 日 16:35 UTC (持续 2 小时 55 分钟)
时间范围: 16:24 – 19:30 UTC(2026 年 3 月 5 日)
影响: GitHub Actions 性能下降。
- 95 % 的工作流运行在 5 分钟内未能启动(平均延迟≈30 分钟)。
- 10 % 的工作流运行因基础设施错误而失败。
根本原因: Redis 基础设施更新时对 Redis 负载均衡器做了错误的配置更改,导致流量路由到错误的主机,触发了两起事件。
缓解措施:
- 修正了错误配置的负载均衡器(作业在 17:24 UTC 恢复成功)。
- 回滚有问题的更新,并在后续工作完成前冻结该区域的进一步更改。
正在进行的工作:
- 改进自动化,防止错误配置更改的传播。
- 加强告警,以更早捕获负载均衡器配置错误。
- 更新 Actions 中的 Redis 客户端配置,使其更能容忍短暂的缓存中断。
3 月 19 日 13:44 UTC (持续 48 分钟)
时间范围:
- 01:05 – 02:52 UTC(2026 年 3 月 19 日)
- 00:42 – 01:58 UTC(2026 年 3 月 20 日)
影响: Copilot Coding Agent 服务性能下降——用户无法启动新的 Copilot Agent 会话或查看已有会话。
| 事件 | 平均错误率 | 峰值错误率 |
|---|---|---|
| 3 月 19 日 | ~53 % | ~93 % |
| 3 月 20 日 | ~99 % | ~100 %(伴随显著的重试放大) |
根本原因: 认证问题导致服务无法连接其后端数据存储。
缓解措施: 轮换受影响的凭证,恢复连接。第一次事件在 01:24 UTC 前已完全缓解;第二次发生是因为第一次的修复不完整。
未来保障措施:
- 实施针对凭证生命周期事件的自动化监控。
- 改进运营流程,缩短类似问题的检测和缓解时间。
3 月 24 日 16:59 UTC (持续 2 小时 52 分钟)
时间范围: 15:57 – 19:51 UTC(2026 年 3 月 24 日)
影响: Microsoft Teams 集成和 Teams Copilot 集成服务性能下降,导致 GitHub 事件通知无法发送至 Microsoft Teams。
- 平均错误率:37.4 %
- 峰值错误率:90.1 %(约 19 % 的所有集成安装未收到通知)
根本原因: 上游依赖出现故障,产生 HTTP 500 错误并导致 Teams 集成的连接被重置。
缓解措施:
** 协调上游服务团队;当上游事件得到缓解时,问题于 19:51 UTC 解决。
后续工作: 更新可观测性和运行手册,以缩短类似事件的缓解时间。
保持了解
- 关注我们的 status page 获取实时更新和事后回顾。
- 在 GitHub Blog 的工程栏目了解我们的持续工作。
作者
相关文章
(此处将列出相关帖子的链接。)
探索更多来自 GitHub 的内容
文档
您需要掌握 GitHub 的所有内容,一站式获取。
GitHub
在 GitHub 上构建下一个项目,这里是每个人的舞台…
开始构建
客户案例
了解使用 GitHub 构建的公司和工程团队。
GitHub 播客
收听 GitHub 播客,这是一档专注于 GitHub 上开源开发者社区的主题、趋势、故事和文化的节目。