GitHub 可用性报告:2026年3月

发布: (2026年4月9日 GMT+8 10:21)
6 分钟阅读
原文: GitHub Blog

Source: GitHub Blog

3 月事件概览

在 3 月,我们经历了四起导致 GitHub 服务性能下降的事件。

3 月 03 日 18:59 UTC (持续 1 小时 10 分钟)

时间范围: 18:46 – 20:09 UTC(2026 年 3 月 3 日)

影响: 可用性下降,影响以下服务:

  • github.com
  • GitHub API
  • GitHub Actions
  • Git 操作(仅 HTTP;SSH 未受影响)
  • GitHub Copilot
  • 其他依赖服务

峰值关键指标:

服务错误 / 失败率
github.com 请求~40 %
GitHub API 请求~43 %
Git over HTTP~6 %
Git over SSH 0 %
GitHub Copilot 请求~21 %
GitHub Actions< 1 %

根本原因: 在部署一次用于降低用户设置缓存机制负载的更改时引入了一个 bug。该 bug 导致每个用户的缓存全部失效、重新计算并写回,产生了巨大的写入量。复制延迟随之蔓延至所有依赖服务。

缓解措施: 立即回滚有问题的部署。

后续步骤:

  • 添加了紧急关闭开关,并改进了缓存机制的监控,以在影响用户之前检测问题。
  • 将缓存机制迁移到专用主机,确保未来的问题仅限于依赖该缓存的服务。

3 月 05 日 16:35 UTC (持续 2 小时 55 分钟)

时间范围: 16:24 – 19:30 UTC(2026 年 3 月 5 日)

影响: GitHub Actions 性能下降。

  • 95 % 的工作流运行在 5 分钟内未能启动(平均延迟≈30 分钟)。
  • 10 % 的工作流运行因基础设施错误而失败。

根本原因: Redis 基础设施更新时对 Redis 负载均衡器做了错误的配置更改,导致流量路由到错误的主机,触发了两起事件。

缓解措施:

  • 修正了错误配置的负载均衡器(作业在 17:24 UTC 恢复成功)。
  • 回滚有问题的更新,并在后续工作完成前冻结该区域的进一步更改。

正在进行的工作:

  • 改进自动化,防止错误配置更改的传播。
  • 加强告警,以更早捕获负载均衡器配置错误。
  • 更新 Actions 中的 Redis 客户端配置,使其更能容忍短暂的缓存中断。

3 月 19 日 13:44 UTC (持续 48 分钟)

时间范围:

  • 01:05 – 02:52 UTC(2026 年 3 月 19 日)
  • 00:42 – 01:58 UTC(2026 年 3 月 20 日)

影响: Copilot Coding Agent 服务性能下降——用户无法启动新的 Copilot Agent 会话或查看已有会话。

事件平均错误率峰值错误率
3 月 19 日~53 %~93 %
3 月 20 日~99 %~100 %(伴随显著的重试放大)

根本原因: 认证问题导致服务无法连接其后端数据存储。

缓解措施: 轮换受影响的凭证,恢复连接。第一次事件在 01:24 UTC 前已完全缓解;第二次发生是因为第一次的修复不完整。

未来保障措施:

  • 实施针对凭证生命周期事件的自动化监控。
  • 改进运营流程,缩短类似问题的检测和缓解时间。

3 月 24 日 16:59 UTC (持续 2 小时 52 分钟)

时间范围: 15:57 – 19:51 UTC(2026 年 3 月 24 日)

影响: Microsoft Teams 集成和 Teams Copilot 集成服务性能下降,导致 GitHub 事件通知无法发送至 Microsoft Teams。

  • 平均错误率:37.4 %
  • 峰值错误率:90.1 %(约 19 % 的所有集成安装未收到通知)

根本原因: 上游依赖出现故障,产生 HTTP 500 错误并导致 Teams 集成的连接被重置。

缓解措施:

** 协调上游服务团队;当上游事件得到缓解时,问题于 19:51 UTC 解决。

后续工作: 更新可观测性和运行手册,以缩短类似事件的缓解时间。

保持了解

  • 关注我们的 status page 获取实时更新和事后回顾。
  • GitHub Blog 的工程栏目了解我们的持续工作。

作者

Jakub Oleksy

相关文章

(此处将列出相关帖子的链接。)

探索更多来自 GitHub 的内容

文档

您需要掌握 GitHub 的所有内容,一站式获取。

前往文档 →

GitHub

在 GitHub 上构建下一个项目,这里是每个人的舞台…

探索 GitHub →

开始构建

开始构建

客户案例

客户案例
了解使用 GitHub 构建的公司和工程团队。

了解更多

GitHub 播客

GitHub 播客
收听 GitHub 播客,这是一档专注于 GitHub 上开源开发者社区的主题、趋势、故事和文化的节目。

立即收听

0 浏览
Back to Blog

相关文章

阅读更多 »

暂停新的 GitHub Copilot Pro 试用

这意味着 - 新用户目前无法启动免费 Copilot Pro 试用。 - 现有的试用不受影响。 - Copilot Free 和付费的 Copilot Pro 订阅……