昨天 GitHub 挂了两个小时

首先说下 www.githubstatus.com  可以实时的查看到 Github 服务的可用性状态 ,文中关于可用性的截图都来自这里。

下图就是今天 (2020年06月30)能看到的服务状态,可以看到昨天 github 的除了 Git Pages 服务,其他服务都出现了事故(incidence);其中 Git operations(就是我们的 git 相关的操作,比如git clone push)降级的时间长达 2 小时6 分钟。

目前 Github status 上关于本次事故的细节只有几个时间点。

简单翻译下:

06/29 11:38 UTC 服务完全恢复

06/29 11:21 UTC  服务正在恢复(pshu 的理解是: 此时服务开始恢复

06/2 9  09 :44   UTC  已经定位到错误发生的原因,并着手恢复

06/2 9  09 :14   UTC  发现报错数量和页面加载速度变慢, 开始调查错误

在问题发生的两个小时里面,git 的操作(clone push) 是不可用的,所以这个两个小时里面一些自动化部署和开发是直接受影响的。而其他的 web 相关的服务,也出现了两次降级,总共2 个多小时的持续时间。

总的来说这次事故给依赖于 Github 的开发者和企业带来一定的麻烦,在 twitter 上也有人在质疑说,在 被微软收购后 Github 越来越不稳定了。下面的twitter 翻译:

在被微软收购以后,Github 好像越来越不稳定了。我决定通过 github status 页面来验证下我的想法。在 2018 年 10 月收购前,github 的可用有性都是 100%的,慢慢就变得不顺畅了,从这个季度看事情基本是废了。(wheels fall of:不要直译成轮子掉了,一般翻译是事情搞砸了)。

当然事情也没有这个推文说的这么严重,但是可用性只有 99 %对一个基础设施来说确实有点不应该。目前事故的原因还没有透露,如果有新的消息pshu 会继续跟进分享给大家的。

欢迎大家点赞转发赞赏!