阿里云香港服务器瘫痪,用户紧急求助!

频道:香港云服务器 日期: 浏览:4

“你们香港节点是不是又挂了?”我刚泡好一杯咖啡,Slack群里就有人这么问。说实话,这种事儿吧,已经不是第一次了,阿里云香港机房出点幺蛾子,大家都见怪不怪了。可偏偏今天这次,闹得有点大,连我负责的几个客户站点都直接打不开,监控报警像下雨一样哗哗往邮箱里砸。说起来,前两天我还在和同事讨论,要不要把部分业务迁去新加坡,结果这下倒好,香港这边直接给了个“活生生的理由”。

阿里香港云服务器故障

其实我一开始还以为是我们自己代码出锅了,毕竟前天刚上线了个新功能,谁知道一查日志,根本没进到应用层,连端口都ping不通。后来在知乎上看到一哥们发帖,说他那边也是阿里香港节点全挂,工单都排不上队,客服只会说“正在紧急处理中”,我心里才算有点底——原来不是我一个人倒霉。

对了,顺便说一句,阿里云的状态页吧,平时看着挺唬人,真出事的时候,更新速度慢得离谱。那天我刷了半小时,还是“服务正常”,可我手里的服务器明明已经凉透了。有人在V2EX上吐槽,说阿里云的“服务健康”页面就是个摆设,我觉得还真有点道理。其实吧,这种大厂的云服务,稳定性本来应该是最大卖点,结果现在搞得大家都得备个Plan B,甚至Plan C。

阿里云香港服务器瘫痪,用户紧急求助!

我记得2022年12月那次阿里云香港大故障,影响了好几千家企业,后来有媒体报道说是因为机房电力系统出问题(参考:财新网,2022年12月19日),那次我也中招了。说实话,云服务这玩意儿,出了事你根本没法自己修,只能干等着厂商救火。那种无力感,真的是谁用谁知道。有人说,云计算的本质就是“把别人的电脑当自己的用”,可一旦“别人的电脑”罢工了,你就只能干瞪眼。

其实我也不是非得吐槽阿里云,毕竟AWS、Azure也不是没出过事。只是香港节点这两年问题有点频繁,尤其是带宽和网络抖动,简直让人头大。前阵子我还看到Gartner的报告,说亚太区云服务市场竞争越来越激烈,厂商都在拼价格和扩容速度,结果基础设施反而容易被忽视(Gartner, 2023)。你说,这是不是有点本末倒置?

说起来,客户那边其实也挺无奈的。每次出事,他们第一反应就是问我:“能不能切回国内?”可你要真切回去,备案、合规、访问速度一堆麻烦事,哪有那么简单。再说了,谁能保证别的云厂商就一定不出问题?我有时候也挺佩服那些能把多云容灾做得很溜的团队,像我们这种小公司,预算和人手都有限,真要搞多活架构,想想都头疼。

阿里云香港服务器瘫痪,用户紧急求助!

不过话说回来,这次故障也算给我提了个醒。以前总觉得云服务商那么大,出事概率很低,现在看,还是得多备点方案。其实我也说不准,未来是不是还会有更大的故障,但至少现在,客户那边的业务能跑起来,已经算是谢天谢地了。对了,刚才还漏了个事,阿里云后来发了个公告,说是“网络设备异常”,具体原因也没细说,反正就是那种“我们很重视,正在修复”的标准话术。你说,这种解释,听了有啥用呢?

有时候我在想,云计算这行,真的是“信仰”大于“技术”吗?还是说,大家都在赌一个概率?反正我现在,已经习惯了每次出事先自嘲一句:“又轮到我了。”

0 留言

评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。