您可能在2月下旬听说过该公司的云计算服务Amazon Web Services (AWS)。亚马逊是该国最大的面向企业的云计算服务提供商,由于中断,成千上万个依赖其服务的网站和应用程序处于异常状态。
发生的事情是这样的: 亚马逊的简单存储服务 (S3) 瘫痪了; 而且,亚马逊客户立即无法访问他们远程存储在公司服务器上的各种东西 -- 从图像到客户交易数据的所有东西。
中断的原因最终被确定为人为错误,其他AWS服务依赖S3进行存储,这一事实加剧了混乱。危险还没有结束: 尽管亚马逊以其非常可靠的往绩而闻名,但这样的中断将不可避免地再次发生。
这就是为什么小企业必须从过去的错误中吸取教训,并为随之而来的下一次停电做好准备。
伤疤仍然存在
由于如此多的企业依赖S3 (根据TechCrunch的说法,超过148,000个网站),因此中断产生了深远的影响,从小的不便到业务模式和收入驱动因素的完全侵蚀。
受欢迎的图像和链接共享网站pinterest使用AWS,这意味着在停电期间,从即将成为新娘的新娘到记录自己喜欢的婚礼装饰品的18岁孩子,每个人都无法建立他们的图书馆。虽然这看起来并不太重要,但它证明了中断会直接影响数百万用户的生活。
例如,任何选择在亚马逊上建立整个基础设施的公司,当其登录停止工作时,无疑都会感到有些恐慌。酒店价格,用户活动,照片,喜欢的网站和产品报价的数据馈送对于那些试图加载它们的人来说只是一个旋转的死亡之轮。很少有人幸免-不是Business Insider或Giphy,也不是无数与物联网连接的恒温器和灯泡。
对未来的希望
幸运的是,亚马逊能够在相对较短的时间内使其系统重回正轨。但是,它以前在托管社区中作为不可移动,牢不可破的支柱的形象无疑受到了影响。此外,该事件引起了许多开发人员的注意,并帮助他们意识到拥有备份计划可能是一种不错的策略。
如果您是这些开发人员之一或小型企业的领导者,请在制定计划时注意以下提示。
1.划分职责。
确保您的托管脚本不仅仅依赖于一项服务。将您的整个操作移交给外部服务 (例如Microsoft或Amazon),将使您无法进行必要的控制,这些控制允许您在发生威胁或中断时解决它们。
如果预算允许,请设置多个托管服务,以防主要来源失败。简单的检查可以确保,如果原始源不可用,回退到另一个主机 -- 甚至是本地托管源 -- 可以保持您的站点运行。
2.积累冗余。
如果您的整个项目确实依赖于AWS功能,则另一种选择是建立一个辅助源 (托管在其他地方),以冗余方式运行。这样,当一项服务中断时,产品可以继续前进,几乎没有中断。
当然,这样做的困难是巨大的。虽然Microsoft Azure或Google提供了相对强大的扩展软件包,但它们的操作方式通常与AWS有很大不同。使用AWS预先构建的许多项目根本无法在Google或其他服务上使用。这意味着您要么需要投资于广泛的定制开发来创建类似的功能,要么需要设定一个预先计划的目标来限制系统对AWS特定功能的依赖。
3.幻想你的失败。
即使采取了最强有力的预防措施,偶尔的停电也是不可避免的。在这种情况下,确保你的故障点是优雅的。当用户收到几乎无法理解的丑陋AWS消息时,会产生恐慌和焦虑的感觉。相反,请使用有用,友好和自我修饰的消息来计划这些类型的情况,这些消息实际上使用户了解正在发生的事情。
例如,如果我的网站atRocksauce Studiosgoes关闭,用户不会面临呕吐难以理解的代码。相反,在向用户提供重试或联系我们的支持团队寻求帮助之前,会弹出一条友好的消息,说 “糟糕!”。这不仅显示了我们对问题的认识,而且还为用户提供了寻求修复的途径。
4.给gab礼物。
准备好与您的用户交流。这可能是最重要的因素,因为拥有一个完全独立的备份系统 -- 无论你是Netflix这样的公司还是一家小型的自举初创公司 -- 都是一个极端的解决方案,因为这个问题可能很少见。相反,通过电子邮件,Twitter,Facebook或其他方式向用户发送格式良好的响应可以为您提供必要的宽限期。
即使您没有答案,也要迅速响应客户的询问,这在很大程度上表明您关心客户并意识到问题。
云托管服务的可靠性以 “正常运行时间” 或这些服务工作和可用的时间量来衡量。大多数公司会尽一切可能使其正常运行时间尽可能接近100%,这意味着他们不太可能在短期内遇到定期中断。话虽如此,如果将来碰巧遇到您的托管服务,采取一些简单的预防措施可以大大减轻停机的痛苦。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。