地  址:江苏省南京市玄武区玄武湖
电  话:4008-888-888
邮  箱:9490489@qq.com
商  务QQ:794548577
企业网站制作:从亚马逊S3云效劳中断得到的4个教导
作者:管理员    发布于:2020-05-29 09:04   文字:【】【】【
从亚马逊S3云效劳中断得到的4个教导 依据互联网监控平台Catchpoint的陈述,亚马逊简单存储效劳(S3)在2月28日产生了3小时39分钟的中断事变。而亚马逊别的的一些云效劳以及一些依赖于这些云平台的许多互联网网站也发生了连锁效应,遭到了严峻的影响。

依据互联网监控平台Catchpoint的陈述,亚马逊简单存储效劳(S3)在2月28日产生了3小时39分钟的中断事变。而亚马逊别的的一些以及一些依赖于这些云平台的许多互联网网站也发生了连锁效应,遭到了严峻的影响。

征询机构Forrester分析师Dave Bartoletti表示, S3就像云中的空气一样,当其效劳中断时,大量网站就像缺氧一样不克不及呼吸。可是破坏,过错和中断就是事务运转在云中需要面对的属实。  

Bartoletti说, 人们对此没必须惊惧,由于这其实不是一个趋势。S3现已十分牢靠平安,它始终是亚马逊云这个桂冠上的宝石。  

此次中断关于业界应该说是敲响了一个警钟,组织需要包管基于的应用程序的平安,并筹备应答下一次云中断工作。以下是行业厂商从中汲取的教导和为云中断做好筹备的四个提醒:  

1.不要把所有的鸡蛋放在一个篮子里  

这个倡议关于差别的用户来说,其意味的事物也差别。但其根本的念头是,如果用户将应用程序或数据块布置到一个云中,通常不会具备很高的容错性。这取决于用户盼望其应用程序具有多高的可用性,由于这将抉择用户事件负载运转在多少个云中。这其间有多个挑选:  

AWS公司倡议用户将事件负载涣散到多个可用区(AZ)。AWS云散布在寰球16个地区中,每一个地区含有至少两个AZ(可用区),有时乃至多达五个AZ。每一个AZ都与同样地区中的别的AZ分离。AWS在同一区域的AZ之间提供低延迟连贯,这是创立散布事件负载的最根本方式。  

为了加强包庇,用户能够跨多个地区传达和运转应用程序。  

最终的包庇是布置多个云供给商的应用程序,例如利用微软Azure,谷歌云平台,或者采用一些内部布置和托管根底设备资源当做备份。  

Bartoletti表示,差别的客户会依据本人的实践状况采取差别的措施。如果用户怙恃云核算为其事务赚取利润,最好包管其容错性和高可用性。如果用户只是利用云核算备份不常常拜访的文件,那么其容错性和可用性没必要那么高。  

应答云故障的一个要害因素是认识什么时分产生。 AWS公司有一系列的办法来做到这一点。最根本的一个办法是利用其所谓的 康健查抄 ,它为每一个帐户提供了利用AWS资源状态的自界说视图。

Amazon CloudWatch能够主动盯梢效劳可用性,监督日志文件,创立警报,以及对故障做出反响。这个事件的一个重要条件是对 正常 行为进行完全分析,以便AWS云东西能够检测 异样 行为。  

一旦发现过错,就需要对一系列的多米诺效应预先设定响应措施。负载平衡器能够用于重定向流量,而且如果备份体系现已这样设置,则能够启动备份体系。  

2.从一初步就构建冗余体系  

组织尝试实时响应中断,这其实不是很有用。而在不可防止的中断到来前做好筹备将会挽回一些丧失。以下有两种根本办法来将冗余构建到云体系中:  

Standby(待机):当产生故障时,应用程序会主动检测故障,并将故障转移到备份冗余体系中。在这种状况下,备份体系能够倒闭,但需要筹备好在检测到过错时启动。另外一种办法是备用备份程序能够在后盾运转工夫运转(本钱更高,但会减少故障切换工夫)。这个备用办法的缺点是检测到过错之后,在将故障转移体系启动的工夫内可能会有所滞后。  

自动冗余:理论上能够防止停机工夫,用户能够将其应用程序构建自动冗余体系。在这种状况下,应用程序散布在多个冗余资源中:当产生故障时,其余资源将会承当更多的事件负载。能够利用分片技能,将效劳分解成组件。例如,一个应用程序跨越八个虚构机实例运转,这八个虚构机实例能够分为四组,每组两个,数据流量能够在它们之间进行负载平衡。如果一组实例失效,别的三组能够分管数据流量。  

3.备份数据  

领有冗余体系是一回事,而备份数据是另外一回事。这关于亚马逊这次的中断尤其重要,由于它影响了亚马逊公司最风行的存储效劳S3正常经营。  

AWS领有多种方式来本地备份数据:  

同步复制是一个过程,如果一个应用程序在一个非必须的地位被复制,那么应用程序只招认一个业务(例如上传一个文件到云,或者将信息输入数据库)。这种办法的缺点是,它将引入辅助复制的等候工夫,并使主体系得到确认。当延迟不是优先级时,这是一个很好的做法。  

异步复制:此过程将主节点与副本解耦,这对需要低延迟写入功用的体系很有效。在这种状况下,用户在落空期间应该情愿接受最近生意业务的一些丧失。  

基于仲裁的复制:这是同步和异步复制的组合,它设置了要为业务进行备份的最小数量的信息。  

为了定夺怎么最好地构建冗余体系和备份数据,客户招考虑其期望的恢复点方针(RPO)和恢复工夫方针(RTO)。  

4.测试体系  

企业为什么要在产生中断之后,才能获知本人的体系是否应答故障?企业自动应答的方法就是事前测试。这可能听起来很张狂,但斗胆的云架构师宁可以让整个节点,效劳,AZ,乃至地区的事务中断,以便查看他们的应用程序是否能够接受。 你应该不断地打败本人的网站。 Bartoletti说。  

Netflix公司领有名为Chaos Monkey和Chaos Gorilla的开源东西,它们是其Simian Army的一局部,能够主动使某些内部体系溃散或中断,以测试其对过错的容忍程度。那么这种措施有用吗?而在这次中断事变产生后,Netflix公司并无陈述其效劳产生什么问题。


2019-07-31 10:27:29 Saas 2019年CRM将引爆SaaS聚变 氢弹是威力强壮的兵器,但引爆氢弹极为艰难,引爆氢弹往往需要在内部安放小型核弹,霎时达成极高温度。好像引爆氢弹一样,SaaS市场的聚变,怙恃的是CRM这款核弹。
Copyright © 2002-2020 免费祝福网页在线制作_360免费建站_网站免费制作_免费的建站平台_免费网站制作模板 版权所有 (网站地图
地址:江苏省南京市玄武区玄武湖 电话:4008-888-888
邮箱:9490489@qq.com QQ:794548577