亚马逊云服务器aws宕机
⑴ 如何阻止云平台发生宕机
几乎每个云平台都发生过宕机事件,云平台自身的设备、软件可能存在漏洞,最终导致系统不可用。此外,电力、带宽、周边环境、系统运维误操作等原因也会导致云平台宕机,宕机是云计算行业的大事件,即便是亚马逊AWS也不可避免。一旦发生宕机,影响的可能是半个地球的人。埃科锐给出的Teridion的连接解决方案解决了在中间环节会出现的问题∞即数据从本地网络转移到主要的运营商和服务提供商。通过一系列技术,像 MPLS- SLA的品质,保证客户可以拥有完善的性能体验。
⑵ awas工具扫网站可以把网站扫崩吗
不可以。
据AWS称,这次宕机仅影响亚马逊23个地理AWS区域之一。但这个问题已经严重到影响到了大量互联网公司的服务。
AWS云存储服务S3也曾在2017年出现大宕机,该错误持续了4个小时,彼时AWS解释称该故障是由于一名程序员在调试系统的时候,运行了一条原本打算删除少量服务器的脚本,结果输错了一个字母,导致大量服务器被删。被错误移除的服务其中运行着两套S3的子系统,从而导致S3不能正常工作,S3API处于不可用状态。
⑶ 有用亚马逊AWS云主机的吗
你好,亚马逊aws属于云主机
vps是虚拟出来的服务器,一台服务器上可以划分出多个vps
而云服务器是基于多台服务器集群的硬件基础上通过一定的技术划分出来的
所以即使其中的一台服务器宕机,云服务器仍会正常运转
vps的好处是比较稳定,缺点是功能简单,性能有限制
天互数据为你解答.希望能帮到你。若有相关问题欢迎继续提问
⑷ AWS 亚马逊和Aliyun阿里云的区别比较和深度分析
AWS 亚马逊云服务成熟稳定,组件化,比如lambda,ecs,可以很容易搭建网站,大数据计算平台,有非常方面的部署脚本,便捷可以释放资源。
Aliyun阿里云侧重在数据仓库,计算与存储是耦合的,耦合一个好处是速度会比较快,AWS的话存储是S3,与计算不是耦合的。
两者方向是不一样的,阿里云不稳定,号称9个9,结果老宕机,比如最近一次的IO HANG影响整个华北。至于生态也不一样,aws基本上基于开源的生态,阿里云有封闭,有开源做了一层产品化,在大数据时代,开放的生态才会有未来。
⑸ 哪些原因会导致数据中心断网
断网类型一:系统故障
典型事件1:亚马逊AWS平安夜断网
故障原因:弹性负载均衡服务故障
2012年12月24日,刚刚过去的圣诞节平安夜,亚马逊并没有让他们的客户过得太平安。亚马逊AWS位于美国东部1区的数据中心发生故障,其弹性负载均衡服务(Elastic Load Balancing Service)中断,导致Netflix和Heroku等网站受到影响。其中,Heroku在之前的AWS美国东部区域服务故障中也受到过影响。不过,有些巧合的事情是Netflix的竞争对手,亚马逊自己的业务Amazon Prime Instant Video并未因为这个故障而受到影响。
12月24日,亚马逊AWS中断服务事件不是第一次,当然也绝非最后一次。
2012年10月22日,亚马逊位于北维吉尼亚的网络服务AWS也中断过一次。其原因与上次相似。事故影响了包括Reddit、Pinterest等知名大网站。中断影响了弹性魔豆服务,其后是弹性魔豆服务的控制台,关系数据库服务,弹性缓存,弹性计算云EC2,以及云搜索。这次事故让很多人认为,亚马逊是应该升级其北维尼吉亚数据中心的基础设施了。
2011年4月22日,亚马逊云数据中心服务器大面积宕机,这一事件被认为是亚马逊史上最为严重的云计算安全事件。由于亚马逊在北弗吉尼亚州的云计算中心宕机,包括回答服务Quora、新闻服务Reddit、Hootsuite和位置跟踪服务FourSquare在内的一些网站受到了影响。亚马逊官方报告中声称,此次事件是由于其EC2系统设计存在漏洞和设计缺陷,并且在不断修复这些已知的漏洞和缺陷来提高EC2(亚马逊ElasticComputeCloud服务)的竞争力。
2010年1月,几乎6万8千名的Salesforce.com用户经历了至少1个小时的宕机。Salesforce.com由于自身数据中心的"系统性错误",包括备份在内的全部服务发生了短暂瘫痪的情况。这也露出了Salesforce.com不愿公开的锁定策略:旗下的PaaS平台、Force.com不能在Salesforce.com之外使用。所以一旦Salesforce.com出现问题,Force.com同样会出现问题。所以服务发生较长时间中断,问题将变得很棘手。
断网诱因二:自然灾害
典型事件1:亚马逊北爱尔兰柏林数据中心宕机
故障原因:闪电击中柏林数据中心的变压器
2011年8月6日,在北爱尔兰都柏林出现的闪电引起亚马逊和微软在欧洲的云计算网络因为数据中心停电而出现大规模宕机。闪电击中都柏林数据中心附近的变压器,导致其爆炸。爆炸引发火灾,使所有公用服务机构的工作暂时陷入中断,导致整个数据中心出现宕机。
这个数据中心是亚马逊在欧洲唯一的数据存储地,也就是说,EC2云计算平台客户在事故期间没有其他数据中心可供临时使用。宕机事件使得采用亚马逊EC2云服务平台的多家网站长中断达两天时间之久。
典型事件2:卡尔加里数据中心火灾事故
故障原因:数据中心发生火灾
2012年7月11日卡尔加里数据中心火灾事故:加拿大通信服务供应商ShawCommunicationsInc位于卡尔加里阿尔伯塔的数据中心发生了一场火灾,造成当地医院的数百个手术延迟。由于该数据中心提供管理应急服务,此次火灾事件影响了支持关键公共服务主要的备份系统。此次事件为一系列政府机构敲响了警钟,必须确保及时的恢复和拥有故障转移系统,同时结合出台灾害管理计划。
典型事件3:超级飓风桑迪袭击数据中心
故障原因:风暴和洪水导致数据中心停止运行
2012年10月29日,超级飓风桑迪:纽约和新泽西州的数据中心都受到了此次飓风的影响,所带来的恶劣影响包括为曼哈顿下城地区的洪水和一些设施的停机,周围地区数据中心发电机运行失常。飓风桑迪所带来的影响超出了一般单一的中断事故,为受灾地区数据中心产业带来了规模空前的灾难。事实上,柴油已然成为了数据中心恢复工作的生命线,作为备用电源系统接管了整个地区的负荷,促使特别措施,保持发电机的燃料。随着眼前的工作重点逐步转移到灾后重建,我们有必要长期就数据中心的选址、工程和灾难恢复进行探讨,这一话题可能将持续几个月,甚至几年。
断网诱因三:人为因素
典型事件1:Hosting.com服务中断事故
故障原因:服务供应商执行断路器操作顺序不正确造成的UPS关闭
2012年7月28日Hosting.com停运事件:人为错误通常被认为是数据中心停机的主导因素之一。7月Hosting.com中断事件造成 1100名客户服务中断就是一个例子。停机事故的发生是由于该公司位于特拉华州纽瓦克的数据中心正进行UPS系统预防性维护,"服务供应商执行断路器操作顺序不正确造成的UPS关闭是造成数据中心套房内的设施损失的关键因素之一。"Hosting.com首席执行官ArtZeile说。"没有任何重要的电力系统或备用电源系统出现故障,完全是一种人为的错误造成的。"
典型事件2:微软爆发BPOS服务中断事件
故障原因:微软在美国、欧洲和亚洲的数据中心的一个没有确定的设置错误造成的
2010年9月,微软在美国西部几周时间内出现至少三次托管服务中断事件向用户致歉。这是微软首次爆出重大的云计算事件。
事故当时,用户访问BPOS(Business Proctivity Online Suite)服务的时候,如果使用微软北美设施访问服务的客户可能遇到了问题,这个故障持续了两个小时。虽然,后来微软工程师声称解决了这一问题,但是没有解决根本问题,因而又产生了9月3日和9月7日服务再次中断。
微软的Clint Patterson说,这次数据突破事件是由于微软在美国、欧洲和亚洲的数据中心的一个没有确定的设置错误造成的。BPOS软件中的离线地址簿在"非常特别的情况下"提供给了非授权用户。这个地址簿包含企业的联络人信息。
微软称,这个错误在发现之后两个小时就修复了。微软称,它拥有跟踪设施,使它能够与那些错误地下载这些数据的人取得联系以便清除这些数据。
断网诱因四:系统故障
典型事件1:GoDaddy网站DNS服务器中断
故障原因:系统内一系列路由器的数据表造成的网络中断
2012年9月10日GoDaddy网站DNS服务器中断:域名巨头GoDaddy是一家最重要的DNS服务器供应商,其拥有500万个网站,管理超过5000万的域名。这就是为什么九月10日中断事故会是一个2012年最具破坏性的事件。
一些炒作甚至认为,此次长达6个小时的中断事件是由于拒绝服务攻击的结果,但GoDaddy后来表示,这是路由器表的损坏数据造成的。"服务中断不是由外部影响造成的。"GoDaddy的临时首席执行官史葛瓦格纳说。"这不是黑客攻击也不是一个拒绝服务攻击(DDoS)。我们已经确定了服务中断是由于内部的一系列路由器的数据表造成的网络事件损坏。"
典型事件2:盛大云存储断网
故障原因:数据中心一台物理服务器磁盘损坏
2012年8月6日晚上8:10,盛大云在其官方微博上发布一则因云主机故障致用户数据丢失事件的公开声明。声明说到:8月6日,盛大云在无锡的数据中心因为一台物理服务器磁盘发生损坏,导致"个别用户"数据的丢失。盛大云已经在尽全力协助用户恢复数据。
对于因为一台"物理服务器磁盘发生损坏",导致"个别用户"数据的丢失的情况,盛大云技术人员给出自己的解释:虚拟机的磁盘有两种生产方式,一种是直接使用宿主机的物理磁盘。这种情况下,如果宿主机的物理磁盘发生故障,云主机不可避免会造成数据丢失,这也是本次事件产生的原因;另外一种是使用远程存储,也就是盛大硬盘产品,这种方式实际上是把用户的数据存到了远程的一个集群里,并同时做了多份备份,即使宿主机出故障也不会影响到云主机的数据。因为物理机的损坏很难避免,为了避免您遇到意外损失,我们建议您在云主机之外,也做好数据备份。
典型事件3:Google App Engine中断服务
故障原因:网络延迟
Google App Engine:GAE是用于开发和托管WEB应用程序的平台,数据中心由google管理,中断时间是10月26日,持续4小时,因为突然变得反应缓慢,而且出错。受此影响,50%的GAE请求均失败。
谷歌表示没有数据丢失,应用程序行为也有备份可以还原。为表歉意,google宣布11月份用户可以google表示他们正在加强其网络服务以应对网络延迟问题,"我们已经增强了流量路由能力,并调整了配置,这些将会有效防止此类问题再次发生"。
断网诱因五:系统Bug
典型事件1:Azure全球中断服务
事故原因:软件Bug导致闰年时间计算不正确
2012年2月28日,由于"闰年bug"导致微软Azure在全球范围内大面积服务中断,中断时间超过24小时。虽然微软表示该软件BUG是由于闰年时间计算不正确导致,但这一事件激起了许多用户的强烈反应,许多人要求微软为此做出更合理详细的解释。
典型事件2:Gmail电子邮箱爆发全球性故障
事故原因:数据中心例行性维护时,新程序代码的副作用
2009年2月24日,谷歌的Gmail电子邮箱爆发全球性故障,服务中断时间长达4小时。谷歌解释事故的原因:在位于欧洲的数据中心例行性维护之时,有些新的程序代码(会试图把地理相近的数据集中于所有人身上)有些副作用,导致欧洲另一个资料中心过载,于是连锁效应就扩及到其它数据中心接口,最终酿成全球性的断线,导致其他数据中心也无法正常工作。
典型事件3:“5.19断网事件”
事故原因:客户端软件Bug,上网终端频繁发起域名解析请求,引发DNS拥塞
2009年5月19日的21:50,江苏、安徽、广西、海南、甘肃、浙江等六省用户申告访问网站速度变慢或无法访问。经过工信部相关单位调查通报称,此次全国六省网络中断事故,原因是国内某公司推出的客户端软件存在缺陷,在该公司域名授权服务器工作异常的情况下,导致安装该软件的上网终端频繁发起域名解析请求,引发DNS拥塞,造成大量用户访问网站慢或网页打不开。
其中,DN SPod是国内知名的域名解析服务商之一的N SPod公司,服务数家知名网站的域名解析服务。此次攻击导致DN SPod公司所属的6台dns域名解析服务器瘫痪,直接造成包括暴风影音在内的多家网络服务商的域名解析系统瘫痪,由此引发网络拥塞,造成大量用户不能正常上网。 工信部指出,此次事件暴露出域名解析服务成为目前网络安全的薄弱环节,指示各单位要加强对域名解析服务的安全保护。
小结
启用云服务的公司,很大程度是考虑这种服务可以更加编辑,性价比高。但是,这样的考虑如果是以降低安全性作为代价,估计很多公司老大不会同意。层出不穷的云服务断网事件引起了云端安全性的担忧。
目前来看,解决的办法可以从几个角度出发,对于企业级客户来说,务必在采用云服务的同时定期备份云端的数据,拥有第二套解决方案按,以备不时之需。而对于云服务提供商来说,既然各种断网事件是在所难免的,那就必须思考一个对策,将自己用户的损失降到最低,对断网事件的响应效率要提高。
政府部门则具有监督和提醒的职责,云服务相关的法律法律要相继出台和不断完善,并且提醒用户百分之百可靠的云计算服务目前还不存在。
⑹ 亚马逊出现故障宕机了,有什么原因会让服务器造成宕机
其实在这一次的网络风波当中,不仅亚马逊出现了故障宕机,包括谷歌,脸书和推特这些全球性的公司都出现了类似的问题,说说话让服务器停止运营的方法有很多,一般情况下,包括转店,网络故障,黑客攻击。今天就跟大家来探讨一下,在这一次的亚马逊服务器停机过程当中,可能由哪些因素引起?
第三,如何看待这一次的风波所造成的影响?
虽然现在这几家公司都对外表示只是网络问题,但是这一点肯定没有办法得到大家的信任,有人猜测,真的可能是一些网络黑客攻击了他们的服务器,让他们同时下线。从而保证服务器不会占有,然后通过断电继续恢复服务器,或者跟黑客进行交谈协商。如果真的是这样的话,那么也就意味着全球没有一个服务器是安全的,毕竟他们的服务器安全等级是非常高的。
⑺ 微软,AWS,谷歌宕机3天会怎样
能力有限,三个公司一起宕机实在无法回答,但是可以给你几个简单的例子参考借鉴:
自2015年3月11日下午5点起,据苹果用户反应AppStore、Mac AppStore、iTunesStore均为宕机状态,iTunes Connect无法登陆,iBooks商店没有响应。此外,iOS和Mac的应用商店也出现了大面积瘫痪。并显示为“所有用户不可用”。此次服务中断时间长达11个小时,甚为罕见。苹果公司在一份电子邮件声明中表示,服务中断是由于内部系统错误引起的。
按照苹果公司的每天在应用商店收入和其他线上收入的数据可推算出,11个小时的损失将不小。
2014年1月21日,大量QQ用户反映,腾讯的第三方登录出现故障,不少第三方服务使用QQ都登录不上。不仅是第三方登录,QQ邮箱也无法正常使用。这次受影响范围很大,腾讯的第三方登录服务器出现了宕机。
2010年6月30日消息,据国外媒体报道,亚马逊网站周二出现大范围宕机,持续时间超过3小时,在此期间用户只能浏览空白和部分产品页面。
周二中午,亚马逊主页图片无法显示,只在屏幕左侧显示有分类列表。搜索功能无法使用,购物车和产品保存列表也出现暂时性空白。
亚马逊年收入近270亿美元,这意味着一旦网站宕机,亚马逊的损失为每分钟5.14万美元。周二亚马逊股价下跌7.8%,高于纳斯达克综合指数的跌幅。
望采纳。
⑻ 亚马逊AWS盯上了中国的手游市场,它为游戏公司们准备了哪些服务
作为世界上用户最多、技术最成熟的公有云服务,亚马逊的AWS显然是全世界开发者所优先考虑的平台,随着这项服务即将在中国落地,亚马逊也开始在中国市场开始它们在商业化动作,这次,AWS首先盯上了国内近500亿规模的手游市场——AWS中国从年初开始,就频繁的举办和游戏相关的主题活动,向中国的游戏公司“布道”,也不断对外进行AWS与成功游戏产品合作的案例宣传。例如PingWest之前报道过的FunPlus,就是一个利用AWS服务和6位工程师,实现了全球1700多台虚拟服务器部署和运维的游戏公司;我们还报道过世界上最赚钱的游戏公司——SuperCell,是如何基于AWS来处理每天TB级数据处理请求的。
而在几天前亚马逊AWS游戏行业研讨会上,亚马逊将它们的这些案例做了一次系统的梳理,其跨国企业及市场营销拓展部主管林家伟分享了AWS在一款游戏的初创期、成长期、成熟期,衰退期这四个阶段,分别能为游戏公司解决什么样的问题。
初创期
林家伟首先举了个例子,Supercell现在已经成为2013年的手游明星,但他们的第一款游戏Gunshine却并不成功。与Supercell一样,在游戏还在初创期时,游戏公司就不可避免需要大量的试错、而且这些尝试本身必须需要是迅速和低成本的,这样游戏公司才能做更多的人力物力去进行游戏创新。
这就是为什么越来越多的开发者开始选择云计算服务:游戏客户不需购买额外得硬件资源,而能直接通过AWS快速部署游戏网络——比如游戏开发者可以选择位于离终端用户最近的区域部署服务器,并根据需求,选择服务器的数量,而不用做其他的冗余的设计。着名的跨国游戏公司育碧,就曾利用AWS在8周内连续推出10款游戏。
在AWS上部署好服务器之后,你可以选择自己熟悉的OS应用环境、可以是Linix或者是Windows,以及更多软件开发工具包写入代码,进行游戏部署。AWS能够自动化地对多台服务器进行流量入口分配,保证每台服务器的负载均衡。如果开发者有DNS服务的需求,可以使用Amazon Route 53服务。而在数据库上,AWS提供了两种选择——游戏开发者既可以使用亚马逊自有的数据库RDS(Amazon Relational Database Service),也能在EC2上自建数据库。所有这些的服务的部署只需要几分钟的时间。整个过程中,AWS都会自动处理有关容量预配置、负载均衡、Auto-scaling 和应用程序运行状况监控的部署细节。
在游戏测试期间,AWS也能根据需求快速的调整游戏策略,它的好处是——游戏的运营人员不需要半夜起来去做服务期的调试设置,而是直接通过亚马逊的管理控制台界面(支持中文)做服务器的部署。对于现在许多已经出海的游戏公司而言,他们能直接通过AWS服务去管理欧洲等海外市场地区服务器,控制台还支持移动端设备进行设置。
增长期
游戏在增长期时所面对的最大问题,就是难以估量的用户爆发量,给服务器带来的压力,开发者一方面需要提升服务器的稳定性减少宕机,另一方面又得考虑成本问题——如果用户增长没有达到预期,那么限制的服务器就是在浪费成本。
林家伟在这里分享的例子是Rovio公司的《愤怒的小鸟》,这款风靡世界的游戏达到过20亿人次的下载,拥有2.5亿月活跃用户,它们的服务就是AWS平台。它们把不同游戏放在不同可用区域,一方面可以做负载平衡,另外,当一个区域受影响的时候,不至于游戏崩溃。而亚马逊数据库服务RDS,支持作多地区部署。在A可用区域数据,会在B可用区域做即时的数据库备份。一旦A部分出现问题,客户不需要修改程序,而是自动切换到B可用区域上来,作为主要的数据库,减少对终端影响。
应对DUA(日活跃用户数)的快速变化,亚马逊推出的Auto Scaling服务。举个例子,在一天中的不同时段,游戏服务器所面对的压力是不同的——比如许多游戏会在中午12点领体力、签到等活动,流量就会迅速攀升。Auto Scaling会根据流量变化,在1分钟的时间内自动增加服务器数量,而在夜晚用户流量回落时,也AWS会自动减少服务数量,帮客户节省资源。这项服务在不同时段区间所启动的服务器量可以让游戏公司根据自己的需要自行设定。它之前只能用API控制,现在也能直接在用户界面控制。
游戏用户在快速增长时,遇到的另一个问题可能是服务器性能上的瓶颈,比如每秒读写的速率问题。亚马逊提供了Provisioned IOPS,提供游戏开发商明确要求的读写性能。这个要求可以很高,甚至可以EBS块连接起来,达到3万量级的IOPS。但对于许多内容,只是被用户读,而不需要写入,游戏客户只需要用ElastiCache 服务,做读写分流,就能降低对数据库请求压力。
索尼旗下的顽皮狗游戏公司,曾对AWS服务做过架构调整。它们把之前关系型数据库中的数据,放在了Amazon S3中。S3能根据用户的存储数量的按需付费。它的好处是,由于并不是所有的玩家都会长期游戏,有些用户玩了一两个月后,很久才回去玩,这些沉淀数据对与延迟要求不高,存储在S3就能降低对数据库的压力,等需要用到数据时,再从S3调入。
在游戏用户快速成长的时候,需要快速做产品迭代,解决游戏中的问题和推出更多的内容迎合玩家需求。而亚马逊CDN,能帮助游戏用户快速把游戏升级包分发出去。
当游戏运行到海量数据时,游戏用户可能会需要亚马逊DynamoDB动态数据库服务。使用它的通过时忽视数据库软硬件服务所带类的所有问题。用户只需设定每秒必须请求的数量,亚马逊能直接帮你配置的到分配到的硬件数量,并能够根据需求调整。而这数据存储在固态硬盘上,能够快速读写调用。在安全性上,这些数据会跨过多个可用区域,自动复制备份。配合DynamoDB同步复制架构,任何单个节点出现的问题,都不会影响到数据库的稳定性。
成熟期
当一个游戏进入成熟期后,游戏公司就需要根据一个相对稳定的状况来进行运营上的成本控制。亚马逊EC2提供了三种预留实例(Reserved Instance),能根据用户的使用频率,对应不同的价格,在保证要部署的区域有足够的服务器资源的情况下,节省主机的租赁成本。
(Funplus如何调配预留实例,降低游戏运营成本的)
最后一部分是结束期,这个时期一般游戏运营会用较少的服务器,保持游戏正常运行,同时保持低开销。客户可以用很少的heavy utiliztion RI保持服务器的正常使用;也可以完全撤出对所有的服务器使用。
⑼ aws服务器如何重启
后台重启:该操作主要用来重启“运行中”状态的云服务器,
即:只有当云服务器的状态为“运行中”时,上面的操作按钮才会显示,用来重启您的云服务器。如:绿色框为操作按钮。
您也可以在服务器上,直接进行重启!
⑽ 研华aws-8248死机是怎么回事
机的原因有很多,一起分析一下。
首先,必须排除你在换CPU之前没有机。
第二,查验你的CPU是否为正品。
第三,查验你的CPU的供电需求,主板是否能满足?
第四,最有可能的:换CPU时,散热风扇与U之间密合不紧,建议,适量重涂导热硅脂,小心安装,并同时对叶片进行除尘。
第五,也有可能的:换U时,你动了主板上其他原件,导致虚接,请检查你的内存条、显卡、声卡等设备是否插紧。
第六,电源是否已老化,如上述五条全都排除,建议,更换电源。