宕机事件,为什么服务器的宕机一般都发生在凌晨使用率最低的时候

来自16年经验老程序员的靠谱回答备案网站宕机事件。宕机事件,为什么服务器的宕机一般都发生在凌晨使用率最低的时候主要有以下几个原因1.凌晨时服务器很忙首先,确实服务器的宕机一般都发生在凌晨使用率最低的时候,但是这个使用率只是针对用户而言的。实际上,在凌晨的时候,服务器是很忙的。主要忙哪些事情呢?主要是一些定时任务,还有数据库备份等。很多比较耗时的操作比如报表统计都会安排在半夜,以免半天影响正常业务,所以这个时候,服务器都是在高负荷运转的,容易产生事故。2.一般晚上的时候会上线新功能同理,发布新代码或者更改功能,也会选择在晚上的业务低峰期。无论前期的测试工作做的多么到位,也难免会隐藏一些bug,到了凌晨,这些bug(比如死循环)已经跑了一段时间了,在无人值守的情况下就可能触发各种故障。如果上线时间比较短还好,遇到更新比较大的情况下,程序员奋战到大半夜,这个情况下人是很疲惫的,更容易忙中出错。3.无人值守导致修复变慢比如死循环和内存泄漏,是需要经过一段时间才能表现出来的。白天有人实时监控,自然出现故障的几率比较小,就算出现故障了,也能很快修复,让用户无法觉察。4.凌晨是黑客作案高峰期夜黑风高,杀人越货。这个时间点是正常人休息时间,而黑客则选择在这个时候活动,不论是安全攻击,或者是DDOS,都可能造成服务器故障。北京时间5月3日凌晨3点43分开始,微软的Azure在全球范围内出现了大面积宕机,整个过程持续了将近2个小时,直到5点30分才完全恢复。受Azure宕机影响,包括Microsoft 365,Dynamics和DevOps在内的微软主要服务均出现使用问题。现在微软官方发布声明,表示本次出现全球性宕机问题是由于“名称服务器授权”问题所导致的。微软解释道:“工程师确认是由于影响DNS解析的名称服务器授权调整影响底层root,并影响下游对计算,存储,应用服务,AAD和SQL数据库服务。在将旧DNS系统迁移到Azure DNS期间,Microsoft服务的某些域未正确更新。在此事件期间,没有客户DNS记录受到影响,并且整个事件期间Azure DNS的可用性保持在100%。该问题仅影响Microsoft服务的记录。”根据公司的声明,尽管工程师在几个小时内确定并解决了该问题,但是一些访问具有错误配置的域的系统存储了该信息,从而导致更长的恢复时间,直到错误的缓存过期。也就是说,微软仍在调查这个问题,并承诺将在72小时内发布详细的根本原因分析(RCA)。这不是Azure第一次受到全球中断的打击; 2016年,全球DNS中断影响了许多基于Azure的服务,包括SQL数据库,应用服务/ Web应用,API管理,服务总线,HDInsight,媒体服务和Visual Studio团队服务。今年早些时候,由于类似的中断,许多Office 365用户无法访问其邮箱。本周日,谷歌在全球范围内遭遇了大规模中断,包括Gmail、YouTube和Google Drive在内基于谷歌云架构服务的诸多谷歌服务均受到影响。本次宕机于北京时间6月3日凌晨2点58分开始,用户访问谷歌服务出现各种错误提醒,并且阻止用户访问电子邮件、上传YouTube视频等等。宕机时候YouTube上出现的错误界面根据谷歌官方状态页面显示,包括Gmail, Calendar, Drive, Docs, Sheets, Slides, Hangouts, Meet, Chat和Voice在内的谷歌服务均无法使用。那些依赖于谷歌云架构的第三方服务同时也受到影响,目前谷歌官方并没有完全恢复的预估时间,也没有公布关于本次宕机事件的根本原因。苹果的iCloud服务也受到轻微影响,苹果报告称有不到1%的用户出现了响应时间低于正常值的情况。AppleInsider也进行了测试,但是并没有出现任何中断或者卡顿的情况。凌晨4点45分:谷歌报告称,由于网络比较拥挤“用户可能会看到性能下降或者间歇性错误”。谷歌表示已经确认了造成拥堵的根本原因,预计很快会恢复正常。凌晨6点:在简讯中,谷歌承认这些问题, 并表示工程团队已经完成缓解工作的第一阶段,目前正在实施第二阶段,应该会尽快修复正常。同花顺崩了,用户无法正常操作,很多投资人认为自己遭遇了投资损失,并要求同花顺赔偿,这一点恐怕很难,10月28日早盘,同花顺交易系统出现异常,无法显示行情,自然也就无法完成交易,成为热搜不说,投资者纷纷吐槽, 有人吐槽“这不能操作,赔钱算谁的?”,碰到这种情况大概率只能自认倒霉。针对投资者的吐槽,同花顺在微博致歉,同花顺发布微博回应称,尊敬的客户,因网络线路出现异常,同花顺APP部分用户出现登录异常,目前已经恢复。如有个别用户仍存在问题,请随时联系我们。由此对用户造成的不便深表歉意。但是非常遗憾的是同花顺设置了“由于用户设置,你无法回复评论。”有逃避质疑的嫌疑,正所谓眼不见为净,这不是处理问题的积极态度。每一家券商都会有一些免责条款,把自己的责任降到最低,同花顺也不例外,有很多的免责条款,意味着投资者使用了同花顺,就必须接受这些免责条款。其中就有各种原因引发的信息传递异常不承担任何的法律责任。因此尽管同花顺造成了宕机,但是存在免责条款,投资者是很难要求赔偿的。但是同花顺宕机给投资者带来的损失或许是存在的,也影响了投资者的交易,事实上损害了投资者的利益,这一点是不可否认的,仅仅道歉是不够的,关闭评论不接受投资者质疑也是欠妥的。同花顺应该以更加积极的态度,应对这一偶发事件,目前成交量不是特别大,超过万亿元成为常态,同花顺宕机大概率不是交易拥堵造成,至于是不是技术原因引发,很难知晓,只有同花顺自己知道。交易系统安全运行事关投资者切身利益,虽然有些技术问题总是具有偶发性,但加强日常管理还是可以最大化减少宕机发生。

本文出自快速备案,转载时请注明出处及相应链接。

本文永久链接: https://www.175ku.com/13477.html