根据实际来看,影响智算中心可靠性的因素包括多个方面,想要保障安全稳定性,需要提升智算基础设施的建设运维能力、网络安全能力、智算供给能力等,这其中涉及到芯片的选择应用、智算中心的制冷情况、网络...【详细】
有消息称这次宕机主要是由于北京的机房出现故障导致的,广州和上海的用户表示能够正常使用。【详细】
4月10日,新浪微博有网友发文表示,华为云登录、管理后台无法访问,疑似华为云出现宕机。【详细】
疫情以来用户量激增,已将服务器扩容30倍。【详细】
如今,数字化时代已经到来,数据中心规模和容量都在成倍增长,随之而来的运维管理复杂度和难度也越来越大,从脚本运维、工具运维到平台运维演进至今,人力已接近极限,随即智能运维应运而生。【详细】
据国外媒体报道,亚马逊目前已在官网证实云计算服务出现了宕机,多个云服务区域的连接因此而受到了影响。 【详细】
据彭博社报道,亚马逊旗下云业务部门Amazon Web Services(AWS)刚刚证实,由于一家外部服务提供商出现问题,影响了部分客户网络和多个AWS区域(AWS Region)之间的互联网连接。 【详细】
谷歌云此次宕机中,北美用户受到的影响大,欧洲一些用户也报告了问题。当地时间下午17:00,在宕机4小时之后,谷歌解决了这一问题。谷歌承诺将发布一份详细的故障分析报告。【详细】
谷歌已经在其云计算平台上发布了一份状态更新,指出问题开始于美国东部时间周日下午3点25分。【详细】
今日, 谷歌云服务 出现了 大规模 宕机, 包 括 Gmail、YouTube 、 G Suite 、 Snapchat 等应用都受到了 影响 。据悉,此次宕机 影响了北美、英国、欧洲、南美等全球多地的谷歌服务。 【详细】
3 月 23 日下午 4 点左右,腾讯多个产品出现大规模宕机,暖暖、QQ 飞车,王者荣耀,吃鸡等 90 多个服务受到影响。下午四点半,腾讯云发布公告称:各位用户,2019 年 03 月 23 日 16 时左右,因上海当地网...【详细】
断电是数据中心中断的常见原因,但它们不是唯一的罪魁祸首。随着企业计算环境变得越来越复杂,IT系统和网络故障导致大量数据中心宕机。 【详细】
在数据中心迁移方面,网络工程师通常没有太多值得期待的事情,除了迁移事故导致意外停机的焦虑以外。但并不一定是这样。有了正确的工具,网络团队可以轻松地了解正确管理流程,并且可以尽其所能确保迁移项...【详细】
近日,阿里云突发的宕机事件又将云安全推到风口浪尖,据了解,此次事件是阿里云华北2地域可用区C部分的ECS服务器(云服务器)等实例出现IO HANG(IO不响应)导致的。阿里云经紧急排查处理后,业务已全部恢...【详细】
近年来,“去运维”的相关讨论甚嚣尘上,但似乎没有引起程序员的过多关注或者大范围讨论。近日,程序员论坛 V2EX 上出现一个热议话题“阿里云正在缓慢而稳步地杀死运维行业”,这似乎表明运维人员最终还是...【详细】
3月3日凌晨,有诸多网友在微博反馈,阿里云疑似出现大规模宕机故障,此次故障影响了众多华北地区的互联网公司。 【详细】
3月4日讯,3月3日凌晨,有网友在微博上称阿里云疑似出现了宕机事故。据新京报消息,目前阿里云方面回应称,经紧急排查处理后已恢复服务。【详细】
当前的IDC的管理日趋复杂,加之运维人员错误操作现象,如何运行一个庞杂的数据中心,进行无数的主动和被动的操作,同时避免错误导致的数据中心故障呢? 【详细】
昨晚你抢到故宫夜游票了么?【详细】
有很多文章都提到过白盒监控和黑盒监控,以及监控的四个黄金指标。关于白盒与黑盒监控的定义,这里不再赘述。一般来说,白盒与黑盒分别从内部和外部来监控系统的运行状况,例如机器存活、CPU 内存使用率、...【详细】
2018 年,云计算市场不仅发展迅速,而且问题不断。云供应商与开源社区的矛盾不断升级,主流云厂商均未逃过宕机事件,更有甚者一年出现多次服务宕机,导致企业对公有云的信心持续走低。【详细】
宕机,是开发和运维人员最为敏感的事情,服务器一旦宕机会给服务商和访客造成不可预估的影响,降低访客对访问网站品牌的信任度。【详细】
宕机月月有,本月特别多。比如今天,又有两个互联网巨头被爆出现宕机事故。【详细】
11月21日一大早,有网友在社交网络媒体上反馈,自己的App Store出现了打不开的情况,随后这个情况蔓延到iTunes Store上,不过那时只是国外用户反馈,所以跟国内用户影响并不大。【详细】
GKE全球大宕机长达19小时,网友表示:Google是一个笑话
自10月16日谷歌YouTube陷入全球性宕机之后,谷歌再次发生重大宕机事故。【详细】
对于数据中心而言,宕机是十分难以承受的事件。宕机会造成数据中心的业务中断,导致用户无法正常访问应用程序。在严重的情况下,会给企业业务方面造成巨大损失。【详细】
最近云平台故障挺多的,阿里云故障完了,我想等两周再发本文,结果AWS美国挂了;AWS的热议刚刚消停,企鹅家也遭灾了【详细】
中国IDC圈讯 7月24日上午,腾讯云因广州运营商光缆物理中断宕机。据微博用户@卢松松 表示,腾讯云此次宕机影响较大,已导致腾讯云广州区域全面断网,包括腾讯云主页、控制台、DNSPod等。数字尾巴主站、新...【详细】
“没有折腾,就没有故障”这句话虽糙,但却很有道理,尤其在运维上。据有关咨询机构统计,数据中心的故障中有百分之七十是人为故障,也就是与人的活动强相关,可见人对于数据中心来说是多么可怕。【详细】
6月27日晚,有大量用户反映阿里云出现连接问题,很多用户在实例上执行操作之后没有回应,在6月28日凌晨,阿里云发出公告,表示问题是运维和工程师的失误导致,现已恢复。无独有偶,chromecast和Google Hom...【详细】
4月18日,纳斯达克(NASDAQ)位于斯德哥尔摩väsby的数据中心发生宕机,事故原因是数据中心的消防灭火系统气体泄露,导致机房关键IT设备关主闭。【详细】
4月2日,有用户发现滴滴外卖出现故障,滴滴出行App中的外卖入口(无锡)被撤下。对此,滴滴方面回应称,昨日我们在无锡开启小范围灰度测试,受到用户大量关注,短期订单暴涨超出预期,为了保证更好的体验...【详细】
虽然数据中心的设计在理论上不会发生故障,但它确实会出现这种情况,因此数据中心运营商将面临非常严峻的情况,特别是托管数据中心。【详细】
虽然数据中心的设计在理论上不会发生故障,但它确实会出现这种情况,因此数据中心运营商将面临非常严峻的情况,特别是托管数据中心。【详细】
日前,伦敦一所学意外启动触发了一个灭火器,其惰性气体和碎屑喷溅到正在运行的IT设备,导致宕机。【详细】
近日,某IDC服务商机房宕机直接导致某商业银行业务中断,此事引起了银监会的高度重视,并发布了《中国银监会办公厅关于银行业金融机构数据中心基础设施外包风险提示的通知》。【详细】
大多数人在生活或工作领域中都不希望出现连接中断的情况,尤其是在以数字生活方式为主的今天,所以数据中心基础设施变得越来越重要。对于许多消费者来说,他们希望自己的数字产品和服务能保持正常工作,所...【详细】