机房断电紧急应对方法

发布者:陈翔发布时间:2019-03-29浏览次数:14

机房断电紧急应对方法

(/汤隆)

机房长时间断电,可造成系统数据的丢失或者出错,而且在再次通电时,还可能造成系统的恢复延长,耽误整个数据机房的正常运作。目前有不少数据中心供电系统的管理软件,通过管理软件对供电系统进行智能化管理,往往可以减少维护的工作量。还要有专业的IT人士及时分析故障原因,针对机房断电突发状况必须筹备紧急预案。说到底,选择一家放心、质量有保障的机房建设公司是至关重要,让专业的人做专业的事!

机房突然断电的处理方法有一般分两种:

1、如果机房中配置了UPS,市电断电后,那么UPS就会启动电池放电,通过UPS逆变器给后端设备提供不间断电。如果断电很长的话,那么在电池放完电前可启动前端的发电机给后端设备供电。这种配置了UPS的机房,后端设备可以不间断供电。

2、如果机房中没有配置UPS,市电断电后,那么就只能启动机房配置的发电机,通过ATS切换来给后端设备供电。这种没有配置UPS的机房,停电后只能中间断下电,之后再通过发电机供电。

应急措施:

第一条:机房意外停电后,首先确定停电的范围以及受影响的设备范围。

第二条:确认停电的范围为本单位或本机房,应立即联系后勤相关部门电话汇报。估算电力可能恢复的时间,并通知直接上级。

第三条:如果确认停电的时间在1个小时内,可以在UPS正常供电的时间内,等到电力恢复。如果不能确认在2个小时内恢复供电,需及时到达现场。做好各设备的电源停电准备。在UPS供电达1.5个小时后,严格按操作手册停掉存储和各应用服务器的电源,最后停核心交换机和路由器。等待电力恢复,电力恢复供电后转第七条执行。如果确认停电的范围仅在于本机房电源故障,立即汇报给机房电源维护负责人。

第四条:机房维护负责人将掉电的电源柜总空开和分空开的状态处于下电状态。并向直接领导汇报,马上联系相关厂家,如有可能请厂家立即到现场支持。

第五条:将掉电的所有的设备电源状态处于下电状态,以防止电源柜加电对设备的冲击。

第六条:等各厂家和相关的人员到齐后,商议设备恢复时因注意的事项,并形成相关文档。

第七条:电力室恢复供电后,先不要急于给电源柜加电,等待10—20 分钟后,再开始给电源柜加电,以防止供电不稳或再次掉电。

第八条:供电正常后,确定设备处于下电状态后,打开电力柜的总控开。

第九条:根据设备加电顺序,启动分项空开。

第十条:设备加电顺序,网络交换类设备正常后再给磁盘阵列柜加电,存储状态。检查正常后,启动主机(以上各设备务必按操作手册的启动顺序上电)。

第十一条:设备启动正常后,开始启动数据库。

第十二条:数据库启动正常后,开始启动中间件服务器。

第十三条:中间件服务器正常后,启动应用程序。

第十四条:机房设备进行全面点检,确认所有设备运行和服务正常。