数据中心机房UPS供电系统的日常巡检和保养
数据中心机房UPS供电系统的日常巡检和保养
1、按照机房的管理规章制度定时巡检
(1)巡检内容。设备的温度、机器的噪声和振动情况有无变化;机房内有否异味;电池外壳有否变形、爬酸和漏液,电池连接有否松动。
(2)定期保养内容。检查线路连接是否牢固,设备温升是否变高,熔丝是否变形,断路器是否有热点。
(3)长期运行的负荷每相负载一般应控制在额定容量的70%以内,尽量将三相负荷调均衡。
(4)当增加新设备时要特别关注UPS的带载量,目前的UPS有高频机和工频机之分,负载功率因数也有不同,所以要仔细计算其带载量。
(5)检查配电柜开关容量的利用情况,根据实际负载及时整定开关保护值。
(6)在雨季到来之前要检查避雷针、避雷带与建筑物主钢筋和接地极连接情况是否良好。检查各级防雷器及浪涌吸收器器件是否良好。
(7)供配电室的环境比主机房要差,应及时清洁电路板和可见连接处的灰尘并及时紧固松动的部分。
(8)如果在装机时使用了一组电池,在更换时最好改为两组并联,单组电池最多不要超过5组。一般电池的真正寿命为额定寿命的60%以下,要及时更换电池,尤其是在使用锂电池的情况下更不要放点太多,以避免爆炸。
2、配电、防雷、接地巡检和保养流程
(1)制定维护保养计划,关键点是检查线路连接的螺钉是否有松动,开关接插点是否牢固,特别是封闭母线每一个固定螺钉处经过长时间运行是否有松动,变压器的温度变化等。上述检查采用测温计,记录检测时间、温度,注意温度变化,发现有效大温升应及时处理。
(2)在配电系统长期运行中,主开关本身的故障概率相对较少,大部分是二次控制部分的器件故障较多,如电源保险、各种继电器及接线松动等。
(3)在配电系统运行中,配电箱、配电柜中零线连接是否牢固对运行中的设备安全非常重要,年检时必须检查固定螺钉是否松动,只有在配电箱、配电柜完全断电时方可移动零线。如需带电移动零线,必须把同一部位的所有零线都用导线与零母排先连接好,方可移动,所有UPS输出配电柜不可以采用该方式。零线必须单点连接。
(4)配电机房的环境低于机房环境,定期清扫灰尘是必要的,但必须是在停电情况下进行。根据配电系统配置的条件,在不影响系统运行的情况下,分步停电清扫和检修,没有温升的螺钉最好不要动,以防螺纹滑扣,造成大故障。
(5)关注负荷的变化,长期运行的负荷应控制在开关设定容量的70%以内(即按三相负荷电流中最大的一相计算),因此,应尽可能调整三相负荷电流平整,提高断路器开关的实际带载能力。
(6)在配电系统中要特别关注、检查开关额定容量整定值的设定。
1)从后端到前端,开关的设定从小到大,运行前期负载较小,后期逐渐增加,要根据实际负荷及时调整。
2)UPS输出配电断路器开关建议都设定为1,因为要确保IT设备的安全运行,该部分开关只作短路保护而不做过载保护。
(7)在雷雨季节到来之前,检查避雷针、避雷带与建筑物主钢筋及接地极的连接是否良好;检查配电系统中防雷及防浪涌器件是否有损坏,应及时更换。
(8)根据不同地域不同的土壤条件,定期、定时段检测接地电阻是否符合要求,必要时需采取一定的措施降低接地电阻。
3、UPS巡检和保养流程
(1)UPS在数据机房中是非常关键的设备,保证其安全和可靠运行是确保计算机等设备正常工作最重要的环节。A级机房一般按市电双总线加两组2N的方式配置UPS,强调的是高可靠性,总负荷小于UPS总容量的一半,初期一般达不到,后期不断增加负荷时要考虑不要超过UPS总容量的一半;也有按市电双总线加两组N+1的方式配置UPS,这样配置UPS的方式是强调高可用性兼顾可靠性,UPS的带载率和运行效率高于2N的方式,总负荷应小于N台UPS的容量。一般情况下,市电采用双总线,UPS采用一组N+1的配置也能获得较高的可靠性。UPS一般都是以7*24H的方式运行,维护管理就是保障其安全可靠运行的一个非常重要的环节。
(2)UPS需要重点关注的主要有以下四个部分。
1)控制电路板长期积累的灰尘以及可能的松动。
2)风扇轴承的磨损。
3)滤波电容器容量的变化。
4)蓄电池维护与管理。
(3)UPS巡检和保养流程。
1)一般UPS机房的环境要求比IT机房低,周边环境也比较差,很多小机房没有新风,机房为负压,洁净度相对较差,夏季与冬季湿度相差较大。控制电路板长期积尘可能影响UPS的安全运行,一般应1~2年停机清扫一次,同时检查各个开关输入和输出节点是否有松动。在UPS运行中严禁用任何物体接触输入和输出强电以外的任何部位。
2)UPS风扇轴承术语易损件,一般寿命3~5年,现在UPS风扇都是冗余配置,少数风扇故障可以不停机更换(建议停机更换),一般不应该等到风扇报警时才去处理,应该在安全使用期内定期更换。巡检时发现异常声音就应及时处理,避免超出冗余数量的风机故障引起UPS停机。有的UPS是需要整个风扇更换,有的是可以仅更换风扇轴承,这样可以大大减少维修成本。
3)交、直流滤波电容在UPS中起着非常重要的作用,关系到直流和交流输出电压的稳定。滤波电容器的寿命理论值为5年左右,与环境温度、工作电流谐波、浪涌等因素相关。实际使用寿命有的超过10年,建议5年以后,每年检测一次,根据容量和漏电流的变化确定是否需要更新。故障的形式有:①漏电流增加造成温度过高使电容器爆掉,有可能造成短路起火,该故障影响是致命的;②电解质干了,电容器已经没有容量了,形同开路,造成输入或输出电压不稳;③相对于IT机房,UPS发生火灾的案例时有发生,建议UPS的输入、输出电缆采用下进出线。
4、蓄电池
(1)蓄电池在UPS中起着极其重要的作用,是保证不中断供电的关键设备。目前UPS都采用阀控铅酸蓄电池,俗称免维护蓄电池,其实不然,它仅减少了补液(蒸馏水、稀硫酸)的过程,降低了蓄电池室对防酸的要求。但每年必须进行两次充放电,尽可能满负荷放电。如果放电负荷小于额定负荷的50%,单节电池的最终放电电压不要小于10.8V。该项工作应在全年外电网供电最稳定的时间段进行,检验蓄电池的容量是否还能带到最初的设计要求。UPS放电以后,必须有24~48H稳定充电时间使其回复容量,因此,同组的UPS再进行放电测试必须在24H以后的第二天进行。
(2)UPS最少应配置两组蓄电池,如果只配置一组蓄电池,一旦有一只蓄电池故障,就可能造成整组蓄电池失效。蓄电池的理论寿命有5、10、15年,实际使用寿命仅为其标称参数的50%~60%,而且其失效时具有突然性,因此,对蓄电池的实时监测是必须的。监测数据中的蓄电池放电时间是根据放电时整套蓄电池的电压测定的,如果其中有一、两只蓄电池突然失效,将导致放电时间减少或整套蓄电池失效。
(3)在蓄电池放电过程中,应实时监视每只蓄电池的电压是否有异常变化,并设置超限电压值,一旦电压变化异常,应立刻停止放电,撤换故障蓄电池,有条件的情况下,可以对该蓄电池反复充放,使其激活后可以再使用。
(4)建议
1)数据中心UPS的运行状况很难实现按额定负载放电,需要放电时可酌情用假负载。
2)目前国内蓄电池的生产工艺决定了大电流深放电将影响蓄电池的使用寿命。
3)建议在蓄电池安全使用手民后期每年要做一次大于额定容量50%、放电时间接近额定负荷放电时间的检测。
(5)UPS单机运行故障检修。在静态旁路工作状态下合上手动维修旁路开关,断开逆变器输出开关,断开蓄电池输入、整流器和静态旁路输入开关;检修完成后,合上整流器和静态旁路输入开关,合上蓄电池输入开关,确认静态旁路已输出,合上UPS输出开关,断开手动维修旁路开关,起动UPS,检查旁路电压,由旁路转入逆变器运行。