机房日常维护管理办法
1、交接班
交接班工作主要包括以下工作任务:
检查值班日志、巡视机房、检查工具情况、返回任务单。
交接班工作要求请参照机房《交接班制度》
2、值班巡视记录
各机房均制作有电源和空调系统记录表,每日定时巡视并填写相应记录,对异常情况应详细记录。
3、客户接待工作
1)电话报障或咨询
数据中心直接客户的服务器出现问题,客户会直接打电话到机房查询原因或者要求进行某些操作。
可能出现的故障:
A.服务器宕机,客户要求重新启动,运行维护人员需在故障处理系统中添加相应的故障处理记录,并查找到该服务器位置后重启,最后完成故障处理系统中相应故障处理记录;
网络不通,在监控室和客户端同时使用PING命令检查,若不能PING通,可以使用显示器查看服务器操作系统状态,以查找原因;维护人员可以检查交换机状态,以检查问题是否在IDC机房;高温停机,若发现是服务器由于散热问题而导致高温停机,应通知厂家上门调试;若是其它故障,则视具体情况进行处理。原则上不私自对机房设备进行调试或配置改动。
B.若用户请求改变其服务器组的网络拓扑,则需要用户传真授权书,并经信息中心业务部门审核许可后,机房维护人员在接到相关任务单后方可进行操作。接听电话必须详细询问并记录来电人员的电话号码、部门名称、人员姓名、故障现象和操作请求。并在故障处理后填写完成记录。如果遇到用户有特殊的服务要求,机房维护人员可向机房主管请示,以得到处理办法。在服务过程中机房维护人员应做到礼貌、热情和耐心。
2)服务器调试
当服务器出现故障时,用户到机房调试服务器
用户到机房调试服务器,必须向机房出示单位介绍信和本人身份证。调试时禁止用户改变服务器硬件配置,因此调试结束后须进行设备登记表验证。用户出入机房都须进行登记。若同一时间上门用户过多,则按情况安排用户进入机房调试,对等待的客户应耐心解释。
3)服务器上架
服务器上架流程如下:
1.接收电子版工单
2.检查上架机柜情况和UPS负荷情况,如资源不能满足,则返回任务单,如资源能满足需求,则搭建L轨道(“L”型钢轨,用于支撑服务器在机柜里的摆放),分配交换机端口,准备电源线和网线。
3.用户上门后,须向机房出示单位介绍信和本人身份证。
4.检查服务器时,注意服务器操作系统是否打全补丁,是否安装杀毒软件。验证服务器硬件配置,主要注意CPU、内存和硬盘和网卡,指导用户完整填写设备登记表。设备登记表一式两份,机房与用户各留存一份,须双方盖章签字生效。
5.服务器上架,连接好电源线和网线,若有需要,则应将切换台连接线连接,注意连接合乎要求,以方便扎线。
6.配置交换机相应端口。验证服务器是否已经连通。
7.将新服务器信息录入资源管理系统。
8.打印标签贴上服务器。
9.在规定时间内完成并返回电子工单,在值班日志中记录。
4)服务器临时撤离
用户要求将服务器搬出机房进行维护调试,则流程如下:
1.接受电子工单
2.用户上门后,须向机房出示单位介绍信和本人身份证,机房应将身份证复印件存档。
3.维护人员将服务器断电断网后搬出机房,注意标记电源线和网线位置,方便以后搬回时重新连接。
4.用户接收服务器,并打收条。
5.在规定时间内完成并返回电子工单,记录入值班日志。
5)服务器撤机
用户要求将服务器撤机,流程如下:
1.接受电子工单
2.用户上门后,须向机房出示单位介绍信和本人身份证,机房应将身份证复印件留存。
3.维护人员将服务器断电断网后搬出机房。
4.用户接收服务器,并打收条。
5.在规定时间内完成并返回电子工单,记录入值班日志,修改资源系统资料。
4巡视
机房维护人员应定时对机房进行巡视。巡视时注意以下方面:
1.网络系统:注意各机柜交换机状态,状态灯有无不正常现象。
2.空调系统:注意各空调温度和湿度显示,制冷效果以及有无报警提示。二枢机房采用水冷系统,因此需要检查进出循环水压力和温度。空调是否有漏水、异响等异常情况。
3.电源系统:注意UPS系统输入输出电压、电流、功率、频率和电池电压数据是否正常;低压柜和电源头柜指示表与状态灯是否正常,相应报警系统是否有动作;并检查各回路开门是否在正常位置。
4.消防系统:注意各种消防设备压力表是否处于正常状态。各放气按钮铅封是否完好。
5.门禁系统:注意机房内外应当关闭的门是否关闭。
6.机房环境:及时清理机房内杂物,检查机柜扎线情况,将推车等放置整齐,保持机房卫生整洁,维持机房秩序有条不紊。机房内是否有异常情况,如异味、异响等,如果有异常情况,需查找异常情况原因并进行处理。
信息中心
2020.6.16