●记者 吴子璇
5月27日,对于信息化技术中心核心机房运行室的张志明来说,是一个值得纪念的日子。这天,他和同事在观畴园打包了两份十六寸的披萨,庆祝他们的住校“满月日”。
坚守核心机房“战场”
核心机房运行室部分人员工作中
时间回溯到一个多月前,北京本轮疫情正处于早期阶段。为了最大程度地保障学校信息化基础设施安全稳定运行,信息化技术中心、网络研究院领导班子提前部署,修订了新冠疫情防控工作应急预案。
4月26日,核心机房运维团队调配了一半运维人员进驻学校开始了封闭保障工作。张志明作为最早一批入校封闭保障的人员,坚定地说:“核心机房是我们学校信息化的‘心脏’,我早一点入校,这个‘心脏’就能多一分保障。”
5月5日,核心机房运维人员全部到岗并进入了封控管理阶段。为了将疫情的潜在风险降到最低,核心机房运维团队按照中心的部署分为互不交叉的AB组工作,同时继续执行7*24h双人双岗工作制。测试报警、校对参数、更换备件、查看设备运行状态……核心机房运维团队以更加精细规范的运维态度,守护着学校信息化的“心脏”。
之所以将核心机房比作学校信息化系统工程建设和运行的“心脏”,是因为核心机房承载了校园网关键设备和学校信息系统设备。“核心机房的安全稳定运行,是学校信息化各项业务得以开展的基础。”信息化技术中心党委书记王继龙说。
用脚丈量核心机房
运维人员正在测量关键设备运行温度
核心机房位于李兆基科技大楼东侧,占地6000平方米,目前共有4322台套设备,每一次巡检都是不小的工作量。正是核心机房运维团队全年不间断地对电气系统、空调系统、消防系统、动环监控等各系统的安全专项检查,很多危险的苗头在警报响起之前就可以第一时间发现。
当被问到现在可以通过动环系统实时监控机房每一处,我们为什么还要人力去一遍遍巡检时,核心机房运行室主任李辉介绍说,“很多警报其实是受到了其他条件影响而次生的,通过肉眼能帮助我们准确发现问题关键点,很多危险情况动环系统还没检测出来,我们就已经快速反应、及时解决了,比如说现在的天气,昼夜温差大,单一通过设备传感器报警并不够,我们可以通过巡检时的体感温度及时调整空调等设备运行参数,避免局部热点的产生。”
7*24小时、6000平方米、4322台套设备、每天巡检八次、平均每次用时80分钟,这些可量化的数据,组成了核心机房运维团队每个人不可量化的生活。
“现在封控期间,我们每天都巡检八次,平均每三小时巡检一次,一次巡检大概用时80分钟,所以值班的一大半时间其实都是在检查设备,两万多的微信步数是我的日常。”核心机房运行室运维人员周大平说,“保持健康的体魄对我们来说很重要。”
在核心机房运维人员进入校内封闭保障40天里,运维团队完成了机房巡检320次,完成月度维护两次,季度维护一次,处理各类报警553次,成功应对大规模计划停电一次,有力保障了核心机房的安全稳定运行。
运维人员在查看设备运行参数
用心维护稳定运行
随时待命、随时补位、随时应对突发事件……早已成为运维团队工作的一部分。住校封闭后,考虑到厂商入校困难,核心机房运行室调整了精密空调等关键设备的运行模式。同时,为保障机房整体运行环境,核心机房运行室坚持每日对机房公共设备消毒,并在每个机房入口配备了一次性手套及消毒液。
做“幕后战士”,是信息化技术中心刘欣老师一直向团队灌输的概念,“我们不能出一点问题,我们出的任何问题,都会给学校工作带来严重影响,大家最好不知道我们的存在,一旦知道可能就是机房设备出问题了。”“零事故”这根弦始终在她脑海紧绷着。
“保障学校信息化安全是我们的职责。”这是核心机房运维团队对于坚守使命共同的答案。当校园信息化领域都正常运转时,这支“幕后团队”便获得了最大的喝彩。
(清华新闻网6月13日电)
编辑:覃霞
审核:吕婷