建行智能运维了解下(一)
建行智能运维了解下(一)
觉得干IT运维累吗?
技术架构日新月异,信息系统运维规模爆炸式增长,业务需求和监管要求持续提高,每天忙得焦头烂额,工作没有成就感,当然很累。
觉得干IT运维苦吗?
锄禾日当午,运维真辛苦,一堆告警来,一解一上午。救火、背锅、睡不了安稳觉,工作时效性强,心里压力大,宝宝心里当然苦。
觉得干IT运维Low吗?
运维过程充满了大量纷繁复杂的劳动,每一次问题的分析和故障的处置都面临着挑战,工作疲于应付,自然也就嗨不了。
相信许多干运维的人都面临着这些困惑!要想破局解困,就必须从过去的被动式运维向主动型运维转变,从操作型向管理型转变,从技术支撑到价值输出转变。那到底可以干些啥呢?
数据中心还能这么干,你很建行嘛!
抗击病毒靠药方,高效运维有秘方
2020年,突然其来的新冠肺炎疫情对许多数据中心的安全运行带来了前所未有的挑战,值班替换人员短缺、紧急变更越来越多、投产版本压力巨大。但在建行,一切都显得井然有序、应对自如:数据中心北京园区依靠一体化运维体系方便地远程接管了武汉园区的部分工作,并利用远程接入开展运维;利用智能运维敏捷投产和自动部署能力仅三个月就对300多套系统投产了1000余个版本,一天就搭建了可满足1万多人同时在线办公的环境;通过智能监控和漏洞挖掘技术,对几十套系统进行渗透测试和漏洞扫描,发现和整改了数百个各类漏洞,为集团员工在疫情发生后居家办公创造了安全可控的环境。
如果你在系统版本投产日或银行业务系统年终结算日看到只有几个值班人员在气定神闲地边聊天边工作,不用怀疑,这就是建行的数据中心!以往那种靠人肉运维的喧嚣场面已经看不见了。运筹帷幄的背后,其实是强大的智能运维体系支撑:以运行数据为核心构建的智能运维体系,利用数据与技术双轮驱动运维工作创新,让两地三中心人员可以更加高效地响应业务需求、快速地处置问题。举个例子,我们通过一键式自动化版本部署,可以支持变更自动协同、一键式回退,在2020年实施的1万多次变更中,投产日应用版本的自动化部署率超过90%,大量的变更已经无须运维人员现场值守了。
还有更多的高效运维场景正在被解锁,智能运维,真香!
冲鸭!我为业务疯狂打call
以往,我们面对“双十一”活动、纪念币预约等业务促销场景,拿提心吊胆来形容也不为过,但现在就踏实多了。我们在新一代系统优势的基础上,通过不断打磨全链路容量评估能力,采取秒级资源扩容、动态流控、故障自愈等技术,提前调配资源,可以实现分钟级动态资源池扩缩容,增强了应用性能与应急处置能力,有效保障了大促期间系统的稳定运行。就说去年的“双十一”活动吧,11月1日,全天线上支付交易总量2亿多笔,交易峰值超过1万笔/秒,交易金额700多亿元,保持了同业领先;11月11日,线上支付交易总量和交易峰值再创新高。整个活动期间,建行交易笔数及金额蝉联四大行第一,智能运维能力的发挥功不可没。
说完紧张的,再聊点儿相对轻松的。近年来,建行数据中心用实际行动全力支持全行“三大战略”的推进,譬如快速稳妥地实施了可视化项目和总行多功能展示中心工作,承接了“创业者港湾”发布会、人民大学战略合作签约、国务院发展研究中心调研等许多重要任务,成为建行展示战略成果的重要窗口、总行签约仪式和发布会等重要活动的首选场所。这不,总行的展示中心快成“网红打卡地点”了,真是圈粉哈!
同样,在数字化经营IT运营保障方面,数据中心作为行内金融科技的最终落地部门,通过科技能力创新确保任务有效落实。一是通过优化整合资源供给服务流程,提升资源供给的完整性及供给效率的同时大幅减少人工环节,实现了包括虚机资源、物理机、存储资源等所有超大批量基础设施资源的按时供给,保障“战机群”敏捷迭代。二是通过将流程与工具全面打通,实现了端到端的自动化,投产效率成倍提升,人为操作风险大幅降低,实现了去年数字化经营1000余次高频投产零失误的良好纪录。三是率先实现了毫秒级采集、1秒级运算能力,保障了数字化经营源数据到达、指标时效性分析的数据采集及监控,以及关联上下游数千个作业的监控,使监控与预测更加精准。
智能运维,让运维从干苦力变成了生产力。