银监会在《商业银行数据中心监管指引》中明确要求“商业银行每年至少进行一次重要信息系统专项灾备切换演练,每三年至少进行一次重要信息系统全面灾备切换演练,以真实业务接管为目标,验证灾备系统有效接管生产系统与安全回切的能力,并且积极建设自动化运维工具平台,逐步达到75%的自动化覆盖率”。
随着银行信息系统不断发展,灾备真实切换、灾备模拟演练等灾备使用场景的操作也日趋复杂,传统人工操作方式的操作风险较高,而操作效率却比较低下,灾备切换等实施工作已逐步无法满足信息系统发展的要求。
某一线城市农村商业银行是北京中亦安图科技股份有限公司(简称:中亦科技,股票代码:301208)核心客户之一,在为客户提供多年IT基础架构服务的基础上,了解到客户对于灾备自动化切换有着迫切的需求,公司基于亦维灾备自动化管理平台(EVO-DR),结合客户业务系统及整体基础架构情况,帮助客户最终实现了两地三中心的灾备自动化切换,在灾备演练中,各项技术指标远超监管要求,得到了客户的充分肯定。
项目背景:
该客户数据中心已上线监控系统,运维标准化和流程化也具备了一定的基础,且已完成两地三中心灾备体系建设,核心业务系统 100多套,涉及主机、网络、存储2000多台。目前灾备切换模式仍然以人工手动为主,由于系统数量多、种类杂,操作过程中各种状况频发,难以实现预期的RTO目标,导致切换效率低下且结果不可控,严重影响整体运维管理的效率和质量,针对以上用户痛点,中亦科技为该银行构建了一个以业务为中心,以流程为导向,符合ITSS、ITIL、ISO20000、ISO27001国际标准的IT运维管理体系,实现灾备切换的标准化、可控化、自动化和可视化,提升工作效率降低人工操作风险。
实施方案:
中亦科技对客户进行了完备的调研、测试工作后,安排运维经验丰富的实施工程师,详细梳理每套业务系统的切换流程、步骤、命令和脚本,形成完善的切换操作手册,确认灾备切换场景预案,并对核心步骤和脚本进行充分测试,对于核心系统进行主备切换测试,按照梳理好的切换步骤和灾备预案,定义每套业务系统的切换流程和切换场景。
灾备切换平台架构
由于灾备切换涉及到两地三个中心区域,给跨地域、跨中心的统筹工作带来了许多技术难题:
• 业务系统架构不断更新迭代,灾备切换流程包括网络层面、服务器层面、应用软件层面等也需要随之不断的调整,中亦科技部署的灾备自动化平台提供了灵活、便捷的灾切流程编排模块,可根据需要快速调整灾切流程,并提交审批。
• 客户指定tomcat版本在部署过程出现的不适配等系列问题,工程师们紧急调整配置文件,保证软件在任何条件下都可以发挥最优的性能,实现价值最大化。
经过中亦科技的工程师们夜以继日模拟与测试,梳理每个应用系统灾备切换步骤流程、完善切换脚本,组件封装、切换场景梳理定义测试投产以及灾备切换演练,在充分考虑用户当前运维现状的基础上,应用先进技术平台,适配传统运维架构和X86云化架构统一的自动化运维平台,将日常运维工作在标准化的基础上封装到自动化运维平台中,提高运维效率降低操作风险,最终完成自动化运维基础平台的搭建。
功能特点:
用户角色与权限:通过详细权限定义角色,用户与角色相结合,保证授权最小化,通过程序自动定时赋予/撤销权限,与流程管理平台结合进行授权审批。
脚本管理:提供脚本全生命周期管理,集中加密存放在平台数据库,授权方可访问;提供脚本批量导入导出功能,方便线下脚本导入平台;提供脚本参数配置,提升脚本易用性;提供脚本敏感字过滤提醒及执行阻断功能,提升脚本审核的效率,控制脚本执行的风险;
调度引擎:流程操作界面可视化;支持串行、并行、分支、跳转、人工干预、批量参数导入和变更;支持暂停、继续、终止、跳转、断点继续、人工干预等功能;支持自定义流程节点。
大屏展现:切换过程动态大屏展现,为决策层、指挥层、操作层提供全方位动态视图展现,主要包括切换过程以及相关业务指标的动态展现。
领导视图大屏展示
工程师视图
项目成果:
• 完成自动化运维基础平台的搭建,实现主机设备纳管、批量操作、作业管理、脚本管理、调度引擎等基础功能;
• 实现自动化变更,将大量、重复的运维操作形成SOP,通过对脚本的服务化封装实现这些工作的标准化和自动化操作,提高运维效率,降低操作风险;
• 支持脚本统一管理,脚本必须支持加密存放到统一平台中,并提供以下管理功能:类型管理、版本管理、配置对比、参数配置、多人审核、权限分离、阻断终止等;
• 实现整体容灾环境全局一体化监控和场景化预案定制,灾备切换及容灾演练过程可视化管理,切换过程自动化实现,结合可视化的展现,形成统一的灾备管理工作支撑平台;
• 实现灾备系统切换自动化,通过灾备系统自动化切换平台,替代手工切换操作,实现切换全流程的自动化执行,以提升切换效率,降低切换人为操作失误概率,确保灾备系统切换安全性。
• 实现灾备系统切换流程可视化,通过可视化的方式对灾备系统切换流程进行全方面监控,支持大屏展示视图,支持对切换流程进行全方位监督与控制,更直观地展现切换流程的进展情况。
• 实现灾难应急场景模块化,通过场景定义,生成应急场景下的应急处置操作手册、操作流程。支持模块化组合,可根据实际需要组合多个子模块形成场景后进行切换演练,直观了解切换整体流程。
• 实现灾难恢复预案管理模块化、原子化,实现对预案模板的增删改查功能,支持预案模块化组合功能,通过定义原子化预案模块,根据不同应急场景产生专项应急预案。
• 提供灵活的Portal界面,支持和客户已有的SSO(单点登录系统)或AD进行集成对接,完成用户的统一管理、统一认证、统一授权、统一入口、统一平台,实现系统自动化、网络自动化、应用自动化的集中运维管理。
发展数字经济、建设数字中国已经上升为国家战略。作为数字经济的重要生产要素,数据在提高社会生产和运行效率等方面发挥着重要作用。在此背景下,做好灾备建设,保障极端情况下的灾难恢复和业务连续性,具有重要意义。中亦科技将继续输出自身在灾备建设方面的技术储备和最佳实践,让灾备系统不再成为空中楼阁,为国计民生数字化转型保驾护航。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com工业级强固型嵌入式平台厂商Neousys宸曜科技宣布其SEMIL-1700GC系列现已支持NVIDIA RTX A2000 Ampere...
工业级强固型嵌入式平台厂商Neousys宸曜科技宣布其SEMIL-1700GC系列现已支持NVIDIA RTX A2000 Ampere...