一场疫情让我们意识到抵御危机的适应能力有多么重要,灵活与韧性成为各行各业追求的目标,数据中心领域也不例外,数据中心的韧性会成为决定未来数据中心成败的重要条件。
四方面增加数据中心韧性
韧性数据中心的概念从韧性城市延伸而来,韧性城市是指一座城市在面临如经济危机、公共卫生事件等各种风险时,能够有效预测、应对并从中恢复的综合能力。在国内,“韧性城市”这一理念已经被写入中央到地方的《“十四五”规划和2035年远景目标纲要》中。
随着数字经济时代的加速到来,数据中心成为最重要的基础设施之一,数据中心的韧性显得尤为重要。要想增加数据中心的韧性,需要从团队建设、制度建设、应急预案和减少人为失误四个方面增强数据中心的运维服务能力。
有孚网络作为国内领先的新型云计算数据中心服务商,在20多年的数字化实践过程中,形成了数据中心与专有云服务双轮驱动、面向未来构建基础设施和云计算的双栖生态。
在运维方面。有孚网络凭借 20 多年丰富的数据中心运维管理经验,打造了完善的服务体系,并长期致力于为客户提供全方位的服务能力与面向未来的业务策略,保障客户从数据中心建立,到托管服务,云管理平台,以至业务拓展的全面服务流程,实现了一站式交付和管家式服务,保证客户及合作伙伴获得更加优质的IT服务和体验。
下面,我们来看看有孚网络在团队建设、制度建设、应急预案和减少人为失误四个方面都采取了哪些措施。
打造一流团队,完善制度建设
首先看运维团队。
有孚网络始终坚持为客户提供全年7*24小时不间断服务,将客户需求放在第一位,以符合国内、国际标准的安全性、可用性为用户提供可持续性的业务保障。全方位、多层次地打造了一支技术过硬、高职业素养的员工队伍。
根据运维工作的分工,有孚网络分别设有设施、监控、服务、网络、安全等负责人,其中设施组负责人又分为强电主管、暖通主管、弱电主管。运维部的员工虽然个个都是身经百战,经验丰富的老师傅,但是仍乐此不疲地积极参与有孚网络定时举办的内部专业技能培训和行业专业证书的认证。
其次看制度建设。
数据中心管理涉及专业设备多,人员团队数量大,为确保质量意识及服务意识的贯彻,需要确保政策先行,为运维工程师日常工作提供可靠的管理依据。为此,有孚网络打造了超全的运维管理体系。力争在运维方面减少失误、遗漏,以较高的工作效率和组织能力,满足用户的需求。
有孚网络的数据中心管理制度参考ISO体系标准、uptime M&O体系架构编写,共计约二十几个管理项目,涉及文件、资产、容量、业务连续性、变更、配置、事件、运行维护、问题、安全、流程等各方面,约近200个文件及记录表。
除此之外,有孚网络还制定了详细的设施管理方法。
在监控方面,通过各个动环监控系统对设备设施进行全天候不间断监控,通过对不同的设备设施进行监控阈值设置,当运行数据、状态出现偏离后立即触发告警,运维工程师会马上到现场查看确认故障原因,及时处置故障。
在巡检方面,有孚网络通过对各主要设备设施进行巡检规划,按照巡检路线对设备设施进行重点检查,并与监控系统相结合,复核运行数据及状态是否在安全运行,发现隐患及时排查原因并进行有效处理。
在维护方面,根据各个设备设施制定不同的维护保养内容、周期,明确耗材更换时间,有效修正运行状态、排查安全隐患,保证设备设施始终处在最佳运行工况。
服务至上搭建应急质量保证体系
在应急预案方面,有孚网络严格按照国际质量控制方法,根据服务水平协议(SLA)要求,秉承“服务至上,质量第一”的原则,形成了整套切实有效的机房运维服务与应急质量保证体系。
以上海地区为例。在目前新一轮疫情防控中,为了保障数据中心在疫情之下的运维工作正常开展,有孚网络根据上海市政府的管理要求并加以细化,事先对防疫管理、人员值守、食宿物资供应、巡检安全、备件调配和应急处置等方面进行了有序部署,公司总部设立了应急管理专班,开通了各个机房的疫情防控绿色通道,以保障员工、客户的安全和业务的稳定运行。
针对本次疫情,有孚网络第一时间向外发布了《告客户书》,对数据中心进行封闭式管理:进入机房人员需提前至少 1 天进行信息报备申请,需如实填写报备信息表单。应急处理可当天报备,并严格执行防疫要求(疫苗接种政策、48 小时核酸报告、健康码、行程码)。管控区内的每日卫生、每日人员信息及每日消杀工作由管控区负责人管理,并由负责人将每日情况通报给对接人。
除此之外,有孚网络数百名经验丰富的服务工程师集结待命,随时准备好协同各个数据中心给予有力的服务支撑。同时,为保障封控期间客户服务体验,已开通疫情防控绿色通道并建立专享服务团队。
人工智能辅助运维
增加数据中心的韧性要减少人为操作的失误,随着人工智能应用的普及,充分利用人工智能技术的智能运维服务已成为数据中心的重要优势。
有孚网络早已开始尝试用人工智能技术加速大型数据中心转型升级。在优化工作负载,提升资源利用率方面,有孚网络云计算数据中心的资源调度管理可以自动将资源调度到需要的地方,保障海量资源的负载均衡。从而可以实现资源的广泛共享,有效提高资源的利用率。 在环保智能化,提升运营能效方面,有孚网络所倡导的新基建解决方案,以AI技术赋能探索智慧化数据中心运营,以综合能源技术应用赋能碳减排先行标杆,通过引入深度学习,实现数据中心自动节能。
在智能运维赋能用户方面,有孚网络坚持高研发投入,引领云计算数据中心赋能创新,以AI技术赋能探索智慧数据中心运营,通过基于AI的数据分析和挖掘,可以提前预测服务器、交换机以及SSD故障,减少数据中心的宕机风险。
一流的团队建设,完善的制度建设,以服务至上理念搭建的应急质量保证体系,人工智能辅助运维以减少人为失误,有孚网络所在韧性运维方面所做的努力都是为了增强数据中心的韧性和综合能力,也数字经济发展夯实数字底座做出贡献。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com