引言
近年来,在云计算蓬勃发展的同时,异构计算市场也乘风得到了长足的发展。在多种数据类型和场景的驱动下,异构计算发展飞速。与此同时,金融信创也如火如荼地开展,金融信创如何在满足当前需求的情况下,为异构计算做好准备,让信创建设在数字化转型中发挥更大的价值,是金融信创建设需要思考的重要问题。本文对信创场景下的异构计算的内涵和外延进行了梳理,并基于金融行业的实际需求,对企业级云平台面向异构计算趋势应该重点关注哪些方面进行了探究。
拆解异构计算
异构计算,是指不同架构的计算。intel x86架构CPU无论是在性能还是生态方面都十分优异,在桌面端和服务器端长久以来占据优势地位。在很多场景里,用户已经习惯了大部分,甚至所有的计算任务都交给CPU,仿佛CPU已约等于x86一种架构,且CPU里面的逻辑核就应该是相同的。但随着云计算的普及、AI的爆发、计算场景的丰富,CPU作为通用处理器处理特定场景的计算任务的瓶颈越来越突出,大家越来越需要使用不同架构的专用芯片来进行计算。
在信创场景下,异构计算还有更深的意义。按照不同的维度进行划分,信创场景下的异构计算,可以分为三类:
(1)计算场景的异构
这是通俗意义上的异构计算,将原本是CPU处理的场景,解耦出来由专用芯片进行处理。
如GPU对图形数据、机器学习数据的高效处理、DPU对网卡和存储等数据的高效处理。之所以要将这些特定场景的算力从CPU解耦出来,是因为随着摩尔定律走向终结,业务对性能的要求越来越高,CPU无法满足所有场景的需求,解耦出来的场景通过专用芯片,能更高效、更灵活的对相关场景进行算力支持。
对于计算场景的异构计算趋势,很多人认为这是计算机体系变革演进的必然。2017年图灵奖获得者在2019年发表的论文《计算机架构的新黄金时代》中预测特定领域体系架构(DSA)芯片是计算机架构的未来机会。
GPU和DPU是近几年发展最迅速的DSA。
GPU,Graphics Processing Unit,直接翻译就是图形处理单元,最开始只是作为图形计算的专用加速器。但是当GPU向通用化发展,能处理非图形化数据,并且拥有体系化的编程框架(如NVIDIA的CUDA)之后,GPU的应用场景越来越丰富了。尤其是与AI的结合,让GPU在并行计算、数据处理方面远超CPU的优势发挥得淋漓尽致。因此,高并行计算类的场景由GPU接管后,很难再回到CPU了,这是典型的基于计算场景的异构计算。
DPU,Data Processing Unit,数据处理单元,顾名思义就是指专注于数据处理的芯片。根据Fungible和AWS的统计,在大型数据中心中,流量处理占到了计算的30%左右,即数据中心中30%的计算是在进行流量处理,有个形象的说话叫做30%的数据中心税。CPU的特点是擅长逻辑判断和串行数据运算,在很长时间里,宝贵的CPU资源不得不挪出30%用于“数据中心税”。而DPU最重要的作用就是直接处理数据流量,让CPU完全不用浪费资源用于数据通信,更专注于逻辑业务处理。
金融作为一个信息化发展最快的行业,复杂的业务场景必将也需要对计算场景进行异构,将GPU、DPU等充分的应用的数字化建设中。
(2)计算性能的异构
相比于传统x86芯片的同构多核,以ARM为代表的后起之秀,在芯片架构上进行了创新,采用了异构多核的芯片架构。芯片里面的核心分为大小核,可以根据业务实际需求,对大小核进行灵活调度,更高效、更节能。ARM类芯片在PPAC(Performance 性能、Power 功耗、Area 面积、Cost 成本)方面的平衡性优势,符合绿色计算、低碳等概念,近年来也得到了很好的普及。
金融业务可以利用这个特性,将性能、功耗、业务需求融合,达到一个平衡,实现绿色计算的效果。
(3)CPU架构的异构
CPU架构的异构,指的是采用不同架构的CPU搭建计算平台。相比于长期以来x86架构CPU一统江湖的局面,近几年,世界上主流的互联网公司,基本上都在使用ARM、RISC-V等非x86架构的CPU作为新的算力来源。
在信创方面,CPU架构的异构更具特别意义。现今信创CPU技术路线较多,分为x86、ARM、LoongArch、Alpha四条路线,还有不断发展的RISC-V将来也可能异军突起。可以说,整个计算机领域的CPU架构的百花齐放,增加了信创CPU多技术路线发展的合理性与可行性。
金融信创建设时,不建议选用单一CPU架构技术路线,而应该充分发挥不同架构CPU的优势,选用多条技术路线,让业务能更科学、更高效的承载。
异构计算引发的计算机体系变革对于信创云计算的意义
云计算作为信息化建设的基座,被证明是大规模资源调度管理的最佳实践,其价值已经被广泛认可了。面对异构计算这种计算机体系层面的变革,云计算领域必将需要进行升级进化,实现对异构计算更好的支持。信创建设,不是采用落后生产力代替先进生产力,而是采用一套合规的、安全的、可控的技术体系与前沿的技术相结合,来实现数字化转型。在金融以及其他行业的信创建设中,异构计算和云计算作为先进生产技术的代表,两者的结合必将是实现数字化转型成功的重要支撑。异构计算趋势对于信创云计算领域主要有三个方面的意义:
(1)提升云计算性能
DPU异构计算的加入,可以自建总线架构,直接控制SSD、GPU等,让数据流量可以不经过CPU,为云计算服务器集群建立一个低时延、低抖动、高可靠的数据交换网络。并且,DPU的可编程性让未来对更多协议的支持,以实现更高性能的提升提供了美好的畅想。不用交“数据中心税”的CPU,可以让云计算虚拟机的vCPU充分用于业务处理,让云计算性能得到极大的提升。
(2)扩宽云计算边界
无论是计算场景的异构,还是计算性能的异构或者CPU架构的异构,都丰富了计算场景,云计算对异构计算的支持,能让云计算在更多场景中使用,扩大云计算应用边界。一个面向未来的云计算平台,必将对异构计算的模块进行更精细化的管理,进行更灵活的调度,让云计算的价值在各种业务场景中充分发挥。
(3)促进云计算落地
信创场景下,多技术路线的异构CPU,需要一个统一的管理平台对硬件资源进行抽象和解耦,屏蔽底层资源的不同,统一以云服务的方式提供给业务层使用,用标准化和灵活度来解决IT资源规模化和复杂化的管理问题。同时,异构计算在安全性提升方面也具有优势,可以规避很多安全风险,让云计算在信创场景更具有可落地性。
面向异构计算趋势的金融企业级云平台功能设计
(1)异构CPU的管理
金融信创云,需要的是一个能将所有底层的企业级服务器虚拟化能力,在多种技术路线的信创CPU上完全实现的云平台。
在全平台,面向全场景,实现一云多芯的效果。云平台需要以集群的方式对异构CPU资源进行管理,进行统一监控、统一运维。对于不同厂商的同构芯片,实现跨芯迁移也是必要的,比如海光CPU集群资源与intel集群资源,鲲鹏CPU集群资源与飞腾CPU集群资源的互迁。
由于CPU架构原因,不同CPU无法以同一个集群的方式进行调度使用,在网络层面,可以基于SDN技术实现异构资源的统一组网。在云平台核心的服务器虚拟化层面,实现在一个VPC里对异构虚拟机进行组网,以应对丰富的业务需求。
对于GPU、DPU等特定领域架构芯片的支持,信创云平台需要通过直通或者SR-IOV的方式实现软硬件对接,并对兼容性问题进行技术攻关。
面向异构计算,信创云平台需要有极强的开放性以实现对不断丰富的IT资源的兼容,向上需要通过接口与其他管理平台实现对接,达到融合管理的效果;向下,需要通过南向接口与丰富的硬件对接,将所有异构资源统一管理,并进行软硬件集成,充分挖掘异构资源算力价值。
(2)资源精细化管理
信创云平台应该重点关注的第二个方面是,对虚拟机和底层资源进行更精细化的管理,为异构计算提供一个更稳定、更高效的虚拟化底座,实现企业级信创云的功能。
如果说现阶段云计算平台主要是对虚拟机的管理,面向异构计算,云平台更多的将是对底层异构设备如DPU、CPU、GPU、以及其他DSA芯片的精细化管理。比如:vCPU的QoS设置,需要精细化到CPU大小核层面,让业务充分利用异构计算的价值;对内存和IO的精细化设置,如内存QoS策略设置、内存大页设置、NUMA功能的支持、多队列设置、MTU设置等;
网络精细化设置方面,可以通过网卡聚合、虚拟机多网卡、分布式虚拟交换机等手段实现,可以通过设置业务优先级、缓冲带宽与平均带宽以及对IP广播包限速等方式实现丰富的网络QoS,可以通过对ARP广播包限速、DHCP报文进行抑制、设置IP/MAC防欺诈以及安全组设置功能实现云平台的网络安全。
(3)云平台底层虚拟化功能加强
可以看到,相对于更侧重云服务能力的云平台,异构计算对云平台底层的服务器虚拟化层提出了更高的要求。面向异构计算趋势,建议企业级的金融信创云平台补齐短板,在以下几方面进行底层虚拟化功能的设计和产品化打造:
1.资源灵活调度
云平台的连续性保护功能可以实现对资源更科学的调度和使用,保证业务的稳定,需要借助虚拟化层面对资源的灵活调度功能。DRS(分布式资源调度程序)和DPM(分布式电源管理)是国外服务器虚拟化领导者VMware上实现的比较成熟的功能,可以基于集群内每台物理机的资源使用情况对虚拟机进行灵活调度,让资源的使用处于一个最合理的状态。亲和性检测功能也是一个非常实用的功能。对于某些业务,比如数据库主备节点,适合放在不同物理机上的虚拟机上承载,对于某些存在关联的业务,适合在同一物理服务器上的不同虚机实现,通过设置非亲和性策略或者亲和性策略,可以实现以上效果。
2.虚拟机高可用
在信创虚拟化平台上对集群和虚拟机设置高可用,可以在承载业务的虚拟机宕机时最大限度的降低对业务的影响。
在开启的高可用的集群中,某一台计算节点出现故障,通过心跳检测,该节点上的虚拟机将按照既定策略自动的迁移到同集群的健康节点,保证业务不中断。在开启了虚拟机高可用的情况下,对于意外宕机的虚拟机,可以快速实现虚拟机的重启,极大的缩短业务恢复时间。
3.服务器虚拟化层安全
数据安全是企业级云平台需要关注的重要特性。通过安全加密算法可以实现重要信息的完整性校验,保证如宿主机关键配置、虚拟磁盘文件、管理平台关键数据的完整性,防止以上信息被恶意篡改。东西向流量防DDoS攻击功能、漏扫、云WAF、态势感知等满足等保三级要求的安全功能则可以从更高维度来保障云平台虚拟化层安全。
信创从来没有弯道超车一说,没有捷径可走,对于国内厂商来说,信创建设是提供一个筑基的战略机会,应该从最底层进行技术突破,只在云管平台上进行云服务的创新,没有底层技术支持,是无法完全发挥异构计算的价值的。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com