不久前,腾讯网络的两项核心技术入选SIGCOMM 2023主会2篇论文。SIGCOMM是全球通信网络领域最具权威的会议,位列网络通信领域Top1。这两项技术的入选也意味着腾讯网络技术得到了学术界的高度认可。
除了在学术界取得成果,腾讯自研的网络技术在工业场景中也走在前沿,率先推出业界领先的大模型专属高性能网络——星脉。关于腾讯网络技术的演进历程以及大模型时代的最新数据中心网络技术,腾讯云副总裁郑亚峰表示,腾讯陪伴了行业从消费互联网走向产业互联网的整个历程。腾讯数据中心网络也伴随着市场环境的变化,历经了三代演进:
第一代,是在腾讯发展初期,数据中心网络流量主要由用户访问数据中心服务器的南北向流量构成,网络架构以接入、汇聚、出口为主。这一阶段主要使用了商用网络设备,搭建标准化数据中心网络,支撑QQ在线人数增长超过1亿,服务器规模增长超10万。
第二代,是随着大数据和云计算的兴起,服务器之间的东西向流量逐渐增多,云租户对网络产生了虚拟化和隔离的要求。数据中心网络架构逐渐演变为同时承载南北向和东西向流量的云网络架构,腾讯云构建了全自研网络设备与管理系统,打造超大规模数据中心网络,服务器规模近200万台。
第三代,是如今随着AI大模型的出现,对网络也提出了新的要求:大带宽、高利用率和无损网络。腾讯云在国内率先推出高性能计算网络,采用东西向、南北向流量的分离架构。构建了独立的超大带宽、符合AI训练流量特征的网络架构,并配合自研软硬件设施,实现整套系统的自主可控,满足超强算力对网络性能的新需求。
郑亚峰提到,在大模型时代,腾讯数据中心网络的一大利器是腾讯自研的星脉高性能计算网络。星脉网络是腾讯云专门面向AI大模型训练场景打造的高性能智算网络,具备业界最高的3.2T通信带宽,可实现通信性能的10倍提升,GPU利用率提升40%,能帮助模型训练成本节省30%~60%。基于腾讯云新一代算力集群HCC,可支持最大10万卡的超大计算规模。
郑亚峰还表示,星脉高性能计算网络的推出,是腾讯云面对大模型训练市场需求的快速响应,也是腾讯长期自研以太网全栈技术的大集成。星脉能有效帮助解决大模型所需要的高性能计算集群网络连接过程中可能出现的网络堵塞、延时、丢包等问题,让企业降本增效。没有前期自研网络技术的投入,也就没有今天腾讯第三代网络架构的进化。未来腾讯云依然会持续投入对网络技术的研发,持续迭代,为企业提供有力的技术支撑。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com