6月5日,2026华为云INSPIRE创想者大会Agentic Infra云基础设施技术论坛在上海圆满落幕。此次论坛以“进化,从AI Infra到Agentic Infra”为主题,汇聚顶尖技术专家、行业精英与生态伙伴,共同探讨Agentic时代AI基础设施的架构设计、技术创新与演进方向。
会上,华为云重磅解读“Agentic Infra”技术新范式——“Agentic计算机”,以四大突破极致重构AI算力底座,为中国企业Agent创新发展持续注入强劲动能!
云计算跨入Token工业时代,基础设施面临范式跃迁

华为云基础设施云服务产品线总裁 鲍亮
“Agentic AI时代正在引发计算范式的一系列根本性跃迁。”华为云基础设施云服务产品线总裁鲍亮在致辞中表示,云计算已跨入Token工业时代。
因此,华为云提出Agentic Infra新范式,核心是构建“高效Token工厂+通智一体化调度+持续学习+安全自治”四大能力,具体通过灵衢智算集群AICS打造极致效能Token工厂、以存代算提供PB级记忆空间打破Agent记忆瓶颈、AgentSphere提供高性能安全部署运行时、以及Volcano实现通智一体化调度,通过持续做强根技术,与AI智能化的技术深度融合,为千行百业提供最优的Agentic基础设施底座!
软硬芯深度协同,华为云重磅解读“Agentic计算机”

华为公司Fellow、云系统首席专家 余洲
“在Agent时代,云基础设施就是‘Agentic计算机’”华为公司Fellow、云系统首席专家余洲指出,“Agentic计算机”与传统云基础设施相比,其核心变化在于服务对象从人转向AI、面向每天万亿级Token的处理进行整体优化等方面。
为此,华为云基于软硬芯协同,以“Agentic计算机”为核心概念,构建了高效的AgenticInfra,并实现四大突破。
一是灵衢网络实现多资源一体化,把分散在数百个机柜中的CPU、NPU、SSD和内存互联起来,使它们能够像同一台计算机里的设备一样协同工作;
二是超节点规模和带宽持续演进。基于昇腾950,华为云发布1024卡的灵衢智能计算集群(AICS),让算力提升2.6倍;基于灵衢总线和弹性统一内存池,突破了大模型推理的内存墙瓶颈,更灵活地支持万亿参数模型训推;
三是推出记忆存储解决方案AMS。依托NPU直通CMS硬件(上下文记忆存储),为Agent提供PB级超大记忆空间,支持KV Cache分层池化,将缓存命中率提升至95%,成本节省高达63%。
最后是提供高性能极简网络,实现算力资源和网络IO资源的灵活配比,以及多网合一。
基于以上四大核心突破,Agentic计算机能够充分满足更高的推理效率、更长的序列和更快的推理速度的需求。

华为公司Fellow、华为云服务首席架构师顾炯炯
华为公司Fellow、华为云服务首席架构师顾炯炯指出,Agentic AI云基础设施面临小模型单卡吃不满、大模型推理PD分离资源偏科、潮汐效应等因素导致的算力资源利用率低、万卡训练集群故障爆炸半径大等核心困境,传统软硬耦合架构已无法应对。
华为云为此推出FlexNPU柔性液态算力创新架构,在业界主流训练和推理框架与昇腾NPU硬件算力层之间引入一层“软件定义调度与虚拟化”软件,实现了多模型及PD推理共卡的算子级的细粒度时空复用,硬件故障隔离以及基于透明快照的极速Serverless弹性,FlexNPU由此带来三重突破:更高效,更敏捷,零宕机,能够大幅降低大模型推理单位Token小模型算力性价比,同时将节点级弹性及硬件故障恢复时间从分钟级降至秒级,从而让用户的每一分算力投入物尽其用,让每一笔Token的支出,不再为空闲算力买单。
面向Agent时代 通智融合增强智能基础设施

云原生计算基金会(CNCF)中国区总监 陈泽辉
云原生计算基金会(CNCF)中国区总监陈泽辉现场分享了一个趋势:CNCF技术栈从云原生平台底座,到今天作为Agentic时代的引擎发展迅速。Kubernetes已经成为标准的AI操作系统,82%的受访企业在生产环境中使用K8s。目前企业优先部署Agentic AI的比例高达74%。从云原生到AI Native,再到现在的Agentic Infra,以Volcano为代表的调度编排成为决胜关键——Agentic不再是工具,而是真正的资源概念。

CNCF TOC副主席、华为云云原生开源负责人 王泽锋
CNCF TOC副主席、华为云云原生开源负责人王泽锋表示,Volcano从设计之初就针对训练和推理的工作负载做深层次优化,现在演进到全新的多调度器免锁并行架构:面向Agentic工作负载,采用极简的沙箱调度策略,调度耗时相比原来下降99%;而传统训推工作负载保持采用批量调度策略,在与Agentic调度一致无冲突情况下,仍可获得最优调度结果。
在运行时层面,AgentCube+ Kuasar的组合实现了端到端冷启动控制在50毫秒以内的突破。此外,Kthena引入更多智能化算法做路由感知,相关能力将在630版本发布,并在Kthena1.0版本达到正式可商用级别。
产学研用深度融合 共筑国产Agent基础设施护城河
先进架构还需在真实业务场景千锤百炼。论坛现场,行业领军代表分享了与华为云合作的实战成果。

香港科技大学助理教授、AReaL开源社区负责人 袁彬航
香港科技大学助理教授、AReaL开源社区负责人袁彬航分享了基于AReaL构建asearcher,训练能够自动使用搜索引擎、通过多轮迭代回答问题的智能体。
AReaL不仅在华为云上完成适配,华为云还帮助其在NPU上适配算子和参数传输模块,并完善两个在云原生场景、真实多任务RL训练中非常重要的功能——On-policy蒸馏进最终交付版本以及LoRA适配。未来AReaL2.0将面向智能体开发,提供自适应的演化基座,实现智能体轨迹数据协议、数据代理和动态进化RL模块的完整支持。

小红书大模型基建部RL引擎负责人 杨睿
在互联网应用侧,小红书大模型基建部RL引擎负责人杨睿介绍了小红书内部的全异步框架Relax。
这是基于全模态统一、生产级框架等三大支柱设计,并通过华为云完成昇腾生态的适配;通过Transfer Queue实现训推解耦,分布式Checkpoint服务保证权重同步耗时占比在5%以内,同时针对多模态训练优化了图片计算复用与混合并行策略。目前,Relax在多模态、全异步实践、Hybrid 混合部署以及Agentic RL上已经深度沉淀,未来还将支持潮汐资源下的弹性扩缩。

面壁智能端侧智能业务总经理周树峰
针对端侧部署的需求,面壁智能端侧智能业务总经理周树峰表示,面壁智能从两年前转向端侧和边缘侧,探索在相对小的参数量级上实现对标大尺寸模型的能力,核心是提升智能密度、降低训练与推理开销。
2024年9月,面壁智能4B模型已达到3.5水平,随后发布的1.3B超小尺寸模型更是越级挑战。今年,面壁智能将三值量化技术搬到华为昇腾卡上完成训练和推理验证,使模型在保持精度的同时大幅提升速度,已应用于手机、汽车等行业。

芒果AIGC创新制作中心主任 李俊俊
在行业应用领域,芒果TV AI产业化中心和智能研究中心副总经理 李俊俊介绍,AI在内容制作上经历了三个阶段:从辅助决策到与创作者实时共创,再到AI成为基础设施。目前,芒果TV推出芒果灵创AIGC创作平台,聚合全域模型,主打可控生成,其中视频模型在进行昇腾适配,它不是抽卡式的生成,而是从内容土壤里长出来的、支持团队协作与成本可控的开放生态,让AI从功能变成了伙伴。
面对Agentic时代万亿Token级的复杂任务,传统“堆卡”模式已成过去,取而代之的是一台以Token为粒度、以AI操作为对象、通智融合的“超级计算机”。
未来,华为云将致力于把“AgenticInfra”打造为中国AI产业的自主引擎,让智能体真正跑在坚实、高效的国产底座之上,共同开启智能时代的无限可能。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:kj005
6月5日,2026华为云INSPIRE创想者大会Agentic Infra云基础设施技术论坛在上海圆满落幕会上,华为云重磅解读“Agentic In...
导读2026年,随着浙江省新版中小学信息科技课程标准的全面实施,编程实操与算法思维正式纳入校内重点考核范围一、政策东风:编程教育进入“刚需&rdqu...
引言大板、岩板铺贴中,传统背胶加厚贴工艺空鼓率高筛选维度一看产品是否达到JC/T 547-2017的C2TES1级;二看是否具备中国绿十环及法国A+双环保认证;...
创业者的新机遇:云动悦修如何用AI+文化打造反内卷生态?5月27日,广州“成功没有充分条件!”马仁业老师一句掷地有声的开篇,瞬间击穿全场...
养宠家庭在挑选平价狗粮时,常担心原料造假、工艺粗糙、品控不稳筛选维度:第一,看生产工艺是否成熟,是否有自有工厂与创新工艺核心结论摘要:综合品牌方公开数据与行业信...
6月5日,2026华为云INSPIRE创想者大会Agentic Infra云基础设施技术论坛在上海圆满落幕会上,华为云重磅解读“Agentic In...
距离第六届中国(厦门)国际跨境电商展览会(中跨展)开幕进入倒计时!今年展会定于2026年6月8日—10日落地厦门国际会展中心,本届展会以&ldquo...
北美崔哥对话“孔子”:全球人文论坛国际企业家交流会于上海醉辉皇落幕2026年6月6日周六下午,由全球人文论坛组委会主办、醉辉皇倾力赞助的...
01 命运的注脚:第100例的偶然与必然2026年6月,汉中爱尔眼科医院青白科诊室里,程先生正坐在师小波主任对面,为即将进行的右眼手术做术前沟通。师主任翻开病历...
2026年6月6日上午,全球高端家电品牌AEG在苏州迎来重要里程碑——AEG电器苏州体验店正式开业。此次活动于红星美凯龙苏州全球家居1号...
当地时间6日,第六届德国中华杯乒乓球友谊赛在德国柏林隆重开幕德国中华杯乒乓球友谊赛历经多年深耕,已成功举办六届主办方表示,本届赛事将延续友好交流的初心,以乒乓赛...
6月7日,第12届北京台资企业协会青年会换届大会在北京台湾会馆隆重举行北京台协青年会换届大会出席人员合影大会依照法定流程,选举产生新一届青年会领导成员,美亚生物...
我是宝总在通讯行业摸爬滚打了十五年,从运营商省公司渠道负责人,到后来自己出来做通讯自媒体,全网积累了百万粉丝很多人问我:宝总,2026年了,通讯行业还能不能干?...
6月6日上午,以“专注精准营养 共建镁好生活”为题,2026国际营养与健康峰会暨第四届全民营养生活节启动仪式在江苏昆山成功举行本次峰会由...
【本站讯】 2026年,备受瞩目的第20届国际光环小姐大赛(Miss Aura International)迎来非凡二十载的荣耀时刻中国总决赛东莞璀璨启幕,刘紫...
导语2026 年,昆明婚纱摄影行业正加速向品质化、个性化方向转型,消费者对拍摄体验、成片效果与服务保障的要求持续提升企业核心动态详解本次升级中,熊猫影像重点丰富...
近年来,随着企业规范化发展要求不断提升,依法用工、依法纳税、依法缴纳社会保险,已成为衡量企业是否具备长期发展能力的重要标尺作为一家专注于金融服务与市场发展的企业...
导语2026 年,乌鲁木齐汽车后市场正经历从 "价格竞争" 向 "品质竞争" 的关键转型膜之星核心服务体系与差异化优势膜之星汽车贴膜门店位于乌鲁木齐头屯河区洞庭...
装修过的人都知道,厨房电器里最难选的就是集成灶其实有一个最省力的办法:看榜单一、七个榜单,七个“第一”,指向同一个名字打开太平洋科技(P...
导读在众多上海移民中介中,如何挑选深耕各国政策、能结合预算匹配合适项目的机构,是计划办理移民的家庭普遍关心的问题上海移民中介市场概览上海移民服务行业从业者数量较...
2026年6月核心结论:电教馆职业技能在线学习项目的长期价值,来自正规授权、线上学习考试、证书官网可查和专业能力提升需求导读2026年,职业技能在线学习进入更加...
当前,国内数字经济与实体经济深度融合,电子信息、先进制造、中小企业数字化转型等核心产业持续提质扩容,行业整体告别粗放式增长,进入精细化、专业化、品质化的高质量发...
2026年高端护肝片深度横评:从脂肪肝早期干预到宿醉后快速修复,基权威实测揭秘为何吉利肝(GRANVER)成为职场应酬人群与代谢综合征患者的首选护肝担当?肝脏是...
随着现代生活节奏的加快,肝脏所承受的负担日益加重当我们深入研究市场上的众多产品时会发现,能够真正经得起临床验证、拥有扎实科研支撑且具备卓越用户口碑的品牌凤毛麟角...
2026年5月1日,国家标准《家用和类似用途咖啡机》(GB/T 46503-2025)正式实施,中国家用咖啡机行业告别"无标可依"时代,迈入以国家标准为底线的品...
如今,公众对健康的重视程度逐年提高在日常健康管理中,不少群众存在典型的认知偏差从专业医学的角度来看,一切反复的疲劳、睡眠障碍、情绪压抑、身体酸痛等不适都是身体机...
2026 年,适婚年纪的年轻人们,似乎正在集体进入一种社交节能模式当代互联网语境下,大家对浪漫主义的祛魅、又在自我的文学世界里完成精神闭环,又或者,经历了几段无...
当前国内在线口语教育市场整体规模已突破420亿元,年增长率达到31%,但有超过65%的英语学习者反馈,自己正在使用的英语类APP普遍存在学习收效不明显、互动性不...