随着生成式AI技术的爆发式增长,AI大模型开始渗透至手机领域,一线厂商已经把AI应用集成到各自最新的产品中,并且在以惊人的速度迭代。为了进一步提升大模型部署的效能,荣耀基于应用腾讯云TencentOS Server AI中提供的TACO-LLM加速模块部署DeepSeek-R1等开源大模型,并应用荣耀企业内部等场景,稳定性、可靠性、推理性能均大幅提升。
在推理平台场景中,荣耀侧重关注框架效能、稳定性、运行状态监控及应急预案等特性。使用TACO-LLM进行推理任务后,在DeepSeek-R1 满血版场景下,相对于荣耀原始线上业务性能,TTFT(首Token 延迟)P95 的响应时间最高降低6.25倍,吞吐提升2倍,端到端延迟降低100%。在社区最新版本sglang场景下,TTFT P95的响应时间最高降低12.5倍。

腾讯云TACO-LLM之所以能够对荣耀业务的性能提升如此明显,主要的得益于多种投机采样技术核心能力:大语言模型的自回归解码属性无法充分利用GPU的算力,计算效率不高,解码成本高昂。而TACO-LLM通过投机采样的方式,从根本上解决了计算密度的问题,让真正部署的大模型实现“并行”解码,从而大幅提高解码效率。
荣耀大数据平台部相关负责人表示:“荣耀使用腾讯云 TACO-LLM 打造高性能的AI底座,部署稳定可靠,提升了性能加速体验。”
TencentOS Server AI加速版中提供的TACO-LLM加速模块,针对企业级AI模型私有化部署挑战,对大语言模型业务进行了专门的内核运行优化,用于提高大语言模型的推理效能,提供兼顾高吞吐和低延时的优化方案,能够“无缝”整合到现有的大模型部署方案中。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:kj005
6月6日,创维举办以“这么美,还那么强”为主题的新品发布会,这无疑是一场科技与美学碰撞的盛宴机身39.9mm超薄无缝贴墙 让电视成为墙上...
发现好多宝子基础护肤做得很到位,但想进阶到高阶抗衰抗老护肤品推荐时却犯了难:不知道该选什么产品、怎么搭配... 作为护肤老司机,今天就来分享两款我私藏的安婕妤高...
继2024年以100%份额配套中标中国联通240V直流供电系统集中采购项目后,近日,天正电气(605066.SH)在中国电信240V直流电源设备(2024-20...
2025年5月29日至6月2日,第二十一届中国国际动漫节在杭州盛大举行2025年6月2日下午,随着最后一个奖项在杭州白马湖国际会展中心A2馆颁出,中国国际动漫节...
西山居十年磨一剑的科幻机甲对战游戏《解限机》正式定档2025年7月2日全球公测《解限机》官宣定档这款重量级新作的动向也引起了新华社的关注,并于今日发文报道《解限...
2025年6月5日,2025六五环境日成都主场活动在成都兴隆湖路演中心隆重举行。活动以“践行‘两山’理念 共绘绿色新篇&rd...
近日,长沙理工大学电气与信息工程学院科研团队联合国网湖南省电力公司带电作业中心,在长沙县漓湘中路成功完成了其自主研发的“输电线路间隔棒自主装卸机器人...
为深化粤港澳大湾区产业合作,加速香港优质资源与内地市场对接,2025年6月5日,由广州市番禺信息技术投资发展有限公司(以下简称“番禺信投&rdquo...
南京,2025年6月9日——日前,国家标准GB/T 45743 -2025《生物样本 细胞运输通用要求》(以下简称《标准》)正式发布细胞...
近期外卖市场竞争日趋激烈,据一项覆盖6341份有效问卷的消费调查显示:外卖用户正从单纯的价格敏感,转向为“品质确定性”买单72%用户陷&...
目前,环保已成为全球瞩目的议题,各个行业都在积极探索可持续发展的道路据Kearney发布的《2024循环时尚指数》显示,虽然全球时尚产业的可持续发展取得了广泛突...