浪潮”源”大模型加速AI生产力升级

2022-06-30 15:42:42 来源：环球网

小大

近日，浪潮信息发布了基于“源1.0”大模型生成的4个技能大模型(SkillModel)，分别为对话模型“源晓问”、问答模型“源晓搜”、翻译模型“源晓译”、古文模型“源晓文”。这些技能大模型在各自细分领域的精度业界领先，可直接应用于人机交互、知识检索、语言翻译和文学创作等领域，模型运行速度最高提升9倍。更重要的是，基于大模型快速生成特定领域的技能大模型(Skill Model)，也意味着“源”的AI生产力大幅升级，能够帮助商业组织和研究机构实现对AI技术的高效、快速和低成本应用，加速产业AI化。

对此，浪潮信息副总裁刘军表示：“研发大模型需要千万元的训练成本，海量数据集及巨大的算力资源，这对很多客户来说是个巨大的门槛，我们希望通过‘技能大模型’的模型生产方式变革，推动AI生产力的升级，让行业用户甚至是中小用户也能利用大模型开展深度创新，从而加速整个社会的智能化升级。”

据悉，此次浪潮信息发布的四大技能模型，在继承“源1.0”大模型通用的知识与能力基础上，面向特定领域的场景进行针对性的技能优化，模型精度和训练效率均处于业界领先：在十分之一参数量的情况下，即可在相同任务上复现98%的通用大模型效果，推理速度最高提升9倍。

资料显示，“源1.0”是浪潮信息在2021年发布的巨量中文语言模型，参数量高达2457亿，比此前OpenAI发布的GPT-3大模型，参数量增加40%，训练数据集提升10倍，发布时便问鼎中文语言理解评测基准CLUE榜单的零样本和小样本学习两类总榜冠军。目前，“源1.0”已经相继完成了模型API、高质量数据集、模型训练代码、推理代码和应用代码等等内容的开源开放，在GitHub社区、浪潮源官网均可以申请获取相关的资源，已有超600家用户借助“源1.0”提供的数据集和API，构建了覆盖金融、互联网、医疗和自动驾驶等行业的高水平人工智能应用。

免责声明：市场有风险，选择需谨慎！此文仅供参考，不作买卖依据。

关键词：

责任编辑：kj005

文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com

关键词：

北京超算“名”“利”双收，超算商业化已经来临