近日,浪潮信息发布了基于“源1.0”大模型生成的4个技能大模型(SkillModel),分别为对话模型“源晓问”、问答模型“源晓搜”、翻译模型“源晓译”、古文模型“源晓文”。这些技能大模型在各自细分领域的精度业界领先,可直接应用于人机交互、知识检索、语言翻译和文学创作等领域,模型运行速度最高提升9倍。更重要的是,基于大模型快速生成特定领域的技能大模型(Skill Model),也意味着“源”的AI生产力大幅升级,能够帮助商业组织和研究机构实现对AI技术的高效、快速和低成本应用,加速产业AI化。
对此,浪潮信息副总裁刘军表示:“研发大模型需要千万元的训练成本,海量数据集及巨大的算力资源,这对很多客户来说是个巨大的门槛,我们希望通过‘技能大模型’的模型生产方式变革,推动AI生产力的升级,让行业用户甚至是中小用户也能利用大模型开展深度创新,从而加速整个社会的智能化升级。”
据悉,此次浪潮信息发布的四大技能模型,在继承“源1.0”大模型通用的知识与能力基础上,面向特定领域的场景进行针对性的技能优化,模型精度和训练效率均处于业界领先:在十分之一参数量的情况下,即可在相同任务上复现98%的通用大模型效果,推理速度最高提升9倍。
资料显示,“源1.0”是浪潮信息在2021年发布的巨量中文语言模型,参数量高达2457亿,比此前OpenAI发布的GPT-3大模型,参数量增加40%,训练数据集提升10倍,发布时便问鼎中文语言理解评测基准CLUE榜单的零样本和小样本学习两类总榜冠军。目前,“源1.0”已经相继完成了模型API、高质量数据集、模型训练代码、推理代码和应用代码等等内容的开源开放,在GitHub社区、浪潮源官网均可以申请获取相关的资源,已有超600家用户借助“源1.0”提供的数据集和API,构建了覆盖金融、互联网、医疗和自动驾驶等行业的高水平人工智能应用。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com