在由ChatGPT引发的大模型热潮中,不少国内的初创企业希望能走出一条中国化道路。
成立于2021年的澜舟科技是由李开复的创新工场从0孵化的AI企业。据创始人周明介绍,澜舟科技致力于解决人类的语言理解和生成难题,提供基于NLP(自然语言理解)技术的开源大模型以及聚焦于营销、金融、文化创意等场景的功能引擎和应用。
2018年以来,BTA、华为等国内互联网厂商在大模型的研发上已经开始涉猎。周明发现,互联网企业的大模型主要服务于企业内部,鲜少对外赋能。研发大模型对中小企业来说有较高门槛,国内相关的AI服务较少,大多公司只能选择接入海外的开源模型。
为此,澜舟科技于2021年7月推出了孟子大模型及相关系列开源模型。基于Transformer,孟子大模型可支持以及快速替换自回归(如GPT)、自编码(如BERT)等多种预训练模型。
在周明看来,初创公司在大模型领域依然有试探天花板的机会。基于网上的公开数据和合作伙伴提供的数据,澜舟科技选择在算法能力上下功夫,而非狂堆参数的“暴力”模式。
最终,澜舟科技花了近一年的时间打磨出了孟子大模型。在模型榜单CLUE发布的中文理解评测排行榜中,孟子大模型分数突破84分,逼近人类基准分数(85.61分)。
目前,孟子大模型已开源17个模型,分别可应用于自然语言理解、金融资料分类、可控文本生成和图片生成等场景。同时,澜舟科技还为下游应用场景提供了句向量计算(用于捕捉文本间的语义相似性)和大模型定制的服务。
除此之外,面向营销、金融、文化创意等场景,澜舟科技推出了AIGC(智能创作平台)、机器翻译平台、金融NLP平台等toB+toC服务。目前,澜舟科技已与华为云、传神语联网、中文在线等企业达成合作,并与北大、清华等10所高校进行产学研的联璧。
目前澜舟科技也在打磨不同规模的ChatGPT模型,从10亿参数、100亿元参数到1000亿参数,适应不同需求。同时在大模型底座基础上,也在考虑训练垂直领域的大模型。澜舟长期以来一直从事金融领域的大模型,最近与中文在线合作宣布,合作打造一款用于网文写作的类ChatGPT模型。
澜舟科技创始人周明于1999年加入微软亚洲研究院并长期领导NLP研究,其团队为微软必应搜索、Office、Azure、微软小冰等产品贡献了核心的 NLP 技术。澜舟科技三名合伙人在大数据、人工智能等领域均有较为丰富的从业或研究经验。
“在国内开源语料稀缺的情况下,中文的数据量大概在英文的1/10,短期内,中文大模型追赶上ChatGPT有一定难度。”周明告诉36氪,“不过,只要AI大模型与上下游自上而下或自下而上形成一个良好的生态或闭环效应,国产的中文ChatGPT是可以期待的。”
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com