初创2个月，排名第八。深圳首个自研大模型上榜

2023-07-28 16:54:05 来源：中华网

小大

7月26日一条大模型上榜的消息首先刷爆了AI从业者的朋友圈。

上面AI从业者说的就是，在榜单上发现了一家且唯一一家大湾区团队，而且一上榜即杀入前八。同属大湾区的其它团队，诸如华为的盘古、腾讯混元模型等均未进入到榜单，可以说这次是大湾区首家大模型团队进入了该权威榜单，并且从评分上超过了ChatGPT 和 Claude-V1.3等实力选手。

GS-LLM-Alpha的开发者为共生矩阵科技（深圳）有限公司。从工商注册信息来看，该公司是2023年5月10日注册的新公司，且无公开融资信息。主创技术团队是前深圳IDEA大模型技术成员，具备全要素大模型自主研发能力。相较于大厂和融资数亿的明星大模型团队，该团队的突然出现成为AI大模型赛道的一个强劲黑马，为本以为格局既定的大模型市场带来更多变数。

到此，值得让人思考的是，为什么这样的团队可以突出重围？实现这样前沿的技术需要什么？

新一代人工智能核心三要素是人、数据与算力。核心中的核心是人：有实际训练与模型研发经验的人。国内进入大模型赛道的玩家主要是两拨人：互联网大厂和具备大模型开发经验的创业团队。前者优势是资本，后者像共生矩阵科技这样的，优势是足够强势的技术人员。

大模型繁荣之下，其实是各种野蛮生长，具备自研能力团队少之又少。就在年初ChatGPT出圈之前，国内仅仅几个团队具备这样的条件专注大模型研发：清华智源/智谱团队、复旦大学Moss团队、深圳IDEA大模型团队，掌握大模型研发技术的核心成员少于100人。在GPT大火之后，互联网大厂快速跟进，但最难解决的是人才。大厂习惯的怼人和怼资源的模式，在研发大模型上体现了超出预期的成本，同时又面临着开源模型和更强的模型出现，那么竞争的意义何在？

以共生矩阵这样初创团队为例，在资源有限的情况下，通过短短数周的准备和训练，就能实现高性能大模型，刷新小规模模型在C-Eval的评分。这足以说明新一代人工智能的竞争将是技术代差的竞争。

同时也简单介绍一下市面上最权威的大模型测评：C-Eval ，覆盖内容广泛，包括STEM、社会科学、人文能力、和其它一些学科，成为大模型全球公认的客观评分标准。