随着AI的发展,人工智能技术的发展正在经历由过去的“预训练模型-特定任务精调”向“基础模型-应用反馈学习”的转变,这种转变将创造更多的应用可能性,并带来巨大的商业价值。各行各业也在积极探索AI新范式,包括通用大模型演进和利用大模型范式解决医疗、工业、办公等场景问题,新产品也已经快速融入各行各业,不断塑造新业态、新场景。
技术先行,云知声“三驾马车”做到行业领先
过去十年是鉴别式AI为主流,未来十年则是生成式AI的天下,其中生成式AI对于数据、算法、算力这三个方面都提出了更高的要求。而国内AI独角兽企业云知声研究发现,生成式AI其实和过去的鉴别式AI,在核心算法框架上来说差别并没有那么大,鉴别式AI主要研究的是数据分布,根据数据分布来区分不同的类型,而生成式AI,则是在数据分布做建模的基础之上,还要去研究数据的生成结构,特别是现在跟自然语言结合在一起以后,就可以用自然语言的方式去灵活控制它的生成的结果。
在人工智能领域,数据、算力和算法早已成为不可缺少的“三驾马车”,对于云知声来说,实际上云知声在2012年成立时就已经开始布局这三方面,也是把深度学习最早用到产业界里的公司之一。在数据方面,云知声构建了一个云平台来汇集数据;在算力方面,早期公司就布局了GPU集群,但规模并不算大,在2016年的时候,云知声开始把GPU集群升级为Atlas大规模机器学习超算平台,为未来同时调度上千块GPU做大模型做了很好的准备;在算法方面,现在语音、歌唱和虚拟人合成技术已经比较成熟,云知声在这方面的技术储备也很充分,未来还需要在多模态领域延伸,比如图像和视频的生成。多模态生成目前也都是通过自然语言来衔接在一起的,需要继续增加算力和数据,并结合应用场景进行拓展。
由点及面,云知声以医疗为切入点探索大模型在具体行业的应用
解决了技术问题,那么如何实现AI大模型在具体行业的应用呢?云知声选择以医疗英语作为切入点。云知声之所以把医疗作为一个主要方向,是因为医疗行业的知识密集程度非常高,如果在医疗领域的问题都能够处理好,相信很多其他行业也都能搞定,这对云知声来说是一个技术的制高点,所以需要攻克它。另外,医疗行业的应用场景、应用空间包括社会价值也都很大。
在数据安全性方面,特别是有些涉及用户的隐私数据,要求都是很高的,最难的就是真实的用户治疗案例,都必须经过数据的脱敏处理。另外,在云知声和医院的合作过程中,也会把数据做相应的加密和tokenization,即把数据符号化,只有机器能够知道解码后的含义。在算法方面,现在的联邦学习也可以把各种特征融合后再去计算,使得不接触初始敏感信息的情况下,还可以继续优化模型。
作为国内顶尖的语音人工智能独角兽企业,云知声十年来构建了以语音、语言和知识图谱为核心,涵盖感知、认知与生成的全栈AI技术体系,并向多模态人工智能方向拓展。如今,ChatGPT的诞生再次掀起人工智能升级,对于云知声而言,已经把ChatGPT技术升级作为公司AGI能力构建的新起点,并优先解决在智慧物联和智慧医疗领域的应用问题,并将向外拓展,赋能更多行业。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com