随着当前人工智能技术普遍应用于日常生活和传统产业,对于底层芯片计算能力的需求一直 在飞速增长,其增速已经大幅超过了摩尔定律的速度。例如在2021年,由Google提出的Switch Transformer网络及Facebook提出的DLRM12T网络,分别是2017年Google提出的Transformer网络模型大小的7,600倍和57,000倍。人工智能运算常常具有大运算量、高并发度、访存频繁的特点,且不同子领域(如视觉、语音与自然语言处理)所涉及的运算模式具有高度多样性,对于芯片的微架构、指令集、制造工艺甚至配套系统软件都提出了巨大的挑战。
寒武纪的主营业务是各类云服务器、边缘计算设备、终端设备中人工智能核心芯片的研发、设计和销售,主要产品为云端智能芯片及加速卡、训练整机、边缘智能芯片及加速卡、终端智能处理器IP以及上述产品的配套软件开发平台。
寒武纪所研发的通用型智能芯片产品,具备灵活的指令集和精巧的处理器架构,技术壁垒高但应用面广,可覆盖人工智能领域高度多样化的应用场景(如 视觉、语音、自然语言理解、传统机器学习、生成式人工智能等)。与CPU、GPU等芯片相比,通用型智能芯片能够更好地匹配和支持人工智能算法中的关键运算操作,在性能和功耗上存在显著优势。根据市场调研公司 Tractica 的研究报告,人工智能芯片的市场规模将由2018年的51亿美元增长到 2025 年的 726 亿美元,年均复合增长率将达到 46.14%。随着人工智能市场需求潜力逐 步释放,通用型人工智能芯片未来将成为该市场的主流产品。
集成电路设计行业属于技术密集型行业,而智能芯片作为集成电路领域新兴的方向,在集成 电路和人工智能方面有着双重技术门槛。通用型智能芯片及其基础系统软件的研发需要全面掌握核心芯片与系统软件的大量关键技术,技术难度高、涉及方向广,是一个极端复杂的系统工程。
寒武纪凭借领先的核心技术,较早实现了多项技术的产品化。自 2016 年 3 月成立以来,寒武纪先后推出了用于终端场景的寒武纪1A、寒武纪1H、寒武纪1M系列智能处理器;基于思元100、思元270、思元290芯片和思元370的云端智能加速卡系列产品;基于思元220芯片的边缘智能加速卡。其中,寒武纪智能处理器IP产品已集成于超过1亿台智能手机及其他智能终端设备中,思元系列产品也已应用于浪潮、联想等多家服务器厂商的产品中。此外,思元270芯片、思元290芯片还分别获得第六届世界互联网大会、世界人工智能大会颁布的奖项。思元220自发布以来,累计销量突破百万片。
同时,寒武纪通过技术创新和设计优化,持续提升产品的性能、能效和易用性,推动产品竞争力不断提升。此外,寒武纪通过对硬件产品及软件生态的不断技术创新和设计优化,实现了产品的多次迭代更新,使得公司产品的成熟度达到了新高度。
2022年寒武纪的基础系统软件平台相比前期版本也进行了优化和迭代。一方面,推理软件平台持续完善了推理加速引擎 MagicMind 及其周边生态,在功能上已全面支持视频理解、图像分类、相似度检测、语义分割、文本检测、OCR、语音及自然语言处理、搜索、推荐等领域的云边端推理业务,并完善了公有云、私有云部署的功能组件及管理模块;在性能上,MagicMind 在多个领域的典型模型上,均取得不弱于同档位友商产品的表现;在兼容性上,MagicMind 达到了稳定状态,版本发布保持了对前序版本的 API、ABI 兼容。另一方面,训练软件平台的研发和改进工作亦持续进行,在功能上支撑了寒武纪新的硬件平台以及 FP19 数据精度,支撑了新的 PyTorch 版本,算子覆盖度达到 80%,TensorFlow 的算子数量及交付网络模型均有所增加,支持了包括 GPT 类语言模型在内的多种主流模型的分布式训练。
值得注意的是,各类人工智能应用厂商如能在云、边、端三个领域进行协同开发和部署,将大幅节省开发成本并提升研发效率。从硬件及开发工具角度而言,低效的软硬件生态最终会被逐步淘汰,人工智能软件生态在云端、边缘端和终端将走向一体化,同时具备云、边、端芯片产品和生态开发能力的智能芯片企业会获得更显著的协同优势。
而寒武纪研发的云边端一体化开发环境,为智能芯片/处理器产品提供统一、完整、高效的应用开发、功能调试和性能调优的软件工具链。在该软件平台的支持下,程序员可实现跨云边端平台的应用开发,大幅提升人工智能应用在不同硬件平台的开发效率和部署速度,同时也使云边端异构硬件资源的统一管理、调度和协同计算成为可能。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com