51Sim作为51WORLD旗下的数据仿真平台,早在2020年便开始了对合成数据的技术探索与落地应用,如今已构建起了大量高质量的合成数据集及针对3D数据生产的工具链,并落地了大量的标杆案例,帮助传统行业进行数字化转型的同时也致力于有效服务AI大模型训练。
顾名思义,合成数据就是通过计算机程序或其他方式生成的虚拟数据,而非从现实世界中直接采集而来。合成数据具备更高效率、更低成本、更高质量等优势。
在中国,经过多年的技术与商业化探索,合成数据已逐渐被市场接受与认可,并在自动驾驶、金融、医疗、零售等领域落地。
51Sim利用合成技术生成的摄像头及激光点云合成数据
为了应对日常感知训练中难以获取的数据,51Sim利用先进的仿真技术构建各类低概率、高风险的边缘场景,以增加训练样本和多样性,提升感知算法泛化能力,帮助主机厂加速模型训练,有效解决预期功能安全问题。
此外,51Sim通过结合两大核心技术:传感器模型像素级标注真值输出与多传感器同步仿真技术,进一步保障了合成数据的精确性和时空一致性。
利用合成技术生成的摄像头数据
利用合成技术生成的激光雷达合成数据
51Sim自动驾驶仿真平台SimOne内置的海外交通场景
51Sim对总长10公里的真实城市道路进行高精路网还原,同时针对标志牌、周边建筑、树木等各类要素进行静态数字孪生场景构建,并借助TransAI对车流进行了模拟还原,由此形成道路数据集。
基于数据集进行事故和违章场景构建,可泛化出数十万种不同场景,最大限度还原真实交通环境中超速、违停、违章变道的相关特性。在仿真环境中输出带标签的激光雷达点云数据, 通过与感知算法识别的点云结构化结果进行对比,验证感知算法的准确性。
该合成数据集成为了真实路侧数据的重要补充,通过仿真训练,该雷视一体机厂商的数据大模型准确率提升了7%。未来,51Sim将进一步深耕合成数据技术,提供高质量的合成数据解决方案,以降低数据成本,推动AI技术的发展。
责任编辑:kj005
文章投诉热线:182 3641 3660 投诉邮箱:7983347 16@qq.com