中华网科技

设为书签Ctrl+D将本页面保存为书签,全面了解最新资讯,方便快捷。
业 界/ 互联网/ 行 业/ 通 信/ 数 码/ 手 机/ 平 板/ 笔记本/ 相 机
当前位置: 科技 > 业界 >

云从科技语音技术刷新多项世界纪录 引领行业发展

云从科技语音技术刷新多项世界纪录 引领行业发展
2021-04-15 08:29:29 来源:科技日报

4月14日,记者从云从科技获悉,通过针对语音技术难点,创新提出的新模型,在语音识别、语义纠错、深度学习降噪等领域刷新多项国际、国内语音识别权威纪录,推动技术朝更智能地“听”迈进了一大步。

据了解,近年来整个人工智能语音领域取得快速发展,但目前常见语音交互场景多是在安静环境下的单人交互,在日常应用仍有诸多问题亟待突破:例如在多人场景的语音、噪声混合中,如何追踪并识别至少一个声音、正常在嘈杂环境下正常交流,也就是“鸡尾酒会问题”,仍是研究者们致力解决的难题。针对这些技术难点,云从在语音识别、语义纠错、深度学习降噪等多个方向上,创新性提出新模型,并在多个数据集上刷新最优成绩。

在语义纠错技术上,字错率降低代表使语音更准确地转换文字,纠正语义的错误。针对常见的语法纠错、拼写纠错与语音识别系统转写的错误分布差异较大、传统模型不适合直接使用等问题,云从科技提出一种基于BART预训练模型的语义纠错技术方案,不仅可以对数据中常见的拼写错误进行纠正,还可以对一些常识错误、语法错误,甚至一些需要推理错误进行纠正。在权威中文语音识别数据集Aishell和清华大学语音Thchs30测试集上,云从科技将字错率(Character Error Rate,CER)第一遍WFST解码以及第二遍RNN重打分结果分别相对降低21.7%和10.3%。

语义纠错技术的提升意味着让AI更加“听得懂”,而语音识别技术的提升意味着让AI“听得出”,即将每个人同“指纹”一样独有的“声纹”识别出来,指标提升意味着更精准识别出说话者。

语音识别技术刷新Aishell纪录,将字错率降低到4.34%,较过去最好成绩降低了8%;云从团队提出的新模型,巧妙融合了语音识别和说话人识别,提高识别率的同时,极大提升了在不同说话人场景下的鲁棒性。

深度学习降噪模型针对在嘈杂环境去除噪声,使语音更清晰。云从科研团队提出一种基于U-Net和注意力机制attention的深度学习神经网络模型CARN模型,在国际顶会Interspeech2020 DNS Challenge比赛数据集上取得了目前最好的结果。(记者 雍黎)

责任编辑:kj005

文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com
关键词:

中国人工智能领域雄起!专利申请量位居世界第一

2021-04-14 09:58:57中国人工智能领域雄起!专利申请量位居世界第一

长征七号遥三运载火箭 已安全运抵文昌航天发射场

2021-04-13 08:20:37长征七号遥三运载火箭 已安全运抵文昌航天发射场

试验六号03星成功发射升空!卫星顺利进入预定轨道

2021-04-09 08:37:35试验六号03星成功发射升空!卫星顺利进入预定轨道

第29月昼工作期:嫦娥四号着陆器和“玉兔二号”月球车计划开展4项工作

2021-04-08 08:20:44第29月昼工作期:嫦娥四号着陆器和“玉兔二号”月球车计划开展4项工作

4月7日,土星和木星将携手月球联袂上演一出“双星伴月”好戏

2021-04-06 09:06:204月7日,土星和木星将携手月球联袂上演一出“双星伴月”好戏

高分十二号02星成功发射升空!用于国土普查、城市规划等领域

2021-03-31 08:27:26高分十二号02星成功发射升空!用于国土普查、城市规划等领域

相关新闻