在设计中遇到了哪些挑战,是如何解决的?

作为一个语音识别装置,首先要做到的就是对于目标语音信号高灵敏的检测和对噪音源的抑制,而对于音箱这个发声装置,想要在播放音乐时依然能够接收语音指令,还需要进一步实现播放状态打断功能。
由于叮咚音箱具备低音单元,在大音量播放立体声音乐的时候,会让音箱本体的发生震动,造成一些非线性的现象,在这种情况下,传统线性原理的回声消除技术就失去了作用。
为了解决这一难题,叮咚音箱的喇叭采用全对称的设计,减少对麦克风的回馈。其次麦克风采用了双缓冲减震的设计,尽量避免喇叭震动带来的非线性回声出现。最后也是最重要的一点,叮咚音箱使用了阵列麦克风的技术,先对喇叭的方向噪音进行一定程度的抑制,在这个基础上再进行回声消除,就容易的多了。
对于语音控制设备,还有一个挑战就是远场声音识别,语音会随着传播距离的增大而有着指数型的衰减,叮咚音箱的八个麦克风阵列就可以起到大作用了,这样的设计可以做360度的音源拾取,通过阵列的形成技术,在空间形成若干个识音区域,然后把音源能量最大的方向定位为目标说话人的方向,相当于锁定了声源位置,再加上回声消除技术,这样就可以让叮咚音箱在5米左右的距离听写识别率超过99%,并在100dB音乐播放过程中实现90%语音打断唤醒率。“其实我们每一个逆向工程,反过来看都是比较简单的,但是实际上要从零做起的话,挑战还是非常大的。”科大讯飞智能终端业务线总监谢信珍说道。
从功能方面来看,叮咚音箱难免会让我们想起亚马逊的Echo,但相比之下,叮咚音箱在硬件配置和价格方面有着明显的优势,而且叮咚音箱在本土作战,拥有着科大讯飞的语音识别技术,并背靠京东微联这个大树,也更接地气。不过叮咚智能音箱若想走出国门的话,要走的路还很长。