多位发言人对汽车语音识别质量的影响
背景噪音和多人交谈的存在会削弱汽车中的语音识别质量。阅读关于Kardome基于位置的信号分离软件如何穿过噪音的研究报告。
80年代中期,别克在其全新的Rivieras豪华轿车上推出了一个结合了 "娱乐 "和 "信息 "的系统,配有9英寸屏幕。但是,不幸的是,这种未来主义的奢华未能坚持下去。
二十年后的今天,车载信息娱乐系统是客户购买新车的最重要因素之一。
今天,制造商为经济型汽车配备了先进的信息娱乐系统,可以实现多种基于语音的任务。
语音交互是联网汽车中信息娱乐系统执行的最重要功能之一。我们使用语音交互来拨打免提电话,并执行诸如获取方向、预订机票或播放音乐等任务。
我们最终将使用语音交互来激活甚至是驾驶我们的汽车。因此,车内使用是语音助手采用的一个重要驱动力。
考虑到免提通信,许多信息娱乐系统的语音质量是可以接受的。此外,绝大多数(如果不是全部)系统都符合国际电信联盟(ITU) P.1100标准,即使在有道路噪音的情况下也是如此。
然而,正如之前的一篇文章《汽车中的语音识别--VUI实验研究》所指出的,道路、风和其他背景噪音会降低汽车中的语音识别质量,进而对语音助理的表现产生负面影响。
此外,多人交谈的存在也会影响语音识别质量。
在与HEAD Acoustics, GmbH(音频和振动分析的全球领导者)的合作中,我们分析了汽车中免提电话的语音质量,重点是多人同时说话的使用情况。
我们还测试了语音识别率,并分析了从0公里/小时到120公里/小时速度下的语音质量。我们使用雷诺梅甘娜GRAND Tour的现有信息娱乐系统进行研究。
两阶段的研究表明,Kardome基于位置的音源分离技术超过了现有的车载免提电话(HFT)和语音识别系统。
请在下面注册以阅读完整的研究报告。