Kardome的技术使VUI能够在实际生活中发挥作用,因为那里有多个扬声器和环境声音。

汽车中的语音识别--一个实验性的VUI研究

Kardome的技术使VUI能够在实际生活中发挥作用,因为那里有多个扬声器和环境声音。

Dani Cherkassky博士
Dani Cherkassky博士
首席执行官,联合创始人
产品更新

目录


Voicebot.AI最近的一项研究显示,大约60%的消费者说语音助手是他们购买新车标准中的一个因素。超过20%的消费者表示,车载语音助手的体验是一个 "重要的考虑因素 "或 "要求"。

这项研究还显示,大约50%的汽车语音界面用户认为,在过去两年中,语音用户界面(VUI)的性能没有显著改善。 

今天,大多数人仍然认为汽车中的VUI是一个小玩意,而不是一个可以取代传统触摸屏和按钮的强大界面。虽然语音识别引擎在过去十年中有所改进,但汽车上的VUI性能仍然受到有限可靠性的影响。干扰的语音信号和驾驶噪音对最先进的语音识别引擎提出了挑战。

图1:语音控制手册

今天,汽车制造商为汽车中的VUI系统提供了一份手册,与宝马的类似。这些手册将责任放在用户身上,为VUI的工作创造一个合适的环境。

对用户的典型指示是。"请避免背景噪音","请要求您的乘客在发出语音命令时不要说话",以及类似的指示。可以理解的是,用户发现自己因不被机器理解而感到沮丧,这减少了信任和参与。 

这就是Kardome介入的地方。Kardome的技术使VUI能够在实际生活中发挥作用,因为那里有多个扬声器和环境声音。Kardome的软件使语音技术在嘈杂的汽车中发挥作用,允许多个用户同时与他们的设备沟通,而不受其他乘客的干扰。Kardome确保最佳的道路安全和卓越的司机/乘客VUI体验。 

这篇文章分享了HEAD acoustics GmbH进行的一项实验研究的结果,HEAD acoustics GmbH是声学解决方案和声音振动分析领域的领导者。该研究的目标是比较谷歌语音转文字(GSST)引擎在一辆时速120公里的汽车中与两种类型的语音处理系统获得的语音识别率(SRR):标准免提电话(HFT)音频堆栈,以及Kardome的AI驱动的信号分离和降噪技术包装在其Gavel评估套件中。 

结果显示,Kardome的技术可以提高汽车语音交互设备在任何类型的声音环境中的语音识别。

SRR评估设置 

Kardome的Gavel评估套件被安装在一辆雷诺梅甘娜Grandtour的头顶舱,紧挨着标准HFT系统的麦克风。我们在车上安装了四个人工头颅测量系统,通过一个全频段的人工嘴来传递语音。

图2:带有四个人工头颅测量系统和Kardome的标枪评估套件的评估设置。


我们考虑了三种情况。

  1. 司机的单独演讲
  2. 两个同时发言,主驾驶和副驾驶
  3. 四个人同时发言

在所有的情况下,现有的车载HFT系统和Kardome的Gavel评估套件记录了语音信号。HEAD acoustics的工程师通过比较GSTT输出的文本和司机的实际语音来测试语音识别率。

结果

图3显示了所考虑的每种情况下的SRR性能。图中的每个bin代表两种信号处理方法(HFT和Kardome)在三种策略中的每一种获得的SRR。绿色的bin对应于HFT,蓝色的bin对应于Kardome的语音聚类系统。

汽车中的语音转文字性能
图3:在车内使用Kardome和标准HFT系统时的GSTT语音识别率。

总结

Kardome的人工智能驱动的信号分离和降噪技术在所有考虑的场景中都显著提高了SRR。随着扬声器数量的增加,干扰的语音信号大大降低了免提电话系统的结果。而Kardome获得了一致的SRR性能,尽管扬声器的数量和干扰信号的数量不同。

使用诸如Kardome的VUI设计改进汽车的语音识别技术,将有助于语音助理制造商克服语音识别中的低效率问题。它还将帮助汽车制造商在即将成为一个拥挤的智能汽车语音助手功能市场中进行有效竞争。 

给我们发信息以了解更多关于Kardome的信息。