新研究显示Kardome优于标准语音识别算法
最近的一项研究表明,Kardome的语音用户界面技术在具有挑战性的声学条件下实现了90%以上的准确性。
在此下载该研究报告
许多因素影响自动语音识别(ASR)系统的性能,包括背景噪音和混响、回声以及与说话者的距离。
为了保持竞争力,语音设备制造商和原始设备制造商(OEM)必须克服这些挑战。
Kardome的语音识别增强技术是一种基于软件的解决方案,能够使语音和语音识别设备发挥更高的准确性。它利用最先进的信号处理技术,在嘈杂的环境和远距离的情况下实现了卓越的性能。
该技术的一个重要因素是将单个说话人的声音从环境中的其他声音和背景噪音中分离出来,并将注意力集中在它身上,以实现高度准确的ASR。
为了显示我们的语音识别技术的准确性,与其他商业技术相比,我们在现实生活环境中进行了一项无偏见的研究。
我们的工程师团队分析了Kardome在各种环境中的表现与标准语音识别算法(如Alexa和Google Home使用的算法)的表现。
作为研究的一部分,我们使用放置在典型客厅环境中的智能音箱进行了这项研究。我们想看看智能音箱的ASR系统在各种模拟场景中的表现如何。
我们用扬声器播放不同的环境噪声源,如电视、厨房(有搅拌机、自来水和有人在做饭)、风扇、吸尘器和咿呀声(多喇叭的对话)。我们以不同的音量播放每种类型的声音,使我们能够评估不同信噪比条件下ASR的准确性。
Kardome工程师使用以下行业标准指标来测试智能音箱的ASR性能。
- 唤醒词错误拒绝率(FRR)。当唤醒词出现时,系统没有检测到它的百分比。
- 唤醒词误报率(FAR)。系统在不存在唤醒词时检测到它的百分比。
- 响应准确率。成功执行命令的百分比。
以下是结果的摘要。
- Kardome在唤醒词FRR检测测试中达到了90%以上的准确性。
- Kardome在所有环境中的表现都优于标准算法60%至80%,包括具有较高噪音水平的条件。
- Kardome的反应准确率比标准算法高出80%。
Kardome的技术推进了最先进的语音识别技术。随着世界朝着更多基于听众的沟通模式发展,更好的语音识别技术对于确保准确的转录和理解至关重要。
联系我们了解更多关于Kardome的VUI技术的信息
在此下载完整的研究报告