Kardome的人工智能驱动的信号分离和降噪技术促进了在任何声学环境中的无缝语音交互,从安静到混乱。
Kardome与其他音频前端解决方案的关键区别在于,我们的技术根据位置对语音信号进行聚类。
Kardome的音源分离软件将任何环境中的每个人都当作是唯一在说话的人。这一重点与基于方向的技术形成对比,如波束成形技术,该技术在室内或任何封闭环境中提供有限的性能。
Kardome的创新语音用户界面技术使车内多人能够向其设备发出清晰、可理解的指令。它允许用户在重要的Zoom会议中被听到,将家庭生活的噪音留在背景中。
此外,Kardome的音频前端工程在任何环境下都能为用户提供清晰的音频输出。
自动语音识别(ASR)引擎,将数字化的语音信号转换成文本,直接影响到语音用户界面(VUI)的性能。
自动语音识别引擎准确翻译语音信号的能力取决于将输入信号与自动语音识别引擎的要求相匹配。因此,降噪、回声消除、声源分离和其他组件被添加到VUI中,以便在到达ASR之前增强获得的信号。
Kardome的核心技术包括语音分离和降噪(SSNR)模块,有助于在嘈杂和多扬声器的情况下实现可靠的ASR性能。
有多少次你的同事在放大会议中难以理解你?
自然环境中,除了主扬声器之外,通常还包含多个声源。声音干扰使用户的语音无法被理解,这会对重要的会议和工作产生负面影响。
在存在多种声音和环境噪音的真实听觉场景中,精确的语音识别是沮丧的用户和高效的人之间的关键区别。
Kardome的技术为用户做了艰苦的工作,使其随时随地都能被理解。在通常会抑制现有波束成形技术性能的声学挑战条件下,Kardome可将干扰信号减轻多达30𝑑𝐵。
Kardome是在任何环境下实现清晰语音识别的解决方案