语音识别技术对工作场所的影响

语音识别技术对工作场所的影响

随着60%以上的员工远程工作,现在对雇主来说,用正确的工具赋予他们的劳动力比以往任何时候都更重要。许多公司正在寻求通过语音识别技术来实现这一目标。

劳拉-塔特
劳拉-塔特
CMO
技术

目录

语音识别技术正在改变我们在许多行业做生意的方式。我们正处于这样一个阶段:语音识别正在融入日常生活,包括工作场所。

随着 60%以上的 员工远程工作,现在对雇主来说,用正确的工具赋予他们的劳动力比以往任何时候都更重要。许多公司正在寻求通过语音识别技术来实现这一目标。

甚至在远程工作因大流行病而增加之前,IT部门已经准备好将语音识别纳入工作场所的主流。 

根据 Gartner的一份 报告,企业对聊天机器人和虚拟个人助理的采用以及消费者对语音设备的使用越来越多,推动了工作中语音转文字应用的整合。

语音技术在工作场所的演变

语音识别技术在相对较短的时间内已经取得了长足的进步。语音命令现在被用于各种应用中,但最重要的变化之一是在工作场所软件中。 

语音到文本听写是最明显的适用于工作的语音识别技术形式。使用语音写作使工作效率提高了十倍,而不是打长篇文件或口述并随后转录文章。

语音听写软件的早期发展

在20世纪90年代初,Dragon Systems Inc. 提供了第一个商业上可用的语音转文字软件。然而,它的成本很高,而且需要对用户进行大量的培训。此外,该软件只与微软程序兼容。 

该软件的早期版本,称为Dragon Dictate,很笨重,要求用户一个一个地发音,中间要有停顿。该软件的后期版本,现在称为Dragon NaturallySpeaking,导致了连续的语音到文本听写。然而,该软件仍被限制在微软兼容的应用程序和PC友好的浏览器中。

到了2000年代中期,人们可以去当地的大卖场,甚至下载软件,花几百美元就能得到一个语音识别程序。但即使如此,工作场所的语音识别技术仍然需要至少30分钟的培训。

今天,你可以很容易地在网上获得免费的语音识别软件,或以低于100美元的价格购买。一些公司如Otter提供订阅服务,每月只需支付少量费用,而且根本不需要培训。

谷歌和微软将语音识别提高到新水平

虽然谷歌在2008年就推出了语音搜索,但直到2015年才为谷歌文档提供语音转文字(STT)。 

开发人员现在使用其基于云的API语音技术来创建各种商业和消费者应用程序。 

Voximplant就是这样一家企业它使用谷歌的云SST API为现代汽车、汉堡王和欧洲最大的银行之一Sberbank等客户建立语音识别工具。

虽然微软早在2002年就已经在以前的产品(如微软Office)中提供了语音识别,但它需要单独安装一个单独的语音识别组件。

2009年,微软发布了Windows语音识别(WSR),为Windows Vista开发。语音识别软件使用户能够使用语音来控制他们的桌面用户界面,并为电子邮件和电子文档口述文字。办公室用户也可以使用语音控制来浏览网站,操作他们的鼠标指针,并执行键盘快捷键。

微软还提供附加的语音控制程序,允许用户用语音控制Excel和其他应用程序,而不是使用键盘或鼠标。这些工具通过点击工具栏上的麦克风图标或使用 "唤醒词 "如 "Excel "来使用。 

有趣的是,谷歌并没有在其电子表格应用中提供语音命令。然而,一些浏览器扩展为谷歌电子表格启用了语音到文本的控制。

除了大型科技公司的产品,许多智能设备都集成了语音识别功能,员工可以使用大多数听写、导航、搜索和其他应用程序。

用于工作的语音技术也已经发展到包括音频和视频会议平台,如Zoom、Google Meet、GotoMeeting等。 

语音识别技术在工作场所的好处

新技术往往能对员工的工作生活产生积极影响。而语音识别也不例外。那么,语音识别技术如何帮助改变工作场所? 

提高生产力

语音识别软件的主要好处是提高生产力。用户可以口述文件、电子邮件回复和其他文本,而无需将任何信息手动输入机器。 

使用语音转文字技术消除了用户的想法和他们的数字输出之间的一个障碍--这可以简化业务流程,节省时间,并最终提高生产力。 

仅仅通过使用语音技术来减少处理文书工作,就可以节省惊人的时间。平均而言,员工花了 60%的时间来处理文件。此外,寻找放错地方的文件占用了员工30%至40%的时间。  

在语音技术的帮助下,员工可以在他们的角色中提高生产力,并专注于更高价值的任务。这意味着您的企业将更快地收到重要信息,提高整个组织的效率。

增强的移动性 

虽然大流行病大大增加了远程工作的员工数量,但为会议和其他目的的旅行长期以来一直是许多人的常规。 

语音技术的进步已经消除了与潜在客户或雇员的当面会面。 

这些发展使远程工作者在工作地点上具有完全的灵活性,并通过允许他们在任何地方完成工作来进一步提高生产力。

受伤的风险更小

语音识别技术可以缓解那些患有重复性压力伤害(如腕管综合症)的人在使用键盘或鼠标时产生的疼痛。该技术还为那些因身体或认知限制而难以使用键盘或鼠标的人提供了一种替代方案。

语音识别正在取得进展的领域

医疗保健

医疗环境可能是语音识别技术显著改善工作流程和性能的最普遍的地方之一。

例如,医生口述笔记的速度已从使用键盘时的每分钟30个字大幅提高到使用语音识别软件时的 每分钟150个字。因此,医生和护士可以优化操作,把更多时间花在病人身上,而不是手写或打医疗笔记,其中大部分是用于电子健康记录(EHR)的监管和计费信息

Nebraska Health和Baptist Health等医疗公司使用Nuance的 Dragon Medical One听写软件来缓解操作,并避免因 "繁重的文档流程 "而产生倦怠。

对于远程医疗来说,研究发现在发送电子邮件和即时信息的过程中会失去面对面的交流,因此通过互联网的语音互动可能有助于抵消这种损失。

内容创建者

语音识别技术使写作变得更加容易和快速。一般来说,普通人每分钟要打38到40个字,而听写的结果是每分钟125到150个字。使用语音识别来做笔记和听写故事是一个巨大的时间节省。 

特别是记者, 每周要花 6个小时来转录音频。人工智能驱动的语音转文字软件可以转录笔记,为记者腾出大量时间来进行深入采访和撰写文章。

社会媒体营销人员、博客作者和其他数字内容创作者受益于语音识别软件,该软件使他们能够快速搜索信息,做语音笔记,并通过听写撰写长篇内容。

法律职业

许多涉及法律文件的任务也很适合使用语音识别软件。 

除了在重要的客户会议期间通过语音起草信件或合同的笔记外,还可以通过人工智能驱动的软件快速完成,该软件可以将笔记转录为要点式文件,并突出强调面向行动的要点。 

一个例子是人工智能驱动的笔记平台Dubber(以前被称为Notiv)。该平台通过电话或视频会议自动记录和抄写会议内容,形成行动和总结。 

语音识别软件的好处对法律界来说并不陌生。在Censuswide的一项调查中,英国 82%的受访 法律公司表示他们正计划投资于语音识别技术。同一项研究发现,不使用语音识别技术的法律专业人士每天要花两到四个小时打字。

语音识别的局限性

虽然语音识别技术在过去十年中取得了重大进展,但其使用仍有许多限制。例如,背景噪音、不同的语言和口音以及其他问题给准确的语音识别带来障碍。 

正如Monument Health公司的首席信息官和首席管理官Stephanie Lahr告诉医疗 IT新闻》,虽然语音识别可以通过释放时间来改善病人和医生的体验,但临床交流是复杂的。大多数领先的语音技术软件无法将临床术语从医生和病人之间的一般闲聊中分离出来。

安全和隐私问题,特别是在医疗和法律行业,也是非常令人担忧的。例如,存储在云中的数据可能会将敏感信息暴露给黑客。另外,语音身份欺诈也是一个重要的问题,正如最近的 银行抢劫案中所看到的

集成了语音识别的设备制造商必须确保软件提供高精确度、前沿技术和语音识别功能,以提供安全的语音控制,推动其在工作场所的使用。

总结

未来的工作场所正在使用语音识别技术,导致生产力的提高,并加强有效的沟通。企业正在看到这种软件的好处,并增加其使用,这可能将导致进一步的创新。 

然而,使用语音识别工作的人的安全和保障是最重要的。尽管如此,这项技术仍然可以帮助彻底改变工作场所,使员工能够在几乎任何地方进行沟通和开展业务。 

未来的商业正在发生转变,而语音识别正在引领潮流。

了解最新的视频业务新闻、战略和见解,并直接发送到您的收件箱中!

今天就开始吧

给你的用户
一个声音

Kardome的VUI技术可以与任何支持语音的平台或智能设备整合。

多扬声器隔离

消除背景噪音

准确的语音识别