河北信息化语音服务

时间:2023年12月15日 来源:

    本发明涉及语音服务交互系统领域,特别涉及一种智能语音服务交互系统。背景技术:随着语音技术的不断发展,近年来语音识别及控制技术迅速崛起,电视、电脑等智能终端均可通过语音控制进行相应的操作,提高了用户和智能终端之间的交互体验和交互效率,有效的弥补传统的手动输入操作的不足;现有的交通管理系统中,使用时不能适时管理,使用时存在应的局限性,影响交通管理系统的使用效果;现有的语音服务中,用户拨打电信、银行等的客户电话,一般会通过ivr交互,是语音告诉打电话的人比如:1、重置密码,2、查询余额,……返回上一级菜单等等,有时候用户经常会听不清,或者没听到,又或者语音速度太慢了,语音播报的选择菜单又特别的多,按顺序播放,用户永远不知道有多少层菜单,还有自己要选择的菜单在第几层等等问题。技术实现要素:本发明的主要目的在于提供一种智能语音服务交互系统,可以有效解决背景技术中的问题。为实现上述目的,本发明采取的技术方案为:一种智能语音服务交互系统,包括处理器、服务器和后台终端,所述处理器上电连接有输入/输出模块、指令转换模块、识别模块、电源模块、和信息传递模块,所述输入/输出模块与处理器中间双向电连接。点击呼叫是指通过调用语音服务接口,通过语音服务分配的号码分别向主叫、被叫发起呼叫,建立起正常通话。河北信息化语音服务

    语音互动语音互动是指通过调用语音呼叫的API,从运营商网络向指定号码发起一通呼叫,呼叫被应答后,播放一段指定音频,用户根据音频引导,通过手机按键信息返回意图,语音平台通过消息回执返回按键信息给企业业务系统。场景:常用于手机用户的订单确认、问卷调查、满意度调查等信息。价值:通过IVR交互自动完成意图确认,减少人力投入。示例场景如下所示。主叫方:尊敬的${mcUserName}您好,这里是天猫商家事业部,想对我们的服务做一用户次调研,如您对我们的服务满意请按1,一般请按2,不满意请按3。被叫方:按1。主叫方:挂机。语音双呼语音双呼是指通过调用语音服务接口,通过语音服务分配的号码分别向主叫、被叫发起呼叫,双方接通后建立起正常通话,通话双方显示的号码均为语音服务平台号码。场景:常用于企业办公电话等,例如钉钉办公电话。价值:通过语音双呼接口,可隐藏通话双方真实号码,同时平台可留存双方通话记录。示例场景如下所示。A希望打电话给B,A单击拨号按钮后,语音服务平台分配主叫外显号M拨打给A,A接通后,语音服务平台再分配被叫外显号码N(M和N可以为同一号码)拨打给B,B接通后建立正常通话。数字语音服务内容语音服务控制装置及其方法。

    ForresterResearch在其对2021年的前列客户服务预测中指出,“随着移情成为中心舞台,语音将成为服务的渠道。”在2020年,Forrester的公司客户告诉分析师,那些因失业而需要修改公用事业、和其他关键服务支付计划的客户已经将通话量推高了50%。虽然交互式语音应答(IVR)系统通过语音识别技术的改进,在理解口语方面已经有了很大的进步,但传统的IVR系统笨重,自助自动化程度很低,高达80%的交互都交给了服务座席。当我与领导们谈论CX转型时,常被忽视的是语音技术在客户服务和销售中的作用。传统上,IVR是一个联络中心的面孔,绝大多数被用作决策树,将呼叫路由到合适的座席。相比之下,数字和消息传递技术不仅被用于通过聊天和消息传递将客户连接到联络中心座席,而且还通过会话式人工智能机器人驱动自动化。后者在一些公司引起了争论,要求删除电话号码,将部分或全部客户转移到信息渠道,通过自动化降低联络中心的成本。然而,期望客户从语音转向数字是不现实的。问题不在于如何让客户远离语音,而在于如何利用语音技术的进步与数字技术相结合,提高对口语的理解和处理能力,从而推动自助服务。根据[24],83%的公司计划在不久的将来将语音与数字渠道相结合。

    

    创建租户模型租户模型(包含Microsoft365数据的自定义语音)是Microsoft365企业客户可选择加入的一种服务,它根据组织的Microsoft365数据自动生成自定义语音识别模型。此模型针对技术术语、行话和人名进行了优化,所有这些都以安全且合规的方式进行。重要如果组织使用租户模型服务进行了注册,语音服务可能会访问组织的语言模型。此模型是通过组织中的任何人都可查看的Microsoft365公共电子邮件和文档生成的。组织的管理员可以通过管理门户在组织范围内启用或禁用语言模型。在本教程中,你将了解如何执行以下操作:通过Microsoft365管理中心注册租户模型获取语音订阅密钥创建租户模型部署租户模型配合使用租户模型和语音SDK注册租户模型服务部署租户模型之前,需注册租户模型服务。注册在Microsoft365管理中心完成,只能由你的管理员执行。登录Microsoft365管理中心。在左窗格中,选择“设置”,然后从嵌套菜单中选择“设置”,然后从主窗口中选择“Azure语音服务”。选中“允许组织范围内的语言模型”复选框,然后选择“保存更改”。若要关闭租户模型实例,请执行以下操作:重复前面的步骤1和2。“允许组织范围内的语言模型”复选框,然后选择“保存更改”。

     您知道如何订阅语音服务?

    请仔细选择能够你要求自定义模型识别的全部场景范围的数据。提示:请从与模型会遇到的语言和声效相匹配的较小的示例数据集着手。例如,可以采用与模型的生产方案相同的硬件和声效环境录制一小段有代表性的示例音频。具有代表性的数据的小型数据集可能会在你投入精力收集大得多的数据集进行训练之前暴露一些问题。若要快速开始使用,请考虑使用示例数据。请参阅此GitHub存储库,了解自定义语音服务识别数据示例。数据类型:训练新模型时,请从文本开始。这些数据将改善对特殊术语和短语的识别。使用文本进行训练比使用音频进行训练的速度快得多(分钟与天的对比)。备注:并非所有基本模型都支持通过音频训练。如果基本模型不支持该训练,语音服务将使用脚本中的文本,而忽略音频。有关支持使用音频数据进行训练的基础模型的列表,请参阅语言支持。即使基础模型支持使用音频数据进行训练,该服务也可能只使用部分音频。它仍将使用所有脚本。如果要更改用于训练的基础模型,并且你的训练数据集内有音频,请务必检查新选择的基础模型是否支持使用音频数据进行训练。如果以前使用的基础模型不支持使用音频数据进行训练,而训练数据集包含音频。

     获取基于物联网主控设备所确定的语音服务控制请求。河北信息化语音服务

若要上传数据,请导航到自定义语音服务识别门户。河北信息化语音服务

    则该模型将标记为“失败”。并非所有基础模型都支持使用音频数据进行训练。如果基础模型不支持它,则服务将忽略音频。并使用听录内容的文本进行训练。在这种情况下,训练将与使用相关文本进行的训练相同。有关支持使用音频数据进行训练的基础模型的列表,请参阅语言支持。用于训练的纯文本数据在识别产品名称或行业特定的术语时,可以使用域相关句子来提高准确性。可将句子作为单个文本文件提供。若要提高准确性,请使用较接近预期口头言语的文本数据。使用纯文本进行的训练通常在几分钟内完成。若要使用句子的自定义模型,需要提供示例言语表。言语不一定要是完整的或者语法正确的,但必须准确反映生产环境中预期的口头输入。如果想要增大某些字词的权重,可添加包含这些特定字词的多个句子。一般原则是,训练文本越接近生产环境中预期的实际文本,模型适应越有效。应在训练文本中包含要增强的行话和短语。如果可能,尽量将一个句子或关键字控制在单独的一行中。对于重要的关键字和短语(例如产品名),可以将其复制几次。但请记住,不要复制太多次,这可能会影响总体识别率。此外,还需要考虑以下限制:请避免将字符、单词或词组重复三次以上。

     河北信息化语音服务

信息来源于互联网 本站不为信息真实性负责