电子类语音关键事件检测服务标准

时间:2024年01月11日 来源:

    上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是。语音关键事件检测技术怎么样?欢迎来电咨询!电子类语音关键事件检测服务标准

    在本实现方式中,类图像为:当前帧图像和当前帧图像之前的连续m帧图像的多张图像,其中,m为正整数;或者,类图像为:当前帧图像。也就是说,在本实现方式中,电子设备可以将所获得的当前帧图像确定为待分析图像;此外,在获取到当前帧图像,并判断该当前帧图像包括目标对象后,电子设备可以判断所获取的关于目标防护舱的当前帧图像之前的连续m帧图像是否均包括目标对象,这样,便可以将当前帧图像和该m帧图像确定为待分析图像。这样,用于确定关于目标防护舱的事件检测结果的待分析图像为多张,可以更充分地反映目标防护舱内部空间的情况,进而提高事件检测的准确率。其中,m可以为任一正整数,例如,5,10等。s304:将待分析图像输入到预设的检测模型中,得到关于目标防护舱的事件检测结果;其中,检测模型为:基于各个样本图像和每个样本图像的事件检测结果所训练得到的模型。在确定待分析图像后,电子设备便可以将待分析图像输入到预设的检测模型中,得到关于目标防护舱的事件检测结果。具体的,在将待分析图像输入到预设的检测模型中后,电子设备可以得到预设的检测模型的输出结果,进而,根据该检测结果,电子设备便可以确定关于目标防护舱的事件检测结果。其中。海南电子类语音关键事件检测特征语音关键事件检测找鱼亮科技!欢迎来电咨询!

    在本申请的示例性实施例中,在通过双向lstm网络获得语句的向量化语义表示w1之前,所述方法还可以包括:将语句中的m个字符随机初始化为一个维度为[m,n]的n维向量d,其中,对于从0到m-1的索引id,每个id对应一个不同的字符;对于长度为s的语句,该语句中每一个字符能够在向量d中找到对应的id,从而获得维度为[s,d]的向量。在本申请的示例性实施例中,通过双向lstm网络获得语句的向量化语义表示w1可以包括:将维度为[s,d]的向量输入预设的双向lstm神经网络,将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,通过bert模型获得语句的向量化语义表示w1可以包括:将语句直接输入所述bert模型,将所述bert模型的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,所述向量化语义表示w1的维度可以为[s,d1];其中,当通过双向lstm网络获得语句的向量化语义表示w1时,d1为2*lstm隐层节点数;当通过bert模型获得语句的向量化语义表示w1时,d1=768。在本申请的示例性实施例中,所述方法还可以包括:预先将触发词的类型划分为x种,将事件主体的类型划分为y种,其中,x、y均为正整数;在获得语句的向量化语义表示w1之前。

    从而可以提高对防护舱内用户出现异常事件的检测准确率可选的,一种具体实现方式中,上述装置还包括图像判断模块;在本实现方式中,一种情况下,图像判断模块,可以用于在基于当前帧图像,确定待分析图像之前,判断当前帧图像和当前帧图像之前的连续预设数量帧图像,是否均包含目标对象;在本实现方式中,另一种情况下,图像判断模块,可以用于在基于当前帧图像,确定待分析图像之前,判断当前帧图像和在当前时刻之前的预设时长内采集到的连续多帧图像,是否均包含目标对象;如果是,触发图像确定模块。可选的,一种具体实现方式中,上述图像确定模块630包括:图像确定子模块,用于将至少包含当前帧图像的类图像确定为待分析图像,其中,类图像中各图像均为关于目标防护舱,且包括目标对象的图像。可选的,一种具体实现方式中,类图像为:当前帧图像和当前帧图像之前的连续m帧图像的多张图像;其中,m为正整数;或,类图像为:当前帧图像。可选的,一种具体实现方式中,上述结果确定模块640包括:图像检测子模块,用于将待分析图像输入到预设的场景图像检测模型中,得到场景图像检测模型输出的检测结果;结果确定子模块,用于基于场景图像检测模型输出的检测结果。通过分析语音信号的频率、幅度和持续时间等特征,语音关键事件检测系统能够识别出不同的声音事件。

    本申请提供了一种事件检测方法,如图1所示,所述方法可以包括s101-s105:s101、获得语句的向量化语义表示w1。在本申请的示例性实施例中,在获得语句的向量化语义表示w1之前,可以首先对要进行事件抽取的数据进行预处理。在本申请的示例性实施例中,所述方法还可以包括:预先将触发词的类型划分为x种,将事件主体的类型划分为y种,其中,x、y均为正整数;在获得语句的向量化语义表示w1之前,根据设定的span宽度,对语句进行span划分,以将语句划分为多个span,并对每个span进行标记;其中,每个标记表示x+y+1种类型中的任意一种,1表示所述触发词的类型和所述事件主体的类型以外的其他类型。在本申请的示例性实施例中,假设触发词的类型(可以称为事件类型)数为n_event=10,即x=10,事件主体的类型(可以称为实体类型)数为n_entity=20,即y=20,则一共有10+20=30种类型。在本申请的示例性实施例中,可以首先对数据进行span的划分。以单个句子为例,假如设定span的大宽度max_span_width=8,则可以得到多个span,需要对每个span进行标记,即确定每个span是否是触发词、事件主体还是其他类型(other类型)。在进行分类时,一共有30种类型,加上other类型一共31种。语音关键事件检测找鱼亮科技!深圳语音关键事件检测设计

通过结合语音关键事件检测和自然语言处理技术,我们可以实现更加智能的语音助手和智能客服系统。电子类语音关键事件检测服务标准

    并判断当前时刻所采集到的当前帧图像是否包括目标对象,由于目标对象为:能够表征用户进入目标防护舱的用户身体部位,则可以基于当前帧图像判断当前时刻是否有用户进入目标防护舱。则当判断结果为是时,便可以基于当前帧图像,确定待分析图像,进而将该待分析图像输入到预设的检测模型中,得到当前时刻,关于目标防护舱的事件检测结果。这样,由于检测模型是基于各个样本图像和各个样本图像的事件检测结果所训练得到的模型,因此,检测模型充分学习了样本图像和事件检测结果之间的对应关系。基于此,在本发明实施例中,利用采集到的真实图像来确定待分析图像,利用训练好的检测模型对待分析图像进行检测,便可以提高关于目标防护舱的事件检测结果的准确率。而上述事件检测结果中可以包括目标防护舱内所发生的事件类型,从而可以提高对防护舱内用户出现异常事件的检测准确率。需要说明的是,由于电子设备可以实时对目标防护舱内部发生的异常事件进行检测,则在上述本发明实施例提供的一种事件检测方法中,电子设备对实时获取的每一关于目标防护舱的图像后,判断该图像是否包括目标对象,并在判断结果为是时,执行后续步骤s303-s304。然而,可以理解的,在某些时刻。电子类语音关键事件检测服务标准

信息来源于互联网 本站不为信息真实性负责