天津数字语音关键事件检测是什么

时间:2022年05月10日 来源:

    第二类图像中各个图像均为:基于每两帧连续的关于目标防护舱且包括目标对象的图像获取的光流图。具体的,在本实现方式中,第二类图像为:包括光流图和光流图之前的连续n帧光流图的多张图像;其中,n为正整数;或者,第二类图像为:光流图。也就是说,在本实现方式中,电子设备可以将所获得的光流图确定为待分析图像;此外,在获取到光流图后,电子设备可以判断光流图之前的连续n帧光流图是否均是基于每两帧连续的关于目标防护舱且包括目标对象的图像获取的,当判断结果为是时,电子设备也可以将包括光流图和该连续n帧光流图的多张图像确定为待分析图像。这样,用于确定当前时刻,关于目标防护舱的事件检测结果的待分析图像为多张,可以更充分地反映目标防护舱中用户的运动变化情况,进而提高事件检测的准确率。其中,n可以为任一正整数,例如,5,10等。基于上述对步骤s304中的说明中,对检测模型模型的描述内容,可以确定不同类型和数量的待分析图像,所利用的检测模型不同。进一步的,针对不同的待分析图像,则上述步骤s304的实现方式不同。下面,针对不同类型和数量的待分析图像,对上述步骤s304的具体执行方式,以及待分析图像与检测模型之间的对应关系进行举例说明。语音关键事件检测是高科技吗?天津数字语音关键事件检测是什么

    存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述方面提供的一种事件检测方法中的任一方法步骤。第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述方面提供的一种事件检测方法中的任一方法步骤。以上可见,应用本发明实施例提供的方案,实时获取目标防护舱的图像,并判断当前时刻所采集到的当前帧图像是否包括目标对象,由于目标对象为:能够表征用户进入目标防护舱的用户身体部位,则可以基于当前帧图像判断当前时刻是否有用户进入目标防护舱。则当判断结果为是时,便可以基于当前帧图像,确定待分析图像,进而将该待分析图像输入到预设的检测模型中,得到当前时刻,关于目标语音关键事件检测防护舱的事件检测结果。这样,由于检测模型是基于各个样本图像和各个样本图像的事件检测结果所训练得到的模型,因此,检测模型充分学习了样本图像和事件检测结果之间的对应关系。基于此,在本发明实施例中,利用采集到的真实图像来确定待分析图像,利用训练好的检测模型对待分析图像进行检测。天津数字语音关键事件检测是什么语音关键事件检测在机关单位的使用。

    根据设定的span宽度,对语句进行span划分,以将语句划分为多个span,并对每个span进行标记;其中,每个标记表示x+y+1种类型中的任意一种,1表示所述触发词的类型和所述事件主体的类型以外的其他类型。在本申请的示例性实施例中,所述对所述向量化语义表示w1进行span划分,得到多个语义片段可以包括:获取设定的span的大宽度max_span_width;根据span的宽度从1到max_span_width依次在所述向量化语义表示w1上进行选取,获得多个span的语义表示span_embedding。在本申请的示例性实施例中,所述对所述新的语义表示w3进行span分类可以包括:使用两层全连接神经网络和softmax层对每个span进行分类;其中,在训练阶段,将分类结果与带有标记的span进行误差计算和反向传播。本申请还提供了一种事件检测装置,可以包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令被所述处理器执行时,实现上述任意一项所述的事件检测方法。与相关技术相比,本申请可以包括:获得语句的向量化语义表示w1;对所述向量化语义表示w1进行span划分,得到多个语义片段;对多个语义片段进行平均池化,得到每个span的表示w2。

    检测模型为:基于各个样本图像和每个样本图像的事件检测结果所训练得到的模型。在该检测模型的训练过程中,可以将各个样本图像作为待训练模型的输入,将各个样本图像的事件检测结果作为待训练模型的输出。这样,在训练过程中,待训练模型可以学习各个样本图像中的图像特征,输出各个样本图像的事件检测结果,逐步建立样本图像的图像特征和事件检测结果的对应关系。这样,经过大量样本图像的学习,便可以得到上述检测模型。而该训练得到的检测模型也就可以用于对基于当前帧图像确定的待分析图像进行检测,输出的事件检测结果,即为关于目标防护舱的事件检测结果。显然,在训练上述检测模型时,所使用的样本图像为关于防护舱的图像。需要强调的是,不同类型和数量的待分析图像,所利用的检测模型也是不同的。为了行为清楚,后续将会对待分析图像与检测模型之间的对应关系进行举例说明。需要说明的是,上述检测模型可以在电子设备中训练得到的,也可以在与电子设备通信连接的其他电子设备中训练得到的,这样,电子设备便可以从该其他电子设备中获得上述检测模型,这都是合理的。此外,在本发明实施例中,电子设备可以检测目标防护舱内是否发生异常事件,则在这种情况下。语音关键事件检测目前使用情况如何?

    确定关于目标防护舱的事件检测结果;其中,场景图像检测模型为:采用各个样本图像组和每个样本图像组的事件检测结果所训练得到的模型,且每一样本图像组中的图像与待分析图像的图像数量相同,各个样本图像组中的图像为:所采集到的关于防护舱的图像。可选的,一种具体实现方式中,上述装置包括:光流图确定模块,用于每当获取到一帧图像时,利用该帧图像和该帧图像的前一帧图像,得到该帧图像对应的光流图;则在本实现方式中,上述图像确定模块630包括:第二图像确定子模块,用于将至少包含光流图在内的第二类图像确定为待分析图像,其中,第二类图像中各个图像的类型均为:基于每两帧连续的关于目标防护舱且包括目标对象的图像获取的光流图,光流图为当前帧图像对应的光流图。可选的,一种具体实现方式中,第二类图像为:包括光流图和光流图之前的连续n帧光流图的多张图像;其中,n为正整数;或,第二类图像为:光流图。可选的,一种具体实现方式中,上述结果确定模块640包括:第二图像检测子模块,用于将待分析图像输入到预设的光流图检测模型中,得到光流图检测模型输出的检测结果;第二结果确定子模块,用于基于光流图检测模型输出的检测结果。语音关键事件检测受哪些因素影响?天津数字语音关键事件检测是什么

语音关键事件检测的效果如何?天津数字语音关键事件检测是什么

    将w2与w4进行横向拼接得到终的语义表示w3,w3的维度可以为[n,2*d1]。在本申请的示例性实施例中,自注意力机制计算具体可以包括:将w2分别进行多次(如三次)线性变换得到w21、w22、w23,然后可以执行矩阵相乘运算得到w4=(w22*w23t)*w21,w3=w2||w4。s105、对所述新的语义表示w3进行span分类,确定每个span是否为一个事件的触发词或事件主体。在本申请的示例性实施例中,所述对所述新的语义表示w3进行span分类可以包括:使用两层全连接神经网络和softmax层对每个span进行分类;其中,在训练阶段,将分类结果与带有标记的span进行误差计算和反向传播。在本申请的示例性实施例中,得到步骤s104的span的表示w3后,可以使用两层全连接神经网络和softmax层对span进行分类。在本申请的示例性实施例中,如果如步骤s101中所述,预先对数据进行了预处理,即预先对数据进行了span分类和标记,则在训练阶段,可以将分类结果与预处理过程所得的带有标记的span进行误差计算和反向传播,并进行参数更新操作完成训练过程。在本申请的示例性实施例中,在预测阶段,根据分类的结果即可得到每个span的类型。softmax的输出是每个span所属对应类型(预处理过程获得的带类型标记的span)的概率。天津数字语音关键事件检测是什么

信息来源于互联网 本站不为信息真实性负责