北京数字语音关键事件检测设计

时间:2022年07月01日 来源:

    也就是说,安装在防护舱内的用于监控防护舱内情况的摄像头,可以作为本发明实施例中关于防护舱的图像的数据来源。这样,可以通过一个设备实现多种功能,可以极大地节省成本。当然,也可以在防护舱的相关位置上安装专门用于实时采集关于防护舱的图像的图像采集设备。这都是合理的。其中,为了获得较高的关于目标防护舱的事件检测结果的准确率,人们希望所获得的关于防护舱的图像能够尽可能的包括防护舱内更多的区域,即人们希望图像采集设备的拍摄区域能够尽可能地覆盖到防护舱内更多的空间。例如,如图2所示,可以将安装在防护舱顶部的摄像头作为本发明实施例中关于防护舱的图像的数据来源。其中,摄像机的镜头可以垂直于舱顶,也可以倾斜于舱顶,与舱顶形成一定的角度,例如,不小于60度。这都是合理的。当然,在实际应用中,作为关于防护舱的图像的数据来源的图像采集设备也可以安装在其他位置,只要能够保证能够基于该图像采集设备所采集到的关于防护舱的图像,确定当前时刻,关于目标防护舱的事件检测结果即可。下面,对本发明实施例提供的一种事件检测方法,进行介绍。图3为本发明实施例提供的一种事件检测方法的流程示意图。需要说明的是。语音关键事件检测在我国是如何发展的?北京数字语音关键事件检测设计

    每种类型与某一数字对应,以便于计算机的处理,则可以分别标记为[0,1,2,3,4,...,29,30]。在本申请的示例性实施例中,因计算机无法直接处理中文,因此可以将句子(语句)中每一个单词转化为数字的映射。即,获得语句的向量化语义表示w1。在本申请的示例性实施例中,所述获得语句的向量化语义表示w1可以包括:通过双向lstm网络模型或bert模型获得语句的向量化语义表示w1。在本申请的示例性实施例中,在通过双向lstm网络获得语句的向量化语义表示w1之前,所述方法还可以包括:将语句中的m个字符随机初始化为一个维度为[m,n]的n维向量d,其中,对于从0到m-1的索引id,每个id对应一个不同的字符;对于长度为s的语句,该语句中每一个字符能够在向量d中找到对应的id,从而获得维度为[s,d]的向量。在本申请的示例性实施例中,通过双向lstm网络获得语句的向量化语义表示w1可以包括:将维度为[s,d]的向量输入预设的双向lstm神经网络,将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,假设语料中一共有20000个不同的字符(汉字和/或单词,可以包括其他常用符号),每个字符可以随机初始化为一个300维的向量,则可以得到一个维度为[20000。上海新一代语音关键事件检测介绍语音关键事件检测受哪些因素影响?

    比如人名、地名、组织机构名、时间等。4、事件检测与主体抽取:事件检测与主体抽取即为同时抽取事件的触发词和事件的主体。5、注意力机制:注意力机制的本质来自于人类视觉注意力机制。当人们发现一个场景经常在某部分出现自己想观察的东西时,人们会进行学习在将来再出现类似场景时把注意力放到该部分上。在计算某一序列表示时,注意力机制可以获得权重和序列位置的相关性。6、自注意力机制:自注意力机制是对注意力机制的改进,减少了对外部信息的依赖,更擅长捕捉数据或特征的内部相关性,无视词之间的距离直接计算依赖关系,能够学习一个句子的内部结构。7、span:span可认为是“一段区域,每个span具有一定的宽度”,就是对一段话进行固定长度的选取,比如一句话“我吃了面包,喝了牛奶”,如果span的宽度为2,则可以得到片段“我今”、“”、“天吃”等。8、span的划分:span的划分是指根据设定的span的大宽度,从小到大依次进行划分。比如span大宽度为8,则span的宽度为1-8,分别进行划分,可以得到多个span。9、span的分类:span的分类是指通过模型或特定的方法判断一条数据所属的类型即标签,一般而言,分类任务中的每条数据只属于一个类别。

    电子设备可以确定存在用户进入目标防护舱,则在当前时刻,目标防护舱内可能发生异常事件,这样,电子设备便可以继续执行步骤s303。需要说明的是,在本实现方式中,电子设备可以采用任一能够检测出当前帧图像和当前帧图像之前的连续预设数量帧图像中是否均包含目标对象的图像识别算法执行上述步骤s302a,对此,本发明实施例不做具体限定。其中,上述预设数量可以为任一正整数,例如,5,10等,这都是合理的。下面,对电子设备执行上述步骤s302a的具体过程进行说明:电子设备在获取到每帧关于目标防护舱的图像后,判断该图像中是否包含目标对象。进而,在获取该图像的下一帧图像后,判断该下一帧图像中是否包括与前一帧图像相同的目标对象。依次类推,直至电子设备判断连续预设数量帧图像后中均包含相同的目标对象后,电子设备继续获得下一帧图像,即采集完连续预设数量帧图像后的当前时刻对应的当前帧图像,并判断该当前帧图像中是否包括前连续预设数量帧图像所包含的目标对象。这样,当判断结果为是时,电子设备便可以继续执行后续步骤s303。另一种具体实现方式中,如图5所示。语音关键事件检测和摄像头有联系吗?

    该m+1帧图像便可以组成一个样本图像组,并进一步确定该样本图像组的事件检测结果为:采集该m+1帧图像时,该防护舱内发生的事件类型。具体的,当待分析图像为:当前帧图像,则场景图像检测模型为:采用各个样本图像和每个样本图像的事件检测结果所训练得到的模型,且每个样本图像为一帧场景图像。其中,针对至少一个防护舱,在该防护舱中发生各类事件时,采集一帧关于该防护舱的图像,并将采集该图像时,该防护舱内发生的事件类型作为该图像的事件检测结果,这样,便可以得到一个样本图像组及样本图像组的事件检测结果。实施例二:待分析图像为上述第二类图像,即待分析图像为:至少包含光流图的光流图;则上述步骤s303,包括如下步骤g1-g2:步骤g1:将待分析图像输入到预设的光流图检测模型中,得到光流图检测模型输出的检测结果;步骤g2:基于光流图检测模型输出的检测结果,确定关于目标防护舱的事件检测结果。其中,由于待分析图像为目标防护舱的场景图像对应的光流图,则在本实施例二中,所采用的检测模型即为预设的光流图检测模型,且用于训练该光流图检测模型的各个第二样本图像组中所包括的图像即为光流图。需要说明的是。语音关键事件检测的运用多吗?浙江自主可控语音关键事件检测介绍

语音关键事件检测主要对哪些领域有大作用?北京数字语音关键事件检测设计

    确定关于目标防护舱的事件检测结果;其中,场景图像检测模型为:采用各个样本图像组和每个样本图像组的事件检测结果所训练得到的模型,且每一样本图像组中的图像与待分析图像的图像数量相同,各个样本图像组中的图像为:所采集到的关于防护舱的图像。可选的,一种具体实现方式中,上述装置包括:光流图确定模块,用于每当获取到一帧图像时,利用该帧图像和该帧图像的前一帧图像,得到该帧图像对应的光流图;则在本实现方式中,上述图像确定模块630包括:第二图像确定子模块,用于将至少包含光流图在内的第二类图像确定为待分析图像,其中,第二类图像中各个图像的类型均为:基于每两帧连续的关于目标防护舱且包括目标对象的图像获取的光流图,光流图为当前帧图像对应的光流图。可选的,一种具体实现方式中,第二类图像为:包括光流图和光流图之前的连续n帧光流图的多张图像;其中,n为正整数;或,第二类图像为:光流图。可选的,一种具体实现方式中,上述结果确定模块640包括:第二图像检测子模块,用于将待分析图像输入到预设的光流图检测模型中,得到光流图检测模型输出的检测结果;第二结果确定子模块,用于基于光流图检测模型输出的检测结果。北京数字语音关键事件检测设计

信息来源于互联网 本站不为信息真实性负责