天津新一代语音关键事件检测内容

时间:2023年06月23日 来源:

    目标对象为:能够表征用户进入目标防护舱的用户身体部位;可以理解的,在某些时刻,目标防护舱内可能并不存在用户,则可以确定在这些时刻目标防护舱内不会发生异常事件。因此,为了节省电子设备的资源,减轻电子设备的运行负担,在获取到当前帧图像后,电子设备便可以利用图像识别算法对当前帧图像进行检测,判断当前帧图像是否包含目标对象。其中,当判断结果为是时,电子设备可以确定存在用户进入目标防护舱,则在当前时刻,目标防护舱内可能发生异常事件,这样,电子设备便可以继续执行步骤s303。需要说明的是,电子设备可以采用任一能够检测出当前帧图像中是否包含目标对象的图像识别算法执行上述步骤s302,对此,本发明实施例不做具体限定。此外,根据实际情况中,根据采集关于目标防护舱的图像的图像采集设备的安装位置,上述目标对象所指示的具体的用户身体部位可以不同。例如,当图像采集设备安装在舱顶时,该目标对象可以是用户的头肩部;当图像采集设备安装在舱壁时,目标对象可以是用户的全身图像。这都是合理的。s303:基于当前帧图像,确定待分析图像;其中,待分析图像为:关于目标防护舱及目标对象的图像。在判断得到当前帧图像中包括目标对象后。语音关键事件检测用到了哪些技术?天津新一代语音关键事件检测内容

    将w2与w4进行横向拼接得到终的语义表示w3,w3的维度可以为[n,2*d1]。在本申请的示例性实施例中,自注意力机制计算具体可以包括:将w2分别进行多次(如三次)线性变换得到w21、w22、w23,然后可以执行矩阵相乘运算得到w4=(w22*w23t)*w21,w3=w2||w4。s105、对所述新的语义表示w3进行span分类,确定每个span是否为一个事件的触发词或事件主体。在本申请的示例性实施例中,所述对所述新的语义表示w3进行span分类可以包括:使用两层全连接神经网络和softmax层对每个span进行分类;其中,在训练阶段,将分类结果与带有标记的span进行误差计算和反向传播。在本申请的示例性实施例中,得到步骤s104的span的表示w3后,可以使用两层全连接神经网络和softmax层对span进行分类。在本申请的示例性实施例中,如果如步骤s101中所述,预先对数据进行了预处理,即预先对数据进行了span分类和标记,则在训练阶段,可以将分类结果与预处理过程所得的带有标记的span进行误差计算和反向传播,并进行参数更新操作完成训练过程。在本申请的示例性实施例中,在预测阶段,根据分类的结果即可得到每个span的类型。softmax的输出是每个span所属对应类型(预处理过程获得的带类型标记的span)的概率。河北数字语音关键事件检测供应语音关键事件检测是高科技吗?

    虽然用户进入了目标防护舱,但是用户并没有在目标防护舱内停留,而是立刻离开了目标防护舱,又或者,在某个时刻,用户从目标防护舱前路过,而在此刻采集到的关于目标防护舱的图像恰好拍摄到用户投射到防护舱门上的影子。显然,在上述这些时刻,虽然电子设备获取的当前帧图像中存在目标对象,但是,电子设备可以确定在这些时刻目标防护舱内不会发生针对该目标对象所在的用户的异常事件,进而,不需要对这些时刻获取的关于目标防护舱的图像执行后续步骤s303-s304。因此,为了进一步节省电子设备的资源,减轻电子设备的运行负担,同时也为了避免误报,电子设备可以通过多种方式来确定执行步骤s303的条件。一种具体实现方式中,如图4所示,在上述步骤s303,基于当前帧图像,确定待分析图像之前,上述本发明实施例提供的一种事件检测方法还可以包括:s302a:判断当前帧图像和当前帧图像之前的连续预设数量帧图像,是否均包含目标对象,如果是,执行上述步骤s303。在本实现方式中,在获取到当前帧图像后,电子设备便可以利用图像识别算法判断当前帧图像和当前帧图像之前的连续预设数量帧图像,是否均包含目标对象。其中,当判断结果为是时。

    根据设定的span宽度,对语句进行span划分,以将语句划分为多个span,并对每个span进行标记;其中,每个标记表示x+y+1种类型中的任意一种,1表示所述触发词的类型和所述事件主体的类型以外的其他类型。在本申请的示例性实施例中,所述对所述向量化语义表示w1进行span划分,得到多个语义片段可以包括:获取设定的span的大宽度max_span_width;根据span的宽度从1到max_span_width依次在所述向量化语义表示w1上进行选取,获得多个span的语义表示span_embedding。在本申请的示例性实施例中,所述对所述新的语义表示w3进行span分类可以包括:使用两层全连接神经网络和softmax层对每个span进行分类;其中,在训练阶段,将分类结果与带有标记的span进行误差计算和反向传播。本申请还提供了一种事件检测装置,可以包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令被所述处理器执行时,实现上述任意一项所述的事件检测方法。与相关技术相比,本申请可以包括:获得语句的向量化语义表示w1;对所述向量化语义表示w1进行span划分,得到多个语义片段;对多个语义片段进行平均池化,得到每个span的表示w2。语音关键事件检测的主要功能。

    n个摄像头11与控制器12之间进行无线通信时,所采用的无线通信协议可以为wifi、蓝牙、zigbee等。可以理解的是,n个摄像头11还可以采用其他的无线通信协议与控制器12进行无线通信,本实用新型实施例不做赘述。在具体应用中,可以在游泳池壁的四周均匀设置摄像头11。通过设置的n个摄像头,可以采集水平方向上游泳池内的图像。在具体实施中,在设置n个摄像头11时,在垂直方向上,每一个摄像头11所设置的位置与游泳池水面之间的距离可以均小于预设值。摄像头11所设置的位置可以位于游泳池水面以下,也可以位于游泳池水面以上,还可以位于游泳池水面附近。在设置摄像头11时,可以将n个摄像头11均设置在游泳池水面以下,且与游泳池水面的垂直距离小于预设值;也可以将n个摄像头11均设置在游泳池水面以上,且与游泳池水面的垂直距离小于预设距离;还可以将n个摄像头11中的一部分设置在游泳池水面以下,其余部分设置在游泳池水面以上。在本实用新型实施例中,预设值可以为50厘米,也可以为40厘米或30厘米。可以理解的是,预设值还可以为其他值,可以根据具体的应用场景设定不同的预设值。在具体实施中,在水平方向上,多个摄像头11可以均匀排列。语音关键事件检测受哪些因素影响?浙江无限语音关键事件检测内容

语音关键事件检测图片。天津新一代语音关键事件检测内容

    本申请提供了一种事件检测方法,如图1所示,所述方法可以包括s101-s105:s101、获得语句的向量化语义表示w1。在本申请的示例性实施例中,在获得语句的向量化语义表示w1之前,可以首先对要进行事件抽取的数据进行预处理。在本申请的示例性实施例中,所述方法还可以包括:预先将触发词的类型划分为x种,将事件主体的类型划分为y种,其中,x、y均为正整数;在获得语句的向量化语义表示w1之前,根据设定的span宽度,对语句进行span划分,以将语句划分为多个span,并对每个span进行标记;其中,每个标记表示x+y+1种类型中的任意一种,1表示所述触发词的类型和所述事件主体的类型以外的其他类型。在本申请的示例性实施例中,假设触发词的类型(可以称为事件类型)数为n_event=10,即x=10,事件主体的类型(可以称为实体类型)数为n_entity=20,即y=20,则一共有10+20=30种类型。在本申请的示例性实施例中,可以首先对数据进行span的划分。以单个句子为例,假如设定span的大宽度max_span_width=8,则可以得到多个span,需要对每个span进行标记,即确定每个span是否是触发词、事件主体还是其他类型(other类型)。在进行分类时,一共有30种类型,加上other类型一共31种。天津新一代语音关键事件检测内容

深圳鱼亮科技有限公司公司是一家专门从事智能家居,语音识别算法,机器人交互系统,降噪产品的生产和销售,是一家服务型企业,公司成立于2017-11-03,位于龙华街道清华社区建设东路青年创业园B栋3层12号。多年来为国内各行业用户提供各种产品支持。Bothlent目前推出了智能家居,语音识别算法,机器人交互系统,降噪等多款产品,已经和行业内多家企业建立合作伙伴关系,目前产品已经应用于多个领域。我们坚持技术创新,把握市场关键需求,以重心技术能力,助力通信产品发展。深圳鱼亮科技有限公司研发团队不断紧跟智能家居,语音识别算法,机器人交互系统,降噪行业发展趋势,研发与改进新的产品,从而保证公司在新技术研发方面不断提升,确保公司产品符合行业标准和要求。智能家居,语音识别算法,机器人交互系统,降噪产品满足客户多方面的使用要求,让客户买的放心,用的称心,产品定位以经济实用为重心,公司真诚期待与您合作,相信有了您的支持我们会以昂扬的姿态不断前进、进步。

信息来源于互联网 本站不为信息真实性负责