浙江新一代语音关键事件检测设计

时间：2024年01月08日来源：

并且对于本领域的普通技术人员来说显而易见的是，在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合，并在具体实施方式中进行了讨论，但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外，任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用，或可以替代任何其它实施例中的任何其他特征或元件。本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合，以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合，以形成另一个由权利要求限定的独特的发明方案。因此，应当理解，在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此，除了根据所附权利要求及其等同替换所做的限制以外，实施例不受其它限制。此外，可以在所附权利要求的保护范围内进行各种修改和改变。此外，在描述具有代表性的实施例时，说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而。随着深度学习技术的不断发展，语音关键事件检测的准确性和实时性将得到进一步提高。浙江新一代语音关键事件检测设计

可以获取概率大值的索引所对应的类型即可。本申请实施例通过双向lstm网络或者bert得到句子的向量化语义表示，然后进行span的划分从而得到多个语义片段，然后对每个语义片段进行平均池化得到每个span的表示，使用自注意力机制获取不同span之间的关系从而得到深层的语义表示，后使用两层全连接网络进行分类操作从而确定每个span是否为某一事件的触发词或者是事件主体。本申请实施例公开了一种采用span划分方式，同时抽取事件触发词和事件主体的事件检测方法，至少具有以下优势：1、同时抽取事件触发词和事件的主体，可获取更加有用的信息，具有较强的实际应用价值。2、在数据处理和建模的过程中不使用现有的自然语言处理工具，使得操作简单，也避免了因使用自然语言处理工具而导致的误差累积的问题，同时也更加符合真实应用场景。3、通过划分span的方式，完美解决了序列标注存在的问题，效率更高，适用性更强。本申请还提供了一种事件检测装置1，如图2所示，可以包括处理器11和计算机可读存储介质12，所述计算机可读存储介质12中存储有指令，当所述指令被所述处理器11执行时，实现上述任意一项所述的事件检测方法。本领域普通技术人员可以理解。广东自主可控语音关键事件检测特征语音关键事件检测在哪些地区被大力推广？欢迎咨询！

虽然用户进入了目标防护舱，但是用户并没有在目标防护舱内停留，而是立刻离开了目标防护舱，又或者，在某个时刻，用户从目标防护舱前路过，而在此刻采集到的关于目标防护舱的图像恰好拍摄到用户投射到防护舱门上的影子。显然，在上述这些时刻，虽然电子设备获取的当前帧图像中存在目标对象，但是，电子设备可以确定在这些时刻目标防护舱内不会发生针对该目标对象所在的用户的异常事件，进而，不需要对这些时刻获取的关于目标防护舱的图像执行后续步骤s303-s304。因此，为了进一步节省电子设备的资源，减轻电子设备的运行负担，同时也为了避免误报，电子设备可以通过多种方式来确定执行步骤s303的条件。一种具体实现方式中，如图4所示，在上述步骤s303，基于当前帧图像，确定待分析图像之前，上述本发明实施例提供的一种事件检测方法还可以包括：s302a：判断当前帧图像和当前帧图像之前的连续预设数量帧图像，是否均包含目标对象，如果是，执行上述步骤s303。在本实现方式中，在获取到当前帧图像后，电子设备便可以利用图像识别算法判断当前帧图像和当前帧图像之前的连续预设数量帧图像，是否均包含目标对象。其中，当判断结果为是时。

本申请提供了一种事件检测方法，如图1所示，所述方法可以包括s101-s105：s101、获得语句的向量化语义表示w1。在本申请的示例性实施例中，在获得语句的向量化语义表示w1之前，可以首先对要进行事件抽取的数据进行预处理。在本申请的示例性实施例中，所述方法还可以包括：预先将触发词的类型划分为x种，将事件主体的类型划分为y种，其中，x、y均为正整数；在获得语句的向量化语义表示w1之前，根据设定的span宽度，对语句进行span划分，以将语句划分为多个span，并对每个span进行标记；其中，每个标记表示x+y+1种类型中的任意一种，1表示所述触发词的类型和所述事件主体的类型以外的其他类型。在本申请的示例性实施例中，假设触发词的类型(可以称为事件类型)数为n_event＝10，即x＝10，事件主体的类型(可以称为实体类型)数为n_entity＝20，即y＝20，则一共有10+20＝30种类型。在本申请的示例性实施例中，可以首先对数据进行span的划分。以单个句子为例，假如设定span的大宽度max_span_width＝8，则可以得到多个span，需要对每个span进行标记，即确定每个span是否是触发词、事件主体还是其他类型(other类型)。在进行分类时，一共有30种类型，加上other类型一共31种。语音关键事件检测在语音识别、语音合成和语音交互等领域具有广泛的应用前景。

直至电子设备判断预设时长内采集到的连续多帧图像中均包含相同的目标对象后，电子设备继续获得下一帧图像，即预设时长后的当前时刻对应的当前帧图像，并判断该当前帧图像中是否包括预设时长内采集到的连续多帧图像所包含的目标对象。这样，当判断结果为是时，电子设备便可以继续执行后续步骤s303。当前，光流法是图像分析领域中被重点关注的一种方法，所谓光流是指图像亮度模式的表观运动。可以理解的，当用户在防护舱中进行各类金融活动时，用户的某些身体部位也是运动的，例如，手指等。光流表达了图像的变化，可以引申出光流场。所谓光流场是指图像中所有像素点构成的一种二维(2d)瞬时速度场，其中的二维速度矢量是景物中可见点的三维速度矢量在成像表面的投影。这样，光流不包含了被观察物体的运动信息，而且还包含有关景物三维结构的丰富信息。因此，在本发明实施例中也可以引入光流法。可选的，一种具体实现方式中，上述本发明实施例提供的一种事件检测方法中，还可以包括如下步骤d1：步骤d1：每当获取到一帧图像时，利用该帧图像和该帧图像的前一帧图像，得到该帧图像对应的光流图；由于光流包含被观察物体的运动信息，因此，光流图表征的是两帧图像之间的变化。语音关键事件检测技术可以帮助听力障碍者更好地理解和感知周围的声音环境。海南电子类语音关键事件检测

语音关键事件检测一般应用在什么行业？浙江新一代语音关键事件检测设计

m个第二摄像头14还可以采用其他的无线通信协议与控制器12进行无线通信，本实用新型实施例不做赘述。给出了本实用新型实施例中的另一种溺水事件检测系统的结构。在本实用新型实施例中，m个第二摄像头14均可以设置在游泳池水面的上方，从而能够从上向下采集游泳池内的图像。在垂直方向上，任一个第二摄像头14设置的位置与游泳池水面的距离可以大于预设距离。也就是说，在垂直方向上，m个第二摄像头14均设置在n个摄像头11的上方。为能够采集较大视角范围内的图像，m个第二摄像头14均可以设置在游泳池上方的悬梁上，游泳池上方的悬梁可以是游泳场馆的悬梁，也可以是设置在游泳池上方较高处的杆状物。具体的，第二摄像头14的设置位置可以根据实际的游泳池场馆的布局进行设定，在设置第二摄像头14时，第二摄像头14能够在垂直方向上采集游泳池内的图像即可。在具体实施中，m个第二摄像头14可以均设置在游泳池水面上方2～5米处，从而能够从上至下采集游泳池内的图像。在本实用新型实施例中，通过设置摄像头11以及第二摄像头14，可以使得通过摄像头11采集水平方向上的图像，通过第二摄像头14采集垂直方向上的图像。浙江新一代语音关键事件检测设计

上一篇：江西光纤数据语音关键事件检测介绍

下一篇：河北自主可控语音关键事件检测特征