重庆移动语音关键事件检测设计

时间：2024年01月10日来源：

目标对象为：能够表征用户进入目标防护舱的用户身体部位；可以理解的，在某些时刻，目标防护舱内可能并不存在用户，则可以确定在这些时刻目标防护舱内不会发生异常事件。因此，为了节省电子设备的资源，减轻电子设备的运行负担，在获取到当前帧图像后，电子设备便可以利用图像识别算法对当前帧图像进行检测，判断当前帧图像是否包含目标对象。其中，当判断结果为是时，电子设备可以确定存在用户进入目标防护舱，则在当前时刻，目标防护舱内可能发生异常事件，这样，电子设备便可以继续执行步骤s303。需要说明的是，电子设备可以采用任一能够检测出当前帧图像中是否包含目标对象的图像识别算法执行上述步骤s302，对此，本发明实施例不做具体限定。此外，根据实际情况中，根据采集关于目标防护舱的图像的图像采集设备的安装位置，上述目标对象所指示的具体的用户身体部位可以不同。例如，当图像采集设备安装在舱顶时，该目标对象可以是用户的头肩部；当图像采集设备安装在舱壁时，目标对象可以是用户的全身图像。这都是合理的。s303：基于当前帧图像，确定待分析图像；其中，待分析图像为：关于目标防护舱及目标对象的图像。在判断得到当前帧图像中包括目标对象后。语音关键事件检测一般应用在什么行业？欢迎来电咨询！重庆移动语音关键事件检测设计

根据设定的span宽度，对语句进行span划分，以将语句划分为多个span，并对每个span进行标记；其中，每个标记表示x+y+1种类型中的任意一种，1表示所述触发词的类型和所述事件主体的类型以外的其他类型。在本申请的示例性实施例中，所述对所述向量化语义表示w1进行span划分，得到多个语义片段可以包括：获取设定的span的大宽度max_span_width；根据span的宽度从1到max_span_width依次在所述向量化语义表示w1上进行选取，获得多个span的语义表示span_embedding。在本申请的示例性实施例中，所述对所述新的语义表示w3进行span分类可以包括：使用两层全连接神经网络和softmax层对每个span进行分类；其中，在训练阶段，将分类结果与带有标记的span进行误差计算和反向传播。本申请还提供了一种事件检测装置，可以包括处理器和计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令被所述处理器执行时，实现上述任意一项所述的事件检测方法。与相关技术相比，本申请可以包括：获得语句的向量化语义表示w1；对所述向量化语义表示w1进行span划分，得到多个语义片段；对多个语义片段进行平均池化，得到每个span的表示w2。云南量子语音关键事件检测特征智能语音质检都有什么功能?欢迎来电咨询！

告警装置13在接收到告警指令后，可以输出与告警指令对应的告警信号。告警装置13通过输出告警信号，提醒游泳场馆内的救生员当前存在溺水事件的发生。在实际应用中，告警装置13可以为便携式的智能手环。当智能手环接收到告警指令后，可以输出振动信号。智能手环可以被佩戴在游泳馆救生员的手腕上。当智能手环振动时，救生员即可获知当前有游泳者发生溺水。告警装置13也可以为智能手机。当智能手机接收到告警指令后，可以同时输出振动信号以及语音信号。救生员可以随身携带该智能手机。当智能手机输出振动信号及语音信号时，救生员即可获知当前有游泳者发生溺水。可以理解的是，告警装置13还可以为其他类型的终端。例如，告警装置13可以为游泳场馆内的广播台。当告警装置13接收到告警指令后，可以输出相应的告警信号，告警信号可以是振动信号、语音信号以及光信号中的至少一种。在判定目标人物溺水之后，若要及时进行应急营救，救生员需要及时地获知游泳者的溺水位置。在具体实施中，控制器12在判定目标人物溺水之后，还可以获取一次检测到目标人物出现在游泳池中的目标位置信息，并将目标位置信息输出至预先关联的告警装置13。

300]的向量d，其中对于索引id从0至19999，每个id对应一个不同的汉字。那么对于一句话(长度为s)中的每一个字符，都可以在d中找到对应的id，从而获取对应的向量，因此可以得到一个维度为[s,300]的向量。然后可以使用双向lstm神经网络得到句子的语义表示向量w1。在本申请的示例性实施例中，通过bert模型获得语句的向量化语义表示w1可以包括：将语句直接输入所述bert模型，将所述bert模型的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中，使用bert模型时，可以将句子直接输入至bert模型，bert模型的输出即可以作为句子的向量化语义表示w1。在本申请的示例性实施例中，所述向量化语义表示w1的维度可以为[s，d1]；其中，当通过双向lstm网络获得语句的向量化语义表示w1时，d1为2*lstm隐层节点数；当通过bert模型获得语句的向量化语义表示w1时，d1＝768。在本申请的示例性实施例中，设以上两种方法得到的语义表示为w1，则,1的维度为[s,d1]，其中s为句子长度；如果使用双向lstm网络获得语句的向量化语义表示w1，则d1为2*lstm隐层节点数，如果使用bert模型获得语句的向量化语义表示w1，则d1＝768。s102、对所述向量化语义表示w1进行span划分，得到多个语义片段。在语音合成中，语音关键事件检测可以用于提取和合成特定情感或风格的语音片段。

虽然用户进入了目标防护舱，但是用户并没有在目标防护舱内停留，而是立刻离开了目标防护舱，又或者，在某个时刻，用户从目标防护舱前路过，而在此刻采集到的关于目标防护舱的图像恰好拍摄到用户投射到防护舱门上的影子。显然，在上述这些时刻，虽然电子设备获取的当前帧图像中存在目标对象，但是，电子设备可以确定在这些时刻目标防护舱内不会发生针对该目标对象所在的用户的异常事件，进而，不需要对这些时刻获取的关于目标防护舱的图像执行后续步骤s303-s304。因此，为了进一步节省电子设备的资源，减轻电子设备的运行负担，同时也为了避免误报，电子设备可以通过多种方式来确定执行步骤s303的条件。一种具体实现方式中，如图4所示，在上述步骤s303，基于当前帧图像，确定待分析图像之前，上述本发明实施例提供的一种事件检测方法还可以包括：s302a：判断当前帧图像和当前帧图像之前的连续预设数量帧图像，是否均包含目标对象，如果是，执行上述步骤s303。在本实现方式中，在获取到当前帧图像后，电子设备便可以利用图像识别算法判断当前帧图像和当前帧图像之前的连续预设数量帧图像，是否均包含目标对象。其中，当判断结果为是时。语音关键事件检测有什么注意事项？欢迎来电咨询！重庆语音关键事件检测供应

语音关键事件检测用到了哪些技术？欢迎咨询！重庆移动语音关键事件检测设计

使得每一个摄像头能够采集到泳池内相同面积的图像。例如，在游泳池的一侧壁上，均匀设置有4个摄像头11，4个摄像头11均设置在游泳池水面以上，4个摄像头11的高度相等，且水平方向上4个摄像头11等间距排列。给出了本实用新型实施例中的一种摄像头11安装位置。图2中，4个摄像头依次为21、22、23、24，在水平方向上四个摄像头等间距排列，且均设置在游泳池壁20上。需要说明的是，在设置多个摄像头11时，可以获取所有摄像头11采集到的图像，并判断所有摄像头11采集到的图像的总和是否覆盖了整个游泳池，也即判断所有摄像头11采集到的图像是否存在盲区。若存在盲区，则可以对多个摄像头11的安装位置进行调整，或者对多个摄像头11的图像采集角度进行调整，也可以增加摄像头11的数量以将盲区覆盖。在具体实施中，溺水事件检测系统还可以包括m个第二摄像头14，m为正整数。m个第二摄像头14与控制器12可以通过有线连接的方式进行通信，也可以通过无线连接的方式进行通信。在本实用新型实施例中，m个第二摄像头14与控制器12通过无线连接的方式进行通信。m个第二摄像头14与控制器12之间进行无线通信时，所采用的无线通信协议可以为wifi、蓝牙、zigbee等。可以理解的是。重庆移动语音关键事件检测设计

上一篇：上海光纤数据语音关键事件检测特征

下一篇：江苏语音关键事件检测哪里买