北京语音关键事件检测特征

时间：2022年02月10日来源：

监控人员往往需要花费很久的时间才能在监控视频中准确定位到异常事件所对应的视频内容。这样，为了减少监控人员在查看视频时所耗费的时间，当事件检测结果为关于发生异常事件且所发生异常事件类型的结果时，电子设备可以采取多种方式对异常事件所发生的时间进行标记。一种具体实现方式中，上述本发明实施例提供的一种事件检测方法还可以包括如下步骤b1：步骤b1：对当前帧图像进行截图，并为所得到的截图添加标签，其中，标签包括：采集当前帧图像的采集时间和所发生异常事件类型对应的类型标签。当电子设备确定当前时刻目标防护舱内出现的异常事件的类型后，便可以对当前帧图像进行截图，并通过标签对所得到的截图进行标记，该标签中包括：当前时刻的时间信息和当前时刻目标防护舱内出现的异常事件的类型的类型标签。这样，当监控人员需要查看目标防护舱的监控视频中与该异常事件对应的视频内容时，便可以直接通过异常事件的类型标签，确定该事件类型对应的截图的标签，进而，根据该标签中的时间信息，确定该异常事件发生的时间。进一步的，监控人员便可以根据所确定的时间，直接调取与该时间对应的监控视频的视频内容。这样。语音关键事件检测如何适应环境的变化？北京语音关键事件检测特征

每种类型与某一数字对应，以便于计算机的处理，则可以分别标记为[0,1,2,3,4,...,29,30]。在本申请的示例性实施例中，因计算机无法直接处理中文，因此可以将句子(语句)中每一个单词转化为数字的映射。即，获得语句的向量化语义表示w1。在本申请的示例性实施例中，所述获得语句的向量化语义表示w1可以包括：通过双向lstm网络模型或bert模型获得语句的向量化语义表示w1。在本申请的示例性实施例中，在通过双向lstm网络获得语句的向量化语义表示w1之前，所述方法还可以包括：将语句中的m个字符随机初始化为一个维度为[m，n]的n维向量d，其中，对于从0到m-1的索引id，每个id对应一个不同的字符；对于长度为s的语句，该语句中每一个字符能够在向量d中找到对应的id，从而获得维度为[s，d]的向量。在本申请的示例性实施例中，通过双向lstm网络获得语句的向量化语义表示w1可以包括：将维度为[s，d]的向量输入预设的双向lstm神经网络，将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中，假设语料中一共有20000个不同的字符(汉字和/或单词，可以包括其他常用符号)，每个字符可以随机初始化为一个300维的向量，则可以得到一个维度为[20000。北京语音关键事件检测特征语音关键事件检测主要应用在哪些领域？

虽然用户进入了目标防护舱，但是用户并没有在目标防护舱内停留，而是立刻离开了目标防护舱，又或者，在某个时刻，用户从目标防护舱前路过，而在此刻采集到的关于目标防护舱的图像恰好拍摄到用户投射到防护舱门上的影子。显然，在上述这些时刻，虽然电子设备获取的当前帧图像中存在目标对象，但是，电子设备可以确定在这些时刻目标防护舱内不会发生针对该目标对象所在的用户的异常事件，进而，不需要对这些时刻获取的关于目标防护舱的图像执行后续步骤s303-s304。因此，为了进一步节省电子设备的资源，减轻电子设备的运行负担，同时也为了避免误报，电子设备可以通过多种方式来确定执行步骤s303的条件。一种具体实现方式中，如图4所示，在上述步骤s303，基于当前帧图像，确定待分析图像之前，上述本发明实施例提供的一种事件检测方法还可以包括：s302a：判断当前帧图像和当前帧图像之前的连续预设数量帧图像，是否均包含目标对象，如果是，执行上述步骤s303。在本实现方式中，在获取到当前帧图像后，电子设备便可以利用图像识别算法判断当前帧图像和当前帧图像之前的连续预设数量帧图像，是否均包含目标对象。其中，当判断结果为是时。

目标对象为：能够表征用户进入目标防护舱的用户身体部位；可以理解的，在某些时刻，目标防护舱内可能并不存在用户，则可以确定在这些时刻目标防护舱内不会发生异常事件。因此，为了节省电子设备的资源，减轻电子设备的运行负担，在获取到当前帧图像后，电子设备便可以利用图像识别算法对当前帧图像进行检测，判断当前帧图像是否包含目标对象。其中，当判断结果为是时，电子设备可以确定存在用户进入目标防护舱，则在当前时刻，目标防护舱内可能发生异常事件，这样，电子设备便可以继续执行步骤s303。需要说明的是，电子设备可以采用任一能够检测出当前帧图像中是否包含目标对象的图像识别算法执行上述步骤s302，对此，本发明实施例不做具体限定。此外，根据实际情况中，根据采集关于目标防护舱的图像的图像采集设备的安装位置，上述目标对象所指示的具体的用户身体部位可以不同。例如，当图像采集设备安装在舱顶时，该目标对象可以是用户的头肩部；当图像采集设备安装在舱壁时，目标对象可以是用户的全身图像。这都是合理的。s303：基于当前帧图像，确定待分析图像；其中，待分析图像为：关于目标防护舱及目标对象的图像。在判断得到当前帧图像中包括目标对象后。语音关键事件检测发展如何？

比如人名、地名、组织机构名、时间等。4、事件检测与主体抽取：事件检测与主体抽取即为同时抽取事件的触发词和事件的主体。5、注意力机制：注意力机制的本质来自于人类视觉注意力机制。当人们发现一个场景经常在某部分出现自己想观察的东西时，人们会进行学习在将来再出现类似场景时把注意力放到该部分上。在计算某一序列表示时，注意力机制可以获得权重和序列位置的相关性。6、自注意力机制：自注意力机制是对注意力机制的改进，减少了对外部信息的依赖，更擅长捕捉数据或特征的内部相关性，无视词之间的距离直接计算依赖关系，能够学习一个句子的内部结构。7、span：span可认为是“一段区域，每个span具有一定的宽度”，就是对一段话进行固定长度的选取，比如一句话“我吃了面包，喝了牛奶”，如果span的宽度为2，则可以得到片段“我今”、“”、“天吃”等。8、span的划分：span的划分是指根据设定的span的大宽度，从小到大依次进行划分。比如span大宽度为8，则span的宽度为1-8，分别进行划分，可以得到多个span。9、span的分类：span的分类是指通过模型或特定的方法判断一条数据所属的类型即标签，一般而言，分类任务中的每条数据只属于一个类别。语音关键事件检测和摄像头有联系吗？北京语音关键事件检测特征

语音关键事件检测是什么？北京语音关键事件检测特征

从而可以提高对防护舱内用户出现异常事件的检测准确率可选的，一种具体实现方式中，上述装置还包括图像判断模块；在本实现方式中，一种情况下，图像判断模块，可以用于在基于当前帧图像，确定待分析图像之前，判断当前帧图像和当前帧图像之前的连续预设数量帧图像，是否均包含目标对象；在本实现方式中，另一种情况下，图像判断模块，可以用于在基于当前帧图像，确定待分析图像之前，判断当前帧图像和在当前时刻之前的预设时长内采集到的连续多帧图像，是否均包含目标对象；如果是，触发图像确定模块。可选的，一种具体实现方式中，上述图像确定模块630包括：图像确定子模块，用于将至少包含当前帧图像的类图像确定为待分析图像，其中，类图像中各图像均为关于目标防护舱，且包括目标对象的图像。可选的，一种具体实现方式中，类图像为：当前帧图像和当前帧图像之前的连续m帧图像的多张图像；其中，m为正整数；或，类图像为：当前帧图像。可选的，一种具体实现方式中，上述结果确定模块640包括：图像检测子模块，用于将待分析图像输入到预设的场景图像检测模型中，得到场景图像检测模型输出的检测结果；结果确定子模块，用于基于场景图像检测模型输出的检测结果。北京语音关键事件检测特征

深圳鱼亮科技有限公司是一家语音识别，音效算法，降噪算法，机器人，智能玩具，软件服务，教育培训，芯片开发，电脑，笔记本，手机，耳机，智能穿戴，进出口服务，云计算，计算机服务，软件开发，底层技术开发，软件服务进出口，品牌代理服务。的公司，是一家集研发、设计、生产和销售为一体的专业化公司。深圳鱼亮科技拥有一支经验丰富、技术创新的专业研发团队，以高度的专注和执着为客户提供智能家居，语音识别算法，机器人交互系统，降噪。深圳鱼亮科技致力于把技术上的创新展现成对用户产品上的贴心，为用户带来良好体验。深圳鱼亮科技始终关注通信产品市场，以敏锐的市场洞察力，实现与客户的成长共赢。

上一篇：广州自主可控语音关键事件检测介绍

下一篇：四川新一代麦克风阵列