湖北自主可控语音关键事件检测设计

时间：2022年12月01日来源：

用于将场景图像检测模型输出的检测结果和光流图检测模型输出的检测结果进行融合计算，基于融合计算的结果，确定关于目标防护舱的事件检测结果。可选的，一种具体实现方式中，上述结果确定单元包括：乘积计算子单元，用于根据场景图像检测模型和光流图检测模型的权重，计算场景图像检测模型输出的检测结果和场景图像检测模型的权重的乘积，并计算光流图检测模型输出的检测结果与光流图检测模型的权重的第二乘积；结果确定子单元，用于计算乘积和第二乘积的和值，基于和值，确定关于目标防护舱的事件监测结果。可选的，一种具体实现方式中，事件检测结果为：关于未发生异常事件的结果，或者，关于发生异常事件且所发生异常事件类型的结果。可选的，一种具体实现方式中，上述装置还包括：事件判断模块，用于当事件检测结果为关于发生异常事件且所发生异常事件类型的结果时，判断目标防护舱当前时刻发生的事件类型是否包括预设类型的事件；如果是，触发报警模块；报警模块，用于生成并发出与预设类型对应的报警信号。可选的，一种具体实现方式中，上述装置还包括：图像截取模块，用于当事件检测结果为关于发生异常事件且所发生异常事件类型的结果时，对当前帧图像进行截图。语音关键事件检测的劣处是什么？湖北自主可控语音关键事件检测设计

每种类型与某一数字对应，以便于计算机的处理，则可以分别标记为[0,1,2,3,4,...,29,30]。在本申请的示例性实施例中，因计算机无法直接处理中文，因此可以将句子(语句)中每一个单词转化为数字的映射。即，获得语句的向量化语义表示w1。在本申请的示例性实施例中，所述获得语句的向量化语义表示w1可以包括：通过双向lstm网络模型或bert模型获得语句的向量化语义表示w1。在本申请的示例性实施例中，在通过双向lstm网络获得语句的向量化语义表示w1之前，所述方法还可以包括：将语句中的m个字符随机初始化为一个维度为[m，n]的n维向量d，其中，对于从0到m-1的索引id，每个id对应一个不同的字符；对于长度为s的语句，该语句中每一个字符能够在向量d中找到对应的id，从而获得维度为[s，d]的向量。在本申请的示例性实施例中，通过双向lstm网络获得语句的向量化语义表示w1可以包括：将维度为[s，d]的向量输入预设的双向lstm神经网络，将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中，假设语料中一共有20000个不同的字符(汉字和/或单词，可以包括其他常用符号)，每个字符可以随机初始化为一个300维的向量，则可以得到一个维度为[20000。湖北自主可控语音关键事件检测设计语音关键事件检测的稳定性怎么样？

从而可以提高对防护舱内用户出现异常事件的检测准确率可选的，一种具体实现方式中，上述装置还包括图像判断模块；在本实现方式中，一种情况下，图像判断模块，可以用于在基于当前帧图像，确定待分析图像之前，判断当前帧图像和当前帧图像之前的连续预设数量帧图像，是否均包含目标对象；在本实现方式中，另一种情况下，图像判断模块，可以用于在基于当前帧图像，确定待分析图像之前，判断当前帧图像和在当前时刻之前的预设时长内采集到的连续多帧图像，是否均包含目标对象；如果是，触发图像确定模块。可选的，一种具体实现方式中，上述图像确定模块630包括：图像确定子模块，用于将至少包含当前帧图像的类图像确定为待分析图像，其中，类图像中各图像均为关于目标防护舱，且包括目标对象的图像。可选的，一种具体实现方式中，类图像为：当前帧图像和当前帧图像之前的连续m帧图像的多张图像；其中，m为正整数；或，类图像为：当前帧图像。可选的，一种具体实现方式中，上述结果确定模块640包括：图像检测子模块，用于将待分析图像输入到预设的场景图像检测模型中，得到场景图像检测模型输出的检测结果；结果确定子模块，用于基于场景图像检测模型输出的检测结果。

比如人名、地名、组织机构名、时间等。4、事件检测与主体抽取：事件检测与主体抽取即为同时抽取事件的触发词和事件的主体。5、注意力机制：注意力机制的本质来自于人类视觉注意力机制。当人们发现一个场景经常在某部分出现自己想观察的东西时，人们会进行学习在将来再出现类似场景时把注意力放到该部分上。在计算某一序列表示时，注意力机制可以获得权重和序列位置的相关性。6、自注意力机制：自注意力机制是对注意力机制的改进，减少了对外部信息的依赖，更擅长捕捉数据或特征的内部相关性，无视词之间的距离直接计算依赖关系，能够学习一个句子的内部结构。7、span：span可认为是“一段区域，每个span具有一定的宽度”，就是对一段话进行固定长度的选取，比如一句话“我吃了面包，喝了牛奶”，如果span的宽度为2，则可以得到片段“我今”、“”、“天吃”等。8、span的划分：span的划分是指根据设定的span的大宽度，从小到大依次进行划分。比如span大宽度为8，则span的宽度为1-8，分别进行划分，可以得到多个span。9、span的分类：span的分类是指通过模型或特定的方法判断一条数据所属的类型即标签，一般而言，分类任务中的每条数据只属于一个类别。语音关键事件检测主要是指哪些事件？

电子设备便可以基于该当前帧图像，确定待分析图像。由于是对目标防护舱内发生的事件进行检测，因此，也就是检测目标防护舱内的用户是否处于正常情况中。这样，电子设备所确定的待分析图像便可以为：关于目标防护舱内的用户的图像，进一步的，目标防护舱内的用户通过当前帧图像中的目标对象表征。因此，电子设备所确定的待分析图像即为：关于目标防护舱及目标对象的图像。例如，包括目标防护舱内部情况及目标对象的图像。需要说明的是，电子设备可以通过多种方式基于当前帧图像，确定待分析图像，对此，本发明实施例不做具体限定。可选的，一种具体实现方式中，上述步骤s303，可以为：将至少包含当前帧图像的类图像确定为待分析图像，其中，类图像中各图像均为关于目标防护舱，且包括目标对象的图像。由于电子设备实时获取的关于目标防护舱的图像均为目标图像采集设备所采集的、能够反映目标防护舱的内部空间在每个时刻的真实情况的图像，并且，由于是对目标防护舱内的用户是否处于正常情况中进行检测。因此，电子设备可以将这些关于目标防护舱，且包括目标对象的图像确定为待分析图像。从而，利用待分析图像，确定当前时刻，关于目标防护舱的事件检测结果。具体的。语音关键事件检测技术怎么样？湖北自主可控语音关键事件检测设计

语音关键事件检测真的好用吗？湖北自主可控语音关键事件检测设计

产品功能ProductFunctions●自动语音关键事件检测（交通事故、违章停车、逆行、物品遗撒、行人穿越车道、排队等）●交通数据检测（车流量、车速、占有率、车型等）（固定场景）系统事件检测实景系统测速实景系统优势SystemAdvantages●高鲁棒性的背景更新技术，使得设备可在极短时间内适应所切换的新背景；●单设备检测区域广阔，采用视频识别、的方法，使得一个摄像头监控的区域能够覆盖多个车道；●误触发少，由于采用了运动轨迹的方法，能够保证每个目标只触发一次，避免了由于目标本身的差异造成的多次触发；●操作无需人为干预，采用了DSP前端处理，可以24小时不间断进行监测；●由于有丰富的模型库支持，可以识别多种异常事件情况；●无需破坏路面，无需路面养护等工作，维护方便。湖北自主可控语音关键事件检测设计

深圳鱼亮科技有限公司坐落于龙华街道清华社区建设东路青年创业园B栋3层12号，是集设计、开发、生产、销售、售后服务于一体，通信产品的服务型企业。公司在行业内发展多年，持续为用户提供整套智能家居，语音识别算法，机器人交互系统，降噪的解决方案。公司主要经营智能家居，语音识别算法，机器人交互系统，降噪等，我们始终坚持以可靠的产品质量，良好的服务理念，优惠的服务价格诚信和让利于客户，坚持用自己的服务去打动客户。Bothlent致力于开拓国内市场，与通信产品行业内企业建立长期稳定的伙伴关系，公司以产品质量及良好的售后服务，获得客户及业内的一致好评。我们本着客户满意的原则为客户提供智能家居，语音识别算法，机器人交互系统，降噪产品售前服务，为客户提供周到的售后服务。价格低廉优惠，服务周到，欢迎您的来电！

上一篇：云南电子类麦克风阵列标准

下一篇：湖北量子麦克风阵列标准