北京语音关键事件检测

时间:2022年02月26日 来源:

    电子设备便可以基于该当前帧图像,确定待分析图像。由于是对目标防护舱内发生的事件进行检测,因此,也就是检测目标防护舱内的用户是否处于正常情况中。这样,电子设备所确定的待分析图像便可以为:关于目标防护舱内的用户的图像,进一步的,目标防护舱内的用户通过当前帧图像中的目标对象表征。因此,电子设备所确定的待分析图像即为:关于目标防护舱及目标对象的图像。例如,包括目标防护舱内部情况及目标对象的图像。需要说明的是,电子设备可以通过多种方式基于当前帧图像,确定待分析图像,对此,本发明实施例不做具体限定。可选的,一种具体实现方式中,上述步骤s303,可以为:将至少包含当前帧图像的类图像确定为待分析图像,其中,类图像中各图像均为关于目标防护舱,且包括目标对象的图像。由于电子设备实时获取的关于目标防护舱的图像均为目标图像采集设备所采集的、能够反映目标防护舱的内部空间在每个时刻的真实情况的图像,并且,由于是对目标防护舱内的用户是否处于正常情况中进行检测。因此,电子设备可以将这些关于目标防护舱,且包括目标对象的图像确定为待分析图像。从而,利用待分析图像,确定当前时刻,关于目标防护舱的事件检测结果。具体的。语音关键事件检测技术怎么样?北京语音关键事件检测

    比如人名、地名、组织机构名、时间等。4、事件检测与主体抽取:事件检测与主体抽取即为同时抽取事件的触发词和事件的主体。5、注意力机制:注意力机制的本质来自于人类视觉注意力机制。当人们发现一个场景经常在某部分出现自己想观察的东西时,人们会进行学习在将来再出现类似场景时把注意力放到该部分上。在计算某一序列表示时,注意力机制可以获得权重和序列位置的相关性。6、自注意力机制:自注意力机制是对注意力机制的改进,减少了对外部信息的依赖,更擅长捕捉数据或特征的内部相关性,无视词之间的距离直接计算依赖关系,能够学习一个句子的内部结构。7、span:span可认为是“一段区域,每个span具有一定的宽度”,就是对一段话进行固定长度的选取,比如一句话“我吃了面包,喝了牛奶”,如果span的宽度为2,则可以得到片段“我今”、“”、“天吃”等。8、span的划分:span的划分是指根据设定的span的大宽度,从小到大依次进行划分。比如span大宽度为8,则span的宽度为1-8,分别进行划分,可以得到多个span。9、span的分类:span的分类是指通过模型或特定的方法判断一条数据所属的类型即标签,一般而言,分类任务中的每条数据只属于一个类别。广东移动语音关键事件检测语音关键事件检测的劣处是什么?

    在本申请的示例性实施例中,所述对所述向量化语义表示w1进行span划分,得到多个语义片段可以包括:获取设定的span的大宽度max_span_width;根据span的宽度从1到max_span_width依次在所述向量化语义表示w1上进行选取,获得多个span的语义表示span_embedding。在本申请的示例性实施例中,可以根据设定的span的大宽度max_span_width=8对步骤s101得到的语义表示w1进行划分。划分方法可以包括:span的宽度从1至max_span_width依次在向量w1上进行选取,得到n个span的语义表示,即span_embedding。s103、对多个语义片段进行平均池化,得到每个span的表示w2。在本申请的示例性实施例中,因每个span的宽度不一样(span_embedding的维度可以为[sw,d1],其中sw取值为1~max_span_width),因此可以对这n个span的语义表示进行平均池化处理,从而得到这n个span的表示w2,w2的维度可以为[n,d1]。s104、使用自注意力机制对获得的每个span的表示w2进行计算,得到每个span的新的语义表示w3。在本申请的示例性实施例中,该自注意力机制可以为自注意力加权计算。在本申请的示例性实施例中,可以将步骤s103所得的span的表示w2通过自注意力机制(自注意力加权计算)计算得到新的表示w4。

    每种类型与某一数字对应,以便于计算机的处理,则可以分别标记为[0,1,2,3,4,...,29,30]。在本申请的示例性实施例中,因计算机无法直接处理中文,因此可以将句子(语句)中每一个单词转化为数字的映射。即,获得语句的向量化语义表示w1。在本申请的示例性实施例中,所述获得语句的向量化语义表示w1可以包括:通过双向lstm网络模型或bert模型获得语句的向量化语义表示w1。在本申请的示例性实施例中,在通过双向lstm网络获得语句的向量化语义表示w1之前,所述方法还可以包括:将语句中的m个字符随机初始化为一个维度为[m,n]的n维向量d,其中,对于从0到m-1的索引id,每个id对应一个不同的字符;对于长度为s的语句,该语句中每一个字符能够在向量d中找到对应的id,从而获得维度为[s,d]的向量。在本申请的示例性实施例中,通过双向lstm网络获得语句的向量化语义表示w1可以包括:将维度为[s,d]的向量输入预设的双向lstm神经网络,将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,假设语料中一共有20000个不同的字符(汉字和/或单词,可以包括其他常用符号),每个字符可以随机初始化为一个300维的向量,则可以得到一个维度为[20000。语音关键事件检测是什么?

    第二类图像中各个图像均为:基于每两帧连续的关于目标防护舱且包括目标对象的图像获取的光流图。具体的,在本实现方式中,第二类图像为:包括光流图和光流图之前的连续n帧光流图的多张图像;其中,n为正整数;或者,第二类图像为:光流图。也就是说,在本实现方式中,电子设备可以将所获得的光流图确定为待分析图像;此外,在获取到光流图后,电子设备可以判断光流图之前的连续n帧光流图是否均是基于每两帧连续的关于目标防护舱且包括目标对象的图像获取的,当判断结果为是时,电子设备也可以将包括光流图和该连续n帧光流图的多张图像确定为待分析图像。这样,用于确定当前时刻,关于目标防护舱的事件检测结果的待分析图像为多张,可以更充分地反映目标防护舱中用户的运动变化情况,进而提高事件检测的准确率。其中,n可以为任一正整数,例如,5,10等。基于上述对步骤s304中的说明中,对检测模型模型的描述内容,可以确定不同类型和数量的待分析图像,所利用的检测模型不同。进一步的,针对不同的待分析图像,则上述步骤s304的实现方式不同。下面,针对不同类型和数量的待分析图像,对上述步骤s304的具体执行方式,以及待分析图像与检测模型之间的对应关系进行举例说明。语音关键事件检测在社会治安方面是否有作用?深圳新一代语音关键事件检测哪里买

语音关键事件检测主要对哪些领域有大作用?北京语音关键事件检测

    光流图检测模型为:采用各个第二样本图像和每个第二样本图像的事件检测结果所训练得到的模型,且每个第二样本图像为一帧光流图。需要说明的是,下面对上述步骤f23的具体实现方式进行举例说明。一种具体实现方式中,上述步骤f23可以包括如下步骤f231-f232:f231:根据场景图像检测模型和光流图检测模型的权重,计算场景图像检测模型输出的检测结果和场景图像检测模型的权重的乘积,并计算光流图检测模型输出的检测结果与光流图检测模型的权重的第二乘积;f232:计算乘积和第二乘积的和值,基于和值,确定关于目标防护舱的事件监测结果。在本实现方式中,当场景图像检测模型输出的检测结果和光流图检测模型输出的检测结果为:正常事件概率以及每种类型的异常事件的概率时,电子设备可以根据预设的场景图像检测模型的权重,计算场景图像检测模型输出的正常事件概率以及每种类型的异常事件的概率分别与该权重的乘积,作为正常事件以及每种类型的异常事件的乘积;并根据预设的光流图检测模型的权重,计算光路途检测模型输出的正常事件概率以及每种类型的异常事件的概率分别与该权重的乘积,作为正常事件以及每种类型的异常事件的第二乘积。进而,计算乘积和第二乘积的和值。北京语音关键事件检测

深圳鱼亮科技有限公司致力于通信产品,以科技创新实现***管理的追求。深圳鱼亮科技作为语音识别,音效算法,降噪算法,机器人,智能玩具,软件服务,教育培训,芯片开发,电脑,笔记本,手机,耳机,智能穿戴,进出口服务,云计算,计算机服务,软件开发,底层技术开发,软件服务进出口,品牌代理服务。的企业之一,为客户提供良好的智能家居,语音识别算法,机器人交互系统,降噪。深圳鱼亮科技致力于把技术上的创新展现成对用户产品上的贴心,为用户带来良好体验。深圳鱼亮科技始终关注自身,在风云变化的时代,对自身的建设毫不懈怠,高度的专注与执着使深圳鱼亮科技在行业的从容而自信。

信息来源于互联网 本站不为信息真实性负责