安徽移动语音关键事件检测

时间:2022年02月21日 来源:

    300]的向量d,其中对于索引id从0至19999,每个id对应一个不同的汉字。那么对于一句话(长度为s)中的每一个字符,都可以在d中找到对应的id,从而获取对应的向量,因此可以得到一个维度为[s,300]的向量。然后可以使用双向lstm神经网络得到句子的语义表示向量w1。在本申请的示例性实施例中,通过bert模型获得语句的向量化语义表示w1可以包括:将语句直接输入所述bert模型,将所述bert模型的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,使用bert模型时,可以将句子直接输入至bert模型,bert模型的输出即可以作为句子的向量化语义表示w1。在本申请的示例性实施例中,所述向量化语义表示w1的维度可以为[s,d1];其中,当通过双向lstm网络获得语句的向量化语义表示w1时,d1为2*lstm隐层节点数;当通过bert模型获得语句的向量化语义表示w1时,d1=768。在本申请的示例性实施例中,设以上两种方法得到的语义表示为w1,则,1的维度为[s,d1],其中s为句子长度;如果使用双向lstm网络获得语句的向量化语义表示w1,则d1为2*lstm隐层节点数,如果使用bert模型获得语句的向量化语义表示w1,则d1=768。s102、对所述向量化语义表示w1进行span划分,得到多个语义片段。语音关键事件检测的历史作用?安徽移动语音关键事件检测

    将w2与w4进行横向拼接得到终的语义表示w3,w3的维度可以为[n,2*d1]。在本申请的示例性实施例中,自注意力机制计算具体可以包括:将w2分别进行多次(如三次)线性变换得到w21、w22、w23,然后可以执行矩阵相乘运算得到w4=(w22*w23t)*w21,w3=w2||w4。s105、对所述新的语义表示w3进行span分类,确定每个span是否为一个事件的触发词或事件主体。在本申请的示例性实施例中,所述对所述新的语义表示w3进行span分类可以包括:使用两层全连接神经网络和softmax层对每个span进行分类;其中,在训练阶段,将分类结果与带有标记的span进行误差计算和反向传播。在本申请的示例性实施例中,得到步骤s104的span的表示w3后,可以使用两层全连接神经网络和softmax层对span进行分类。在本申请的示例性实施例中,如果如步骤s101中所述,预先对数据进行了预处理,即预先对数据进行了span分类和标记,则在训练阶段,可以将分类结果与预处理过程所得的带有标记的span进行误差计算和反向传播,并进行参数更新操作完成训练过程。在本申请的示例性实施例中,在预测阶段,根据分类的结果即可得到每个span的类型。softmax的输出是每个span所属对应类型(预处理过程获得的带类型标记的span)的概率。安徽移动语音关键事件检测语音关键事件检测的运用多吗?

    m个第二摄像头14还可以采用其他的无线通信协议与控制器12进行无线通信,本实用新型实施例不做赘述。给出了本实用新型实施例中的另一种溺水事件检测系统的结构。在本实用新型实施例中,m个第二摄像头14均可以设置在游泳池水面的上方,从而能够从上向下采集游泳池内的图像。在垂直方向上,任一个第二摄像头14设置的位置与游泳池水面的距离可以大于预设距离。也就是说,在垂直方向上,m个第二摄像头14均设置在n个摄像头11的上方。为能够采集较大视角范围内的图像,m个第二摄像头14均可以设置在游泳池上方的悬梁上,游泳池上方的悬梁可以是游泳场馆的悬梁,也可以是设置在游泳池上方较高处的杆状物。具体的,第二摄像头14的设置位置可以根据实际的游泳池场馆的布局进行设定,在设置第二摄像头14时,第二摄像头14能够在垂直方向上采集游泳池内的图像即可。在具体实施中,m个第二摄像头14可以均设置在游泳池水面上方2~5米处,从而能够从上至下采集游泳池内的图像。在本实用新型实施例中,通过设置摄像头11以及第二摄像头14,可以使得通过摄像头11采集水平方向上的图像,通过第二摄像头14采集垂直方向上的图像。

    确定关于目标防护舱的事件检测结果;其中,场景图像检测模型为:采用各个样本图像组和每个样本图像组的事件检测结果所训练得到的模型,且每一样本图像组中的图像与待分析图像的图像数量相同,各个样本图像组中的图像为:所采集到的关于防护舱的图像。可选的,一种具体实现方式中,上述装置包括:光流图确定模块,用于每当获取到一帧图像时,利用该帧图像和该帧图像的前一帧图像,得到该帧图像对应的光流图;则在本实现方式中,上述图像确定模块630包括:第二图像确定子模块,用于将至少包含光流图在内的第二类图像确定为待分析图像,其中,第二类图像中各个图像的类型均为:基于每两帧连续的关于目标防护舱且包括目标对象的图像获取的光流图,光流图为当前帧图像对应的光流图。可选的,一种具体实现方式中,第二类图像为:包括光流图和光流图之前的连续n帧光流图的多张图像;其中,n为正整数;或,第二类图像为:光流图。可选的,一种具体实现方式中,上述结果确定模块640包括:第二图像检测子模块,用于将待分析图像输入到预设的光流图检测模型中,得到光流图检测模型输出的检测结果;第二结果确定子模块,用于基于光流图检测模型输出的检测结果。语音关键事件检测的主要功能。

    在本实现方式中,类图像为:当前帧图像和当前帧图像之前的连续m帧图像的多张图像,其中,m为正整数;或者,类图像为:当前帧图像。也就是说,在本实现方式中,电子设备可以将所获得的当前帧图像确定为待分析图像;此外,在获取到当前帧图像,并判断该当前帧图像包括目标对象后,电子设备可以判断所获取的关于目标防护舱的当前帧图像之前的连续m帧图像是否均包括目标对象,这样,便可以将当前帧图像和该m帧图像确定为待分析图像。这样,用于确定关于目标防护舱的事件检测结果的待分析图像为多张,可以更充分地反映目标防护舱内部空间的情况,进而提高事件检测的准确率。其中,m可以为任一正整数,例如,5,10等。s304:将待分析图像输入到预设的检测模型中,得到关于目标防护舱的事件检测结果;其中,检测模型为:基于各个样本图像和每个样本图像的事件检测结果所训练得到的模型。在确定待分析图像后,电子设备便可以将待分析图像输入到预设的检测模型中,得到关于目标防护舱的事件检测结果。具体的,在将待分析图像输入到预设的检测模型中后,电子设备可以得到预设的检测模型的输出结果,进而,根据该检测结果,电子设备便可以确定关于目标防护舱的事件检测结果。其中。语音关键事件检测在机关单位的使用。安徽光纤数据语音关键事件检测特征

语音关键事件检测在国际上的运用如何?安徽移动语音关键事件检测

    上述步骤s302a可以为:步骤s302b:判断当前帧图像和在当前时刻之前的预设时长内采集到的连续多帧图像,是否均包含目标对象;如果是,执行上述步骤s303。在本实现方式中,在获取到当前帧图像后,电子设备便可以利用图像识别算法判断当前帧图像和在当前时刻之前的预设时长内采集到的连续多帧图像,是否均包含目标对象。其中,当判断结果为是时,电子设备可以确定存在用户进入目标防护舱,则在当前时刻,目标防护舱内可能发生异常事件,这样,电子设备便可以继续执行步骤s303。需要说明的是,在本实现方式中,电子设备可以采用任一能够检测出当前帧图像和在当前时刻之前的预设时长内采集到的连续多帧图像中是否均包含目标对象的图像识别算法执行上述步骤s302b,对此,本发明实施例不做具体限定。其中,上述预设时长可以为任一时长,例如,2s,5s等,这都是合理的。下面,对电子设备执行上述步骤s302b的具体过程进行说明:电子设备在获取到每帧关于目标防护舱的图像后,判断该图像中是否包含目标对象。进而,在获取该图像的下一帧图像后,判断该下一帧图像中是否包括与前一帧图像相同的目标对象。依次类推。安徽移动语音关键事件检测

深圳鱼亮科技有限公司总部位于龙华街道清华社区建设东路青年创业园B栋3层12号,是一家语音识别,音效算法,降噪算法,机器人,智能玩具,软件服务,教育培训,芯片开发,电脑,笔记本,手机,耳机,智能穿戴,进出口服务,云计算,计算机服务,软件开发,底层技术开发,软件服务进出口,品牌代理服务。的公司。深圳鱼亮科技作为语音识别,音效算法,降噪算法,机器人,智能玩具,软件服务,教育培训,芯片开发,电脑,笔记本,手机,耳机,智能穿戴,进出口服务,云计算,计算机服务,软件开发,底层技术开发,软件服务进出口,品牌代理服务。的企业之一,为客户提供良好的智能家居,语音识别算法,机器人交互系统,降噪。深圳鱼亮科技致力于把技术上的创新展现成对用户产品上的贴心,为用户带来良好体验。深圳鱼亮科技始终关注通信产品行业。满足市场需求,提高产品价值,是我们前行的力量。

信息来源于互联网 本站不为信息真实性负责