浙江新一代语音关键事件检测设计

时间:2023年03月13日 来源:

    存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述方面提供的一种事件检测方法中的任一方法步骤。第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述方面提供的一种事件检测方法中的任一方法步骤。以上可见,应用本发明实施例提供的方案,实时获取目标防护舱的图像,并判断当前时刻所采集到的当前帧图像是否包括目标对象,由于目标对象为:能够表征用户进入目标防护舱的用户身体部位,则可以基于当前帧图像判断当前时刻是否有用户进入目标防护舱。则当判断结果为是时,便可以基于当前帧图像,确定待分析图像,进而将该待分析图像输入到预设的检测模型中,得到当前时刻,关于目标语音关键事件检测防护舱的事件检测结果。这样,由于检测模型是基于各个样本图像和各个样本图像的事件检测结果所训练得到的模型,因此,检测模型充分学习了样本图像和事件检测结果之间的对应关系。基于此,在本发明实施例中,利用采集到的真实图像来确定待分析图像,利用训练好的检测模型对待分析图像进行检测。语音关键事件检测的评价怎么样?浙江新一代语音关键事件检测设计

    在该方法或过程不依赖于本文所述步骤的特定顺序的程度上,该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的,其它的步骤顺序也是可能的。因此,说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外,针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤,本领域技术人员可以容易地理解,这些顺序可以变化,并且仍然保持在本申请实施例的精神和范围内。在本申请的示例性实施例中,在介绍本申请实施例方案之前,可以首先对本申请实施例涉及的术语进行介绍:1、事件类型及定义:事件类型是指不同的事件所属的类别,比如在金融领域有“实控人股东变更”、“信批违规”、“财务造假”等事件类型。事件类型的定义一般由该领域的**或经验人士来确定。2、触发词:触发词是指能够清楚的表明事件类型的一些词汇,比如“杀”、“袭击”、“见面”等。3、事件主体以及定义:事件主体是指事件发生的主要参与方,也是与该事件联系为紧密的一方,定义为实体。如:“xx科技实际控制人变更yy集团”、“zz集团已经资不抵债将进行破产重整”,这些事件中,“xx科技”即为该事件的主体,类型为“机构”,事件主体可以定义为多种实体类型。广西语音关键事件检测标准语音关键事件检测真的好用吗?

    每种类型与某一数字对应,以便于计算机的处理,则可以分别标记为[0,1,2,3,4,...,29,30]。在本申请的示例性实施例中,因计算机无法直接处理中文,因此可以将句子(语句)中每一个单词转化为数字的映射。即,获得语句的向量化语义表示w1。在本申请的示例性实施例中,所述获得语句的向量化语义表示w1可以包括:通过双向lstm网络模型或bert模型获得语句的向量化语义表示w1。在本申请的示例性实施例中,在通过双向lstm网络获得语句的向量化语义表示w1之前,所述方法还可以包括:将语句中的m个字符随机初始化为一个维度为[m,n]的n维向量d,其中,对于从0到m-1的索引id,每个id对应一个不同的字符;对于长度为s的语句,该语句中每一个字符能够在向量d中找到对应的id,从而获得维度为[s,d]的向量。在本申请的示例性实施例中,通过双向lstm网络获得语句的向量化语义表示w1可以包括:将维度为[s,d]的向量输入预设的双向lstm神经网络,将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,假设语料中一共有20000个不同的字符(汉字和/或单词,可以包括其他常用符号),每个字符可以随机初始化为一个300维的向量,则可以得到一个维度为[20000。

    将w2与w4进行横向拼接得到终的语义表示w3,w3的维度可以为[n,2*d1]。在本申请的示例性实施例中,自注意力机制计算具体可以包括:将w2分别进行多次(如三次)线性变换得到w21、w22、w23,然后可以执行矩阵相乘运算得到w4=(w22*w23t)*w21,w3=w2||w4。s105、对所述新的语义表示w3进行span分类,确定每个span是否为一个事件的触发词或事件主体。在本申请的示例性实施例中,所述对所述新的语义表示w3进行span分类可以包括:使用两层全连接神经网络和softmax层对每个span进行分类;其中,在训练阶段,将分类结果与带有标记的span进行误差计算和反向传播。在本申请的示例性实施例中,得到步骤s104的span的表示w3后,可以使用两层全连接神经网络和softmax层对span进行分类。在本申请的示例性实施例中,如果如步骤s101中所述,预先对数据进行了预处理,即预先对数据进行了span分类和标记,则在训练阶段,可以将分类结果与预处理过程所得的带有标记的span进行误差计算和反向传播,并进行参数更新操作完成训练过程。在本申请的示例性实施例中,在预测阶段,根据分类的结果即可得到每个span的类型。softmax的输出是每个span所属对应类型(预处理过程获得的带类型标记的span)的概率。语音关键事件检测受哪些因素影响?

    这样,电子设备在每获取到一帧图像时,便可以利用该帧图像和该帧图像的前一帧图像,得到该帧图像对应的光流图。进一步的,在本实现方式中,上述步骤s303,基于当前帧图像,确定待分析图像,便可以包括如下步骤e1:步骤e1:将至少包含光流图在内的第二类图像确定为待分析图像,其中,第二类图像中各个图像均为:基于每两帧连续的关于目标防护舱且包括目标对象的图像获取的光流图,光流图为当前帧图像对应的光流图。由于电子设备实时获取的关于目标防护舱的图像均为目标图像采集设备所采集的、能够反映目标防护舱的内部空间在每个时刻的真实情况的图像,而光流图是基于这些关于目标防护舱的图像中人物的运动变化情况获得的,因此,电子设备可以将光流图确定为待分析图像。从而,利用待分析图像,确定当前时刻,关于目标防护舱的事件检测结果。其中,为了描述简单,可以将当前帧图像的光流图简称为光流图。其中,由于本发明实施例是对目标防护舱内的用户是否处于正常情况中进行检测,因此,第二类图像中的各个光流图应该是关于目标防护舱中用户运动情况的光流图。进一步的,由于每帧光流图是通过连续两帧图像获取到的,因此,在本实现方式中。语音关键事件检测主要有哪些零部件?河北光纤数据语音关键事件检测内容

语音关键事件检测一般设置在哪些地方?浙江新一代语音关键事件检测设计

    n个摄像头11与控制器12之间进行无线通信时,所采用的无线通信协议可以为wifi、蓝牙、zigbee等。可以理解的是,n个摄像头11还可以采用其他的无线通信协议与控制器12进行无线通信,本实用新型实施例不做赘述。在具体应用中,可以在游泳池壁的四周均匀设置摄像头11。通过设置的n个摄像头,可以采集水平方向上游泳池内的图像。在具体实施中,在设置n个摄像头11时,在垂直方向上,每一个摄像头11所设置的位置与游泳池水面之间的距离可以均小于预设值。摄像头11所设置的位置可以位于游泳池水面以下,也可以位于游泳池水面以上,还可以位于游泳池水面附近。在设置摄像头11时,可以将n个摄像头11均设置在游泳池水面以下,且与游泳池水面的垂直距离小于预设值;也可以将n个摄像头11均设置在游泳池水面以上,且与游泳池水面的垂直距离小于预设距离;还可以将n个摄像头11中的一部分设置在游泳池水面以下,其余部分设置在游泳池水面以上。在本实用新型实施例中,预设值可以为50厘米,也可以为40厘米或30厘米。可以理解的是,预设值还可以为其他值,可以根据具体的应用场景设定不同的预设值。在具体实施中,在水平方向上,多个摄像头11可以均匀排列。浙江新一代语音关键事件检测设计

深圳鱼亮科技有限公司位于龙华街道清华社区建设东路青年创业园B栋3层12号,交通便利,环境优美,是一家服务型企业。公司致力于为客户提供安全、质量有保证的良好产品及服务,是一家有限责任公司(自然)企业。公司拥有专业的技术团队,具有智能家居,语音识别算法,机器人交互系统,降噪等多项业务。深圳鱼亮科技以创造***产品及服务的理念,打造高指标的服务,引导行业的发展。

信息来源于互联网 本站不为信息真实性负责