福建新一代语音关键事件检测设计

时间:2022年02月12日 来源:

    也就是说,安装在防护舱内的用于监控防护舱内情况的摄像头,可以作为本发明实施例中关于防护舱的图像的数据来源。这样,可以通过一个设备实现多种功能,可以极大地节省成本。当然,也可以在防护舱的相关位置上安装专门用于实时采集关于防护舱的图像的图像采集设备。这都是合理的。其中,为了获得较高的关于目标防护舱的事件检测结果的准确率,人们希望所获得的关于防护舱的图像能够尽可能的包括防护舱内更多的区域,即人们希望图像采集设备的拍摄区域能够尽可能地覆盖到防护舱内更多的空间。例如,如图2所示,可以将安装在防护舱顶部的摄像头作为本发明实施例中关于防护舱的图像的数据来源。其中,摄像机的镜头可以垂直于舱顶,也可以倾斜于舱顶,与舱顶形成一定的角度,例如,不小于60度。这都是合理的。当然,在实际应用中,作为关于防护舱的图像的数据来源的图像采集设备也可以安装在其他位置,只要能够保证能够基于该图像采集设备所采集到的关于防护舱的图像,确定当前时刻,关于目标防护舱的事件检测结果即可。下面,对本发明实施例提供的一种事件检测方法,进行介绍。图3为本发明实施例提供的一种事件检测方法的流程示意图。需要说明的是。语音关键事件检测图片。福建新一代语音关键事件检测设计

    在本申请的示例性实施例中,在通过双向lstm网络获得语句的向量化语义表示w1之前,所述方法还可以包括:将语句中的m个字符随机初始化为一个维度为[m,n]的n维向量d,其中,对于从0到m-1的索引id,每个id对应一个不同的字符;对于长度为s的语句,该语句中每一个字符能够在向量d中找到对应的id,从而获得维度为[s,d]的向量。在本申请的示例性实施例中,通过双向lstm网络获得语句的向量化语义表示w1可以包括:将维度为[s,d]的向量输入预设的双向lstm神经网络,将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,通过bert模型获得语句的向量化语义表示w1可以包括:将语句直接输入所述bert模型,将所述bert模型的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,所述向量化语义表示w1的维度可以为[s,d1];其中,当通过双向lstm网络获得语句的向量化语义表示w1时,d1为2*lstm隐层节点数;当通过bert模型获得语句的向量化语义表示w1时,d1=768。在本申请的示例性实施例中,所述方法还可以包括:预先将触发词的类型划分为x种,将事件主体的类型划分为y种,其中,x、y均为正整数;在获得语句的向量化语义表示w1之前。福建新一代语音关键事件检测设计语音关键事件检测的成熟度如何?

    第二类图像中各个图像均为:基于每两帧连续的关于目标防护舱且包括目标对象的图像获取的光流图。具体的,在本实现方式中,第二类图像为:包括光流图和光流图之前的连续n帧光流图的多张图像;其中,n为正整数;或者,第二类图像为:光流图。也就是说,在本实现方式中,电子设备可以将所获得的光流图确定为待分析图像;此外,在获取到光流图后,电子设备可以判断光流图之前的连续n帧光流图是否均是基于每两帧连续的关于目标防护舱且包括目标对象的图像获取的,当判断结果为是时,电子设备也可以将包括光流图和该连续n帧光流图的多张图像确定为待分析图像。这样,用于确定当前时刻,关于目标防护舱的事件检测结果的待分析图像为多张,可以更充分地反映目标防护舱中用户的运动变化情况,进而提高事件检测的准确率。其中,n可以为任一正整数,例如,5,10等。基于上述对步骤s304中的说明中,对检测模型模型的描述内容,可以确定不同类型和数量的待分析图像,所利用的检测模型不同。进一步的,针对不同的待分析图像,则上述步骤s304的实现方式不同。下面,针对不同类型和数量的待分析图像,对上述步骤s304的具体执行方式,以及待分析图像与检测模型之间的对应关系进行举例说明。

    并为所得到的截图添加标签,其中,标签包括:采集当前帧图像的采集时间和所发生异常事件类型对应的类型标签。可选的,一种具体实现方式中,上述装置还包括:视频标记模块,用于当事件检测结果为关于发生异常事件且所发生异常事件类型的结果时,在关于目标防护舱的监控视频中,为当前帧图像添加第二标签,其中,第二标签包括:所发生异常事件类型对应的类型标签。相应于上述本发明实例提供的一种事件检测方法,本发明实施例还提供了一种电子设备,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信,存储器703,用于存放计算机程序;处理器701,用于执行存储器703上所存放的程序时,实现上述本发明实施例提供的一种事件检测方法中的任一方法步骤。上述电子设备提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中用一条粗线表示,但并不表示有一根总线或一种类型的总线。语音关键事件检测的维修指南。

    电子设备可以确定存在用户进入目标防护舱,则在当前时刻,目标防护舱内可能发生异常事件,这样,电子设备便可以继续执行步骤s303。需要说明的是,在本实现方式中,电子设备可以采用任一能够检测出当前帧图像和当前帧图像之前的连续预设数量帧图像中是否均包含目标对象的图像识别算法执行上述步骤s302a,对此,本发明实施例不做具体限定。其中,上述预设数量可以为任一正整数,例如,5,10等,这都是合理的。下面,对电子设备执行上述步骤s302a的具体过程进行说明:电子设备在获取到每帧关于目标防护舱的图像后,判断该图像中是否包含目标对象。进而,在获取该图像的下一帧图像后,判断该下一帧图像中是否包括与前一帧图像相同的目标对象。依次类推,直至电子设备判断连续预设数量帧图像后中均包含相同的目标对象后,电子设备继续获得下一帧图像,即采集完连续预设数量帧图像后的当前时刻对应的当前帧图像,并判断该当前帧图像中是否包括前连续预设数量帧图像所包含的目标对象。这样,当判断结果为是时,电子设备便可以继续执行后续步骤s303。另一种具体实现方式中,如图5所示。语音关键事件检测的难点有哪些?山东移动语音关键事件检测内容

语音关键事件检测领域有哪些?福建新一代语音关键事件检测设计

    比如人名、地名、组织机构名、时间等。4、事件检测与主体抽取:事件检测与主体抽取即为同时抽取事件的触发词和事件的主体。5、注意力机制:注意力机制的本质来自于人类视觉注意力机制。当人们发现一个场景经常在某部分出现自己想观察的东西时,人们会进行学习在将来再出现类似场景时把注意力放到该部分上。在计算某一序列表示时,注意力机制可以获得权重和序列位置的相关性。6、自注意力机制:自注意力机制是对注意力机制的改进,减少了对外部信息的依赖,更擅长捕捉数据或特征的内部相关性,无视词之间的距离直接计算依赖关系,能够学习一个句子的内部结构。7、span:span可认为是“一段区域,每个span具有一定的宽度”,就是对一段话进行固定长度的选取,比如一句话“我吃了面包,喝了牛奶”,如果span的宽度为2,则可以得到片段“我今”、“”、“天吃”等。8、span的划分:span的划分是指根据设定的span的大宽度,从小到大依次进行划分。比如span大宽度为8,则span的宽度为1-8,分别进行划分,可以得到多个span。9、span的分类:span的分类是指通过模型或特定的方法判断一条数据所属的类型即标签,一般而言,分类任务中的每条数据只属于一个类别。福建新一代语音关键事件检测设计

深圳鱼亮科技有限公司致力于通信产品,是一家服务型的公司。公司自成立以来,以质量为发展,让匠心弥散在每个细节,公司旗下智能家居,语音识别算法,机器人交互系统,降噪深受客户的喜爱。公司注重以质量为中心,以服务为理念,秉持诚信为本的理念,打造通信产品良好品牌。在社会各界的鼎力支持下,持续创新,不断铸造***服务体验,为客户成功提供坚实有力的支持。

信息来源于互联网 本站不为信息真实性负责