河北自主可控语音关键事件检测特征

时间:2024年01月08日 来源:

    实施例一:待分析图像为上述类图像,即待分析图像为至少包含当前帧图像的目标防护舱的图像:则上述步骤s304,包括如下步骤f1-f2:步骤f1:将待分析图像输入到预设的场景图像检测模型中,得到场景图像检测模型输出的检测结果;步骤f2:基于场景图像检测模型输出的检测结果,确定关于目标防护舱的事件检测结果;其中,由于待分析图像为目标防护舱的场景图像,则在本实施例一中,所采用的检测模型即为预设的场景图像检测模型,且用于训练该场景图像检测模型的各个样本图像组中所包括的图像可以称为场景图像。需要说明的是,场景图像检测模型为:采用各个样本图像组和每个样本图像组的事件检测结果所训练得到的模型,且每一样本图像组中的图像与待分析图像的图像数量相同,各个样本图像组中的图像为:所采集到的关于防护舱的图像。具体的,当待分析图像为:当前帧图像和当前帧图像之前的连续m帧图像的多张图像,则场景图像检测模型为:采用各个样本图像组和每个样本图像组的事件检测结果所训练得到的模型,且每一样本图像组中包括m+1帧场景图像。其中,针对至少一个防护舱,在该防护舱中发生各类事件时,采集m+1帧关于该防护舱的图像,这样。语音关键事件检测领域有哪些?欢迎来电咨询!河北自主可控语音关键事件检测特征

    在本申请的示例性实施例中,在通过双向lstm网络获得语句的向量化语义表示w1之前,所述方法还可以包括:将语句中的m个字符随机初始化为一个维度为[m,n]的n维向量d,其中,对于从0到m-1的索引id,每个id对应一个不同的字符;对于长度为s的语句,该语句中每一个字符能够在向量d中找到对应的id,从而获得维度为[s,d]的向量。在本申请的示例性实施例中,通过双向lstm网络获得语句的向量化语义表示w1可以包括:将维度为[s,d]的向量输入预设的双向lstm神经网络,将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,通过bert模型获得语句的向量化语义表示w1可以包括:将语句直接输入所述bert模型,将所述bert模型的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,所述向量化语义表示w1的维度可以为[s,d1];其中,当通过双向lstm网络获得语句的向量化语义表示w1时,d1为2*lstm隐层节点数;当通过bert模型获得语句的向量化语义表示w1时,d1=768。在本申请的示例性实施例中,所述方法还可以包括:预先将触发词的类型划分为x种,将事件主体的类型划分为y种,其中,x、y均为正整数;在获得语句的向量化语义表示w1之前。语音关键事件检测介绍语音关键事件检测的好处有哪些?欢迎咨询!

    该m+1帧图像便可以组成一个样本图像组,并进一步确定该样本图像组的事件检测结果为:采集该m+1帧图像时,该防护舱内发生的事件类型。具体的,当待分析图像为:当前帧图像,则场景图像检测模型为:采用各个样本图像和每个样本图像的事件检测结果所训练得到的模型,且每个样本图像为一帧场景图像。其中,针对至少一个防护舱,在该防护舱中发生各类事件时,采集一帧关于该防护舱的图像,并将采集该图像时,该防护舱内发生的事件类型作为该图像的事件检测结果,这样,便可以得到一个样本图像组及样本图像组的事件检测结果。实施例二:待分析图像为上述第二类图像,即待分析图像为:至少包含光流图的光流图;则上述步骤s303,包括如下步骤g1-g2:步骤g1:将待分析图像输入到预设的光流图检测模型中,得到光流图检测模型输出的检测结果;步骤g2:基于光流图检测模型输出的检测结果,确定关于目标防护舱的事件检测结果。其中,由于待分析图像为目标防护舱的场景图像对应的光流图,则在本实施例二中,所采用的检测模型即为预设的光流图检测模型,且用于训练该光流图检测模型的各个第二样本图像组中所包括的图像即为光流图。需要说明的是。

    光流图检测模型为:采用各个第二样本图像组和每个第二样本图像组的事件检测结果所训练得到的模型,且每一第二样本图像组中的图像与待分析图像的图像数量相同,各个第二样本图像组中的图像为:关于防护舱的光流图。具体的,当待分析图像为:包括光流图和光流图之前的连续n帧光流图的多张图像,则光流图检测模型为:采用各个第二样本图像组和每个第二样本图像组的事件检测结果所训练得到的模型,且每一第二样本图像组中包括n+1帧光流图。其中,针对至少一个防护舱,在该防护舱中发生各类事件时,获取n+1帧关于该防护舱的光流图,这样,该n+1帧光流图便可以组成一个第二样本图像组,并进一步确定该第二样本图像组的事件检测结果为:获取该n+1帧光流图时,该防护舱内发生的事件类型。具体的,当待分析图像为:光流图,则光流图检测模型为:采用各个第二样本图像和每个第二样本图像的事件检测结果所训练得到的模型,且每个第二样本图像为一帧光流图。其中,针对至少一个防护舱,在该防护舱中发生各类事件时,获取一帧关于该防护舱的光流图,并将获取该光流图时,该防护舱内发生的事件类型作为该光流图的事件检测结果,这样。语音关键事件检测有什么注意事项?

    确定在时刻t0目标人物所处的位置信息,以及在时刻t1目标人物所处的位置信息。根据两个时刻目标人物所处的位置信息,可以获取目标人物的运动轨迹。根据目标人物的运动轨迹,可以获知目标人物所处的理论位置范围。在确定了目标人物的理论位置范围之后,控制器12可以从m个第二摄像头14采集到的实时图像中,识别出目标人物游泳时的动作姿势,进而获取目标人物的泳姿信息。在实际应用中,游泳者在游泳时,其对应的泳姿可以为蝶泳、蛙泳、仰泳、自由泳等。无论哪种泳姿,都存在一定的规律性。在具体实施中,控制器12可以采用现有的图像识别方法来识别目标人物游泳时的动作姿势。控制器12可以将识别出的动作姿势与现有的泳姿信息库进行比对,从而获知目标人物的泳姿信息。具体的比对过程也可以采用现有的匹配算法,本实用新型实施例不做赘述。在具体实施中,可以预先根据经验值,设置相应的目标频率值。例如,根据大数据统计分析,正常情况下,游泳者沉浮一次间隔的时间为15s,也即1分钟游泳者的沉浮频率为4次。此时,可以设置目标频率值为1分钟4次。可以理解的是,目标频率值也可以根据实际的应用场景进行设定,并不仅限于本实用新型上述实施例中提供的示例。通过分析语音信号的频率、幅度和持续时间等特征,语音关键事件检测系统能够识别出不同的声音事件。天津语音关键事件检测内容

语音关键事件检测就找鱼亮科技,服务体系完善!河北自主可控语音关键事件检测特征

    并且对于本领域的普通技术人员来说显而易见的是,在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合,并在具体实施方式中进行了讨论,但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外,任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用,或可以替代任何其它实施例中的任何其他特征或元件。本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合,以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合,以形成另一个由权利要求限定的独特的发明方案。因此,应当理解,在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此,除了根据所附权利要求及其等同替换所做的限制以外,实施例不受其它限制。此外,可以在所附权利要求的保护范围内进行各种修改和改变。此外,在描述具有代表性的实施例时,说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而。河北自主可控语音关键事件检测特征

信息来源于互联网 本站不为信息真实性负责