云南电子类语音关键事件检测介绍

时间:2024年02月01日 来源:

    用于将场景图像检测模型输出的检测结果和光流图检测模型输出的检测结果进行融合计算,基于融合计算的结果,确定关于目标防护舱的事件检测结果。可选的,一种具体实现方式中,上述结果确定单元包括:乘积计算子单元,用于根据场景图像检测模型和光流图检测模型的权重,计算场景图像检测模型输出的检测结果和场景图像检测模型的权重的乘积,并计算光流图检测模型输出的检测结果与光流图检测模型的权重的第二乘积;结果确定子单元,用于计算乘积和第二乘积的和值,基于和值,确定关于目标防护舱的事件监测结果。可选的,一种具体实现方式中,事件检测结果为:关于未发生异常事件的结果,或者,关于发生异常事件且所发生异常事件类型的结果。可选的,一种具体实现方式中,上述装置还包括:事件判断模块,用于当事件检测结果为关于发生异常事件且所发生异常事件类型的结果时,判断目标防护舱当前时刻发生的事件类型是否包括预设类型的事件;如果是,触发报警模块;报警模块,用于生成并发出与预设类型对应的报警信号。可选的,一种具体实现方式中,上述装置还包括:图像截取模块,用于当事件检测结果为关于发生异常事件且所发生异常事件类型的结果时,对当前帧图像进行截图。利用语音关键事件检测技术,我们可以自动提取音频中的情感信息,如愤怒、快乐或悲伤等。云南电子类语音关键事件检测介绍

    比如人名、地名、组织机构名、时间等。4、事件检测与主体抽取:事件检测与主体抽取即为同时抽取事件的触发词和事件的主体。5、注意力机制:注意力机制的本质来自于人类视觉注意力机制。当人们发现一个场景经常在某部分出现自己想观察的东西时,人们会进行学习在将来再出现类似场景时把注意力放到该部分上。在计算某一序列表示时,注意力机制可以获得权重和序列位置的相关性。6、自注意力机制:自注意力机制是对注意力机制的改进,减少了对外部信息的依赖,更擅长捕捉数据或特征的内部相关性,无视词之间的距离直接计算依赖关系,能够学习一个句子的内部结构。7、span:span可认为是“一段区域,每个span具有一定的宽度”,就是对一段话进行固定长度的选取,比如一句话“我吃了面包,喝了牛奶”,如果span的宽度为2,则可以得到片段“我今”、“”、“天吃”等。8、span的划分:span的划分是指根据设定的span的大宽度,从小到大依次进行划分。比如span大宽度为8,则span的宽度为1-8,分别进行划分,可以得到多个span。9、span的分类:span的分类是指通过模型或特定的方法判断一条数据所属的类型即标签,一般而言,分类任务中的每条数据只属于一个类别。福建自主可控语音关键事件检测服务标准智能语音质检都有什么功能?欢迎来电咨询!

    电子设备在上述步骤s304中得到的事件检测结果可以为:关于未发生异常事件的结果,即目标防护舱内未发生异常情况;相对应的,电子设备在上述步骤s304中得到的事件检测结果也可以为:关于发生异常事件的结果,即目标防护舱内发生异常情况。可选的,一种具体实现方式中,上述事件检测结果为:关于未发生异常事件的结果。具体的,当事件检测结果为:关于未发生异常事件的结果时,则在上述步骤s304中,上述检测模型可以直接输出:未发生异常事件,这样,电子设备便可以确定目标防护舱内未发生异常事件。可选的,另一种具体实现方式中,上述事件检测结果为:关于发生异常事件的结果。具体的,当事件检测结果为:关于发生异常事件的结果时,则在上述步骤s304中,上述检测模型可以直接输出:发生异常事件,这样,电子设备便可以确定目标防护舱内发生异常事件。显然,在上述实现方式中,电子设备能够确定目标防护舱内是否发生异常事件,而不能确定当发生异常事件时,该异常事件的事件类型。因此,为了便于监控人员能够有针对性地对防护舱内所发生的异常事件进行处理,降低用户的人身伤害和财产损失,电子设备不但可以检测目标防护舱内是否发生异常事件。

    确定在时刻t0目标人物所处的位置信息,以及在时刻t1目标人物所处的位置信息。根据两个时刻目标人物所处的位置信息,可以获取目标人物的运动轨迹。根据目标人物的运动轨迹,可以获知目标人物所处的理论位置范围。在确定了目标人物的理论位置范围之后,控制器12可以从m个第二摄像头14采集到的实时图像中,识别出目标人物游泳时的动作姿势,进而获取目标人物的泳姿信息。在实际应用中,游泳者在游泳时,其对应的泳姿可以为蝶泳、蛙泳、仰泳、自由泳等。无论哪种泳姿,都存在一定的规律性。在具体实施中,控制器12可以采用现有的图像识别方法来识别目标人物游泳时的动作姿势。控制器12可以将识别出的动作姿势与现有的泳姿信息库进行比对,从而获知目标人物的泳姿信息。具体的比对过程也可以采用现有的匹配算法,本实用新型实施例不做赘述。在具体实施中,可以预先根据经验值,设置相应的目标频率值。例如,根据大数据统计分析,正常情况下,游泳者沉浮一次间隔的时间为15s,也即1分钟游泳者的沉浮频率为4次。此时,可以设置目标频率值为1分钟4次。可以理解的是,目标频率值也可以根据实际的应用场景进行设定,并不仅限于本实用新型上述实施例中提供的示例。通过分析语音信号的频率、幅度和持续时间等特征,语音关键事件检测系统能够识别出不同的声音事件。

    确定关于目标防护舱的事件检测结果;其中,场景图像检测模型为:采用各个样本图像组和每个样本图像组的事件检测结果所训练得到的模型,且每一样本图像组中的图像与待分析图像的图像数量相同,各个样本图像组中的图像为:所采集到的关于防护舱的图像。可选的,一种具体实现方式中,上述装置包括:光流图确定模块,用于每当获取到一帧图像时,利用该帧图像和该帧图像的前一帧图像,得到该帧图像对应的光流图;则在本实现方式中,上述图像确定模块630包括:第二图像确定子模块,用于将至少包含光流图在内的第二类图像确定为待分析图像,其中,第二类图像中各个图像的类型均为:基于每两帧连续的关于目标防护舱且包括目标对象的图像获取的光流图,光流图为当前帧图像对应的光流图。可选的,一种具体实现方式中,第二类图像为:包括光流图和光流图之前的连续n帧光流图的多张图像;其中,n为正整数;或,第二类图像为:光流图。可选的,一种具体实现方式中,上述结果确定模块640包括:第二图像检测子模块,用于将待分析图像输入到预设的光流图检测模型中,得到光流图检测模型输出的检测结果;第二结果确定子模块,用于基于光流图检测模型输出的检测结果。在医学领域,语音关键事件检测可以用于分析患者的语音数据,辅助医生进行疾病诊断。深圳电子类语音关键事件检测特征

语音关键事件检测在国际上的运用如何?欢迎咨询!云南电子类语音关键事件检测介绍

    当目标人物的沉浮频率偏离目标频率值时,也即目标人物沉浮频率过高或沉浮频率过低,目标人物均存在溺水的可能性。在具体实施中,游泳者在正常游泳时,泳姿可能会发生变化,但是泳姿通常是正常的,例如,游泳者在某一时间段进行蛙泳,之后一段时间进行仰泳。若游泳者出现溺水时,其对应的泳姿会出现异常。因此,在本实用新型实施例中,当目标人物的沉浮频率偏离预设的目标频率值,且目标人物的泳姿信息异常时,控制器12可以判定目标人物发生溺水。在具体实施中,若在目标人物所处的理论位置范围内没有检测到目标人物,且没有检测到目标人物的时间超过预设时长时,目标人物也可能会发生溺水。在本实用新型实施例中,当目标人物的沉浮频率偏离预设的目标频率值,且在预设时长内在所述理论位置范围内没有检测到目标人物时,控制器12也可以判定目标人物发生溺水。在实际应用中,预设时长可以根据具体的应用场景进行设定。例如,预设时长设置为15s。又如,预设时长设置为20s。需要说明的是,在本实用新型实施例中,控制器12执行的算法运算操作均可以采用现有的公知技术所实现。在具体实施中,在判定目标人物溺水之后,控制器12可以向预先关联的告警装置13输出告警指令。云南电子类语音关键事件检测介绍

信息来源于互联网 本站不为信息真实性负责