广州自主可控语音关键事件检测特征

时间:2022年09月20日 来源:

    直至电子设备判断预设时长内采集到的连续多帧图像中均包含相同的目标对象后,电子设备继续获得下一帧图像,即预设时长后的当前时刻对应的当前帧图像,并判断该当前帧图像中是否包括预设时长内采集到的连续多帧图像所包含的目标对象。这样,当判断结果为是时,电子设备便可以继续执行后续步骤s303。当前,光流法是图像分析领域中被重点关注的一种方法,所谓光流是指图像亮度模式的表观运动。可以理解的,当用户在防护舱中进行各类金融活动时,用户的某些身体部位也是运动的,例如,手指等。光流表达了图像的变化,可以引申出光流场。所谓光流场是指图像中所有像素点构成的一种二维(2d)瞬时速度场,其中的二维速度矢量是景物中可见点的三维速度矢量在成像表面的投影。这样,光流不包含了被观察物体的运动信息,而且还包含有关景物三维结构的丰富信息。因此,在本发明实施例中也可以引入光流法。可选的,一种具体实现方式中,上述本发明实施例提供的一种事件检测方法中,还可以包括如下步骤d1:步骤d1:每当获取到一帧图像时,利用该帧图像和该帧图像的前一帧图像,得到该帧图像对应的光流图;由于光流包含被观察物体的运动信息,因此,光流图表征的是两帧图像之间的变化。语音关键事件检测有哪些关键技术?广州自主可控语音关键事件检测特征

    每种类型与某一数字对应,以便于计算机的处理,则可以分别标记为[0,1,2,3,4,...,29,30]。在本申请的示例性实施例中,因计算机无法直接处理中文,因此可以将句子(语句)中每一个单词转化为数字的映射。即,获得语句的向量化语义表示w1。在本申请的示例性实施例中,所述获得语句的向量化语义表示w1可以包括:通过双向lstm网络模型或bert模型获得语句的向量化语义表示w1。在本申请的示例性实施例中,在通过双向lstm网络获得语句的向量化语义表示w1之前,所述方法还可以包括:将语句中的m个字符随机初始化为一个维度为[m,n]的n维向量d,其中,对于从0到m-1的索引id,每个id对应一个不同的字符;对于长度为s的语句,该语句中每一个字符能够在向量d中找到对应的id,从而获得维度为[s,d]的向量。在本申请的示例性实施例中,通过双向lstm网络获得语句的向量化语义表示w1可以包括:将维度为[s,d]的向量输入预设的双向lstm神经网络,将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,假设语料中一共有20000个不同的字符(汉字和/或单词,可以包括其他常用符号),每个字符可以随机初始化为一个300维的向量,则可以得到一个维度为[20000。广州自主可控语音关键事件检测特征语音关键事件检测的维修指南。

    电子设备便可以基于该当前帧图像,确定待分析图像。由于是对目标防护舱内发生的事件进行检测,因此,也就是检测目标防护舱内的用户是否处于正常情况中。这样,电子设备所确定的待分析图像便可以为:关于目标防护舱内的用户的图像,进一步的,目标防护舱内的用户通过当前帧图像中的目标对象表征。因此,电子设备所确定的待分析图像即为:关于目标防护舱及目标对象的图像。例如,包括目标防护舱内部情况及目标对象的图像。需要说明的是,电子设备可以通过多种方式基于当前帧图像,确定待分析图像,对此,本发明实施例不做具体限定。可选的,一种具体实现方式中,上述步骤s303,可以为:将至少包含当前帧图像的类图像确定为待分析图像,其中,类图像中各图像均为关于目标防护舱,且包括目标对象的图像。由于电子设备实时获取的关于目标防护舱的图像均为目标图像采集设备所采集的、能够反映目标防护舱的内部空间在每个时刻的真实情况的图像,并且,由于是对目标防护舱内的用户是否处于正常情况中进行检测。因此,电子设备可以将这些关于目标防护舱,且包括目标对象的图像确定为待分析图像。从而,利用待分析图像,确定当前时刻,关于目标防护舱的事件检测结果。具体的。

    通信接口用于上述电子设备与其他设备之间的通信。存储器可以包括随机存取存储器(randomaccessmemory,ram),也可以包括非易失性存储器(non-volatilememory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。上述的处理器可以是通用处理器,包括处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,该计算机程序被处理器执行时实现上述本发明实施例提供的一种事件检测方法中的任一方法步骤。需要说明的是,在本文中,诸如和第二等之类的关系术语用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含。语音关键事件检测一般设置在哪些地方?

    用于基于当前帧图像,确定待分析图像,其中,待分析图像为:关于目标防护舱及目标对象的图像;结果确定模块640,用于将待分析图像输入到预设的检测模型中,得到关于目标防护舱的事件检测结果;其中,检测模型为:基于各个样本图像和每个样本图像的事件检测结果所训练得到的模型。以上可见,应用本发明实施例提供的方案,实时获取目标防护舱的图像,并判断当前时刻所采集到的当前帧图像是否包括目标对象,由于目标对象为:能够表征用户进入目标防护舱的用户身体部位,则可以基于当前帧图像判断当前时刻是否有用户进入目标防护舱。则当判断结果为是时,便可以基于当前帧图像,确定待分析图像,进而将该待分析图像输入到预设的检测模型中,得到关于目标防护舱的事件检测结果。这样,由于检测模型是基于各个样本图像和各个样本图像的事件检测结果所训练得到的模型,因此,检测模型充分学习了样本图像和事件检测结果之间的对应关系。基于此,在本发明实施例中,利用采集到的真实图像来确定待分析图像,利用训练好的检测模型对待分析图像进行检测,便可以提高关于目标防护舱的事件检测结果的准确率。而上述事件检测结果中可以包括目标防护舱内所发生的事件类型。语音关键事件检测是什么?广州新一代语音关键事件检测标准

语音关键事件检测的主要功能。广州自主可控语音关键事件检测特征

近年来,通信产品技术突飞猛进,通信产业成为全世界发展速度的产业之一。在中国国内,受益于我国对相关部门与公共安全的重视,以及经济飞速发展带来的大型活动增加,我国专网通信行业保持飞速增长趋势。从细分产品及服务来看,全球语音识别,音效算法,降噪算法,机器人,智能玩具,软件服务,教育培训,芯片开发,电脑,笔记本,手机,耳机,智能穿戴,进出口服务,云计算,计算机服务,软件开发,底层技术开发,软件服务进出口,品牌代理服务。行业竞争层次明显,在不同产品、服务领域有不同的竞争对手。前瞻对全球统一通信产品和服务的销售(尤其是中端企业领域),云产品和服务领域,视频产品和服务方面,以及呼叫中心产品和服务方面的竞争对手进行了整理和归纳。智能手机的日益普及以及电信运营商对语音识别,音效算法,降噪算法,机器人,智能玩具,软件服务,教育培训,芯片开发,电脑,笔记本,手机,耳机,智能穿戴,进出口服务,云计算,计算机服务,软件开发,底层技术开发,软件服务进出口,品牌代理服务。基础设施现代化的大规模加入预计将有助于在预测时间线内UCC市场的持续增长。人工智能有限责任公司(自然)企业发展进入快车道,近两年实现了真正的跨越式发展。预计2018年的主旋律仍将是人工智能技术的产业化落地,将会有更多的传统企业借助AI技术实现智能化转型。广州自主可控语音关键事件检测特征

深圳鱼亮科技有限公司是一家有着雄厚实力背景、信誉可靠、励精图治、展望未来、有梦想有目标,有组织有体系的公司,坚持于带领员工在未来的道路上大放光明,携手共画蓝图,在广东省等地区的通信产品行业中积累了大批忠诚的客户粉丝源,也收获了良好的用户口碑,为公司的发展奠定的良好的行业基础,也希望未来公司能成为*****,努力为行业领域的发展奉献出自己的一份力量,我们相信精益求精的工作态度和不断的完善创新理念以及自强不息,斗志昂扬的的企业精神将**深圳鱼亮科技供应和您一起携手步入辉煌,共创佳绩,一直以来,公司贯彻执行科学管理、创新发展、诚实守信的方针,员工精诚努力,协同奋取,以品质、服务来赢得市场,我们一直在路上!

信息来源于互联网 本站不为信息真实性负责