云南无限语音关键事件检测服务标准

时间：2024年01月11日来源：

上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器，如数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是。随着深度学习技术的不断发展，语音关键事件检测的准确性和实时性将得到进一步提高。云南无限语音关键事件检测服务标准

将w2与w4进行横向拼接得到终的语义表示w3，w3的维度可以为[n,2*d1]。在本申请的示例性实施例中，自注意力机制计算具体可以包括：将w2分别进行多次(如三次)线性变换得到w21、w22、w23,然后可以执行矩阵相乘运算得到w4＝(w22*w23t)*w21，w3＝w2||w4。s105、对所述新的语义表示w3进行span分类，确定每个span是否为一个事件的触发词或事件主体。在本申请的示例性实施例中，所述对所述新的语义表示w3进行span分类可以包括：使用两层全连接神经网络和softmax层对每个span进行分类；其中，在训练阶段，将分类结果与带有标记的span进行误差计算和反向传播。在本申请的示例性实施例中，得到步骤s104的span的表示w3后，可以使用两层全连接神经网络和softmax层对span进行分类。在本申请的示例性实施例中，如果如步骤s101中所述，预先对数据进行了预处理，即预先对数据进行了span分类和标记，则在训练阶段，可以将分类结果与预处理过程所得的带有标记的span进行误差计算和反向传播，并进行参数更新操作完成训练过程。在本申请的示例性实施例中，在预测阶段，根据分类的结果即可得到每个span的类型。softmax的输出是每个span所属对应类型(预处理过程获得的带类型标记的span)的概率。江苏量子语音关键事件检测哪里买语音关键事件检测技术怎么样？欢迎来电咨询！

300]的向量d，其中对于索引id从0至19999，每个id对应一个不同的汉字。那么对于一句话(长度为s)中的每一个字符，都可以在d中找到对应的id，从而获取对应的向量，因此可以得到一个维度为[s,300]的向量。然后可以使用双向lstm神经网络得到句子的语义表示向量w1。在本申请的示例性实施例中，通过bert模型获得语句的向量化语义表示w1可以包括：将语句直接输入所述bert模型，将所述bert模型的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中，使用bert模型时，可以将句子直接输入至bert模型，bert模型的输出即可以作为句子的向量化语义表示w1。在本申请的示例性实施例中，所述向量化语义表示w1的维度可以为[s，d1]；其中，当通过双向lstm网络获得语句的向量化语义表示w1时，d1为2*lstm隐层节点数；当通过bert模型获得语句的向量化语义表示w1时，d1＝768。在本申请的示例性实施例中，设以上两种方法得到的语义表示为w1，则,1的维度为[s,d1]，其中s为句子长度；如果使用双向lstm网络获得语句的向量化语义表示w1，则d1为2*lstm隐层节点数，如果使用bert模型获得语句的向量化语义表示w1，则d1＝768。s102、对所述向量化语义表示w1进行span划分，得到多个语义片段。

缺点在于：首先处理繁琐，其次这些工具在处理的过程中本身具有一定的误差，因此在后续建模分析的过程中会存在误差累积的问题。3、基于序列标注的一系列模型很难解决事件主体存在交叉的情况，比如“北京的法院”为一个事件主体(机构)，但是“北京”本身也是一种主体/实体(地名)。技术实现要素：本申请提供了一种事件检测方法和装置，能够获取更加有用的信息，具有较强的实际应用价值；在数据处理和建模的过程中操作简单，避免了因使用自然语言处理工具而导致的误差累积的问题；通过划分span的方式，完美解决了序列标注存在的问题，效率更高，适用性更强。本申请提供了一种事件检测方法，所述方法可以包括：获得语句的向量化语义表示w1；对所述向量化语义表示w1进行span划分，得到多个语义片段；对多个语义片段进行平均池化，得到每个span的表示w2；使用自注意力机制对获得的每个span的表示w2进行计算，得到每个span的新的语义表示w3；对所述新的语义表示w3进行span分类，确定每个span是否为一个事件的触发词或事件主体。在本申请的示例性实施例中，所述获得语句的向量化语义表示w1可以包括：通过双向lstm网络模型或bert模型获得语句的向量化语义表示w1。语音关键事件检测一般设置在哪些地方？欢迎咨询！

从而可以提高对防护舱内用户出现异常事件的检测准确率可选的，一种具体实现方式中，上述装置还包括图像判断模块；在本实现方式中，一种情况下，图像判断模块，可以用于在基于当前帧图像，确定待分析图像之前，判断当前帧图像和当前帧图像之前的连续预设数量帧图像，是否均包含目标对象；在本实现方式中，另一种情况下，图像判断模块，可以用于在基于当前帧图像，确定待分析图像之前，判断当前帧图像和在当前时刻之前的预设时长内采集到的连续多帧图像，是否均包含目标对象；如果是，触发图像确定模块。可选的，一种具体实现方式中，上述图像确定模块630包括：图像确定子模块，用于将至少包含当前帧图像的类图像确定为待分析图像，其中，类图像中各图像均为关于目标防护舱，且包括目标对象的图像。可选的，一种具体实现方式中，类图像为：当前帧图像和当前帧图像之前的连续m帧图像的多张图像；其中，m为正整数；或，类图像为：当前帧图像。可选的，一种具体实现方式中，上述结果确定模块640包括：图像检测子模块，用于将待分析图像输入到预设的场景图像检测模型中，得到场景图像检测模型输出的检测结果；结果确定子模块，用于基于场景图像检测模型输出的检测结果。语音关键事件检测是未来语音识别和智能交互领域的重要研究方向之一。广西移动语音关键事件检测标准

语音关键事件检测在线咨询鱼亮科技！云南无限语音关键事件检测服务标准

实施例一：待分析图像为上述类图像，即待分析图像为至少包含当前帧图像的目标防护舱的图像：则上述步骤s304，包括如下步骤f1-f2：步骤f1：将待分析图像输入到预设的场景图像检测模型中，得到场景图像检测模型输出的检测结果；步骤f2：基于场景图像检测模型输出的检测结果，确定关于目标防护舱的事件检测结果；其中，由于待分析图像为目标防护舱的场景图像，则在本实施例一中，所采用的检测模型即为预设的场景图像检测模型，且用于训练该场景图像检测模型的各个样本图像组中所包括的图像可以称为场景图像。需要说明的是，场景图像检测模型为：采用各个样本图像组和每个样本图像组的事件检测结果所训练得到的模型，且每一样本图像组中的图像与待分析图像的图像数量相同，各个样本图像组中的图像为：所采集到的关于防护舱的图像。具体的，当待分析图像为：当前帧图像和当前帧图像之前的连续m帧图像的多张图像，则场景图像检测模型为：采用各个样本图像组和每个样本图像组的事件检测结果所训练得到的模型，且每一样本图像组中包括m+1帧场景图像。其中，针对至少一个防护舱，在该防护舱中发生各类事件时，采集m+1帧关于该防护舱的图像，这样。云南无限语音关键事件检测服务标准

上一篇：四川光纤数据语音关键事件检测设计

下一篇：自主可控语音关键事件检测服务标准