北京商显声学回声抑制算法

时间：2023年01月14日来源：

AEC定义声学回声（AcousticEcho）电话的扬声器的声音(包括反射声)，被麦克风拾取传送给远端，使得远端说话人又听到自己的声音，广义回声指的是设备喇叭和自身麦克风的耦合现象都称为回声。回声消除AEC（AcousticEchoCancellation）一般指的是声学回声消除，其主要用于抑制产品本身发出的声音，使得产品在播放音频时依然可以进行语音交互；随着秒新月异的科技发展，各项技术成果不断地应用在我们日益拓展的各领域需求当中，刷新着我们的生活和工作。地球村的崛起，不断以互联网、物联网等方式揭示着万物相连的关系。无论是飞机、高铁还是电话、网络，都成为托起地球新村时空纵横的重要载体。怎样拉近人与人之间的关系，如何建立起更行之有效的联络方式，提高远程协同工作、信息传达效率成为了一个重要命题。远程会议的出现在很大程度上为这种多极化办公互动提供了质量的平台保障，在借助互联网便捷的远程通信架构下，通讯数据安全，稳定可靠，很长一段时间广受用户青睐。然而美中不足的是，这样的（声音）系统仍逃不出的还是自然声学上的问题。有和业内朋友聊天中谈到，今后的扩声系统也许只保留两级传统装置了，那就是声电转换和电声转换的拾音和还原。

声学回声，表现为收发环路的隔离度不好，其根本原因就是耳机在装配时麦克风与喇叭的密封隔离没做好。北京商显声学回声抑制算法

至于双讲恢复能力WebRTCAEC算法提供了{kAecNlpConservative,kAecNlpModerate,kAecNlpAggressive}3个模式，由低到高依次不同的抑制程度，远近端信号处理流程,NLMS自适应算法（上图中橙色部分）的运用旨在尽可能地消除信号d(n)中的线性部分回声，而残留的非线性回声信号会在非线性滤波（上图中紫色部分）部分中被消除，这两个模块是WebrtcAEC的模块。模块前后依赖，现实场景中远端信号x(n)由扬声器播放出来在被麦克风采集的过程中，同时包含了回声y(n)与近端信号x(n)的线性叠加和非线性叠加：需要消除线性回声的目的是为了增大近端信号X(ω)与滤波结果E(ω)之间的差异，计算相干性时差异就越大（近端信号接近1，而远端信号部分越接近0），更容易通过门限直接区分近端帧与远端帧。非线性滤波部分中只需要根据检测的帧类型，调节抑制系数，滤波消除回声即可。下面我们结合实例分析这套架构中的线性部分与非线性分。线性滤波线性回声y'(n)可以理解为是远端参考信号x(n)经过房间冲击响应之后的结果，线性滤波的本质也就是在估计一组滤波器使得y'(n)尽可能的等于x(n)，通过统计滤波器组的比较大幅值位置index找到与之对齐远端信号帧，该帧数据会参与相干性计算等后续模块。

安徽语音识别声学回声通话回到前面的这个声学回声路径图。

并与正常品的对比和设定合理的limits，可以快速准确的检查出耳机的异常音不良。耳机底噪底噪也就是本底噪声，一般指在电声系统中，除去有用的信号外的总噪声。底噪有来自于固有的电子、电磁噪音，也有确是功放电路或电源性能问题导致的。理论上底噪是无法去除的，当然只有当底噪大到影响听感的时候才是问题。很多时候可以提高信噪比把底噪给压低，这确实可以降低听音乐时噪声的影响。但是总之人们还是有带耳机不听音乐的时候，典型的如ANC耳机降噪工作的时候，此时显得尤为重要，近期几大品牌都因为ANC底噪问题造成过批量退货。为了准确的检测产品底噪，我们需要知道目前行业内耳机功放工作类型大概有以下两种：1、产品处于蓝牙播放状态时，功放IC有打开，输入端无任何音源，喇叭输出端有底噪信号输出。2、产品处于蓝牙播放状态时，IC会被系统静音，信号输入端需要给一个很小信号触发功放IC打开，喇叭输出端有底噪信号输出。总的来说，底噪时需要多种指标和技术手段来验证和管控。指南测控整个标准声学测试系统通过极高灵敏度的仪器和声学传感器，采用多种评估底噪能量值的方法，以及专门为底噪测试而设计的箱体及治具结构，测试软件逻辑等一体化的设计。

这样会带来一个新的问题：按照Widrow的自适应滤波理论，滤波器的长度越长，其收敛速度越慢，同时权噪声越大，进而导致强混响下回声消除不够理想。第二个问题是延时跳变问题。在实时音视频通话领域，延时跳变是一个比较普遍的问题。主要现象是麦克端采集的信号和回声参考信号之间的时延关系会发生跳变，每次跳变之后就需要重新对齐信号，就会漏一些回声出来。第三个问题是啸叫问题。啸叫的检测和啸叫的抑制是公认的在回声领域的经典难题。还有双讲问题。双讲是评估回声消除算法性能的一个重要指标，当然也是很难处理的一个问题，因为双讲很容易导致滤波器系数发散。综合以上这些维度我们可以看到，非线性的声学回声消除是一个很有挑战的研究方向。双耦合声学回声消除算法这个是我们团队提出来的一种算法，它的主要特点是，在构建滤波器模型的过程中结合了非线性声学回声的一些特性，因此它在抑制非线性回声方面，也体现出固有的优势。1.非线性声学回声系统建模,继续回到前面的这个声学回声路径。我们对这个模型进行了简化。我们将左边的喇叭端用一个传递函数Wn来表示，假设它的是非线性的回声路径传递函数；同时我们将喇叭右边，就是麦克端，统一用Wl来表示。

右边的非线性声学回声场景。

在这里我将整个回声路径分成了A、B、C、D四个部分。我们一起来看一下，ABCD里面哪一个环节有可能是非线性的？答案应该是B。也就是回声路径里面的功率放大器和喇叭，具体的原因稍后会做详细分析。接下来我想再解释一下为什么A、C、D它们不是非线性的。首先这里的A和D比较好判断，他们都属于线性时不变系统。比较难判断的是C，因为在一些比较复杂的场景下，声学回声往往会经过多个不同路径的多次反射之后到达接收端，同时会带有很强的混响，甚至在更极端情况下，喇叭与麦克风之间还会产生相对位移变化，导致回声路径也会随时间快速变化。这么多因素叠加在一起，往往会导致回声消除算法的性能急剧退化，甚至完全失效。有同学可能会问，难道这么复杂的情况，不是非线性的吗？我认为C应该是一个线性时变的声学系统，因为我们区分线性跟非线性的主要依据是叠加原理，前面提到的这些复杂场景，它们依然是满足叠加原理的，所以C是线性系统。这里还要再补充一点，细心的朋友会发现B里面有一个功率放大器，同时在C里面也有一个功率放大器，为什么经B的功率放大器放大之后，可能带来非线性失真，而C的功率放大器不会产生非线性失真呢？二者的主要区别在于B放大之后输出是一个大信号。

介绍非线性声学回声消除的公开文献也少之又少。天津智能音响声学回声分析

非线性的声学回声消除问题，在实际声学系统里面非常普遍也非常棘手。北京商显声学回声抑制算法

服务型商家为应对市场竞争并提升未来的竞争力，对网络维护加入将不断增加，以支撑持续稳定增长的业务需求。通信业市场需求和加入规模的增长，将为通信技术服务行业开拓广阔的市场空间。通信产品指人与人或人与自然之间通过某种行为或媒介进行的信息交流与传递，从广义上指需要信息的双方或多方在不违背各自意愿的情况下采用任意方法，任意媒质，将信息从某方准确安全地传送到另方。通信产品不仅成就通讯业收入增长的重要源原，还从某种程度上改变了人们的通信方式和生活习惯，造就了一批风光无限的新兴服务型企业。中国通信产业年度事件和通信产业年度技术趋势的发布已经成为中国通信产业大会的鲜明标签，持续十年之久。每年大会发布的年度判断，被企业普遍引用和期待，成为过去年度的一个行业烙印总结，成为未来一年技术市场服务型的一个预测。北京商显声学回声抑制算法

深圳鱼亮科技有限公司成立于2017-11-03，同时启动了以Bothlent为主的智能家居，语音识别算法，机器人交互系统，降噪产业布局。深圳鱼亮科技经营业绩遍布国内诸多地区地区，业务布局涵盖智能家居，语音识别算法，机器人交互系统，降噪等板块。我们在发展业务的同时，进一步推动了品牌价值完善。随着业务能力的增长，以及品牌价值的提升，也逐渐形成通信产品综合一体化能力。深圳鱼亮科技始终保持在通信产品领域优先的前提下，不断优化业务结构。在智能家居，语音识别算法，机器人交互系统，降噪等领域承揽了一大批高精尖项目，积极为更多通信产品企业提供服务。

上一篇：河南环境降噪噪声

下一篇：江苏前处理降噪通话清晰度