音频信号补偿方法、装置、电子设备及可读存储介质与流程
未命名
10-08
阅读:105
评论:0

1.本技术属于音频技术领域,具体涉及一种音频信号补偿方法、装置、电子设备及可读存储介质。
背景技术:
2.目前,电子设备在通过至少两个麦克风进行拾音时,为了能够拾取特定方向的目标声源并降低噪声的干扰,通常会采用空间滤波算法对采集的音频信号进行处理。在该空间滤波算法中,需使用用于控制历史值和当前值所占的比例的遗忘因子,对当前帧协方差矩阵进行更新。
3.然而,使用上述遗忘因子对协方差矩阵进行更新,会造成一段时间内协方差矩阵的跟踪延迟,而该跟踪延迟会使得该段时间内拾取的上述目标声源的频谱损伤,则当目标声源发生移动时会导致电子设备拾音的质量较差。
技术实现要素:
4.本技术实施例的目的是提供一种音频信号补偿方法、装置、电子设备及可读存储介质,能够解决当目标声源发生移动时会导致电子设备拾音的质量较差的问题。
5.第一方面,本技术实施例提供了一种音频信号补偿方法,该方法包括:基于第一音频信号的第一实时功率,以及第二音频信号的第二实时功率,确定补偿掩码,第一音频信号包括至少两个麦克风采集的音频信号,第二音频信号为对第一音频信号进行空间滤波后得到的音频信号;基于第一音频信号的幅度平均值,以及第一音频信号中第三音频信号的相位,确定补偿音频信号,第三音频信号为至少两个麦克风中任一麦克风采集的音频信号;采用补偿掩码和补偿音频信号,对第二音频信号进行补偿处理,得到补偿后的第二音频信号。
6.第二方面,本技术实施例提供了一种音频信号补偿装置,该装置包括确定模块和处理模块;确定模块,用于基于第一音频信号的第一实时功率,以及第二音频信号的第二实时功率,确定补偿掩码,第一音频信号包括至少两个麦克风采集的音频信号,第二音频信号为对第一音频信号进行空间滤波后得到的音频信号;确定模块,还用于基于第一音频信号的幅度平均值,以及第一音频信号中第三音频信号的相位,确定补偿音频信号,第三音频信号为至少两个麦克风中任一麦克风采集的音频信号;处理模块,用于采用补偿掩码和补偿音频信号,对第二音频信号进行补偿处理,得到补偿后的第二音频信号。
7.第三方面,本技术实施例提供了一种电子设备,该电子设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
8.第四方面,本技术实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
9.第五方面,本技术实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方
法。
10.第六方面,本技术实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面所述的方法。
11.在本技术实施例中,可以基于第一音频信号的第一实时功率,以及第二音频信号的第二实时功率,确定补偿掩码,第一音频信号包括至少两个麦克风采集的音频信号,第二音频信号为对第一音频信号进行空间滤波后得到的音频信号;且基于第一音频信号的幅度平均值,以及第一音频信号中第三音频信号的相位,确定补偿音频信号,第三音频信号为至少两个麦克风中任一麦克风采集的音频信号;并采用补偿掩码和补偿音频信号,对第二音频信号进行补偿处理,得到补偿后的第二音频信号。通过该方案,电子设备可以先基于至少两个麦克风采集的音频信号在空间滤波前后的实时功率,确定出补偿掩码;然后再基于该音频信号的特性,确定出补偿音频信号;并采用该补偿掩码和该补偿音频信号,对空间滤波后的该音频信号进行补偿处理;从而可以通过该补偿掩码实现对该补偿音频信号混合比例的调整,以使补偿处理后得到的音频信号的强度得到提升、频谱得到适应性修复。如此可以通过该补偿处理提升拾取的音频信号的质量,以降低空降滤波带来的跟踪延迟的影响,进而可以提升电子设备拾音的质量。
附图说明
12.图1是传统技术中麦克风阵列拾取固定声源的音频信号的示意图;
13.图2是传统技术中麦克风阵列拾取移动声源的音频信号的示意图;
14.图3是本技术实施例提供的音频信号补偿方法的流程图之一;
15.图4是本技术实施例提供的音频信号补偿方法的流程图之二;
16.图5是本技术实施例提供的音频信号补偿方法的流程图之三;
17.图6是本技术实施例提供的音频信号补偿方法的流程图之四;
18.图7是本技术实施例提供的音频信号补偿方法的流程图之五;
19.图8是本技术实施例提供的音频信号补偿方法中双麦克风阵列拾取的音频信号的频谱图;
20.图9是本技术实施例提供的音频信号补偿方法的示意图;
21.图10是本技术实施例提供的音频信号补偿方法中麦克风拾音增强信号的频谱图;
22.图11是本技术实施例提供的音频信号补偿装置的示意图;
23.图12是本技术实施例提供的电子设备的示意图;
24.图13是本技术实施例提供的电子设备的硬件示意图。
具体实施方式
25.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本技术保护的范围。
26.本技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
27.下面首先对本技术的说明书和权利要求书中涉及的一些名词或者术语进行解释说明。
28.空间滤波算法:也称为波束形成算法,是智能天线研究中的核心内容,可根据用户信号在空间传输的不同路径,在传输质量较好的路径方向上给予相应的天线增益,以形成窄波束对准用户信号;而在传输质量较差的路径方向上尽量压低旁瓣,采用指向性接收,以提高系统的容量。该算法可以通过对多路麦克风(常为多路全向麦克风)信号进行合并,抑制非目标方向信号,增强目标方向信号;进而可以实现对特定方向的聚焦拾音,能够有效提高接收信号的信噪比,也有起到降噪的作用。
29.空间滤波算法的基本原理是波的干涉,通过调整不同阵列单元信号之间的参数,使得某些角度的信号增强,而另一些角度的信号相互抵消。随着电子器件的工艺水平和性能越来越成熟,成本越来越低,该算法的应用也越来越广泛,具体包括但不限于以下设备和使用场景:耳机/手机的通话拾音降噪、数字助听器、声源定位、智能音箱、会议室麦克风、相控雷达/天线、车载拾音、去混响、远场拾音等。
30.短时傅里叶变换(short time fourier transform,stft):stft是和傅里叶变换相关的一种数学变换,用于确定时变信号其局部区域正弦波的频率与相位。
31.stft的基本思想是:选择一个时频局部化的窗函数g(t),假设通过分析,窗函数g(t)在一个短时间间隔内是平稳(伪平稳)的,那么移动窗函数g(t),使f(t)g(t)在不同的有限时间宽度内是平稳信号,从而计算出各个不同时刻的功率谱。stft使用一个固定的窗函数,窗函数一旦确定了,其形状就不再发生改变,短时傅里叶变换的分辨率也就确定了;如果要改变分辨率,则需要重新选择窗函数。stft用来分析分段平稳信号或者近似平稳信号犹可,但是对于非平稳信号,当信号变化剧烈时,要求窗函数有较高的时间分辨率;而波形变化比较平缓的时刻,则要求窗函数有较高的频率分辨率。stft不能兼顾频率分辨率与时间分辨率的需求,短时傅里叶变换窗函数受到海森堡不确定性原理的限制,时频窗的面积不小于2,这也就从另一个侧面说明了短时傅里叶变换窗函数的时间分辨率与频率分辨率不能同时达到最优。
32.信噪比:即信号与干扰加噪声比,是指接收到的有用信号的强度与接收到的干扰信号(包括噪声和干扰)的强度的比值。信号与干扰加噪声比最初出现在多用户检测,假设有两个用户,分别为用户1和用户2,发射天线发送两路信号(码分多址中采用码正交,正交频分复用技术中采用频谱正交,这样用来区分发给两个用户的不同数据);对于用户1的接收端,可以接收到发射天线发送给用户1的数据(即有用信号),也可以接收到发射天线发送给用户2的数据(即干扰信号);对于用户2的接收端,可以接收到发射天线发送给用户1的数据(即干扰信号),也可以接收到发射天线发送给用户2的数据(即有用信号)。
33.在第三代合作伙伴计划(3rd generation partnership project,3gpp)的提案中有多进多出(multiple-in multipleout,mimo)技术,需要用信道质量指示器来向发射机反馈信道特征,以调整发射天线的数据速率,实现自适应调制。如果能估计并反馈信道的完全特征,即信道矩阵h当然最好,但在实际系统中,尤其是mimo系统中,准确及时估计信道矩阵
h是不现实的,并且受反馈信道的限制,反馈信息也不可能太多。因此,在3gpp的提案中大多采用信噪比作为反馈信息,用于自适应调制的控制参数。
34.信噪比还可以作为接收机的一个重要指标,用于对设备的灵敏度和抗干扰能力提出更高的要求。码分多址系统是一个干扰受限的系统,系统中的多用户干扰对系统影响较大,在具体设计时需考虑信噪比。这是由于码分多址系统的扩频码不是完全正交的,具有一定的相关值,当多个用户的终端位置较近时,终端间的干扰就会较大;同时,码分多址基站采用的频率是相同的,不同的基站之间也会存在干扰。
35.麦克风:又称为传声器,也称话筒、微音器;麦克风是将声音信号转换为电信号的能量转换器件;其工作原理是将声音的震动传到具有永久电荷隔离的聚合材料振动膜上,推动内部的磁铁形成变化的电流,然后将该变化的电流传输到之后的声音处理电路进行放大处理。
36.下面结合附图,通过具体的实施例及其应用场景对本技术实施例提供的音频信号补偿方法、装置、电子设备及可读存储介质进行详细地说明。
37.目前,移动终端(例如,智能手机、平板电脑、耳机等)的硬件设备中通常包括由一定数量的麦克风硬件组成的麦克风阵列,用于对声场的空间特性进行采样、滤波等。通过麦克风阵列,具体可以实现声源定位(包括角度和距离的测量),抑制背景噪声、干扰、混响、回声,信号提取,信号分离等。例如,以智能音箱中的麦克风阵列为例,当用户距离智能音箱较远时,该智能音箱可以通过该智能音箱中的麦克风阵列进行声源定位和抑制背景噪声,从而准确拾取用户的语音指令。
38.常用的麦克风阵列按麦克风的布局形状可以分为:线性阵列(例如二麦阵列或三麦阵列等)、环形阵列、以及矩形阵列。其中,线性阵列可以实现平面180度收音,但无法区分水平角度和垂直角度;环形阵列可以实现平面360度收音,同时也可以区分水平角度与垂直角度;矩形阵列仅可以区分水平角度与垂直角度。麦克风阵列的几何构型按设计已知,麦克风阵列中的所有麦克风的频率响应一致,采样时钟也是同步的。
39.在通话、录音、网络电话(voice over internet protocol,voip)、游戏语聊等场景下,麦克风阵列可以结合空间滤波算法,实现拾取特定方向的目标声源,并衰减干扰信号(包括特定方向的干扰声源或无明确方向的环境噪声等)的作用,从而提升语音/音频质量。
40.按照不同的准则,可以将空间滤波算法分为许多种类。
41.一、基于不同的作用对象,可分为以下3类:
42.1、基于方向估计的自适应算法。该算法可以分为两种情况,第一种情况,参考用户信号方向已知,这时可根据不同的准则,例如,线性约束最小方差准则、最大似然准则或最大信噪比准则等,计算自适应权值;第二种情况,参考用户信号方向未知,这时可根据多信号分类、旋转不变技术信号参数估计等方法等估计信号波达方位角度(direction of arrival,doa)。该算法虽然在分析上较为方便,但是存在运算复杂度高、对误差敏感度高等问题。
43.2、基于训练信号或者参考信号的算法。该算法不需要估计信号的到达方向,也对天线本身的结构没有太多的限制,但是该算法存在的问题是发射训练信号需要先验载波和符号的恢复,这对于存在同信道干扰的情况比较困难,而且发射训练信号会降低频谱的利用率。
44.3、基于信号结构的波束形成算法。该算法利用信号的时域特性来计算权值,利用了恒模特性、有线集码、循环平稳特性和高阶统计量等,对误差比较稳健,不需要信号的方向信息,但是该算法存在的问题是收敛速度较慢。
45.二、基于是否需要发射参考信号,可分为以下2类:
46.1、非盲算法。该算法通过发射训练序列或者导频信号来确定信道响应,然后根据一定的准则调整权值。常用的非盲算法包括最小均方算法、直接矩阵求逆算法、递归最小二乘算法等。
47.2、盲算法。该算法不需要发射训练序列或者导频信号,接收端将自己发送的信号作为参考信号进行估计,然后调整权值。典型的盲算法包括两种:一种是利用信号特征的盲算法,例如,利用信号恒模特性的恒模算法、利用信号循环平稳性的周期平稳性算法或有限符号集算法等;另一种是利用doa的盲算法,例如如music算法或esprit算法等。
48.二、基于不同的实现方式,可分为以下2类:
49.1、模拟波束形成(analogousbeam forming,abf)算法。该算法的核心思想是模拟射频接收信号经射频前端下变频到中频,利用权值更新算法计算加权系数,对模拟中频信号加权求和,再由模数转换器转换为数字中频信号做后续处理。该算法电路较复杂、精度较低。
50.2、数字波束形成(digitalbeam forming,dbf)算法。该算法的核心思想是在数字域执行波束形成,射频接收信号经射频前端下变频到中频,模拟中频信号经模数转换器转换为数字信号,再利用权值更新算法计算加权系数,对数字中频信号加权求和。该算法灵活性较好,支持多目标并行跟踪。
51.需要说明的是,空间滤波算法的效果和性能,与麦克风阵列的阵形有很大的关系,不同的麦克风阵列阵型会使空间滤波算法有不同的效果和性能。
52.图1示出了传统技术中麦克风阵列拾取固定声源的音频信号的示意图,如图1所示,麦克风阵列11由多个麦克风12组成,麦克风阵列11需要采集目标音频信号13,可以看出,麦克风阵列11在采集音频信号时,还会采集到噪声音频信号14;从而可以通过空间滤波算法对麦克风阵列11采集的音频信号进行处理,以在空间中形成指向波束,保证拾取目标音频信号13的同时,衰减噪声音频信号14的干扰。
53.示例性地,假设上述多个麦克风12的数量为m(m为大于或等于2的整数),频域分量(即频域索引)为f,时间轴分量(即帧号)为k;那么通过上述空间滤波算法对上述麦克风阵列11采集的音频信号进行处理的具体过程如下(1~5):
54.1、将上述麦克风阵列11采集到的音频信号,进行stft,得到该音频信号的频谱分量x(f,k)=[x1(f,k),x2(f,k),
…
,xm(f,k)];
[0055]
2、利用上述目标音频信号13和上述噪声音频信号14的时频统计特征区别,进行该目标音频信号13的激活检测,得到vad(k)信息;
[0056]
3、计算上述音频信号的协方差矩阵φ
xx
(f,k)=x(f,k)xh(f,k),并利用上述vad(k)信息加权估计上述目标音频信号13的协方差矩阵φ
ss
(f,k),以及上述噪声音频信号14的协方差矩阵φ
nn
(f,k),并利用遗忘因子加权α,对协方差矩阵历史值进行指数平均;其中,φ
ss
(f,k)可以通过下述的公式(1)得到,φ
nn
(f,k)可以通过下述的公式(2)得到:
[0057]
φ
ss
(f,k)=α
·
φ
ss
(f,k-1)+(1-α)
·
vad(k)
·
φ
xx
(f,k);
ꢀꢀꢀꢀ
(1)
[0058]
φ
nn
(f,k)=α
·
φ
nn
(f,k-1)+(1-α)
·
(1-vad(k))
·
φ
xx
(f,k);
ꢀꢀꢀꢀ
(2)
[0059]
4、按照信噪比最大化的优化目标,使用广义特征值分解的方法求取最优滤波系数w(f,k)=[w1(f,k),w2(f,k),
…
,wm(f,k)],即是满足约束条件的广义特征向量;其中,w(f,k)可以通过下述的公式(3)和公式(4)得到:
[0060][0061]
φ
ss
·
wi(f,k)=λi·
φ
nn
·
wi(f,k){i∈[1,m]};
ꢀꢀꢀꢀ
(4)
[0062]
5、使用滤波器系数对上述音频信号加权求和,得到增强后的该音频信号s(f,k),表示为下述的公式(5):
[0063][0064]
然而,上述空间滤波算法中,在更新上述目标音频信号13的协方差矩阵和上述噪声音频信号14的协方差矩阵时,需要使用遗忘因子α,以控制历史值和当前值所占的比例。而若当前值比例过大,则滤波器可能因数值抖动而发散;反之,若历史值比例过大,则滤波器数值稳定,但会引入跟踪延迟问题。
[0065]
当上述目标音频信号13和上述噪声音频信号14的位置固定时,上述跟踪延迟可以忽略;但在智能手机或智能平板等移动设备的使用场景中,采集的音频信号的位置通常并非固定不变,而是经常移动的,具体场景如下:
[0066]
场景1:用户边走边免提通话的场景,由于走路过程中手臂的摆动,因此用户语音(即上述目标音频信号13)是在快速移动的;
[0067]
场景2:用户手持通话的场景,当用户的手握姿发生变化或头部转动时,用户语音(即上述目标音频信号13)会快速移动;
[0068]
场景3:用户在公交车站或地铁车站户外通话的场景,当车辆驶过时,环境噪声(即上述噪声音频信号14)会快速移动。
[0069]
图2示出了传统技术中麦克风阵列拾取移动声源的音频信号的示意图,如图2所示,在目标音频信号13或噪声音频信号14移动的情况下,尤其当移动速度大于跟踪速度时,必然出现协方差矩阵的跟踪延迟,从而导致拾音音质较差。
[0070]
例如,当上述目标音频信号13快速移动时,会造成一段时间内该目标音频信号13的协方差矩阵的跟踪误差,那么在该段时间内拾取到的音频信号中,该目标音频信号13将会发生频谱损伤,声音小,声音断续等问题。
[0071]
又例如,当上述噪声音频信号14快速移动时,会造成一段时间内该噪声音频信号14协方差矩阵的跟踪误差,那么在该段时间内拾取到的音频信号中,该目标音频信号13的比例将会增加,使得上述目标音频信号13的信噪比降低,从而导致拾取的声音听上去很嘈杂,影响拾音音质。
[0072]
为了解决上述问题,本技术实施例提供一种音频信号补偿方法、装置、电子设备及可读存储介质,在本技术的方案中,可以基于麦克风阵列的至少两个麦克风采集的第一音频信号的第一实时功率,以及第二音频信号的第二实时功率,确定补偿掩码,第二音频信号为采用上述空间滤波算法对该音频信号进行空间滤波后得到的音频信号;且基于第一音频信号的幅度平均值,以及第一音频信号中第三音频信号的相位,确定补偿音频信号,第三音
频信号为该至少两个麦克风中任一麦克风采集的音频信号;并采用该补偿掩码和该补偿音频信号,对第二音频信号进行补偿处理,得到补偿后的第二音频信号。通过该方案,电子设备可以先基于至少两个麦克风采集的音频信号在空间滤波前后的实时功率,确定出补偿掩码;然后再基于该音频信号的特性,确定出补偿音频信号;并采用该补偿掩码和该补偿音频信号,对空间滤波后的该音频信号进行补偿处理;从而可以通过该补偿掩码实现对该补偿音频信号混合比例的调整,以使补偿处理后得到的音频信号的强度得到提升、频谱得到适应性修复。如此可以通过该补偿处理提升拾取的音频信号的质量,以降低空降滤波带来的跟踪延迟的影响,进而可以提升电子设备拾音的质量。
[0073]
需要说明的是,本技术实施例提供的音频信号补偿方法,执行主体可以为音频信号补偿装置、电子设备或电子设备中的功能模块等。本技术的一些实施例中以电子设备执行音频信号补偿方法为例,说明本技术实施例提供的音频信号补偿方法。
[0074]
图3示出了本技术实施例提供的音频信号补偿方法的流程图。如图3所示,本技术实施例提供的音频信号补偿方法可以包括下述的步骤301至步骤303。
[0075]
步骤301、电子设备基于第一音频信号的第一实时功率,以及第二音频信号的第二实时功率,确定补偿掩码。
[0076]
其中,上述第一音频信号包括至少两个麦克风采集的音频信号,上述第二音频信号为对该第一音频信号进行空间滤波后得到的音频信号。
[0077]
本技术实施例中,上述补偿掩码用于指示补偿上述第二音频信号的程度。
[0078]
可选地,本技术实施例中,上述第二音频信号具体可以为:采用上述空间滤波算法对上述第一音频信号进行空间滤波后得到的音频信号。
[0079]
可选地,本技术实施例中,上述至少两个麦克风采集的音频信号中可以包括:电子设备需要采集的目标声源的音频信号,以及环境噪声音频信号。
[0080]
可选地,本技术实施例中,上述至少两个麦克风可以为电子设备的麦克风阵列中的麦克风。
[0081]
可选地,本技术实施例中,上述至少两个麦克风中的任意两个麦克风可以相同或不同。
[0082]
可选地,本技术实施例中,上述至少两个麦克风中的任一麦克风可以为电动式麦克风、电容式麦克风、压电式麦克风、电磁式麦克风、碳粒式麦克风或半导体式麦克风等。
[0083]
例如,以上述任一麦克风为电动式麦克风为例,该任一麦克风可以为动圈式麦克风或铝带式麦克风等。
[0084]
又例如,以上述任一麦克风为压电式麦克风为例,该任一麦克风可以为晶体式麦克风或陶瓷式麦克风等。
[0085]
可选地,本技术实施例中,上述目标声源可以为用户的语音或播放的音乐等需采集的任意声源。
[0086]
可选地,本技术实施例中,上述环境噪声音频信号可以包括:风声或鸟叫声等。
[0087]
可选地,本技术实施例中,上述第一实时功率用于指示上述第一音频信号的能量。
[0088]
可选地,本技术实施例中,上述第二实时功率用于指示上述第二音频信号的能量。
[0089]
下面对电子设备确定上述补偿掩码的具体方法进行详细地说明。
[0090]
可选地,本技术实施例中,结合图3,如图4所示,上述步骤301具体可以通过下述的
步骤301a实现。
[0091]
步骤301a、电子设备将第一实时功率和第二实时功率之差,与第一实时功率和第二实时功率之和的商值,确定为补偿掩码。
[0092]
可选地,本技术实施例中,电子设备在确定上述补偿掩码之前,可以先通过下述的公式(6)确定上述第一音频信号的幅度平均值x
abs
(f,k):
[0093][0094]
其中,m为上述至少两个麦克风的数量,f为频域分量(即频域索引),k为时间轴分量(即帧号),xi(f,k)为该至少两个麦克风中的第i个麦克风采集的音频信号在k时刻的f频点上的幅度值。
[0095]
需要说明的是,本技术实施例的所有公式中,m、f、k的意义均相同,为了避免重复,下述的公式中将不再赘述。
[0096]
可选地,本技术实施例中,电子设备在确定上述第一音频信号的幅度平均值x
abs
(f,k)之后,可以根据该x
abs
(f,k),并通过下述的公式(7)确定上述第一实时功率px(f,k):
[0097]
px(f,k)=|x
abs
(f,k)|2。
ꢀꢀꢀꢀ
(7)
[0098]
之后,电子设备可以根据上述第二音频信号的幅度值s(f,k),并通过下述的公式(8)确定上述第二实时功率ps(f,k):
[0099]
ps(f,k)=|s(f,k)|2。
ꢀꢀꢀꢀ
(8)
[0100]
如此,电子设备可以通过下述的公式(9),将上述第一实时功率px(f,k)和上述第二实时功率ps(f,k)之差,与该第一实时功率px(f,k)和该第二实时功率ps(f,k)之和的商值,确定为上述补偿掩码r(f,k):
[0101][0102]
可选地,本技术实施例中,若上述公式(9)中px(f,k)-ps(f,k)的值为负数,则电子设备可以将上述补偿掩码r(f,k)确定为0,此时电子设备无需对上述第二音频信号进行补偿。
[0103]
可以看出,上述补偿掩码r(f,k)的取值范围为(0,1),上述公式(9)实际是对上述第一实时功率px(f,k)和上述第二实时功率ps(f,k)之间的差别进行归一化表示。
[0104]
本技术实施例中,由于电子设备可以将上述商值确定为上述补偿掩码,即可以基于空间滤波处理前后音频信号(即第一音频信号与第二音频信号)的能量差异,确定该补偿掩码,因此在通过该补偿掩码补偿该第二音频信号时,可以提升确定该第二音频信号所占比例的准确性。
[0105]
步骤302、电子设备基于第一音频信号的幅度平均值,以及第一音频信号中第三音频信号的相位,确定补偿音频信号。
[0106]
其中,上述第三音频信号为上述至少两个麦克风中任一麦克风采集的音频信号,上述补偿音频信号用于对上述第二音频信号进行补偿。
[0107]
可选地,本技术实施例中,上述任一麦克风可以为上述至少两个麦克风中,距离上述第一音频信号的声源最近的麦克风;或可以为该至少两个麦克风中的第1个麦克风等。
[0108]
下面对电子设备确定上述补偿音频信号的具体方法进行详细地说明。
[0109]
可选地,本技术实施例中,电子设备可以通过下述的方式一或方式二,确定上述补偿音频信号。
[0110]
方式一
[0111]
可选地,本技术实施例中,结合图3,如图5所示,上述步骤302具体可以通过下述的步骤302a实现。
[0112]
步骤302a、电子设备将第三音频信号的相位作为欧拉公式的相位部分,并将第一音频信号的幅度平均值作为欧拉公式的幅值部分,计算得到补偿音频信号。
[0113]
需要说明的是,欧拉公式用于构造一个复数形式的频域信号,其输入有两个分量,即频域信号的幅值和频域信号的相位(该两个分量均为实数形式),其输出为一个分量,即复数形式的频域信号。
[0114]
其中,上述复数形式的频域信号的相位定义如下:复数z=x+iy,其相位为atan2(y,x),值域范围[-pi,pi],atan2也叫做四象限反正切;得到z的相位,就可以利用欧拉公式合成信号:复数z=x+jy=a*exp(j*theta),其中a是幅值,theta是相位角。
[0115]
示例性地,以上述第三音频信号为上述至少两个麦克风中的第1个麦克风采集的音频信号(即x1(f,k),以下称为音频信号1)为例,电子设备在得到该音频信号1的相位和上述幅度平均值之后,可以通过下述的公式(10)确定上述补偿音频信号sc(f,k):
[0116]
sc(f,k)=x
abs
(f,k)
·
exp(j
·
∠x1(f,k));
ꢀꢀꢀꢀ
(10)
[0117]
其中,x
abs
(f,k)为上述第一音频信号的幅度平均值,exp(j
·
∠x1(f,k)为音频信号1的的相位,j为虚数单位。
[0118]
可以看出,上述补偿音频信号sc(f,k)是时间k频率f下的复数值,其幅度部分为上述第一音频信号的幅度平均值,相位部分为上述音频信号1的相位。
[0119]
本技术实施例中,由于电子设备可以将上述第三音频信号的相位作为欧拉公式的相位部分,并将上述第一音频信号的幅度平均值作为欧拉公式的幅值部分,计算得到上述补偿音频信号,即可以在确定该补偿音频信号时,基于空间滤波前的音频信号的特性,因此可以使确定的该补偿音频信号能够补偿空间滤波带来的频谱损伤,从而可以准确补偿上述第二音频信号。
[0120]
方式二
[0121]
可选地,本技术实施例中,结合图3,如图6所示,在上述步骤302之前,本技术实施例提供的音频信号补偿方法还可以包括下述的步骤a,并且上述步骤302具体可以通过下述的步骤302b实现。
[0122]
步骤a、电子设备基于第一音频信号的信噪比,确定降噪增益。
[0123]
其中,上述降噪增益用于对上述补偿音频信号进行降噪处理。
[0124]
可选地,本技术实施例中,对上述补偿音频信号进行降噪处理,可以提高该补偿音频信号的信噪比。
[0125]
可选地,本技术实施例中,电子设备在确定上述降噪增益之前,可以先对上述波束形成算法中得到的上述环境噪声音频信号的协方差矩阵取对角线均值,得到该环境噪声音频信号的功率谱均值然后通过下述的公式(11)计算上述第一音频信号的后验信噪比γ(f,k):
[0126][0127]
其中,px(f,k)为上述第一实时功率,为上述环境噪声音频信号的功率谱均值。
[0128]
之后,电子设备可以采用引导判决方法(即decision-directed approach),将计算得到的后验信噪比γ(f,k)与1的差值作为上述第一音频信号的先验信噪比的估计值,并通过与上一帧的先验信噪比平滑得到该第一音频信号的先验信噪比ξ(f,k);该先验信噪比ξ(f,k)可以通过下述的公式(12)计算得到:
[0129]
ξ(f,k)=α*ξ(f,k-1)+(1-α)*max(0,γ(f,k)-1);
ꢀꢀꢀꢀ
(12)
[0130]
其中,ξ(f,k-1)为上述上一帧的先验信噪比,γ(f,k)为上述后先验信噪比,α为平滑系数,通常取0.95。
[0131]
如此,电子设备在得到上述第一音频信号的先验信噪比之后,可以基于最小均方误差的对数幅度谱估计,通过下述的公式(13)确定上述降噪增益g(f,k):
[0132][0133]
其中,ξ(f,k)为上述第一音频信号的先验信噪比;γ(f,k)为上述后先验信噪比。
[0134]
步骤302b、电子设备将第三音频信号的相位作为欧拉公式的相位部分,并将降噪增益与第一音频信号的幅度平均值的乘积作为欧拉公式的幅值部分,计算得到补偿音频信号。
[0135]
示例性地,以上述第三音频信号为上述至少一个麦克风中的第2个麦克风采集的音频信号(即x2(f,k),以下称为音频信号2)为例,电子设备在得到上述降噪增益、上述幅度平均值和该音频信号2的相位之后,可以通过下述的公式(14)确定上述补偿音频信号sc(f,k):
[0136]
sc(f,k)=g(f,k)
·
x
abs
(f,k)
·
exp(j
·
∠x2(f,k));
ꢀꢀꢀꢀ
(14)
[0137]
其中,g(f,k)为上述降噪增益,x
abs
(f,k)为上述第一音频信号的幅度平均值,exp(j
·
∠x2(f,k)为上述音频信号2的相位,j为虚数单位。
[0138]
对上述步骤302b的具体描述,可以参照上述步骤302a中的相关描述,为了避免重复,此处不再赘述。
[0139]
本技术实施例中,由于电子设备可以先确定用于对上述补偿音频信号进行降噪处理的上述降噪增益,然后再将将上述第三音频信号的相位作为欧拉公式的相位部分,并将该降噪增益与上述第一音频信号的幅度平均值的乘积作为欧拉公式的幅值部分,计算得到上述补偿音频信号,因此可以减少该补偿音频信号中混合的噪声信号,从而可以提高该补偿音频信号的信噪比以提升该补偿音频信号的补偿效果。
[0140]
步骤303、电子设备采用补偿掩码和补偿音频信号,对第二音频信号进行补偿处理,得到补偿后的第二音频信号。
[0141]
下面对电子设备得到上述补偿后的第二音频信号的具体方法进行详细地说明。
[0142]
可选地,本技术实施例中,结合图3,如图7所示,上述步骤303具体可以通过下述的
步骤303a实现。
[0143]
步骤303a、电子设备采用补偿掩码,对补偿音频信号和第二音频信号进行加权求和处理,得到补偿后的第二音频信号。
[0144]
可选地,本技术实施例中,电子设备采用上述补偿掩码,对上述补偿音频信号和上述第二音频信号进行加权求和处理可以理解为:电子设备采用该补偿掩码对该补偿音频信号进行加权,并采用1与该补偿掩码的差对该第二音频信号加权,然后将得到的两部分相加得到上述补偿后的第二音频信号。
[0145]
可选地,本技术实施例中,电子设备可以通过下述的公式(15)确定上述补偿后的第二音频信号s
enhance
:
[0146]senhance
=r(f,k)
·
sc(f,k)+(1-r(f,k))
·
s(f,k);
ꢀꢀꢀꢀ
(15)
[0147]
其中,r(f,k)为上述补偿掩码,sc(f,k)为上述补偿音频信号,s(f,k)为上述第二音频信号。
[0148]
可以看出,通过上述补偿掩码r(f,k),可以确定上述补偿后的第二音频信号中上述补偿音频信号和上述第二音频信号的混合比例,以确定补偿该第二音频信号的程度。
[0149]
本技术实施例中,由于电子设备可以采用上述补偿掩码,对上述补偿音频信号和上述第二音频信号进行加权求和处理,得到补偿后的第二音频信号,因此可以通过该补偿掩码适应性调节该补偿音频信号与该第二音频信号的混合比例,从而使该补偿后的第二音频信号准确到达增强的效果,以提升拾音音质。
[0150]
下面结合附图,对本技术实施例提供的音频信号补偿方法进行示例性地说明。
[0151]
示例性地,假设电子设备中的麦克风阵列包括麦克风1和麦克风2(即上述至少两个麦克风),若电子设备需拾取15秒来自用户的音频信号,其中用户在第6秒到第11秒之间处于快速移动状态,则如图8所示,在第6秒到第11秒之间,由于用户快速移动带来的跟踪延迟的影响,该麦克风1和该麦克风2拾取的音频信号的质量均较差。
[0152]
之后,如图9所示,电子设备可以先基于上述麦克风1拾取的音频信号x1(f,k)和上述麦克风2拾取的音频信号x2(f,k)(即麦克风信号x(f,k),也即上述第一音频信号),在通过自适应空间滤波模块进行空间滤波前后的实时功率,确定出一个补偿掩码r(f,k);然后基于x(f,k)的幅度平均值,以及x1(f,k)(即上述第三音频信号)的相位,确定出补偿音频信号,以对空间滤波后的x(f,k)(即s(f,k),也即上述第二音频信号)进行补偿;之后采用r(f,k)和该补偿音频信号,对s(f,k)进行补偿处理,得到输出的阵列拾音增强信号(即上述补偿后的第二音频信号)。
[0153]
图10示出了本技术实施例中上述麦克风拾音增强信号的频谱图,如图10所示,相较于现有的拾音输出方案输出的在上述第6秒到第11秒之间的音频信号101,采用本技术实施例提供的音频信号补偿方法得到的上述麦克风拾音增强信号中,在该第6秒到第11秒之间的音频信号102得到了显著增强,从而降低了上述跟踪延迟的影响,提升了拾音的质量。
[0154]
在本技术实施例提供的音频信号补偿方法中,电子设备可以先基于至少两个麦克风采集的音频信号在空间滤波前后的实时功率,确定出补偿掩码;然后再基于该音频信号的特性,确定出补偿音频信号;并采用该补偿掩码和该补偿音频信号,对空间滤波后的该音频信号进行补偿处理;从而可以通过该补偿掩码实现对该补偿音频信号混合比例的调整,以使补偿处理后得到的音频信号的强度得到提升、频谱得到适应性修复。如此可以通过该
personal computer,umpc)、上网本或者个人数字助理(personal digital assistant,pda)等,还可以为服务器、网络附属存储器(network attached storage,nas)、个人计算机(personal computer,pc)、电视机(television,tv)、柜员机或者自助机等,本技术实施例不作具体限定。
[0164]
本技术实施例中的音频信号补偿装置可以为具有操作系统的装置。该操作系统可以为安卓(android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本技术实施例不作具体限定。
[0165]
本技术实施例提供的音频信号补偿装置能够实现上述方法实施例实现的各个过程,为避免重复,这里不再赘述。
[0166]
如图12所示,本技术实施例还提供一种电子设备1200,包括处理器1201和存储器1202,存储器1202上存储有可在所述处理器1201上运行的程序或指令,该程序或指令被处理器1201执行时实现如上述音频信号补偿方法实施例的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0167]
需要说明的是,本技术实施例中的电子设备包括移动电子设备和非移动电子设备。
[0168]
图13为实现本技术实施例的一种电子设备的硬件结构示意图。
[0169]
如图13所示,电子设备1000包括但不限于:射频单元1001、网络模块1002、音频输出单元1003、输入单元1004、传感器1005、显示单元1006、用户输入单元1007、接口单元1008、存储器1009、以及处理器1010等部件。
[0170]
本领域技术人员可以理解,电子设备1000还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器1010逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图13中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
[0171]
其中,处理器1010,可以用于基于第一音频信号的第一实时功率,以及第二音频信号的第二实时功率,确定补偿掩码,该第一音频信号包括至少两个麦克风采集的音频信号,该第二音频信号为对该第一音频信号进行空间滤波后得到的音频信号。处理器1010,还可以用于基于该第一音频信号的幅度平均值,以及该第一音频信号中第三音频信号的相位,确定补偿音频信号,该第三音频信号为该至少两个麦克风中任一麦克风采集的音频信号。处理器1010,还可以用于采用该补偿掩码和该补偿音频信号,对该第二音频信号进行补偿处理,得到补偿后的第二音频信号。
[0172]
一种可能的实现方式中,处理器1010,具体可以用于将上述第三音频信号的相位作为欧拉公式的相位部分,并将上述第一音频信号的幅度平均值作为欧拉公式的幅值部分,计算得到上述补偿音频信号。
[0173]
一种可能的实现方式中,处理器1010,还可以用于在基于上述第一音频信号的幅度平均值,以及上述第三音频信号的相位,确定上述补偿音频信号之前,基于该第一音频信号的信噪比,确定降噪增益。处理器1010,具体可以用于将该第三音频信号的相位作为欧拉公式的相位部分,并将该降噪增益与该第一音频信号的幅度平均值的乘积作为欧拉公式的幅值部分,计算得到该补偿音频信号。
[0174]
一种可能的实现方式中,处理器1010,具体可以用于将上述第一实时功率和上述第二实时功率之差,与该第一实时功率和该第二实时功率之和的商值,确定为上述补偿掩码。
[0175]
一种可能的实现方式中,处理器1010,具体可以用于采用上述补偿掩码,对上述补偿音频信号和上述第二音频信号进行加权求和处理,得到补偿后的该第二音频信号。
[0176]
在本技术实施例提供的电子设备中,该电子设备可以先基于至少两个麦克风采集的音频信号在空间滤波前后的实时功率,确定出补偿掩码;然后再基于该音频信号的特性,确定出补偿音频信号;并采用该补偿掩码和该补偿音频信号,对空间滤波后的该音频信号进行补偿处理;从而可以通过该补偿掩码实现对该补偿音频信号混合比例的调整,以使补偿处理后得到的音频信号的强度得到提升、频谱得到适应性修复。如此可以通过该补偿处理提升拾取的音频信号的质量,以降低空降滤波带来的跟踪延迟的影响,进而可以提升电子设备拾音的质量。
[0177]
应理解的是,本技术实施例中,输入单元1004可以包括图形处理器(graphics processing unit,gpu)10041和麦克风10042,图形处理器10041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元1006可包括显示面板10061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板10061。用户输入单元1007包括触控面板10071以及其他输入设备10072中的至少一种。触控面板10071,也称为触摸屏。触控面板10071可包括触摸检测装置和触摸控制器两个部分。其他输入设备10072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
[0178]
存储器1009可用于存储软件程序以及各种数据。存储器1009可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器1009可以包括易失性存储器或非易失性存储器,或者,存储器1009可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasable prom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory,ram),静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic ram,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,ddrsdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synch link dram,sldram)和直接内存总线随机存取存储器(direct rambus ram,drram)。本技术实施例中的存储器1009包括但不限于这些和任意其它适合类型的存储器。
[0179]
处理器1010可包括一个或多个处理单元;可选的,处理器1010集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器1010中。
[0180]
本技术实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述音频信号补偿方法实施例的各个过程,且能达
到相同的技术效果,为避免重复,这里不再赘述。
[0181]
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器rom、随机存取存储器ram、磁碟或者光盘等。
[0182]
本技术实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述音频信号补偿方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0183]
应理解,本技术实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
[0184]
本技术实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如上述音频信号补偿方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0185]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本技术实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
[0186]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本技术各个实施例所述的方法。
[0187]
上面结合附图对本技术的实施例进行了描述,但是本技术并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本技术的启示下,在不脱离本技术宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本技术的保护之内。
技术特征:
1.一种音频信号补偿方法,其特征在于,所述方法包括:基于第一音频信号的第一实时功率,以及第二音频信号的第二实时功率,确定补偿掩码,所述第一音频信号包括至少两个麦克风采集的音频信号,所述第二音频信号为对所述第一音频信号进行空间滤波后得到的音频信号;基于所述第一音频信号的幅度平均值,以及所述第一音频信号中第三音频信号的相位,确定补偿音频信号,所述第三音频信号为所述至少两个麦克风中任一麦克风采集的音频信号;采用所述补偿掩码和所述补偿音频信号,对所述第二音频信号进行补偿处理,得到补偿后的所述第二音频信号。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一音频信号的幅度平均值,以及所述第一音频信号中的第三音频信号的相位,确定补偿音频信号,包括:将所述第三音频信号的相位作为欧拉公式的相位部分,并将所述第一音频信号的幅度平均值作为欧拉公式的幅值部分,计算得到所述补偿音频信号。3.根据权利要求1所述的方法,其特征在于,所述基于所述第一音频信号的幅度平均值,以及所述第一音频信号中的第三音频信号的相位,确定补偿音频信号之前,所述方法还包括:基于所述第一音频信号的信噪比,确定降噪增益;所述基于所述第一音频信号的幅度平均值,以及所述第一音频信号中的第三音频信号的相位,确定补偿音频信号,包括:将所述第三音频信号的相位作为欧拉公式的相位部分,并将所述降噪增益与所述第一音频信号的幅度平均值的乘积作为欧拉公式的幅值部分,计算得到所述补偿音频信号。4.根据权利要求1所述的方法,其特征在于,所述基于第一音频信号的第一实时功率,以及第二音频信号的第二实时功率,确定补偿掩码,包括:将所述第一实时功率和所述第二实时功率之差,与所述第一实时功率和所述第二实时功率之和的商值,确定为所述补偿掩码。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述采用所述补偿掩码和所述补偿音频信号,对所述第二音频信号进行补偿处理,得到补偿后的所述第二音频信号,包括:采用所述补偿掩码,对所述补偿音频信号和所述第二音频信号进行加权求和处理,得到补偿后的所述第二音频信号。6.一种音频信号补偿装置,其特征在于,所述装置包括确定模块和处理模块;所述确定模块,用于基于第一音频信号的第一实时功率,以及第二音频信号的第二实时功率,确定补偿掩码,所述第一音频信号包括至少两个麦克风采集的音频信号,所述第二音频信号为对所述第一音频信号进行空间滤波后得到的音频信号;所述确定模块,还用于基于所述第一音频信号的幅度平均值,以及所述第一音频信号中第三音频信号的相位,确定补偿音频信号,所述第三音频信号为所述至少两个麦克风中任一麦克风采集的音频信号;所述处理模块,用于采用所述补偿掩码和所述补偿音频信号,对所述第二音频信号进行补偿处理,得到补偿后的所述第二音频信号。
7.根据权利要求6所述的装置,其特征在于,所述确定模块,具体用于将所述第三音频信号的相位作为欧拉公式的相位部分,并将所述第一音频信号的幅度平均值作为欧拉公式的幅值部分,计算得到所述补偿音频信号。8.根据权利要求6所述的装置,其特征在于,所述确定模块,还用于在基于所述幅度平均值,以及所述第三音频信号的相位,确定所述补偿音频信号之前,基于所述第一音频信号的信噪比,确定降噪增益;所述确定模块,具体用于将所述第三音频信号的相位作为欧拉公式的相位部分,并将所述降噪增益与所述第一音频信号的幅度平均值的乘积作为欧拉公式的幅值部分,计算得到所述补偿音频信号。9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-5中任一项所述的音频信号补偿方法的步骤。10.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-5中任一项所述的音频信号补偿方法的步骤。
技术总结
本申请公开了一种音频信号补偿方法、装置、电子设备及可读存储介质,属于音频技术领域。该方法包括:基于第一音频信号的第一实时功率,以及第二音频信号的第二实时功率,确定补偿掩码,第一音频信号包括至少两个麦克风采集的音频信号,第二音频信号为对第一音频信号进行空间滤波后得到的音频信号;基于第一音频信号的幅度平均值,以及第一音频信号中第三音频信号的相位,确定补偿音频信号,第三音频信号为至少两个麦克风中任一麦克风采集的音频信号;采用补偿掩码和补偿音频信号,对第二音频信号进行补偿处理,得到补偿后的第二音频信号。号。号。
技术研发人员:杨闳博
受保护的技术使用者:维沃移动通信有限公司
技术研发日:2023.07.03
技术公布日:2023/10/6
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/