一种异音识别方法、装置、电子设备及可读存储介质与流程

未命名 10-08 阅读:100 评论:0


1.本发明涉及智能电子设备技术领域,特别是涉及一种异音识别方法、装置、电子设备及计算机可读存储介质。


背景技术:

2.对于带有外放功能的语音交互产品,例如智能门铃产品等,在产品交付之前需要对产品外放功能的用户版本软件进行质检,来确定产品是否有异音,通常是通过人工听音的方式进行质检,但是人工听音的方式受限于听音环境的噪声干扰以及听音人员的疲劳程度,对听音结果的准确性有较大影响,影响异音识别效率和准确度。
3.鉴于此,如何提高异音识别的效率、准确度和降低人力成本成为本领域技术人员需要解决的问题。


技术实现要素:

4.本发明实施例的目的是提供一种异音识别方法、装置、电子设备及计算机可读存储介质,在使用过程中能够实现对异音信号的自动识别,利于提高识别效率和准确度,降低人力成本。
5.为解决上述技术问题,本发明实施例提供了一种异音识别方法,应用于具有外放功能的智能设备,所述方法包括:
6.获取所述智能设备播放的声音信号,得到与原音频信号对应的录音信号;
7.将所述录音信号与所述原音频信号进行信号对齐,使所述录音信号和所述原音频信号的起始时间相同;
8.根据信号对齐后的录音信号得到录音语谱图,根据所述原音频信号得到原语谱图;
9.对所述录音语谱图和所述原语谱图进行对比分析,识别出异音信号。
10.可选的,所述将所述录音信号与所述原音频信号进行信号对齐,使所述录音信号和所述原音频信号的起始时间相同,包括:
11.采用互相关函数对所述录音信号与所述原音频信号进行互相关操作,得到互相关结果;
12.基于所述互相关结果确定所述录音信号相对于所述原音频信号的延迟时长;
13.将所述录音信号沿时间轴反向平移所述延迟时长,以使所述录音信号和所述原音频信号的起始时间相同。
14.可选的,所述互相关函数为:
15.其中,c(i-n)表示第i个互相关函数值,n表示原音频信号的数据长度,m表示录音信号的数据长度,i∈[1,m+n],x(i)表示原音频信号中的第i个信号,y(m-i+1)表示录音信号中第m-i+1个信号;
[0016]
所述互相关结果包括多个互相关函数值。
[0017]
可选的,所述根据信号对齐后的录音信号得到录音语谱图,根据所述原音频信号得到原语谱图,包括:
[0018]
预先设定快速傅里叶变换阶数和加窗函数,并对所述对齐后的录音信号和所述原音频信号分别进行快速傅里叶变换,得到与所述对其后的录音信号对应的频域数据以及与所述原音频信号对应的频域数据;
[0019]
基于所述对其后的录音信号对应的频域数据生成录音语谱图;
[0020]
基于与所述原音频信号对应的频域数据生成原语谱图。
[0021]
可选的,所述对所述录音语谱图和所述原语谱图进行对比分析,识别出异音信号,包括:
[0022]
对所述录音语谱图进行识别,确定出异音频段;
[0023]
将所述录音语谱图和所述原语谱图对应的语谱图矩阵中位于所述异音频段的每个频率点对应进行差值处理,得到针对每个时刻各自对应的多个频率差值;
[0024]
根据所述每个时刻各自对应的多个频率差值,识别出异音时刻;
[0025]
将与所述异音时刻对应的信号确定为异音信号。
[0026]
可选的,所述根据所述每个时刻各自对应的多个频率差值,识别出异音时刻,包括:
[0027]
针对每个所述时刻各自对应的多个频率差值,判断所述频段差值是否大于预设差值,若是,则在所述录音语谱图中保留与所述频率差值对应的目标频率点;
[0028]
针对每个所述时刻,将与所述时刻对应的各个目标频率点的频率差值进行累加,得到与所述时刻对应的累加频率;
[0029]
根据与每个所述时刻各自对应的累加频率,确定出各异常时刻;
[0030]
针对每个所述异常时刻,基于所述异常时刻对应的各个目标频率点的能量,计算得到所述异常时刻的能量差异值;
[0031]
判断所述异常时刻的能量差异值是否小于预设差异值,若是,则确定所述异常时刻为异音时刻。
[0032]
可选的,所述基于所述异常时刻对应的各个目标频率点的能量,计算得到所述异常时刻的能量差异值,包括:
[0033]
基于所述异常时刻对应的各个目标频率点的能量,采用能量差异关系式计算得到所述异常时刻的能量差异值,其中,所述能量差异关系式为:
[0034]
其中,s(t)表示t时刻的能量差异值,l表示t时刻对应的目标频率点的总数量,x(j)表示t时刻第j个目标频率点的能量值,mean(x)表示t时刻l个目标频率点的平均能量值。
[0035]
本发明实施例还提供了一种异音识别装置,应用于具有外放功能的智能设备,所述装置包括:
[0036]
获取模块,用于获取所述智能设备播放的声音信号,得到与原音频信号对应的录音信号;
[0037]
对齐模块,用于将所述录音信号与所述原音频信号进行信号对齐,使所述录音信号和所述原音频信号的起始时间相同;
[0038]
处理模块,用于根据信号对齐后的录音信号得到录音语谱图,根据所述原音频信号得到原语谱图;
[0039]
识别模块,用于对所述录音语谱图和所述原语谱图进行对比分析,识别出异音信号。
[0040]
本发明实施例还提供了一种电子设备,包括:
[0041]
存储器,用于存储计算机程序;
[0042]
处理器,用于执行所述计算机程序时实现如上述所述异音识别方法的步骤。
[0043]
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述异音识别方法的步骤。
[0044]
本发明实施例提供了一种异音识别方法、装置、电子设备及计算机可读存储介质,应用于具有外放功能的智能设备,该方法包括:获取智能设备播放的声音信号,得到与原音频信号对应的录音信号;将录音信号与原音频信号进行信号对齐,使录音信号和原音频信号的起始时间相同;根据信号对齐后的录音信号得到录音语谱图,根据原音频信号得到原语谱图;对录音语谱图和原语谱图进行对比分析,识别出异音时刻。
[0045]
可见,本发明实施例中在智能设备播放原音频信号的过程中获取相应的声音信号得到对应的录音信号,然后再将该录音信号与原音频信号进行信号对齐,使录音信号和原音频信号的起始时间相同,并根据信号对齐后的录音信号得到录音语谱图,根据原音频信号得到原语谱图,进一步通过对录音语谱图和原语谱图进行对比分析即可识别出异音时刻,从而识别出与异音时刻对应的异音信号,本发明能够实现对异音信号的自动识别,利于提高识别效率和准确度,降低人力成本。
附图说明
[0046]
为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0047]
图1为本发明实施例提供的一种异音识别方法的流程示意图;
[0048]
图2为本发明实施例提供的一种原音频信号与录音信号的互相关结果示意图;
[0049]
图3为本发明实施例提供的一种原音频信号与录音信号在信号对齐后的波形图;
[0050]
图4为本发明实施例提供的一种原音频信号对应的原语谱图;
[0051]
图5为本发明实施例提供的一种录音信号对应的录音语谱图;
[0052]
图6为本发明实施例提供的一种累加频率示意图;
[0053]
图7为本发明实施例提供的一种能量差异示意图;
[0054]
图8为本发明实施例提供的一种异音识别装置的结构示意图;
[0055]
图9为本发明实施例提供的一种电子设备的结构示意图;
[0056]
图10为本发明实施例提供的一种计算机可读存储介质的结构示意图。
具体实施方式
[0057]
本发明实施例提供了一种异音识别方法、装置、电子设备及计算机可读存储介质,在使用过程中能够实现对异音信号的自动识别,利于提高识别效率和准确度,降低人力成本。
[0058]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0059]
请参照图1,图1为本发明实施例提供的一种异音识别方法的流程示意图。该方法应用于具有外放功能的智能设备,包括:
[0060]
s110:获取智能设备播放的声音信号,得到与原音频信号对应的录音信号;
[0061]
需要说明的是,本发明实施例中可以在设有外放功能的智能设备播放预设的原音频信号的过程中,采用麦克风采集智能设备播放的声音信号,得到与原音频信号对应的录音信号。
[0062]
s120:将录音信号与原音频信号进行信号对齐,使录音信号和原音频信号的起始时间相同;
[0063]
具体的,本发明实施例中在得到录音信号后,由于录音信号和原音频信号之间会存在一定的时间延时,因此需要将录音信号与原音频信号进行信号对齐,从而使录音信号的起始时间与原音频信号的起始时间相同,以保障异音识别的准确性。
[0064]
s130:根据信号对齐后的录音信号得到录音语谱图,根据原音频信号得到原语谱图;
[0065]
具体的,在信号对齐后,对对齐后的录音信号和原音频信号分别进行信号处理,得到与对齐后的录音信号对应的录音语谱图,得到与原音频信号对应的原语谱图。
[0066]
s140:对录音语谱图和原语谱图进行对比分析,识别出异音信号。
[0067]
需要说明的是,在得到与对齐后的录音信号对应的录音语谱图,得到与原音频信号对应的原语谱图后,将与对齐后的录音信号对应的录音语谱图,得到与原音频信号对应的原语谱图进行对比分析,从而识别出出现异音的异音信号。
[0068]
进一步的,上述s120中将录音信号与原音频信号进行信号对齐,使录音信号和原音频信号的起始时间相同的过程,具体可以包括:
[0069]
采用互相关函数对录音信号与原音频信号进行互相关操作,得到互相关结果;
[0070]
基于互相关结果确定录音信号相对于原音频信号的延迟时长;
[0071]
将录音信号沿时间轴反向平移延迟时长,以使录音信号和原音频信号的起始时间相同。
[0072]
需要说明的是,本发明实施例中可以通过互相关函数对录音信号和原音频信号进行互相关处理,并得到互相关结果,根据互相关结果即可确定出录音信号相对于原音频信号的延迟时长,例如原音频信号为x(n),其中,n=1,2

n,单次录音的录音信号为y(m),其中,m=1,2

m,互相关函数为:
[0073]
其中,c(i-n)表示第i个互相关函数值,n表示原音
频信号的数据长度,m表示录音信号的数据长度,i∈[1,m+n],x(i)表示原音频信号中的第i个信号,y(m-i+1)表示录音信号中第m-i+1个信号;
[0074]
则,根据上述互相关函数即可得到多个互相关函数值,并由该多个互相关函数值构成互相关结果,根据该互相关结果即可确定出录音信号相对于原音频信号的延迟时长,将录音信号沿时间轴反向平移延迟时长,以使录音信号和原音频信号的起始时间相同。其中,互相关结果如图2所示,录音信号和原音频信号进行对齐后的对齐信号如图3所示。
[0075]
进一步的,上述s130中根据信号对齐后的录音信号得到录音语谱图,根据原音频信号得到原语谱图的过程,具体可以包括:
[0076]
预先设定快速傅里叶变换阶数和加窗函数,并对对齐后的录音信号和原音频信号分别进行快速傅里叶变换,得到与对其后的录音信号对应的频域数据以及与原音频信号对应的频域数据;
[0077]
基于对其后的录音信号对应的频域数据生成录音语谱图;
[0078]
基于与原音频信号对应的频域数据生成原语谱图。
[0079]
需要说明的是,本发明实施例中可以预先设定fft(fast fourier transformation,快速傅氏变换)阶数和加窗函数,设定信号重叠率overlap,并根据该重叠率对对齐后的录音信号和原音频信号分别依次进行fft,得到一组不同时间(窗函数取样时刻)的与对其后的录音信号对应的频域数据以及与原音频信号对应的频域数据,并根据对其后的录音信号对应的频域数据生成录音语谱图,根据与原音频信号对应的频域数据生成原语谱图,其中,原语谱图如图4所示,录音语谱图如图5所示,语谱图中的行对应时间、列对应为频率。
[0080]
进一步的,上述s140中对录音语谱图和原语谱图进行对比分析,识别出异音信号的过程,具体可以包括:
[0081]
对录音语谱图进行识别,确定出异音频段;
[0082]
将录音语谱图和原语谱图对应的语谱图矩阵中位于异音频段的每个频率点对应进行差值处理,得到针对每个时刻各自对应的多个频率差值;
[0083]
根据每个时刻各自对应的多个频率差值,识别出异音时刻;
[0084]
将与该异音时刻对应的信号确定为异音信号。
[0085]
需要说明的是,本发明实施例中具体可以对录音语谱图进行识别,其中,语谱图是一个实数矩阵,每个时刻对应多个频率点,针对每个时刻的各个频率点,判断这些频率点中是否存在连续多个频率点的频率是否大于预设频率值,从而确定出异音频段f1-f2,其中,f1和f2的具体数值根据实际情况进行确定,本发明实施例对此不作特殊限定。
[0086]
具体的,在确定出异音频段后,为了进一步突出差异比较大的频段,可以将录音语谱图和原语谱图对应的语谱图矩阵中位于异音频段的每个频率点对应进行差值处理,得到针对每个时刻各自对应的多个频率差值。也即,将f1-f2中同一时刻上的录音语谱图中的频率点与原语谱图中相应的频率点的频率值作差,从而可以得到位于异音频段f1-f2中的、与该时刻对应的多个频率差值,然后再根据每个时刻各自对应的多个频率差值,识别出异音时刻,从而将与该异音时刻对应的信号确定为异音信号。
[0087]
进一步的,上述根据每个时刻各自对应的多个频率差值,识别出异音时刻的过程,具体可以包括:
[0088]
针对每个时刻各自对应的多个频率差值,判断频段差值是否大于预设差值,若是,则在录音语谱图中保留与频率差值对应的目标频率点;
[0089]
针对每个时刻,将与时刻对应的各个目标频率点的频率差值进行累加,得到与时刻对应的累加频率;
[0090]
根据与每个时刻各自对应的累加频率,确定出各异常时刻;
[0091]
针对每个异常时刻,基于异常时刻对应的各个目标频率点的能量,计算得到异常时刻的能量差异值;
[0092]
判断异常时刻的能量差异值是否小于预设差异值,若是,则确定异常时刻为异音时刻。
[0093]
需要说明的是,针对每个时刻,将该时刻f1至f2异音频段中的各个频率差值与预设差值相比较,在频率差值大于预设差值的情况下,在录音语谱图中保留与该频率差值对应的频率点,将所保留的频率点作为目标频率点,在频率差值未大于该预设差值的情况下,在录音语谱图中不保留对应的频率点,从而针对在f1-f2中的每个时刻,可以将该时刻中所保留的每个目标频率点各自对应的频率差值相累加,得到该时刻对应的累加频率,从而得到异音频率中每个时刻分别对应的累加频率(如图6所示)。
[0094]
具体的,在得到与每个时刻各自对应的累加频率后,可以将各个累加频率进一步分别与预设频率范围进行比较,在位于该预设频率范围内的累加频率值对应的时刻确定为异音时刻,从而确定出各异常时刻。在确定出各个异音时刻后,可以针对每个异常时刻,根据该异常时刻对应的各个目标频率点各自的能量,计算得到异常时刻的能量差异值(如图7所示),并进一步判断该异常时刻的能量差异值是否小于预设差异值,在小于的情况下,确定该异常时刻为异音时刻,则该异音时刻对应的信号即为异音信号。
[0095]
更进一步的,上述基于异常时刻对应的各个目标频率点的能量,计算得到异常时刻的能量差异值的过程,具体可以包括:
[0096]
基于异常时刻对应的各个目标频率点的能量,采用能量差异关系式计算得到异常时刻的能量差异值,其中,能量差异关系式为:
[0097]
其中,s(t)表示t时刻的能量差异值,l表示t时刻对应的目标频率点的总数量,x(j)表示t时刻第j个目标频率点的能量值,mean(x)表示t时刻l个目标频率点的平均能量值。
[0098]
需要说明的是,原音频信号和录音信号之间的差异可能由于环境本底噪声或测试过程里因为降低成本取消或简化测试屏蔽箱而采集到的干扰信号而造成,因此为了避免这些并非为异音的信号被机器判断为异音,本发明实施例中可以对f1-f2频段的目标频率点的信号进行统计处理,具体可以通过能量差异关系式计算每个时刻的能量差异值,在该能量差异值小于预设差异值(如2)的情况下,可以确定该时刻在频段f1至f2内差异稳定,也即确定该差异是异音的竖直亮线造成的,也即确定出异音信号;否则即使能量差异较大,也不判定为异音,从而提高异音识别的准确率。
[0099]
可见,本发明实施例中在智能设备播放原音频信号的过程中获取相应的声音信号
得到对应的录音信号,然后再将该录音信号与原音频信号进行信号对齐,使录音信号和原音频信号的起始时间相同,并根据信号对齐后的录音信号得到录音语谱图,根据原音频信号得到原语谱图,进一步通过对录音语谱图和原语谱图进行对比分析即可识别出异音时刻,从而识别出与异音时刻对应的异音信号,本发明能够实现对异音信号的自动识别,利于提高识别效率和准确度,降低人力成本。
[0100]
在上述实施例的基础上,本发明实施例还提供了一种异音识别装置,应用于具有外放功能的智能设备,具体请参照图8,该装置包括:
[0101]
获取模块11,用于获取智能设备播放的声音信号,得到与原音频信号对应的录音信号;
[0102]
对齐模块12,用于将录音信号与原音频信号进行信号对齐,使录音信号和原音频信号的起始时间相同;
[0103]
处理模块13,用于根据信号对齐后的录音信号得到录音语谱图,根据原音频信号得到原语谱图;
[0104]
识别模块14,用于对录音语谱图和原语谱图进行对比分析,识别出异音时刻。
[0105]
需要说明的是,本发明实施例中提供的异音识别装置具有与上述实施例中所提供的异音识别方法相同的有益效果,对于本发明实施例中所涉及到的异音识别方法的具体介绍请参照上述实施例,本技术在此不再赘述。
[0106]
图9为本技术实施例提供的一种电子设备的结构图,如图9所示,电子设备包括:存储器20,用于存储计算机程序;
[0107]
处理器21,用于执行计算机程序时实现如上述实施例异音识别方法的步骤。
[0108]
本实施例提供的电子设备可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。
[0109]
其中,处理器21可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器21可以采用dsp(digital signal processing,数字信号处理)、fpga(field-programmable gate array,现场可编程门阵列)、pla(programmable logic array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu(central processing unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以在集成有gpu(graphics processing unit,图像处理器),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器21还可以包括ai(artificial intelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。
[0110]
存储器20可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器20还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器20至少用于存储以下计算机程序201,其中,该计算机程序被处理器21加载并执行之后,能够实现前述任一实施例公开的异音识别方法的相关步骤。另外,存储器20所存储的资源还可以包括操作系统202和数据203等,存储方式可以是短暂存储或者永久存储。其中,操作系统202可以包括windows、unix、linux等。数据203可以包括但不限于设定的偏移量等。
[0111]
在一些实施例中,电子设备还可包括有显示屏22、输入输出接口23、通信接口24、电源25以及通信总线26。
[0112]
本领域技术人员可以理解,图9中示出的结构并不构成对电子设备的限定,可以包括比图示更多或更少的组件。
[0113]
可以理解的是,如果上述实施例中的异音识别方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本技术各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、磁碟或者光盘等各种可以存储程序代码的介质。
[0114]
基于此,如图10所示,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质30上存储有计算机程序31,计算机程序31被处理器执行时实现如上述异音识别方法的步骤。
[0115]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0116]
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0117]
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0118]
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其他形式的存储介质中。
[0119]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明
将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

技术特征:
1.一种异音识别方法,其特征在于,应用于具有外放功能的智能设备,所述方法包括:获取所述智能设备播放的声音信号,得到与原音频信号对应的录音信号;将所述录音信号与所述原音频信号进行信号对齐,使所述录音信号和所述原音频信号的起始时间相同;根据信号对齐后的录音信号得到录音语谱图,根据所述原音频信号得到原语谱图;对所述录音语谱图和所述原语谱图进行对比分析,识别出异音信号。2.根据权利要求1所述的异音识别方法,其特征在于,所述将所述录音信号与所述原音频信号进行信号对齐,使所述录音信号和所述原音频信号的起始时间相同,包括:采用互相关函数对所述录音信号与所述原音频信号进行互相关操作,得到互相关结果;基于所述互相关结果确定所述录音信号相对于所述原音频信号的延迟时长;将所述录音信号沿时间轴反向平移所述延迟时长,以使所述录音信号和所述原音频信号的起始时间相同。3.根据权利要求2所述的异音识别方法,其特征在于,所述互相关函数为:其中,c(i-n)表示第i个互相关函数值,n表示原音频信号的数据长度,m表示录音信号的数据长度,i∈[1,m+n],x(i)表示原音频信号中的第i个信号,y(m-i+1)表示录音信号中第m-i+1个信号;所述互相关结果包括多个互相关函数值。4.根据权利要求1所述的异音识别方法,其特征在于,所述根据信号对齐后的录音信号得到录音语谱图,根据所述原音频信号得到原语谱图,包括:预先设定快速傅里叶变换阶数和加窗函数,并对所述对齐后的录音信号和所述原音频信号分别进行快速傅里叶变换,得到与所述对其后的录音信号对应的频域数据以及与所述原音频信号对应的频域数据;基于所述对其后的录音信号对应的频域数据生成录音语谱图;基于与所述原音频信号对应的频域数据生成原语谱图。5.根据权利要求1至4任意一项所述的异音识别方法,其特征在于,所述对所述录音语谱图和所述原语谱图进行对比分析,识别出异音信号,包括:对所述录音语谱图进行识别,确定出异音频段;将所述录音语谱图和所述原语谱图对应的语谱图矩阵中位于所述异音频段的每个频率点对应进行差值处理,得到针对每个时刻各自对应的多个频率差值;根据所述每个时刻各自对应的多个频率差值,识别出异音时刻;将与所述异音时刻对应的信号确定为异音信号。6.根据权利要求5所述的异音识别方法,其特征在于,所述根据所述每个时刻各自对应的多个频率差值,识别出异音时刻,包括:针对每个所述时刻各自对应的多个频率差值,判断所述频段差值是否大于预设差值,若是,则在所述录音语谱图中保留与所述频率差值对应的目标频率点;针对每个所述时刻,将与所述时刻对应的各个目标频率点的频率差值进行累加,得到与所述时刻对应的累加频率;
根据与每个所述时刻各自对应的累加频率,确定出各异常时刻;针对每个所述异常时刻,基于所述异常时刻对应的各个目标频率点的能量,计算得到所述异常时刻的能量差异值;判断所述异常时刻的能量差异值是否小于预设差异值,若是,则确定所述异常时刻为异音时刻。7.根据权利要求6所述的异音识别方法,其特征在于,所述基于所述异常时刻对应的各个目标频率点的能量,计算得到所述异常时刻的能量差异值,包括:基于所述异常时刻对应的各个目标频率点的能量,采用能量差异关系式计算得到所述异常时刻的能量差异值,其中,所述能量差异关系式为:其中,
s(t)
表示t时刻的能量差异值,l表示t时刻对应的目标频率点的总数量,
x
(
j
)表示t时刻第j个目标频率点的能量值,
mean
(
x
)表示t时刻l个目标频率点的平均能量值。8.一种异音识别装置,其特征在于,应用于具有外放功能的智能设备,所述装置包括:获取模块,用于获取所述智能设备播放的声音信号,得到与原音频信号对应的录音信号;对齐模块,用于将所述录音信号与所述原音频信号进行信号对齐,使所述录音信号和所述原音频信号的起始时间相同;处理模块,用于根据信号对齐后的录音信号得到录音语谱图,根据所述原音频信号得到原语谱图;识别模块,用于对所述录音语谱图和所述原语谱图进行对比分析,识别出异音信号。9.一种电子设备,其特征在于,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述异音识别方法的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述异音识别方法的步骤。

技术总结
本发明公开了一种异音识别方法、装置、电子设备及计算机可读存储介质,应用于具有外放功能的智能设备,为解决现有异音识别效率和准确度低的问题,提出通过获取智能设备播放的声音信号,得到与原音频信号对应的录音信号;将录音信号与原音频信号进行信号对齐,使录音信号和原音频信号的起始时间相同;根据信号对齐后的录音信号得到录音语谱图,根据原音频信号得到原语谱图;对录音语谱图和原语谱图进行对比分析,识别出异音信号;本发明能够实现对异音信号的自动识别,利于提高识别效率和准确度,降低人力成本。降低人力成本。降低人力成本。


技术研发人员:华洋 杜洋 赵江涛
受保护的技术使用者:歌尔科技有限公司
技术研发日:2023.07.28
技术公布日:2023/10/5
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐