一种水声多目标识别方法、装置及计算机可读存储介质
未命名
09-22
阅读:56
评论:0
1.本发明涉及水下目标识别技术领域,尤其是指一种水声多目标识别方法、装置及计算机可读存储介质。
背景技术:
2.随着水下设备系统的不断发展和智能化程度提高,水下声学目标识别技术的重要性在军事和商业应用中都有明显的提高。水声目标识别技术通过分析被动声纳信号来识别不同类别的目标,传统的水下声学目标识别主要依靠人类观察者对声纳接收到的信号进行实时分析来识别目标的类型。后来通过声学信号理论、现代谱理论的运用,识别精度和效率有了一定的提升,但是随着水声信息量的大幅增加,继续沿用传统水声目标识别方法难度不断提,现阶段已经显得捉襟见肘。因此,水声目标智能识别方法应时而出。水声目标智能识别方法分析从原始声学数据中提取特征,然后这些特征被输入到智能算法中,训练一个分类器,实现自动目标识别。这一过程的主要部分包括两个:特征提取和分类器设计。
3.现有技术中,针对特征提取和分类器设计产生了两种不同的智能发展方向:基于特征的方法和基于模型的方法。基于特征的方法通过分析原始信号,捕捉信号的明显差异。其中,有效的特征不仅可以简化分类器的设计,而且对识别的准确性也有直接影响。然而特征提取本质上是对原始数据进行降维的过程,因此,难免会有信息的损失,这将大大限制复杂海洋环境下的识别精度。如公开号为cn201910661350的基于大数据的水声目标智能识别方法的专利中采集大量水声目标发出的水声信号,提取适当的特征,再对数据进行有目标或无目标的标记,建立训练样本集对人工智能模型进行训练。在实际使用中,采集周围的水声信号并提取特征,输入到训练好的人工智能模型中就可以判断出水声目标的有无和类型,能够识别较长距离的水声目标。但这一方法只能判断水声目标的有无,不能在多目标情况下实现目标类型识别。基于模型的方法更加关注于如何将复杂的智能分类算法应用于水声目标识别领域中,如卷积神经网络(cnn)、深度置信网络(dbn)和稀疏自动编码器(sae)等。在数据充足的情况下,它们可以从训练数据中自动提取有价值的特征而不需要专家知识。然而,在水声目标识别问题中,可用的数据量通常不足以满足训练的要求,会导致模型训练不充分或过拟合问题。如公开号为cn202110753982的用于水声目标识别的u-net结构生成对抗网络及方法专利中,建立了一个使用水下目标识别的基于u-net结构的生成对抗网络模型,该模型可以很好地消除小样本数据在深度学习网络中的过拟合问题。通过加大网络层数,消除过拟合现象,提高水声信号的识别率,增大网络模型的鲁棒性。但是通过加大深度学习网络层数解决过拟合问题,增加了网络复杂度和实时性差,反应速度慢,需要耗费更多的运算资源,无法满足小型化、实时性的要求。又如公开号为cn202010427316的一种基于加权支持向量机的水声目标识别方法的专利中,对原始水声目标信号进行分帧特征提取,搭建加权支持向量机识别模型,利用网络搜索法寻找最优核函数参数及惩罚因子,加权支持向量机识别模型进行训练,得到具有水下目标识别功能的支持向量机模型,识别正确率在80%以上。但是单阶段特征提取难度大,提取的水声目标特征区分度较差,识别准确率
较低。此外,基于模型的方法缺乏物理可解释性,稳定性也无法保证,无法给观察者提供有用的辅助判决信息。因此,基于模型的方法不能直接用于水下目标识别。
4.综上所述,现有的用于水声目标识别的方法存在实时性差,反应速度慢,特征提取难度大以及识别准确率低的问题。
技术实现要素:
5.为此,本发明所要解决的技术问题在于克服现有技术中水声目标识别实时性差,反应速度慢,特征提取难度大以及识别准确率低的问题。
6.为解决上述技术问题,本发明提供了一种水声多目标识别方法,包括:
7.获取训练集中的水声音频信号,并获取所述水声音频信号的时域信号和频域信号;
8.基于所述水声音频信号的时域信号和频域信号计算所述水声音频信号的探测特征,得到探测特征向量;其中,所述探测特征包括但不限于所述水声音频信号的时域特征、频域特征、时频特征;
9.将所述探测特征向量输入至第一分类器进行训练,得到训练好的第一分类器;
10.基于所述水声音频信号的时域信号和频域信号计算所述水声音频信号的识别特征,得到识别特征向量;其中,所述识别特征包括但不限于所述探测特征中未包含的所述水声音频信号的时域特征、频域特征、时频特征;
11.将所述识别特征向量输入至第二分类器进行训练,得到训练好的第二分类器;
12.基于所述训练好的第一分类器和所述训练好的第二分类器构建水声多目标识别模型。
13.在本发明的一个实施例中,所述获取水声音频信号,并获取所述水声音频信号的时域信号和频域信号包括:
14.获取水声音频信号,并对所述水声音频信号进行分帧处理;
15.分别获取每帧水声音频信号的时域信号和频域信号,得到所述水声音频信号的时域信号集和频域信号集。
16.在本发明的一个实施例中,所述基于所述水声音频信号的时域信号和频域信号计算所述水声音频信号的探测特征,得到探测特征向量包括:
17.分别计算所述水声音频信号的时域信号集中每帧时域信号的时域特征;
18.使用统计函数对所述每帧时域信号的时域特征进行统计,得到所述水声音频信号的时域特征向量;其中,所述时域特征包括但不限于过零率、短时能量、短时自相关函数;
19.分别计算所述水声音频信号的频域信号集中每帧频域信号的频域特征;
20.使用统计函数对所述每帧频域信号的频域特征进行统计,得到所述水声音频信号的频域特征向量;其中,所述频域特征包括但不限于梅尔倒谱系数、频谱宽度、频谱差分幅度;
21.将所述时域特征向量与所述频域特征向量组合作为探测特征向量。
22.在本发明的一个实施例中,所述基于所述水声音频信号的时域信号和频域信号计算所述水声音频信号的识别特征,得到识别特征向量包括:
23.基于所述水声音频信号的时域信号集和所述频域信号集,分别计算每帧水声音频
信号的时频特征;
24.利用统计函数分别对所述每帧水声音频信号的视频特征进行统计,得到时频特征向量,将所述时频特征向量作为识别特征向量;
25.其中,所述时频特征包括但不限于谱偏态系数、光谱峰度、光谱清晰度和频谱质心。
26.在本发明的一个实施例中,所述统计函数包括但不限于最大值函数、最小值函数、标准差函数、平均值函数。
27.在本发明的一个实施例中,所述将所述探测特征向量输入至第一分类器进行训练,得到训练好的第一分类器包括:
28.将所述探测特征向量输入至第一分类器进行训练,直到二分类任务交叉熵损失函数达到最小,得到训练好的第一分类器;
29.其中,所述二分类任务交叉熵损失函数为:
[0030][0031]
其中,是预测结果为正样本的概率,y为样本标签,正样本为1,负样本为0。
[0032]
在本发明的一个实施例中,所述将所述识别特征向量输入至第二分类器进行训练,得到训练好的第二分类器包括:
[0033]
将所述识别特征向量输入至第二分类器进行训练,直到多分类任务交叉熵损失函数达到最小,得到训练好的第二分类器;
[0034]
其中,所述多分类任务交叉熵损失函数为:
[0035][0036]
其中,k为类别数量,y表示样本标签,若样本类别为i,则yi=1,否则,yi=0;pi为预测结果类别为i的概率。
[0037]
在本发明的一个实施例中,所述基于所述训练好的第一分类器和所述训练好的第二分类器构建水声多目标识别模型后还包括:
[0038]
获取测试集中的水声音频信号,并计算所述水声音频信号的探测特征向量,将所述探测特征向量输入至所述水声多目标识别模型中的第一分类器进行分类;
[0039]
根据分类结果判断所述水声音频信号是否存在对应的水声目标,若存在,则将所述水声音频信号作为目标水声音频信号;
[0040]
计算所述目标水声音频信号的识别特征向量,并将所述识别特征向量输入至所述水声多目标识别模型中的第二分类器进行分类,以判断所述目标水声音频信号对应的水声目标类型。
[0041]
本发明还提供了一种水声多目标识别装置,包括:
[0042]
信号获取模块,用于获取训练集中的水声音频信号,并获取所述水声音频信号的时域信号和频域信号;
[0043]
探测特征提取模块,用于基于所述水声音频信号的时域信号和频域信号计算所述水声音频信号的探测特征,得到探测特征向量;其中,所述探测特征包括但不限于所述水声音频信号的时域特征、频域特征、时频特征;
[0044]
第一分类模块,用于将所述探测特征向量输入至第一分类器进行训练得到训练好
的第一分类器;
[0045]
识别特征提取模块,用于基于所述水声音频信号的时域信号和频域信号计算所述水声音频信号的识别特征,得到识别特征向量;其中,所述识别特征包括但不限于所述探测特征中未包含的所述水声音频信号的时域特征、频域特征、时频特征;
[0046]
第二分类模块,用于将所述识别特征向量输入至第二分类器进行训练,得到训练好的第二分类器;
[0047]
模型构建模块,用于基于所述训练好的第一分类器和所述训练好的第二分类器构建水声多目标识别模型。
[0048]
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的水声多目标识别方法的步骤。
[0049]
本发明所述的水声多目标识别方法包括:计算水声音频信号的探测特征,得到探测特征向量,并将探测特征向量输入至第一分类器进行分类,以判断所述水声音频信号是否存在对应的水声目标,若存在,则计算所述水声音频信号的识别特征,得到识别特征向量,并将识别特征向量输入至第二分类器,以便根据分类结果识别所述水声音频信号对应的水声目标类型。本发明可以直接对水声音频信号进行特征计算,实时性高,反应速度快,并且探测特征和识别特征均包括但不限于水声音频信号的时域特征、频域特征和时频特征,通过多角度分析水声音频信号,获取探测特征和识别特征,减少了特征提取过程中的信息损失,除此之外,先根据探测特征探测水声目标,再根据识别特征识别水声目标,提高了水声目标识别精度。
附图说明
[0050]
为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明,其中
[0051]
图1是本发明提供的水声多目标识别原理示意图;
[0052]
图2是本发明提供的水声多目标识别方法流程图;
[0053]
图3是本发明提供的水声多目标识别模型训练及测试示意图;
[0054]
图4是本发明提供的水声音频信号特征提取策略示意图;
[0055]
图5是本发明提供的水声多目标识别装置结构示意图。
具体实施方式
[0056]
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
[0057]
实施例1:
[0058]
本技术提供的水声多目标识别方法主要包括两个阶段,第一阶段为目标探测阶段,这一阶段生成用于探测水声目标是否存在的探测特征集(tshd),第二阶段生成用于识别水声目标类型的识别特征集(tshr)。如图1所示为本技术提供的水声多目标识别原理示意图,当采集到一个待检测水声音频信号时,首先提取水声音频信号的tshd特征集,输入至分类器中,以确定水下目标是否存在。如果存在水下目标,则重新提取水声音频信号的tshr特征集,输入至分类器中,识别水下目标的类型。
[0059]
如图2所示为本发明的提供的水声多目标识别方法流程图,包括:
[0060]
s10:获取训练集中的水声音频信号,并获取水声音频信号的时域信号和频域信号。
[0061]
在一些实施例中,步骤s10的具体实现方式为:获取训练集中的水声音频信号,对其进行分帧处理,分别获取每帧水声音频信号的时域信号和频域信号,得到时域信号集和频域信号集。
[0062]
示例地,在本实施例中,将水声音频信号划分若干帧为时长为一秒的信号,可以更好地提取每帧水声音频信号的特征,以便特征提取更全面,提高模型的识别精度。
[0063]
可选地,可以使用傅里叶变换(fft)方法获取水声音频信号的频域信号。
[0064]
s20:基于水声音频信号的时域信号和频域信号计算水声音频信号的探测特征,得到探测特征向量。
[0065]
具体地,探测特征包括但不限于所述水声音频信号的时域特征、频域特征、时频特征。
[0066]
在一些实施例中,步骤s20的具体实现方式为:
[0067]
s200:分别计算每帧时域信号的时域特征。
[0068]
可选地,时域特征包括但不限于该时域信号的过零率、短时能量、短时自相关函数。
[0069]
s201:使用统计函数对每帧时域信号的时域特征进行统计,得到水声音频信号的时域特征向量。
[0070]
示例地,本实施例中通过计算每帧时域信号的过零率作为时域特征,利用统计函数对每帧时域信号的过零率进行统计得到时域特征向量。
[0071]
具体地,过零率是指音频信号通过零点(即从正变为负或从负变为正)的次数,其表达式为:
[0072][0073]
其中,sgn[]是符号函数,n为一帧的长度,n为帧数;
[0074][0075]
在本技术的其他实施例中,所计算的时域特征还可以是该时域信号的短时能量、短时自相关函数或其他时域参数信息,本技术对此不做限定。
[0076]
s202:分别计算每帧频域信号的频域特征。
[0077]
可选地,频域特征包括但不限于梅尔倒谱系数、频谱宽度、频谱差分幅度。
[0078]
s203:使用统计函数对每帧频域信号的频域特征进行统计,得到水声音频信号的频域特征向量。
[0079]
示例地,本实施例中通过计算每帧频域信号的梅尔倒谱系数作为频域特征,并利用统计函数对每帧频域信号的梅尔倒谱系数进行统计,得到频域特征向量。
[0080]
具体地,将每帧频谱信号通过,mel滤波器得到mel频谱,在mel频谱上进行倒谱分析(取对数,做逆变换,实际逆变换一般是通过dct离散余弦变换来实现的,取dct后第2到13个系数作为梅尔倒谱系数),得到梅尔倒谱系数。
[0081]
在本技术的其他实施例中,所计算的频域特征还可以是频谱宽度、频谱差分幅度或其他频域参数信息,本技术对此不做限定。
[0082]
s204:将水声音频信号的时域特征向量和频域特征向量组合作为探测特征向量。
[0083]
本实施例中以计算水声音频信号的时域特征和频域特征作为探测特征为例,在其他实施例中,还可以选择将水声音频信号的时域特征、频域特征、时频特征、专用音频特征中的一种或几种作为探测特征。
[0084]
s30:将探测特征向量输入至第一分类器进行训练,得到训练好的第一分类器。
[0085]
在一些实施例中,步骤s30的具体实现方式为:将探测特征向量输入至第一分类器进行训练,直到二分类任务交叉熵损失函数达到最小,得到训练好的第一分类器。
[0086]
具体地,二分类任务交叉熵损失函数为:
[0087][0088]
其中,是预测结果为正样本的概率,y为样本标签,正样本为1,负样本为0。
[0089]
示例地,若该水声音频信号存在对应的水声目标,则样本标签为正样本,若该水声音频信号不存在对应的水声目标,则样本标签为负样本。
[0090]
s40:基于水声音频信号的时域信号和频域信号计算水声音频信号的识别特征,得到水声音频信号的识别特征向量。
[0091]
具体地,识别特征包括但不限于探测特征中未包含的水声音频信号的时域特征、频域特征、时频特征。
[0092]
在一些实施例中,步骤s40的具体实现方式为:基于水声音频信号的时域信号集和频域信号集,分别计算每帧水声音频信号的时频特征,利用统计函数对每帧水声音频信号的时频特征进行统计,得到时频特征向量,将该时频特征向量作为识别特征向量。
[0093]
可选地,时频特征包括但不限于谱偏态系数、光谱峰度、光谱清晰度和频谱质心。
[0094]
在本技术的其他实施例中,还可以将谱偏态系数、光谱峰度、光谱清晰度和频谱质心中的一种或几种作为时频特征,本技术对此不做限定。
[0095]
本实施例中以计算水声音频信号的频域特征作为识别特征为例,在其他实施例中,还可以选择将探测特征中未包含的的时域特征、频域特征、时频特征、专用音频特征中的一种或几种作为识别特征。
[0096]
s50:将识别特征向量输入至第二分类器进行训练,得到训练好的第二分类器。
[0097]
在一些实施例中,步骤s50的具体实现方式为:将识别特征向量输入至第二分类器进行训练,直到多分类任务交叉熵损失函数达到最小,得到训练好的第二分类器。
[0098]
具体地,多分类任务交叉熵损失函数为:
[0099][0100]
其中,k为类别数量,y表示样本标签,若样本类别为i,则yi=1,否则,yi=0;pi为预测结果类别为i的概率。
[0101]
s60:基于训练好的第一分类器和训练好的第二分类器构建水声多目标识别模型。
[0102]
可选地,步骤s20、s40中的统计函数可以为最大值函数、最小值函数、标准差函数、平均值函数等。
[0103]
如图3所示为本技术提供的水声多目标识别模型的训练和测试过程示意图。
[0104]
可选地,本实施例在构建水声多目标识别模型后,还包括利用测试集中的水声音频信号对该水声多目标识别模型进行测试,其具体过程包括:
[0105]
获取测试集中的水声音频信号,并基于该水声音频信号的时域信号和频域信号计算该水声音频信号的探测特征向量,将该探测特征向量输入至水声多目标识别模型中的第一分类器进行分类。
[0106]
根据分类结果判断该水声音频信号是否存在对应的水声目标,若存在,则将该水声音频信号作为目标水声音频信号。
[0107]
基于该目标水声音频信号的时域信号和频域信号计算该目标水声音频信号的识别特征向量,将该识别特征向量输入至水声多目标识别模型中的第二分类器进行分类,以根据分类结果判断该目标水声音频信号对应的水声目标类型。
[0108]
本技术提供的水声多目标识别方法可以对水声音频信号直接进行特征计算,无需使用特征提取网络提取特征信息,实时性更高,反应速度也更快。通过时域信号和频域信号直接计算对应的时域、频域和时频特征,降低了特征提取的难度。将水声目标识别分为探测目标和识别目标两个阶段,也提高了水声目标识别的准确性。
[0109]
实施例2:
[0110]
基于上述实施例1,本技术实施例提出了一种水声音频信号特征提取策略,如图4所示,根据水声音频信号的时域信号和频域信号分别提取对应的时域特征、频域特征和时频特征,利用统计函数对这些特征进行统计,得到相应的特征向量,将该特征向量作为分类器对水声音频信号进行分类的依据。
[0111]
基于这一特征提取策略,本技术实施例对一组海洋数据进行了特征提取,如表1所示,其中包括tshd和tshr,tshd为探测特征集,在本实施例中tshd包括水声音频信号的时域特征和频域特征,用于探测水声音频信号是否存在对应的水声目标,tshr为识别特征集,在本实施例中tshr包括时频特征,用于识别水声音频信号对应的水声目标类型。
[0112]
表1
[0113][0114]
其中,zcr为过零率,mfcc为梅尔倒谱系数,spectral skewness为谱偏态系数,spectral kurtosis为光谱峰度,spectral sharpness为光谱清晰度,spectral centroid为频谱质心。
[0115]
利用统计函数对表1中的时域特征、频域特征和时频特征进行统计,得到探测特征
向量和识别特征向量。如表2所示为本技术实施例使用的统计函数。
[0116]
表2
[0117][0118]
其中,使用不同的统计函数对特征进行统计可以得到不同的特征向量,因此tshd共含有15个特征(3*5),tshr共含有52个特征(4*13)。
[0119]
本技术还提供了一种水声多目标识别装置,如图5所示,包括:
[0120]
信号获取模块10,用于获取训练集中的水声音频信号,并获取水声音频信号的时域信号和频域信号。
[0121]
探测特征提取模块20,用于基于水声音频信号的时域信号和频域信号计算水声音频信号的探测特征,得到探测特征向量。
[0122]
第一分类模块30,用于将探测特征向量输入至第一分类器进行训练得到训练好的第一分类器。
[0123]
识别特征提取模块40,用于基于水声音频信号的时域信号和频域信号计算水声音频信号的识别特征,得到识别特征向量。
[0124]
第二分类模块50,用于将识别特征向量输入至第二分类器进行训练,得到训练好的第二分类器。
[0125]
模型构建模块60,用于基于训练好的第一分类器和训练好的第二分类器构建水声
多目标识别模型。
[0126]
本技术实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述的水声多目标识别方法的步骤。
[0127]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0128]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0129]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0130]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0131]
显然,上述实施例仅仅是为清楚地说明所作的举例,并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
技术特征:
1.一种水声多目标识别方法,其特征在于,包括:获取训练集中的水声音频信号,并获取所述水声音频信号的时域信号和频域信号;基于所述水声音频信号的时域信号和频域信号计算所述水声音频信号的探测特征,得到探测特征向量;其中,所述探测特征包括但不限于所述水声音频信号的时域特征、频域特征、时频特征;将所述探测特征向量输入至第一分类器进行训练,得到训练好的第一分类器;基于所述水声音频信号的时域信号和频域信号计算所述水声音频信号的识别特征,得到识别特征向量;其中,所述识别特征包括但不限于所述探测特征中未包含的所述水声音频信号的时域特征、频域特征、时频特征;将所述识别特征向量输入至第二分类器进行训练,得到训练好的第二分类器;基于所述训练好的第一分类器和所述训练好的第二分类器构建水声多目标识别模型。2.根据权利要求1所述的水声多目标识别方法,其特征在于,所述获取水声音频信号,并获取所述水声音频信号的时域信号和频域信号包括:获取水声音频信号,并对所述水声音频信号进行分帧处理;分别获取每帧水声音频信号的时域信号和频域信号,得到所述水声音频信号的时域信号集和频域信号集。3.根据权利要求2所述的水声多目标识别方法,其特征在于,所述基于所述水声音频信号的时域信号和频域信号计算所述水声音频信号的探测特征,得到探测特征向量包括:分别计算所述水声音频信号的时域信号集中每帧时域信号的时域特征;使用统计函数对所述每帧时域信号的时域特征进行统计,得到所述水声音频信号的时域特征向量;其中,所述时域特征包括但不限于过零率、短时能量、短时自相关函数;分别计算所述水声音频信号的频域信号集中每帧频域信号的频域特征;使用统计函数对所述每帧频域信号的频域特征进行统计,得到所述水声音频信号的频域特征向量;其中,所述频域特征包括但不限于梅尔倒谱系数、频谱宽度、频谱差分幅度;将所述时域特征向量与所述频域特征向量组合作为探测特征向量。4.根据权利要求2所述的水声多目标识别方法,其特征在于,所述基于所述水声音频信号的时域信号和频域信号计算所述水声音频信号的识别特征,得到识别特征向量包括:基于所述水声音频信号的时域信号集和所述频域信号集,分别计算每帧水声音频信号的时频特征;利用统计函数分别对所述每帧水声音频信号的时频特征进行统计,得到时频特征向量,将所述时频特征向量作为识别特征向量;其中,所述时频特征包括但不限于谱偏态系数、光谱峰度、光谱清晰度和频谱质心。5.根据权利要求3或4任一项所述的水声多目标识别方法,其特征在于,所述统计函数包括但不限于最大值函数、最小值函数、标准差函数、平均值函数。6.根据权利要求1所述的水声多目标识别方法,其特征在于,所述将所述探测特征向量输入至第一分类器进行训练,得到训练好的第一分类器包括:将所述探测特征向量输入至第一分类器进行训练,直到二分类任务交叉熵损失函数达到最小,得到训练好的第一分类器;其中,所述二分类任务交叉熵损失函数为:
其中,是预测结果为正样本的概率,y为样本标签,正样本为1,负样本为0。7.根据权利要求1所述的水声多目标识别方法,其特征在于,所述将所述所述识别特征向量输入至第二分类器进行训练,得到训练好的第二分类器包括:将所述识别特征向量输入至第二分类器进行训练,直到多分类任务交叉熵损失函数达到最小,得到训练好的第二分类器;其中,所述多分类任务交叉熵损失函数为:其中,k为类别数量,y表示样本标签,若样本类别为i,则y
i
=1,否则,y
i
=0;p
i
为预测结果类别为i的概率。8.根据权利要求1所述的水声多目标识别方法,其特征在于,所述基于所述训练好的第一分类器和所述训练好的第二分类器构建水声多目标识别模型后还包括:获取测试集中的水声音频信号,并计算所述水声音频信号的探测特征向量,将所述探测特征向量输入至所述水声多目标识别模型中的第一分类器进行分类;根据分类结果判断所述水声音频信号是否存在对应的水声目标,若存在,则将所述水声音频信号作为目标水声音频信号;计算所述目标水声音频信号的识别特征向量,并将所述识别特征向量输入至所述水声多目标识别模型中的第二分类器进行分类,以判断所述目标水声音频信号对应的水声目标类型。9.一种水声多目标识别装置,其特征在于,包括:信号获取模块,用于获取训练集中的水声音频信号,并获取所述水声音频信号的时域信号和频域信号;探测特征提取模块,用于基于所述水声音频信号的时域信号和频域信号计算所述水声音频信号的探测特征,得到探测特征向量;其中,所述探测特征包括但不限于所述水声音频信号的时域特征、频域特征、时频特征;第一分类模块,用于将所述探测特征向量输入至第一分类器进行训练得到训练好的第一分类器;识别特征提取模块,用于基于所述水声音频信号的时域信号和频域信号计算所述水声音频信号的识别特征,得到识别特征向量;其中,所述识别特征包括但不限于所述探测特征中未包含的所述水声音频信号的时域特征、频域特征、时频特征;第二分类模块,用于将所述识别特征向量输入至第二分类器进行训练,得到训练好的第二分类器;模型构建模块,用于基于所述训练好的第一分类器和所述训练好的第二分类器构建水声多目标识别模型。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-8任一项所述的水声多目标识别方法的步骤。
技术总结
本发明涉及一种水声多目标识别方法、装置及计算机可读存储介质,属于水下目标识别技术领域。本发明包括:计算水声音频信号的探测特征,并将探测特征向量输入第一分类器进行分类,以判断水声音频信号是否存在对应的水声目标,若存在,则计算水声音频信号的识别特征,并将识别特征向量输入第二至分类器,以便判断水声音频信号对应的水声目标类型。本发明可以直接对水声音频信号进行特征计算,实时性高,反应速度快;且通过多角度分析水声音频信号,获取探测特征和识别特征,减少了特征提取时的信息损失;除此之外,将水声目标识别分为探测和识别两个阶段,先根据探测特征探测水声目标,再根据识别特征识别水声目标类型,提高了水声目标识别精度。目标识别精度。目标识别精度。
技术研发人员:黄敏 肖仲喆 王薪贵
受保护的技术使用者:苏州大学
技术研发日:2023.05.29
技术公布日:2023/9/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:一种基于液晶微透镜阵列的图像质量提高方法及系统 下一篇:一种用于可视化检测CrO