基于改进MobileViT网络的雷达有源干扰识别方法
未命名
09-23
阅读:45
评论:0
基于改进mobilevit网络的雷达有源干扰识别方法
技术领域
1.本发明涉及雷达干扰识别技术领域,更具体地,涉及基于改进mobilevit网络的雷达有源干扰识别方法。
背景技术:
2.雷达作为现代战场上一种全天候的信息传感设备,其已成为当今战场诸如侦察监视、目标识别、武器制导以及诸兵种协同作战等方面的核心装备,正因为其在战场上发挥的巨大作用,雷达已成为现代战争中首先被打击的对象,随着雷达干扰系统特别是数字射频存储器(drfm)的快速发展,快速有效的有源干扰手段层出不穷,雷达系统的运行性能受到严重损害,因此,特别是在日益复杂多变的电磁战场下,提高雷达抗干扰能力变得越来越重要;
3.当雷达进行有源干扰信号处理时,如何有效地进行干扰识别是能否实现干扰抑制的重要前提,只有确定了具体干扰类型才能采取相应合理的抗干扰措施,实现有源干扰识别的主要思路是将其转换成一个模式识别问题来解决,提取出各类干扰具有区分性的特征参数,输入合理设计的分类器,以实现对各种干扰的分类识别,这类识别方法的要点在于特征选取和分类器设计上,目前应用广泛的特征分类器有决策树、支持向量机、和聚类算法等,在对一种干扰特性分析的基础上,开发了许多有效的识别方法,设计了一种能够有效识别某些类型干扰的算法,同时,利用随机森林分类器确实可以识别和分类多种类型的有源干扰信号,研究人员利用时频分布图,通过提取时频图像特征和使用机器学习技术来识别各种类型的干扰;
4.近年来,许多研究探索了深度学习算法用于识别雷达干扰信号,文献使用卷积神经网络训练雷达干扰信号的时频图,采用自适应裁剪算法去除冗余信息,文献使用卷积神经网络训练三种雷达信号的时频谱图。文献提出了一种基于稳健功率谱特征的干扰识别网络,可识别十种雷达干扰信号,文献开发了一个基于一维卷积神经网络的干扰分类模型,并使用孪生卷积神经网络和融合网络对其进行了改进,文献采用递归图像提取方法,使用二维卷积神经网络实现了对八种干扰信号的超过99%的识别准确率,文献提出了一种高效的双线性efficientnet-b3网络,结合注意力机制识别八种主动雷达干扰信号,文献开发了一个复杂的卷积神经网络用于雷达干扰信号识别,文献提出了一种双向门控循环单元和基于一维卷积神经网络的干扰识别模型,可对七种主动雷达干扰进行分类;
5.上述使用神经网络识别干扰时,没有考虑模型大小是否适合部署到硬件上的问题,在针对神经网络训练时没有考虑小样本的实际情况。本文针对上述实际问题,采用mobilevit网络,轻量化的模型降低对硬件要求,mobilevit结合了卷积神经网络与transfomer的优点,构建了一个轻量级、通用且对设备友好的网络。
技术实现要素:
6.本发明为克服使用神经网络识别干扰时,没有考虑模型大小是否适合部署到硬件
上的问题,提供基于改进mobilevit网络的雷达有源干扰识别方法。
7.基于改进mobilevit网络的雷达有源干扰识别方法包括如下步骤:
8.s1:获取信号;
9.s2:将信号进行预处理,生成时频图;
10.s3:构建加入坐标注意力模块的mobilevit网络;
11.s4:将时频图输入步骤s3得到的mobilevit网络中进行特征提取,对时频图进行识别,输出识别结果。
12.进一步,步骤s2中,所述对信号进行预处理,包括如下步骤:
13.s2.1:对信号采用短时傅里叶变换,得到信号的时频域分布特征,生成时频图;
14.s2.2:将时频图随机裁剪和垂直翻转,将修改后的时频图按标准正态分布形式排列,完成预处理操作。
15.进一步,步骤s3中,加入坐标注意力模块的mobilevit网络结构具体为:
16.加入坐标注意力模块的mobilevit网络的输入依次经过3
×
3标准卷积,5个mv2模块,mobilevit block模块,一个mv2模块,mobilevit block模块,一个mv2模块,mobilevit block模块,1
×
1卷积层和全局平均池化,在3
×
3标准卷积做2倍下采样,在第二、第五、第六和第七个mv2模块分别做一次2倍下采样;在所有mv2模块中加入坐标注意力模块。
17.进一步,所述mobilevit block结构具体为:
18.将mobilevit block的输入通过一个卷积核大小为n
×
n的卷积层,再通过一个卷积核大小为1x1的卷积层,接着依次通过unfold、transformer、fold结构进行全局特征建模,继续通过一个卷积核大小为1x1的卷积层,mobilevit block的输入可以通过分支与1
×
1的卷积层的输出进行concat拼接后,通过一个卷积核大小为n
×
n的卷积层输出。
19.进一步,所述在所有mobilevit网络加入坐标注意力模块,具体为:坐标注意力模块插入到mv2模块中的3
×
3深度可分离卷积和1
×
1卷积层之间,将所述3
×
3深度可分离卷积、所述坐标注意力模块、所述1
×
1卷积层依次相连。
20.进一步,所述mv2模块结构具体为:1
×
1卷积层、batchnorm正则化操作与relu6函数作为第一模块,3
×
3深度可分离卷积与batchnorm正则化操作、relu6函数作为第二模块,坐标注意力模块作为第三模块、1
×
1卷积层与batchnorm正则化操作作为第四模块,所述第一模块、第二模块、第三模块和第四模块依次相连。
21.进一步,所述unfold是将输入的特征图x
l
∈rh×w×d变为x
unfold
∈r
p
×n×d,w和h为每个特征图的宽高,n为特征图的数目,d为维数。
22.进一步,所述坐标注意力模块具体为:
23.坐标注意力模块利用两个一维全局池化操作分别将垂直和水平方向的输入特征聚合为两个独立的方向感知特征图,将两个独立的方向感知特征图concat拼接在一起,输入1
×
1卷积层,将经过batchnorm归一化操作和非线性化处理的特征图输入sigmoid激活函数,沿空间维度将切分为两个单独的张量fh和fw,利用两个1
×
1卷积层fh和fw将特征图fh和fw变换,输出带有注意力权重的特征图。
24.进一步,所述分别将垂直和水平方向的输入特征聚合为两个独立的方向感知特征图的计算方式:
[0025][0026][0027]
h表示特征图的高度,w表示特征图的宽度,xc(h,i):表示在位置h上通道c的输入值中的第i个元素,表示在位置h上通道c的输出值。
[0028]
进一步,所述坐标注意力模块的输出计算方式为:
[0029][0030]gh
代表输入特征图在高度方向的注意力权重,gw代表输入特征图在宽度方向的注意力权重,y(i,j)为输出矩阵第i行、第j列的元素,x(i,j)为输入矩阵第i行、第j列的元素.
[0031]
与现有技术相比,本发明技术方案的有益效果是:
[0032]
采用mobilevit网络,轻量化的模型降低对硬件要求,mobilevit结合了卷积神经网络与transfomer的优点,构建了一个轻量级、通用且对设备友好的网络。
附图说明
[0033]
图1为本发明所述的基于改进mobilevit网络的雷达有源干扰识别方法流程图;
[0034]
图2为本发明所述的mobilevit网络结构图;
[0035]
图3为本发明实施例基于改进mobilevit网络的雷达有源干扰识别方法流程图;
[0036]
图4为本发明所述的改进前的mobilenetv2模块;
[0037]
图5为本发明所述的坐标注意力机制模块;
[0038]
图6为本发明所述的改进后mobilenetv2模块;
[0039]
图7为本发明所述的mobilevit block模块。
具体实施方式
[0040]
附图仅用于示例性说明,不能理解为对本专利的限制;
[0041]
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
[0042]
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
[0043]
下面结合附图和实施例对本发明的技术方案做进一步的说明。
[0044]
实施例1
[0045]
本实施例提供一种基于改进mobilevit网络的雷达有源干扰识别方法,如图1所示,包括如下步骤:
[0046]
s1:获取信号;
[0047]
s2:将信号进行预处理,生成时频图;
[0048]
s3:构建加入坐标注意力模块的mobilevit网络;
[0049]
s4:将时频图输入步骤s3得到的mobilevit网络中进行特征提取,对时频图进行识别,输出识别结果。
[0050]
实施例2
[0051]
本实施例在实施例1的基础上,继续公开以下内容:步骤s2中,所述对信号进行预处理,包括如下步骤:
[0052]
s2.1:对信号采用短时傅里叶变换,得到信号的时频域分布特征,生成时频图;
[0053]
s2.2:将时频图随机裁剪和垂直翻转,将修改后的时频图按标准正态分布形式排列,完成预处理操作;
[0054]
在具体实施过程中,因为原始数据是雷达一维序列信号,那么可以使用时频分析(如短时傅里叶变换、小波变换、wigner-ville分布等)将其表示为时间和频率的二维函数,其可被看成是二维图像(在输入网络学习之前需经过预处理来最大化特征挖掘),这样就可以利用深度学习在图像处理上的算法识别该信号,cnn更适合于处理二维图像,而不是一维信号,如果只使用时域或频域信息进行网络训练,则可能会发生信息丢失,因此,我们需要对该信号进行时频变换处理,以便更好地应用于cnn,为了实现这一点,我们使用时频分析从根本上获得了信号的时频域特征,以提取更普遍和具有代表性的特征,时频分析提供了时域和频域的联合分布信息,并描述了信号频率与时间之间的关系。
[0055]
常用的时频变换方法包括短时傅里叶变换(stft)和平滑伪维格纳-维尔分布(smoothed pseudo wigner-ville distribution,spwvd),spwvd由于比stft分辨率,应用于干扰信号的时频变换,但是,只要分辨率合适,stft也可以有很好的成像效果,尽管分辨率没有spwvd那么高,虽然spwvd的分辨率高于stft,但其计算复杂度和内存负担增加,导致处理时间长,不适合快速干扰识别,虽然spwvd具有更好的成像性能,但实际应用需要在成像性能、计算复杂度和处理时间之间进行权衡,因此,本研究选择stft进行信号预处理;
[0056]
短时傅里叶变换在频谱分析方法傅里叶变换的基础上发展来的,它的基本思想是先在时域对信号s(τ)进行加窗处理,把信号拆分成多个子信号段,再移动时域窗函数h(t)对各时间段的信号做计算每一小段时间内信号的频率分量,算法如下:
[0057][0058]
其中,ω表示频率,τ为积分时间变量,若设置的矩形窗时长为ωt,fs是干扰信号的采样率,对应时域窗的点m=ωt
·fs
,stft是一种线性变换,在使用中不会产生交叉干扰项,因此对频率分集信号具有较强的处理能力,且具有良好的抗干扰能力,stft不能同时在时域和频域上获得高分辨率,这意味着滑动窗口越短,时间分辨率越高,滑动窗口越长,频率分辨率越高,用于生成时频图的stft窗口函数选取汉明窗,窗长度为128个采样点,每个平移的步长为1。
[0059]
对信号进行短时傅里叶变换,将生成的时频图做中心处理,所生成8类数据的时频图,初始生成的图片分辨率为875
×
656,输入网络时将图片设置为256
×
256,数据预处理将图片随机裁剪,依概率垂直翻转,并且将数据转换为标准正态分布,使模型更容易收敛。
[0060]
实施例3
[0061]
本实施例在实施例1和2的基础上,继续公开以下内容:
[0062]
如图2所示,步骤s3中,加入坐标注意力模块的mobilevit网络结构具体为:
[0063]
加入坐标注意力模块的mobilevit网络的输入依次经过3
×
3标准卷积,5个mv2模块,mobilevitblock模块、一个mv2模块,mobilevitblock模块、一个mv2模块,
mobilevitblock模块,1
×
1卷积层和全局平均池化,在3
×
3标准卷积做2倍下采样,在第二、第五、第六和第七个mv2模块分别做一次2倍下采样;在所有mv2模块中加入坐标注意力模块,mobilevit是结合了mobilenet和visiontransformer的优点构成的神经网络,其中mobilenet卷积神经网络有着轻量级的骨干结构,基于自注意力机制的visiontransformer善于提取全局特征信息,mobilevit结合卷积神经网络和visiontransformer的优势构建了一个轻量级、快速的网络模型,干扰识别过程如图3所示,mobilevit网络的初始学习率设置为0.0002,模型优化器使用adamw,权重衰减设置为0.0001,生成时频图所使用的stft窗口函数为汉明窗口,窗口长度为128个采样点,每次平移的步长为1。
[0064]
实施例4
[0065]
本实施例在实施例1和2和3的基础上,继续公开以下内容:
[0066]
如图7所示,所述mobilevitblock结构具体为:
[0067]
将mobilevitblock的输入通过一个卷积核大小为n
×
n的卷积层,再通过一个卷积核大小为1x1的卷积层,接着依次通过unfold、transformer、fold结构进行全局特征建模,继续通过一个卷积核大小为1x1的卷积层,mobilevitblock的输入可以通过分支与1
×
1的卷积层的输出进行concat拼接后,通过一个卷积核大小为n
×
n的卷积层输出,mobilevit block对给定的输入图片特征x∈rh×w×c(c表示特征图通道数,h表示特征图的高,w表示特征图的宽)通过一个local representation(局部表征模块),由一个n
×
n的标准卷积(n=3)局部的特征提取,然后接一个pw(pointwise)卷积,即1
×
1卷积调整通道数,将特征张量投影到高维空间(d维,其中d》c)进入到global representation(全局表征)模块;
[0068]
全局表征模块通过unfold(展平)、transformer和fold(折叠)步骤进行全局的特征建模,然后再通过一个卷积核大小为1
×
1的卷积层将通道数调整回原始大小。
[0069]
实施例5
[0070]
本实施例在实施例1的基础上,继续公开以下内容:
[0071]
如图6所示,所述在所有mobilevit网络加入坐标注意力模块,具体为:坐标注意力模块插入到mv2模块中的3
×
3深度可分离卷积和1
×
1卷积层之间,将所述3
×
3深度可分离卷积、所述坐标注意力模块、所述1
×
1卷积层依次相连,
[0072]
如图4所示,所述mv2模块结构具体为:1
×
1卷积层、batchnorm正则化操作与relu6函数作为第一模块,3
×
3深度可分离卷积与batchnorm正则化操作、relu6函数作为第二模块,坐标注意力模块作为第三模块、1
×
1卷积层与batchnorm正则化操作作为第四模块,所述第一模块、第二模块、第三模块、第四模块依次相连,在mv2模块中,加入适用于轻量级网络的注意力机制,坐标注意力(coordinate attention)通过将位置信息嵌入到通道注意力中,使得轻量级网络能够在更大的区域上进行注意力,同时避免了产生大量的计算开销。
[0073]
实施例6
[0074]
本实施例在实施例1和2的基础上,继续公开以下内容:所述unfold是将输入的特征图x
l
∈rh×w×d变为x
unfold
∈r
p
×n×d,w和h为每个特征图的宽高,n为特征图的数目,d为维数。
[0075]
实施例7
[0076]
本实施例在实施例1的基础上,继续公开以下内容:
[0077]
如图5所示,所述坐标注意力模块具体为:
[0078]
坐标注意力模块利用两个一维全局池化操作分别将垂直和水平方向的输入特征
聚合为两个独立的方向感知特征图,将两个独立的方向感知特征图concat拼接在一起,输入1
×
1卷积层,将经过batchnorm归一化操作和非线性化处理的特征图输入sigmoid激活函数,沿空间维度将切分为两个单独的张量fh和fw,利用两个1
×
1卷积层fh和fw将特征图fh和fw变换,输出带有注意力权重的特征图。
[0079]
所述分别将垂直和水平方向的输入特征聚合为两个独立的方向感知特征图的计算方式:
[0080][0081][0082]
h表示特征图的高度,w表示特征图的宽度,xc(h,i)表示在位置h上通道c的输入值中的第i个元素,表示在位置h上通道c的输出值,
[0083]
所述坐标注意力模块的输出计算方式为:
[0084][0085]gh
代表输入特征图在高度方向的注意力权重,gw代表输入特征图在宽度方向的注意力权重,y(i,j)为输出矩阵第i行、第j列的元素,x(i,j)为输入矩阵第i行、第j列的元素。
[0086]
相同或相似的标号对应相同或相似的部件;
[0087]
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
[0088]
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
技术特征:
1.基于改进mobilevit网络的雷达有源干扰识别方法,其特征在于,包括如下步骤:s1:获取信号;s2:将信号进行预处理,生成时频图;s3:构建加入坐标注意力模块的mobilevit网络;s4:将时频图输入步骤s3得到的mobilevit网络中进行特征提取,对时频图进行识别,输出识别结果。2.根据权利要求1所述的基于改进mobilevit网络的雷达有源干扰识别方法,其特征在于,步骤s2中,所述对信号进行预处理,包括如下步骤:s2.1:对信号采用短时傅里叶变换,得到信号的时频域分布特征,生成时频图;s2.2:将时频图随机裁剪和垂直翻转,将修改后的时频图按标准正态分布形式排列,完成预处理操作。3.根据权利要求1所述的基于改进mobilevit网络的雷达有源干扰识别方法,其特征在于,步骤s3中,加入坐标注意力模块的mobilevit网络结构具体为:加入坐标注意力模块的mobilevit网络的输入依次经过3
×
3标准卷积,5个mv2模块,mobilevit block模块,一个mv2模块,mobilevit block模块,一个mv2模块,mobilevit block模块,1
×
1卷积层和全局平均池化,在3
×
3标准卷积做2倍下采样,在第二、第五、第六和第七个mv2模块分别做一次2倍下采样;在所有mv2模块中加入坐标注意力模块。4.根据权利要求3所述的基于改进mobilevit网络的雷达有源干扰识别方法,其特征在于,所述mobilevit block结构具体为:将mobilevit block的输入通过一个卷积核大小为n
×
n的卷积层,再通过一个卷积核大小为1x1的卷积层,接着依次通过unfold、transformer、fold结构进行全局特征建模,继续通过一个卷积核大小为1x1的卷积层,所述mobilevit block的输入可以通过分支与1
×
1的卷积层的输出进行concat拼接后,通过一个卷积核大小为n
×
n的卷积层输出。5.根据权利要求3所述的基于改进mobilevit网络的雷达有源干扰识别方法,其特征在于,所述在所有mobilevit网络加入坐标注意力模块,具体为:坐标注意力模块插入到mv2模块中的3
×
3深度可分离卷积和1
×
1卷积层之间,将所述3
×
3深度可分离卷积、所述坐标注意力模块和所述1
×
1卷积层依次相连。6.根据权利要求5所述的基于改进mobilevit网络的雷达有源干扰识别方法,其特征在于,所述mv2模块结构具体为:1
×
1卷积层、batchnorm正则化操作与relu6函数作为第一模块,3
×
3深度可分离卷积与batchnorm正则化操作、relu6函数作为第二模块,坐标注意力模块作为第三模块、1
×
1卷积层与batchnorm正则化操作作为第四模块,所述第一模块、第二模块、第三模块和第四模块依次相连。7.根据权利要求4所述的基于改进mobilevit网络的雷达有源干扰识别方法,其特征在于,所述unfold是将输入的特征图x
l
∈r
h
×
w
×
d
变为x
unfold
∈r
p
×
n
×
d
,w和h为每个特征图的宽高,n为特征图的数目,d为维数。8.根据权利要求4所述的基于改进mobilevit网络的雷达有源干扰识别方法,其特征在于,所述坐标注意力模块具体为:坐标注意力模块利用两个一维全局池化操作分别将垂直和水平方向的输入特征聚合为两个独立的方向感知特征图,将两个独立的方向感知特征图concat拼接在一起,输入1
×
1卷积层,将经过batchnorm归一化操作和非线性化处理的特征图输入sigmoid激活函数,沿空间维度将切分为两个单独的张量f
h
和f
w
,利用两个1
×
1卷积层f
h
和f
w
将特征图f
h
和f
w
变换,输出带有注意力权重的特征图。9.根据权利要求8所述的基于改进mobilevit网络的雷达有源干扰识别方法,其特征在于,所述分别将垂直和水平方向的输入特征聚合为两个独立的方向感知特征图的计算方式:式:h表示特征图的高度,w表示特征图的宽度,x
c
(h,i)表示在位置h上通道c的输入值中的第i个元素表示在位置h上通道c的输出值。10.根据权利要求9所述的基于改进mobilevit网络的雷达有源干扰识别方法,其特征在于,所述坐标注意力模块的输出计算方式为:g
h
代表输入特征图在高度方向的注意力权重,g
w
代表输入特征图在宽度方向的注意力权重,y(i,j)为输出矩阵第i行、第j列的元素,x(i,j)为输入矩阵第i行、第j列的元素。
技术总结
本发明属于雷达干扰识别技术领域,具体涉及一种基于改进MobileViT网络的雷达有源干扰识别方法,本发明引入轻量化神经网络用于干扰识别,在识别精度提升的情况下,减少了网络参数量,加快的网络推理速度,降低了硬件的要求,在原有骨干网络结构上,加入适用于轻量化网络的坐标注意力机制,在保留轻量化的基础上,提升了网络识别分类性能。升了网络识别分类性能。升了网络识别分类性能。
技术研发人员:谢恺 邹文旭 林进健 谢洪途 王亮 戴欣华 郑海平
受保护的技术使用者:中山大学
技术研发日:2023.06.27
技术公布日:2023/9/22
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/