一种基于多先验引导的弱特征目标检测方法

未命名 10-21 阅读:83 评论:0


1.本发明涉及图像处理领域,尤其涉及一种基于多先验引导的弱特征目标检测方法。


背景技术:

2.全场景可用的弱特征目标检测理论是计算机视觉领域研究人员密切关注的研究方向之一,占据了非常重要的理论地位。该理论旨在通过利用图像输入信号与预期类别的特征差异,实现对不同类别目标的分类,并利用感兴趣目标与背景环境之间隐含的模式及内在关联,实现目标的准确定位。这种方法可以适用于各种场景,包括光线强弱、背景复杂、目标尺度变化等情况下的目标检测。因此在实际应用领域包括工业检测、医疗诊断、军事对抗中有着广泛应用前景。
3.传统目标检测方法通常是通过提取目标的高级特征,如纹理、颜色、形状等来进行目标检测。然而,这些高级特征对于目标存在变形、遮挡、光照变化等情况时,很可能会失效,进而导致算表现下降。相对而言,弱特征目标检测方法则不依赖于这些高级特征,而是主要利用目标周围的一些低级特征,例如边缘、角点等来进行检测,缓解了算法在面对目标高频特征变化时的敏感程度。
4.目前主要的弱特征目标检测方法可以分为两类。一类方法仿照了自然界中捕食者对有伪装能力猎物的搜寻过程,将网络设计为搜索与识别、定位与聚焦两个阶段。这种方法的核心思想是利用“由粗到精”的策略,通过不断迭代来逐步提高检测的准确性和稳定性。在搜索与识别阶段,网络首先对图像进行全局的搜索,以找到可能的目标区域。在定位与聚焦阶段,网络则将目光集中在已经确定为目标的区域上,并进一步提高对目标的识别和定位的精度。另一类弱特征目标检测方法则是通过辅助任务来实现对检测的引导作用。例如,有些研究人员利用边缘信息作为引导来获取高效的数据表征。他们认为,边缘信息往往可以提供有关目标形状和轮廓的重要信息,因此可以被用来指导目标检测的过程。此外,还有一些研究人员关注输入信号中变化剧烈的部分,并通过过滤背景信息中的噪声来实现对隐式弱特征目标的定位。以上基于额外任务思想的算法都仅仅使用单一任务作为补充信息指导网络训练。与人在进行弱特征目标检测任务时所使用的多维度、多角度观测综合得出结论的思路不相符。事实上,在现实生活中,人们进行目标检测任务时通常需要综合考虑多种信息,例如目标的形状、颜色、纹理、光照等等。因此,仅仅依靠单一先验的引导作用,可能无法充分挖掘出数据中的有效信息,也无法满足对精度日益增长的需求。


技术实现要素:

5.本发明所要解决的技术问题是,提供一种基于多先验引导的弱特征目标检测方法,能够克服现有检测方法中对弱特征目标识别不清、对输入图像质量要求高、抗干扰能力弱的特点。
6.为了解决上述技术问题,本发明是通过以下技术方案实现的:一种基于多先验引
导的弱特征目标检测方法,包括以下步骤:
7.(1)将标注好的以公开的已标注数据集作为基础,使用随机裁剪、缩放、抖动等方法进行数据增强预处理;
8.(2)利用特征金字塔形态的视觉transformer主干网络实现对输入图像的特征提取,利用维度缩减机制实现对多层次特征金字塔的构建;
9.(3)利用深度贝叶斯网络传递概率分布的特性,深度卷积神经网络利用局部特征的特性,具象信心得分以及边缘信息表征方法,利用多层特征结构实现对原始图像特征归纳偏置的总结;
10.(4)利用归纳偏置作为特征引导项,通过特征交联模块实现对原始图像特征的引导,由粗到精的实现对目标掩膜的总结;
11.(5)利用特征融合模块中的循环精炼机制对融合特征进行进一步精炼,在精炼特征的基础上使用卷积神经网络实现像素级的掩膜分割,得到最终的弱特征目标检测结果。
12.进一步地,所述步骤(2)中使用的视觉transformer共包含4个传递阶段:在阶段1中,采用了一个transformer空间缩减编码器结构。该结构将空间缩减倍数设为2,键值对的空间分辨率缩减倍率设为4。输出特征图的通道数为64,空间分辨率为88。归一化方法采用层归一化。在阶段2中,同样使用了一个transformer空间缩减编码器结构。空间缩减编码器的缩减倍数为2,键值对的空间分辨率缩减倍率为4。输出特征图的通道数为128,空间分辨率为44。归一化方法仍为层归一化。阶段3包含一个transformer空间缩减编码器结构,空间缩减倍数为2,键值对的空间分辨率缩减倍率为4。输出特征图的通道数为320,空间分辨率为22。同样采用层归一化作为归一化方法。阶段4同样包含一个transformer空间缩减编码器结构,空间缩减倍数为2,键值对的空间分辨率缩减倍率为4。输出特征图的通道数为512,空间分辨率为11。归一化方法仍为层归一化。
13.特征金字塔由四个层次组成,分别使用阶段1至阶段4输出的特征进行构造。输出通道数依次为64、128、320和512。
14.进一步地,在步骤(3)中使用的深度贝叶斯网络结构如下所示:它利用基于特征金字塔形态的视觉transformer主干网络提取的最后一层特征。针对每个特征点,采用输入通道为512、输出通道为128的卷积层、批归一化层和relu激活函数,以建立像素级别的概率分布集合。然后对分布结果进行多次采样,使用方差衡量算法来评估当前特征像素点的确定度。
15.进一步地,在步骤(3)中使用的深度卷积神经网络结构如下所示:它利用特征金字塔形态的视觉transformer主干网络提取的第一层和最后一层特征。对于第一层特征,经过输入通道为64、输出通道为128的卷积层、批归一化层和relu模块。对于最后一层特征,经过输入通道为512、输出通道为256的卷积层、批归一化层和relu模块,再接一个输入通道为256、输出通道为128的卷积层、批归一化层、relu模块和一个8倍上采样模块,以实现特征图的对齐。两个特征分支进行像素级别的相加操作,然后经过一个输入通道为128、输出通道为64的卷积层、批归一化层、relu模块,最后再通过一个输入通道为64、输出通道为1的卷积层、批归一化层、relu模块,来回归边缘信息图像。
16.进一步地,对于步骤(5),采用了由粗到精的思想,分为4个步骤对最终掩膜进行精炼。在每个步骤中,使用信心得分-边缘融合方法来实现特征融合。具体而言,特征融合模块
的特点在于实现了多维度观测特征的融合。该模块利用了残差连接、卷积、批归一化和relu激活函数来保留自身特性,并将其他观测维度的特征信息进行融合。为了对特征图大小进行对齐,采用了上采样操作。此外,循环精炼模块用于优化网络的学习参数,进一步优化参数。
17.进一步地,对于步骤(5),每个阶段的特征融合模块包含两个支路。信心得分支路由一个3x3卷积层、一个批归一化层和一个relu激活函数组成。在与边缘支路输入进行拼接后,经过另一个3x3卷积层、一个批归一化层和一个relu激活函数处理,然后与残差连接一起送入卷积融合模块。边缘支路由一个3x3卷积层、一个批归一化层和一个relu激活函数组成。在与信心得分支路输入进行拼接后,经过另一个3x3卷积层、一个批归一化层和一个relu激活函数处理,然后与残差连接一起送入卷积融合模块。每个阶段的卷积融合模块包括一个3x3卷积核和一个1x1卷积核,输出通道数分别为520、320、128和64。
18.进一步地,对于步骤(5)循环精炼模块实现方法中,特征图大小为11
×
11的第四层特征图通过上采样方法与第一层特征进行空间对齐。采用拼接特征进行反向传递和损失函数计算,实现进一步精炼特征。该循环精炼模块包括一个上采样层、一个通道拼接操作和一个3x3卷积层。
19.与现有技术相比,本发明的有益之处在于:这种基于多先验引导的弱特征目标检测方法采用的网络结构设计合理,能够满足极端天气环境以及对主动隐蔽目标的检测,其具有以下优点:
20.(1)本发明提出了一种针对弱特征目标检测任务优化的新型神经网络架构,能够实现在目标所处环境、光照、目标自身纹理等高级特征变化的情况下,实现对弱特征目标的稳定检测;有效利用了人在进行弱特征目标检测任务中所执行的信心得分概念,使用深度贝叶斯网络模拟判断概率,实现了对复杂识别问题的分布拆解。
21.(2)本发明设计了多重辅助任务引导的弱特征目标检测算法,分别设计信心得分与边缘提取模块,有效构建了先验的总结方法;提出并行组卷积的特征交联方式分别对原始特征实现融合引导,有效实现了先验的应用;提出了先验引导的特征融合模块,采用对称结构实现异质特征的融合,提升了融合特征的表征能力,进而提升了算法性能。
22.(3)本发明在训练过程中设计了特征循环精炼方法,提出了循环精炼模块。在不增加模型参数量的情况下,利用残差链接引入上一阶段的梯度,提升了反向传播的效率,加快了模型的收敛速度以及模型参数的准确程度。
23.(4)本发明根据神经网络模型大小进行了细致的调优,通过充分考虑各个网络结构的作用并精心设计每个模块的通道数和中间层扩张倍率,能够在保持网络运行速度的同时提高模型的检测精度,降低算法算力依赖程度,扩展其部署应用平台。
附图说明
24.图1是本发明一种基于多先验引导的弱特征目标检测方法的整体流程图;
25.图2是信心得分构建网络的详细结构图;
26.图3是边缘提取网络的详细结构图;
27.图4是特征融合模块的详细结构图;
28.图5是采用本发明方法获得的检测结果。
具体实施方式
29.下面结合附图和具体实施方式对本发明进行详细描述。
30.一种基于多先验引导的弱特征目标检测方法,包括以下步骤:
31.(1)将标注好的已公开的已标注数据集作为基础,使用随机裁剪、缩放、抖动等方法进行数据增强预处理;
32.(2)利用特征金字塔形态的视觉transformer主干网络实现对输入图像的图像特征提取,利用维度缩减机制实现对多层次图像特征金字塔的构建;
33.所述特征金字塔形态的视觉transformer主干网络具有4个阶段:
34.阶段1包含1个transformer空间缩减编码器结构,空间缩减编码器缩减倍数为2,键值对的空间分辨率缩减倍率为4,输出特征图的通道数为64,输出特征图的空间分辨率为88,归一化方法为层归一化;
35.阶段2包含1个transformer空间缩减编码器结构,空间缩减编码器缩减倍数为2,键值对的空间分辨率缩减倍率为4,输出特征图的通道数为128,输出特征图的空间分辨率为44,归一化方法为层归一化;
36.阶段3包含1个transformer空间缩减编码器结构,空间缩减编码器缩减倍数为2,键值对的空间分辨率缩减倍率为4,输出特征图的通道数为320,输出特征图的空间分辨率为22,归一化方法为层归一化;
37.阶段4包含1个transformer空间缩减编码器结构,空间缩减编码器缩减倍数为2,键值对的空间分辨率缩减倍率为4,输出特征图的通道数为512,输出特征图的空间分辨率为11,归一化方法为层归一化;
38.所述特征金字塔包含4个层次:分别使用阶段1至阶段4输出的特征进行构造,输出通道数分别为64,128,320,512。
39.(3)利用深度贝叶斯网络传递概率分布的特性,深度卷积神经网络利用局部特征的特性,具象信心得分以及边缘信息表征方法,利用多层特征结构实现对原始图像特征的先验总结;
40.所述深度贝叶斯网络结构如下为:使用特征金字塔形态的视觉transformer主干网络所提取的最后一层特征,针对每一个特征点,使用输入输出通道分别为512,128的卷积、批归一化、relu激活函数,建立像素级别的概率分布集合。对分布结果进行多次采样,并使用其方差衡量算法对当前特征像素点的确定度。
41.所述深度卷积神经网络结构如下:使用特征金字塔形态的视觉transformer主干网络所提取的第一层以及最后一层特征。对第一层特征而言,经过输入输出通道分别为64,128、128,128的卷积、批归一化、relu模块。对最后一层特征而言,经过输入输出通道分别为512,256、256,128的卷积、批归一化、relu模块和一个8倍上采样模块,以实现特征图对齐。两个特征分支进行像素级别的相加操作,在经过两个输入输出通道为128,64、64,1的卷积、批归一化、relu模块,回归得到边缘信息图像。
42.(4)利用先验总结作为特征引导项,通过特征交联模块实现对图像特征的引导,由粗到精的实现对目标掩膜的总结。
43.特征交联模块使用由粗到精的思想,分4步对最终掩膜进行精炼,每一个阶段的特征融合模块包含2个支路,其中信心得分支路包括1个3x3卷积、1个批归一化,以及一个relu
激活函数。其与边缘支路输入进行拼接操作后在经过1个3x3卷积、1个批归一化,以及一个relu激活函数后,与残差连接一并送入卷积融合模块;边缘支路包括1个3x3卷积、1个批归一化,以及一个relu激活函数。其与信心得分支路输入进行拼接操作后在经过1个3x3卷积、1个批归一化,以及一个relu激活函数后,与残差连接一并送入卷积融合模块。每一个阶段的卷积融合模块分别包括1个卷积核为3x3,1个卷积核为1x1,输出通道数分别为520,320,128,64的卷积层。
44.(5)利用特征融合模块中的循环精炼模块对图像特征进行进一步精炼得到精炼特征,在精炼特征的基础上使用卷积神经网络实现像素级的掩膜分割,得到最终的弱特征目标检测结果。
45.实验环境配置如下,以gpu(型号为nvidia rtx8000)作为计算平台,采用gpu并行计算框架,选取pytorch作为深度学习神经网络架构进行训练,并在nvidia gtx3060 laptop上进行了推理速度验证,本发明具体步骤概括为:
46.(1)将标注好的已公开的已标注数据集作为基础,使用随机裁剪、缩放、抖动等方法进行数据增强预处理;
47.(2)依照图1中的总体网络架构图和图2信心得分推理模块结构示意图、图3边缘推理模块示意图、图4特征融合模块示意图中对的模块结构说明,构建卷积神经网络架构,网络整体可被分为主干网络、先验推理模块、特征融合模块三个模块;先验推理模块包括边缘信息推理模块、信心得分推理模块;
48.(3)利用训练集和测试集,通过自适应学习率调整算法、利用pytorch框架中的梯度传播机制对网络整体进行训练,得到训练好的模型参数并保存网络模型;
49.(4)调用网络模型对实际的多测试集中数据进行推理计算。得到相应掩膜,进而在四个评价指标上对模型进行评价;
50.结合上述步骤,本发明的具体技术细节如下:
51.(1)信心得分推理模块
52.如图2,使用自分编码器的思想,利用贝叶斯深度网络针对每一个特征像素建立一个像素分布,每一个像素分布可以是高斯分布或是其他分布。对于特征金字塔形态的视觉transformer主干网络提取的最后一层特征图其拥有i
×
j个像素。使用神经网络进行标准拉普拉斯分布位置参数μ
ij
与尺度参数b
ij
的回归:
[0053][0054][0055]
其中,g
μ
(
·
),gb(
·
)代表卷积操作,cbr(
·
)代表一个卷积、批归一化、relu激活模块(convolution、batch normalization、relu)的串行拼接,而后对得到的拉普拉斯分布进行采样操作后,使用其方差作为信心得分。
[0056]
(2)边缘信息推理模块
[0057]
如图3,通过使用特征金字塔形态的视觉transformer主干网络提取的中的和进行目标边缘的推理:
[0058][0059]
其中,σ(
·
)包括两个卷积、批归一化,和relu激活操作。cat(
·
)代表通道方向的拼接操作,dr(
·
)代表维度缩减操作,(
·
)
up
代表上采样操作,ε
out
即为目标边缘。
[0060]
(3)特征融合模块
[0061]
具体的,特征融合模块表现为:
[0062][0063][0064]

[0065][0066]
其中,和分别代表了第i个阶段的融合信心得分和融合边缘特征,θ(
·
)代表一个连接操作和一个卷积、批归一化、relu激活模块(convolution、batch normalization、relu,cbr)操作,cat(
·
)代表通道方向的拼接操作。
[0067]
循环精炼模块的主要目的是在不增加网络参数的情况下实现算法的快速收敛。它通过设计循环精炼模块对即将输出的特征进行进一步优化和精炼。该模块的优势主要表现在两个方面:第一,它能够快速优化融合部分的参数,使其在单次训练中进行多次优化,从而加速收敛速度;第二,在从上层向底层传递信息的基础上,该模块还增加了从底层向上层传递信息的通道,从而增强了模型对特征的融合表征能力。
[0068]
具体的,当循环数目为1时,需要进行网络初始化:
[0069][0070][0071][0072]
其中,代表第m层输入特征,代表第n次循环中,融合了3,4层特征的融合特征;代表第n次循环中,融合了2,3,4层特征的融合特征;代表第n次循环中,融合了1,2,3,4层特征的融合特征。代表操作。cat(
·
,
·
)代表通道维度的拼接操作,conv(
·
)代表二维卷积操作,cbr(
·
)代表一个连接操作和一个卷积、批归一化、relu激活模块的串联,(
·
)
up
代表2倍上采样操作。
[0073]
当循环数目大于1时,循环精炼模块会将的信息带入到第n个循环中。具体表现为:
[0074][0075][0076]
rf(
·
,
·
)代表conv(cat(
·
,
·
))最终的输出结果可以表现为:
[0077]
[0078]
为了在参数优化过程中反映循环精炼模块的影响,可以在训练过程中采用以循环次数为权重的损失函数计算方式来计算总体损失函数。这种方式的具体表现是:
[0079][0080][0081]
其中,m为权重系数,n为当前循环次数,n为总体循环次数。指的是带权重系数的交并比(intersection of union,iou)损失函数,代表带权重系数的二元交叉熵损失函数。代表第n个阶段网络输出的目标检测结果,y
gt
代表输入信号的检测结果真值。
[0082]
(4)模型训练过程中损失函数的计算方法
[0083]
传统的l
bce
损失函数存在以下几个问题:首先,它独立地计算每个像素的损失,忽略了图像的全局结构,因此无法区分物体和背景部分;其次,在背景占据图像主要部分的情况下,前景目标像素的损失将被稀释;最后,传统的l
bce
为每个像素分配相同的权重,而边缘、角落等像素信息其实更容易被错误分类,应该得到更多关注。解决这一问题,本发明中使用带权重的二元交叉熵损失
[0084][0085]
其中,h,w分别代表输入图像的长,宽;i∈{1,h},j∈{1,e}代表当前表示的像素编号。1(
·
)代表指示函数,γ是超参数。l∈{0,1}指代该像素是否属于弱特征目标,和分别代表预测结果和真值在(i,j)位置的值。ψ代表网络中的所有参数,代表预测的概率。在中,每个像素都被赋予了一个权重其中较难区分的像素被赋予的权重值大,反之容易区分的像素则被赋予小权重。
[0086][0087]
其中,a
ij
代表像素(i,j)周围的区域,分别代表是像素(m,n),(i,j)是否属于弱特征目标的真值,1代表属于,0代表不属于。对于所有像素而言,如果较大则代表该中心像素与周围环境差异较大,亦可以认为该像素点的重要度衡量高。若较小,则可以认为其所处环境变换较小,为其赋予较少注意力。为了使网络进一步增强对目标整体结构的认知,使用带权重的交并比损失函数(weighted intersection over union)代替传统的交并比损失函数l
iou
(intersection over union)。
[0088][0089]
这种基于多先验引导的弱特征目标检测方法通过引入不易变换的归纳偏置,对主干网络所提特征进行引导,一方面增强了特征表征能力,另一方面为网络设计提供了仿生学解释。其仿照人类在进行弱特征目标检测任务过程中所需的信心得分以及边缘信息对原始特征进行先验提取,如图3和图4所示;采用的特征融合结构设计合理,使用由粗到精的思想,分4步对信心得分特征以及边缘特征进行引导,如图5所示。表1是采用本发明方法与其他常用方法在三个主流数据集上的定量对比结果。
[0090][0091]
由表1可以看出,跟目前主流的弱特征目标检测网络相比,本发明算法性能表现优异,其具有以下优点:
[0092]
(1)本发明提出了一种针对弱特征目标检测任务优化的新型神经网络架构,能够实现在目标所处环境、光照、目标自身纹理等高级特征变化的情况下,实现对弱特征目标的稳定检测;有效利用了人在进行弱特征目标检测任务中所执行的信心得分概念,使用深度贝叶斯网络模拟判断概率,实现了对复杂识别问题的分布拆解。
[0093]
(2)本发明设计了多重辅助任务引导的弱特征目标检测算法,分别设计信心得分与边缘提取模块,有效构建了归纳偏置的总结方法;提出并行组卷积的特征交联方式分别对原始特征实现融合引导,有效实现了先验的应用;提出了多归纳偏置引导的特征融合模块,采用对称结构实现异质特征的融合,提升了融合特征的表征能力,进而提升了算法性能。
[0094]
(3)本发明在训练过程中设计了特征循环精炼方法,提出了循环精炼模块。在不增加模型参数量的情况下,利用残差链接引入上一阶段的梯度,提升了反向传播的效率,加快了模型的收敛速度以及模型参数的准确程度。
[0095]
(4)本发明根据神经网络模型大小进行了细致的调优,通过充分考虑各个网络结构的作用并精心设计每个模块的通道数和中间层扩张倍率,能够在保持网络运行速度的同时提高模型的检测精度,降低算法算力依赖程度,扩展其部署应用平台。
[0096]
需要强调的是:以上仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

技术特征:
1.一种基于多先验引导的弱特征目标检测方法,其特征在于,包括以下步骤:(1)将标注好的已公开的已标注数据集作为基础,使用包括随机裁剪、缩放、抖动的方法进行数据增强预处理;(2)利用特征金字塔形态的视觉transformer主干网络实现对数据增强预处理后的数据集输入实现图像特征提取,利用维度缩减机制实现对图像特征金字塔的构建;(3)利用深度贝叶斯网络传递概率分布的特性,由信心得分推理模块获得目标的信心得分;利用深度卷积神经网络聚合图像特征的局部信息,使用边缘推理模块获取目标的边缘,通过独立分支的分层结构,实现对目标的信心得分、边缘的先验进行总结;(4)利用先验作为特征引导项,通过特征交联模块实现对图像特征以及先验的集聚操作,实现图像特征与信心得分,边缘的特征聚合;(5)利用聚合后的图像特征,在特征融合模块中使用循环精炼模块对图像特征进行进一步精炼得到精炼特征,在精炼特征的基础上使用卷积神经网络实现像素级的掩膜分割,得到最终的弱特征目标检测结果。2.根据权利要求1所述的基于多先验引导的弱特征目标检测方法,其特征在于,所述步骤(2)中使用的视觉transformer主干网络具有4个阶段:阶段1包含1个transformer空间缩减编码器结构,空间缩减编码器缩减倍数为2,键值对的空间分辨率缩减倍率为4,输出图像特征的通道数为64,输出图像特征的空间分辨率为88,归一化方法为层归一化;阶段2包含1个transformer空间缩减编码器结构,空间缩减编码器缩减倍数为2,键值对的空间分辨率缩减倍率为4,输出图像特征的通道数为128,输出图像特征的空间分辨率为44,归一化方法为层归一化;阶段3包含1个transformer空间缩减编码器结构,空间缩减编码器缩减倍数为2,键值对的空间分辨率缩减倍率为4,输出图像特征的通道数为320,输出图像特征的空间分辨率为22,归一化方法为层归一化;阶段4包含1个transformer空间缩减编码器结构,空间缩减编码器缩减倍数为2,键值对的空间分辨率缩减倍率为4,输出图像特征的通道数为512,输出图像特征的空间分辨率为11,归一化方法为层归一化;所述主干网络包含4个层次:分别使用阶段1至阶段4输出的图像特征进行构造,输出通道数分别为64,128,320,512。3.根据权利要求1所述的基于多先验引导的弱特征目标检测方法,其特征在于,所述步骤(3)中使用的深度贝叶斯网络结构如下为:使用特征金字塔形态的视觉transformer主干网络所提取的最后一层特征,针对每一个特征点,使用输入输出通道分别为512,128的卷积、批归一化、relu激活函数,建立像素级别的概率分布集合,对分布结果进行多次采样,并使用其方差衡量算法对当前图像特征像素点的信心得分。4.根据权利要求1所述的基于多先验引导的弱特征目标检测方法,其特征在于,所述步骤(3)中使用的深度卷积神经网络结构如下:使用特征金字塔形态的视觉transformer主干网络所提取的第一层以及最后一层特征,对第一层特征而言,经过输入输出通道分别为64,128、128,128的卷积、批归一化、relu模块;对最后一层特征而言,经过输入输出通道分别为512,256、256,128的卷积、批归一化、relu模块和一个8倍上采样模块,以实现图像特征对
齐,对经过处理后的第一层特征和最后一层特征进行像素级别的相加操作,在经过两个输入输出通道为128,64、64,1的卷积、批归一化、relu模块,回归得到边缘信息。5.根据权利要求4所述的基于多先验引导的弱特征目标检测方法,其特征在于,为了实现多维度观测特征的融合,使用残差链接、卷积、批归一化和relu激活模块,在保留自身特性的同时,将其他观测维度的特征信息融合在一起,通过使用了上采样操作每次将空间分辨率扩大2倍,实现特征图大小进行对齐,采用循环精炼模块来优化网络的学习参数,其中循环次数为4,以实现参数的再优化。6.根据权利要求5所述的多先验引导的弱特征目标检测方法,其特征在于,在所述循环精炼模块中,在第四层大小为11
×
11的融合的图像特征上使用上采样方法与第一层图像特征进行空间对齐,使用拼接特征进行反向传递与损失函数计算,实现图像特征进一步精炼。

技术总结
本发明公开了一种基于多先验引导的弱特征目标检测方法,首先以公开的已标注数据集作为基础,使用随机裁剪、缩放、抖动等方法进行数据增强;而后使用特征金字塔形态的视觉Transformer主干网络实现对输入图像的特征提取;接着分别通过构建贝叶斯网络、深度卷积神经网络具象信心得分以及边缘信息;接着通过先验引导特征交联模块设计实现提取特征的交联;最后使用特征融合模块自底向上地实现基于信心得分信息与基于边缘信息的特征融合,通过循环精炼模块的思路实现对检测结果的进一步优化。这种检测方法采用的网络结构设计合理,可以针对弱特征目标实现像素级的检测,并保证了较低的推理时间。较低的推理时间。较低的推理时间。


技术研发人员:张弘 吕毅轩 杨一帆 李旭亮
受保护的技术使用者:北京航空航天大学
技术研发日:2023.08.09
技术公布日:2023/10/15
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐