一种基于特征变换与统计校正的跨域小样本图像识别方法与流程

未命名 10-19 阅读:80 评论:0


1.本发明涉及机器学习与计算机视觉技术领域,具体来说,涉及一种基于特征变换与统计校正的跨域小样本图像识别方法、装置及介质。


背景技术:

2.当前,小样本分类识别问题的研究不断深入,基于元学习(又称小样本学习)的方法在模型构建与算法设计上取得快速发展,如基于原型的学习模型、基于匹配网络的学习模型、基于模型无关的元学习算法等。这些模型与算法极大程度推进了小样本学习的发展,提升了小样本分类识别的性能。这些经典模型的应用前提是:感兴趣的目标任务数据与辅助模型训练的大规模数据集(源域数据)具有相同的数据分布,否则在源域上学习的模型难以有效迁移至目标任务,即模型难以在目标任务上提取到有效的数据特征用以完成目标任务。
3.迁移学习是解决目标任务数据与源域数据分布不一致情况下的可行策略。传统迁移学习假设目标任务中的数据类别与源域上的数据类别一致,但数据具有不同的性质,如源域为自然图像,目标域为素描图像等。因此,解决迁移学习的主要策略是寻找一个公共的投影空间,在此空间中,来自源域与目标域上相同类别的数据具有较小的距离,而来自不同类别的数据间具有较大的距离,从而可采用此空间中源域数据训练学习模型,待模型完成学习后可应用于此空间中的来自目标域的数据,以此完成目标任务。然而这样的学习策略在目标域与源域数据无相同类别分布时不再适用,因为无法在投影子空间中形成同类别数据相近、不同类别数据远离的建模。
4.因此,跨域小样本学习问题成为近期研究热点,跨域小样本学习主要解决源域大规模数据集与目标域小样本任务间数据与类别均具有不同分布下的模型有效学习问题。已有研究方法主要集中在以下两种:
5.一是采用多个源域学习多个模型以构建通用的跨域特征,如在不同源域上学习单独的特征抽取模型,而后将各模型特征级联形成跨域通用特征;抑或是结合基础特征抽取模型与域自适应模块,在不同源域上进行训练以得到不同源域上的特征。这种策略最终通过对不同源域模型生成特征进行组合的方式构建适用于目标域任务的特征。
6.另一直接在单个源域上进行模型训练,而后通过迁移模块将模型迁移至目标域任务,如首先在源域上预训练模型,而后直接采用目标域任务上的少量数据微调模型参数,抑或固定模型在源域上所学参数,而后采用目标域任务少量数据优化迁移模块参数,以使迁移模块能有效调整模型所抽取特征适应目标域任务需求。
7.本文提供的背景描述用于总体上呈现本公开的上下文的目的。除非本文另外指示,在该章节中描述的资料不是该申请的权利要求的现有技术并且不要通过包括在该章节内来承认其成为现有技术。


技术实现要素:

8.针对相关技术中的上述技术问题,本发明提出了一种基于特征变换与统计校正的跨域小样本图像识别方法,其包括如下步骤:
9.s1,获取待识别图像;
10.s2,将所述待识别的图像输入预先训练好的基于特征变换与统计校正的深度卷积网络模型并输出识别结果,所述基于特征变换与统计校正的深度卷积网络模型深度卷积网络模型包括:
11.一第一深度卷积网络模型f
θ
,其中θ为其参数,且f
θ
由num个卷积块级联而成,所述num为大于2的正整数,每个卷积块由卷积层、批处理归一化层bn、relu非线性激活层、以及最大化汇聚层依序级联;
12.一lla变换模块,所述lla变换模块接在所述第一深度卷积网络模型f
θ
之后,所述lla变换模块为:
13.其中v为自变量,k》0为控制σ(v)一阶梯度的超参数,即表明lla在半开区间(-∞,0)和(0,+∞)上为lipschitz连续函数,且1+k为相应的lipschitz常量;
14.在所述第一深度卷积网络模型的前num_film个卷积块的bn层后增加一特征变换模块film,所述特征变换模块用于对所述bn层的输出进行尺度伸缩变换;在所述第一深度卷积网络模型的后num_rsa个卷积块均增加一残差变换模块rsa,所述rsa模块用于对所述输入到num_rsa个卷积块的输入特征进行残差计算;
15.一分类器,所述分类器用于对所述lla变换模块的输出进行分类以输出识别结果;
16.具体的,所述film模块具体为:
17.film变换可表示为以下线性操作:
18.u

l
=α
⊙ul
19.式中

表示元素广播点乘,即α的每一维度上的元素与u
l
中相对应维度上的所有h
l
×wl
个元素相乘;u
l
为第一深度卷积网络f
θ
第l个卷积块的bn层输出特征。
20.具体的,所述rsa模块具体为:rsa模块采用以下残差方式实现:
21.u

l

=γ(u
l
′‑1;ζ
l

)+u
l

22.式中γ(u
l
′‑1;ζ
l

)为构建u
l
′‑1与u
l

间的残差连接,其为矩阵乘积操作,其中u
l
′‑1、u
l

分别是第l
′‑
1、l

第一深度卷积网络f
θ
第l

个卷积块的bn层输出特征。
23.具体的,所述基于特征变换与统计校正的深度卷积网络模型的训练过程如下:
24.s21,在源域训练第一深度卷积网络模型f
θ
,获取达到预设准确率的第一深度卷积网络模型f
θ
的参数θ;
25.s21,固定参数θ,在目标域对基于特征变换与统计校正的深度卷积网络模型进行训练获取所述film模块以及rsa模块的参数{α,ζ}。
26.第二方面,本发明的另一个实施例公开了一种基于特征变换与统计校正的深度卷积网络模型训练方法,其包括如下步骤:
27.s1,在源域训练第一深度卷积网络模型f
θ
,获取达到预设准确率的第一深度卷积网络模型f
θ
的参数θ;其中所述第一深度卷积网络模型f
θ
包括:num个卷积块级联而成,所述num为大于2的正整数,每个卷积块由卷积层、批处理归一化层bn、relu非线性激活层、以及最大化汇聚层依序级联;
28.s2,固定参数θ,在目标域对基于特征变换与统计校正的深度卷积网络模型进行训练获取所述film模块以及rsa模块的参数{α,ζ};其中所述特征变换与统计校正的深度卷积网络模型包括:
29.一lla变换模块,所述lla变换模块接在所述第一深度卷积网络模型f
θ
之后,所述lla变换模块为:
30.其中v为自变量,k》0为控制σ(v)一阶梯度的超参数,即表明lla在半开区间(-∞,0)和(0,+∞)上为lipschitz连续函数,且1+k为相应的lipschitz常量;
31.在所述第一深度卷积网络模型的前num_film个卷积块的bn层后增加一特征变换模块film,所述特征变换模块用于对所述bn层的输出进行尺度伸缩变换;
32.在所述第一深度卷积网络模型的后num_rsa个卷积块均增加一残差变换模块rsa,所述rsa模块用于对所述输入到num_rsa个卷积块的输入特征进行残差计算;
33.一分类器,所述分类器用于对所述lla变换模块的输出进行分类以输出识别结果。
34.具体的,步骤s1中对第一深度卷积网络模型f
θ
的训练采用下式的损失函数:
[0035][0036]
式中z表示训练集数据数量,l()为交叉熵损失函数,为来自训练集的数据和相应的类别标签,pw为分类器,该分类器在获取到最优θ后被移除。
[0037]
具体的,所述步骤s2中对在目标域对基于特征变换与统计校正的深度卷积网络模型进行训练通过在支撑集上最小化以下目标函数:
[0038][0039]
式中(xi,yi)为来自任务支撑集中的图像和相应的类别标签,l()为交叉熵损失函数,σ()为lla变换,p为最近类中心分类器,f
θ,α,ζ
(xi)为所述基于特征变换与统计校正的深度卷积网络作用于输入对象xi,其中各类中心通过下式获取:
[0040][0041]
式中j∈{1,2,

,n}为类别标签,n为类别数,k为各类中训练样本数,σ()为lla变换,1(yi=j)为指示函数,当yi的类别为j时返回1,否则0。
[0042]
第三方面,本发明的另一个实施例公开了一种基于特征变换与统计校正的跨域小样本图像识别装置,其包括如下单元:
[0043]
图像获取单元,用于获取待识别图像;
[0044]
识别单元,用于将所述待识别的图像输入预先训练好的基于特征变换与统计校正的深度卷积网络模型并输出识别结果,所述基于特征变换与统计校正的深度卷积网络模型深度卷积网络模型包括:
[0045]
一第一深度卷积网络模型f
θ
,其中θ为其参数,且f
θ
由num个卷积块级联而成,所述num为大于2的正整数,每个卷积块由卷积层、批处理归一化层bn、relu非线性激活层、以及最大化汇聚层依序级联;
[0046]
一lla变换模块,所述lla变换模块接在所述第一深度卷积网络模型f
θ
之后,所述lla变换模块为:
[0047]
其中v为自变量,k》0为控制σ(v)一阶梯度的超参数,即表明lla在半开区间(-∞,0)和(0,+∞)上为lipschitz连续函数,且1+k为相应的lipschitz常量;
[0048]
在所述第一深度卷积网络模型的前num_film个卷积块的bn层后增加一特征变换模块film,所述特征变换模块用于对所述bn层的输出进行尺度伸缩变换;在所述第一深度卷积网络模型的后num_rsa个卷积块均增加一残差变换模块rsa,所述rsa模块用于对所述输入到num_rsa个卷积块的输入特征进行残差计算;
[0049]
一分类器,所述分类器用于对所述lla变换模块的输出进行分类以输出识别结果。
[0050]
具体的,所述film模块具体为:
[0051]
film变换可表示为以下线性操作:
[0052]i′
l
=α
⊙ul
[0053]
式中

表示元素广播点乘,即α的每一维度上的元素与u
l
中相对应维度上的所有h
l
×wl
个元素相乘;u
l
为第一深度卷积网络f
θ
第l个卷积块的bn层输出特征;
[0054]
所述rsa模块具体为:rsa模块采用以下残差方式实现:
[0055]u′
l

=γ(u
l
′‑1;ζ
l

)+u
l

[0056]
式中γ(u
l
′‑1;ζ
l

)为构建u
l
′‑1与u
l

间的残差连接,其为矩阵乘积操作,其中u
l
′‑1、u
l

分别是第l
′‑
1、l

第一深度卷积网络f
θ
第l

个卷积块的bn层输出特征。
[0057]
第四方面,本发明的另一个实施例公开了一种非易失性存储介质,所述非易失性存储介质上存储有指令,所述指令被处理器执行时,用于实现如上述的一种基于特征变换与统计校正的跨域小样本图像识别方法或上述的基于特征变换与统计校正的深度卷积网络模型训练方法。
[0058]
本发明的基于特征变换与统计校正的跨域小样本图像识别方法,通过在深度卷积网络的基础上在其上嵌入特征线性变换层film和残差非线性变换层rsa,以实现任务级别的特征变换;进一步的,使用一非参非线性激活函数laa,从统计上校正网络输出特征的激活状态,以实现数据集级别的特征变换。本实施例的方法,可以有效实现跨域小样本分类识
别任务,即可以在目标任务仅有极少有标签训练数据情况下实现鲁棒分类识别。
[0059]
本发明的方法,先借助其他大规模数据集(又称源域数据)预先优化模型,使模型具备一定的先验知识,而后通过采用目标任务上少量有标签数据对模型进行任务级与数据集级微调,使模型生成的特征适用于目标任务。本实施例的方法具有计算简单、优化高效、性能鲁棒的特点,且不要求源域数据具有与目标任务数据有相同或近似的分布特征,进一步扩大了本实施例方法的适用性。
附图说明
[0060]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0061]
图1是本发明实施例提供的基于特征变换与统计校正的跨域小样本图像识别方法流程图;
[0062]
图2是本发明实施例提供的基于特征变换与统计校正的深度卷积网络模型示意图;
[0063]
图3是本发明实施例提供的卷积块示意图;
[0064]
图4是本发明实施例提供的film变换示意图;
[0065]
图5是本发明实施例提供的rsa特征变换示意图;
[0066]
图6是本发明实施例提供的lla函数示意图;
[0067]
图7是本发明实施例提供的lla一阶导数函数示意图,其是在对称区间[-2,2]上的函数图;
[0068]
图8是本发明实施例提供的示意图lla一阶导数函数示意图,其是在区间[0,6]上的函数图;
[0069]
图9是本发明实施例提供的conv4网络结构示意图;
[0070]
图10是本发明实施例提供的基于特征变换与统计校正的深度卷积网络模型训练方法流程示意图;
[0071]
图11是本发明实施例提供的基于特征变换与统计校正的跨域小样本图像识别方法设备示意图。
具体实施方式
[0072]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
[0073]
实施例一
[0074]
参考图1,本实施例公开了一种基于特征变换与统计校正的跨域小样本图像识别方法,其包括如下步骤:
[0075]
s1,获取待识别图像;
[0076]
具体的,本实施例可以通过传感器获取待识别图像,例如在医学影响识别时,可以通过医学影像设备获取待识别图像。在另一个实施方式中,也可以由医学影像设备获取医学影像图像,并将所述医学影像图像发送到服务器或计算设备中,供所述服务器或计算设备进行图像的识别。
[0077]
在另一个实施方式中,本实施例的待识别图像也可以时遥感图像,所述遥感图像由对应的传感器获取。
[0078]
具体的,本实施例可以直接获取来自传感器输出的图像,或者传感器将其获取的图像上传并存储到计算设备中,由计算设备获取待识别图像。
[0079]
s2,将所述待识别的图像输入预先训练好的基于特征变换与统计校正的深度卷积网络模型并输出识别结果,所述基于特征变换与统计校正的深度卷积网络模型深度卷积网络模型包括:
[0080]
一第一深度卷积网络模型f
θ
,其中θ为其参数,且f
θ
由num个卷积块级联而成,所述num为大于2的正整数,每个卷积块由卷积层、批处理归一化层bn、relu非线性激活层、以及最大化汇聚层依序级联;
[0081]
一lla变换模块,所述lla变换模块接在所述第一深度卷积网络模型f
θ
之后,所述lla变换模块为:
[0082]
其中v为自变量,k》0为控制σ(v)一阶梯度的超参数,即表明lla在半开区间(-∞,0)和(0,+∞)上为lipschitz连续函数,且1+k为相应的lipschitz常量;
[0083]
在所述第一深度卷积网络模型的前num_film个卷积块的bn层后增加一特征变换模块film,所述特征变换模块用于对所述bn层的输出进行尺度伸缩变换;在所述第一深度卷积网络模型的后num_rsa个卷积块均增加一残差变换模块rsa,所述rsa模块用于对所述输入到num_rsa个卷积块的输入特征进行残差计算;
[0084]
一分类器,所述分类器用于对所述lla变换模块的输出进行分类以输出识别结果。
[0085]
在一个实施方式中,num=num_film+num_rsa。
[0086]
本领域技术人员知晓,第一深度卷积网络模型f
θ
,其中θ为其参数,且f
θ
由num个卷积块级联而成,所述num为大于2的正整数,每个卷积块由卷积层conv、批处理归一化层bn、relu非线性激活层、以及最大化汇聚层pool依序级联;
[0087]
本实施例的深度卷积网络模型,在第一深度卷积网络模型f
θ
进行优化,所述优化包括:一lla变换模块,所述lla变换模块接在所述第一深度卷积网络模型f
θ
之后,所述lla变换模块为:
[0088]
其中v为自变量,k》0为控制σ(v)一阶梯度的超参数,即表明lla在半开区间(-∞,0)和(0,+∞)上为lipschitz连续函数,且1+k为相应的lipschitz常量;
[0089]
在所述第一深度卷积网络模型的前num_film个卷积块的bn层后增加一特征变换模块film,所述特征变换模块用于对所述bn层的输出进行尺度伸缩变换;
[0090]
在所述第一深度卷积网络模型的后num_rsa个卷积块均增加一残差变换模块rsa,所述rsa模块用于对所述输入到num_rsa个卷积块的输入特征进行残差计算。
[0091]
参考图2,图2是本实施例的深度卷积网络模型示意图,本实施例以2个卷积块进行说明,本领域技术人员知晓,第一深度卷积网络模型的卷积块可以大于2个。
[0092]
参考图2,在第一个卷积块的bn层后增加一特征变换模块film,所述特征变换模块film用于对所述bn层的输出进行尺度伸缩变换;
[0093]
假设第一深度卷积网络f
θ
第l个卷积块的bn层输出特征为其中c
l
,h
l
和w
l
分别为特征维数,特征长度和宽度。则film变换可表示为以下线性操作:
[0094]u′
l
=α
⊙ul
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0095]
式中

表示元素广播点乘,即α的每一维度上的元素与u
l
中相对应维度上的所有h
l
×wl
个元素相乘。通过该操作实现对原有特征进行尺度伸缩变换。图4为film模块示意图。
[0096]
本实施例将该操作作用于第一深度卷积网络f
θ
的前端卷积块中的bn层之后,用以改变特征分布性质。
[0097]
本实施例的前端卷积块为第一个卷积块,本领域技术人员知晓,在第一深度卷积网络具有多于2个卷积块时,其前端卷积块可以根据第一深度卷积网络的卷积块个数进行划分。
[0098]
因深度卷积网络前端的卷积块所学特征一般具有较强共性,即在不同数据集(或域)上学到的特征差异不大,所以通过简单的线性尺度伸缩变化即能较好实现特征迁移。
[0099]
虽然film变换模块能对深度卷积网络前端卷积块特征实现了一定程度的变换,但深度卷积网络后端卷积块所学特征一般具有较强的数据集属性,简单线性变换难以实现其特征的有效迁移。此外,film变换对同一维度所有位置上的特征采用同一尺度进行变换,忽略了特征的空间位置属性。因此,本实施例进一步采用残差自适应模块(rsa)对深度卷积网络后端卷积块特征进行非线性变换。
[0100]
假设深度卷积网络f
θ
第l

个卷积块的输入特征为其中c
l
′‑1,h
l
′‑1和w
l
′‑1分别为f
θ
第l
′‑
1个卷积块输出的特征维数,特征长度和宽度;则第l

个卷积块中卷积层输出特征(其中c
l

,h
l

和w
l

分别为特征维数,特征长度和宽度)可表示为:
[0101]ul

=θ
l

*u
l
′‑1ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0102]
式中*表示卷积操作,θ
l

表示深度卷积网络f
θ
在第l

个卷积块的卷积层中的参数。则对u
l

的rsa变换可采用以下残差方式实现:
[0103]u′
l

=γ(u
l
′‑1;ζ
l

)+u
l

ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0104]
式中γ(u
l
′‑1;ζ
l

)为构建u
l-1
与u
l

间的残差连接,其参数在本实施例中具体为矩阵乘积操作。在具体实现中,采用卷积操作实现,先将ζ
l

调整为具有c
l

个核大小为c
l
′‑1×1×
1的卷积算子,然后与l

层输入特征u
l
′‑1进行卷积,得到输出大小为c
l

×hl

×
l

的特征。图5为rsa模块示意图。
[0105]
rsa变换模块通过把残差连接γ生成的特征与原始卷积操作所得特征u
l
进行相加,在不同空间位置上实现特征的位置相关非线性调整,且其调整值在不同位置上的调整尺度与该位置具体内容相关,不再如film对所有位置采用相同的尺度进行变换,从而具有更强的特征变换能力。本实施例中将rsa模块放置于深度卷积网络后端卷积块的卷积层。
[0106]
本实施例的后端卷积块为第二个卷积块,本领域技术人员知晓,在第一深度卷积网络具有多于2个卷积块时,其后端卷积块可以根据第一深度卷积网络的卷积块个数进行划分。
[0107]
film变换模块与rsa变换模块共同作用在深度卷积网络内部,分别对深度卷积网络前端卷积块和后端卷积块特征进行变换,在模型跨域使用中,需在具体的目标任务上学习以确定模块中的变换参数。因此,两者可以实现任务级别的特征变换。另一方面,已有研究表明:如果目标域为小样本任务,则在小样本任务上对变换模块参数进行学习,仍不足以改变深度卷积网络在源域数据上学习时所形成的系统偏置。换而言之,任务级别的特征变换仍不足以实现模型有效跨域迁移。为此,本实施例采用数据集级别的特征变换策略:lla非线性变换。
[0108]
lla作用于深度卷积网络最后卷积块所输出的特征,它通过适当放大较小的特征值和保持较大的特征值,使得各特征维度在不同小样本任务上输出特征的统计平均值趋于一致,从而在统计上保证所有特征维度在模型跨域使用时特征的有效性。lla不局限于具体的某个任务,而是关注模型跨域使用时在目标域上不同小样本任务上的统计特性,因此它具有数据集级别的特征变换能力。此外,lla为非参模型,因此具备极高的执行效率。
[0109]
在数学模型上,lla变换可表示为:
[0110][0111]
式中v为自变量,k》0为控制σ(v)一阶梯度的超参数,即表明lla在半开区间(-∞,0)和(0,+∞)上为lipschitz连续函数,且1+k为相应的lipschitz常量,本实施例中取k=2。图6为lla函数图。通过计算lla的一阶与二阶导数:
[0112][0113]
可发现:当自变量v《2时,有σ

《0和σ

》0,且随着v增大,σ(v)快速趋于1。该性质表明:1)lla能对小于2的值进行有效提升,并且保证他们之间的相对关系不变;2)lla能有效保证较大的值保持不变。这些性质可以保证不同维度特征经lla变换后的统计均值更具一致性。图7以及图8展示了lla的一阶导数函数图。
[0114]
在本实施例中,假设深度卷积模型f
θ
最后卷积块输出特征为其中c,h和w分别为特征维数,特征长度和宽度,则首先对u进行全局汇聚操作,使得而后对u各维度独立采用lla进行变换,最后将变换后的特征输入至分类器进行分类。
[0115]
具体的,本实施例的深度卷积网络模型的训练过程如下:
[0116]
s21,在源域训练第一深度卷积网络模型f
θ
,获取达到预设准确率的第一深度
卷积网络模型f
θ
的参数θ;
[0117]
本实施例先使用包含有大量样本的源域对第一深度卷积网络模型f
θ
进行训练;
[0118]
在步骤s21的训练中,先对第一深度卷积网络模型f
θ
进行训练以获取第一深度卷积网络模型f
θ
的参数θ。在对第一深度卷积网络模型f
θ
的进行训练时,其不包括film模块、rsa模块以及laa模型,其使用本领域中公知的对深度卷积网络进行训练的方法。例如,使用梯度下降学习方法。
[0119]
步骤s21对第一深度卷积网络模型f
θ
的训练可以采用下式的损失函数:
[0120][0121]
式中z表示训练集数据数量,l()为交叉熵损失函数,为来自训练集的数据和相应的类别标签,pw为分类器,该分类器在获取到最优θ后被移除,不再需要。
[0122]
在步骤s21中,需要先构建源域的数据集;假设源域上共有i张图像数据分别来自c个不同类别,其中xi与yi分别表示图像和相应的类别标签,且yi∈{1,2,

,c}。每类中保留j张图像构建测试集用于模型评测,各类剩余图像构建为训练集用于模型学习。一般假设上各类图像数量充足,满足进行深度卷积网络模型训练要求。
[0123]
具体的,在源域数据上,采用深度神经网络模型f
θ
构建c类分类识别任务,在构建好的源域训练集数据进行常规梯度下降学习,并在测试集数据上进行模型评测,取在测试集数据上取得最佳性能的参数作为模型最优参数θ。
[0124]
s22,固定参数θ,在目标域对基于特征变换与统计校正的深度卷积网络模型进行训练获取所述film模块以及rsa模块的参数{α,ζ};
[0125]
具体的,步骤s22是在目标域上进行训练。其中目标域是小样本,一般不满足深度卷积网络模型的训练要求。本实施例预先使用源域的数据训练第一深度卷积网络模型,然后将其迁移到小样本上进行第二次训练。
[0126]
目标域小样本任务包含一个支撑集和一个测试集其中n表示类别数,k表示各类中有标签的数据数量,m表示从各类中取出的去除其标签后的数据。一般k《《m,如k=1,m=15;则任务的目标就是采用中数据进行模型学习,而后预测中数据的真实类别。
[0127]
由于目标域单个任务上的评估结果很难有效反应模型的真实性能,一般假设在目标域上可构建大量的目标任务,即为采样于目标域数据集任务分布中的一个具体任务,所以最终以模型在目标域上所有采样任务上的平均性能作为其最终性能。
[0128]
在目标域小样本任务上采用支撑集s中数据构建n类分类识别任务,并采用误差梯度修正特征变换模块
‑‑
film和rsa中的参数{α,ζ}。具体学习中,通过在支撑集上最小化以下目标函数:
[0129][0130]
式中(xi,yi)为来自任务支撑集中的图像和相应的类别标签,l()为交叉熵损失函数,σ()为lla变换,p为最近类中心分类器,f
θ,α,ζ
(xi)为所述基于特征变换与统计校正的深度卷积网络作用于输入对象xi,其中各类中心通过下式获取:
[0131][0132]
式中j∈{1,2,

,n}为类别标签,n为类别数,k为各类中训练样本数,σ()为lla变换,1(yi=j)为指示函数,当yi的类别为j时返回1,否则0。
[0133]
参考图9,本实施例以conv4网络对本实施例的方案进行阐述。conv4网络包含4个卷积块,依序级。
[0134]
本实施例采用nwpu45数据集(以下简称nwpu45)做为源域数据集,gid数据集(以下简称gid)做为目标域数据集进行阐述,介绍在5-way 5-shot设定下的分类识别,即小样本任务中共有5个类别,各类有5张有标签的训练样本,采用adadelta优化算法进行模型优化学习,在pytorch框架下实现。
[0135]
构建源域数据集和目标域小样本任务:
[0136]
1.去除源域nwpu45与目标域gid的重复类别。在nwpu45上剩余42个类别,共29400张图像数据,即c=42,i=29400;在gid上剩余13个类别,共7800张图像数据,即c=13,i=7800。
[0137]
2.将nwpu45划分为训练集和测试集在各类中选取630张为该类的训练图像,各类剩余70张图像为该类的测试图像。
[0138]
3.在目标域gid构造小样本任务其中为支撑集,为测试集。具体过程为:在13个类中,随机选取5个类,再在每个类中随机选取20张图像数据。在20张图像数据中,选取5张为支撑集的样本,各类剩余15张为测试集的样本,即在一个小样本任务中,n=5,k=5,m=15。
[0139]
4.重复步骤3,直至构造完1000个小样本任务。
[0140]
5.在源域nwpu45上构造训练数据包,每个数据包包含64张图片,称为一个batch,则在训练集上共可构建413个数据包
[0141]
6.依序每次取一个数据包,并将数据包中的图片i=1,2,

,64,输入conv4网络f
θ
中,提取相应的特征,再输入到分类器pw中,预测各样本的类别标签即
[0142]
7.采用下式计算当前模型预测损失:
[0143][0144]
其中t为当前数据包中的数据数量t=64,l()为交叉熵损失函数,为在源域数据集上的交叉熵损失。根据该损失,采用梯度下降算法对conv4网络的参数θ进行更新。
[0145]
8.重复步骤6-7,直至在413个数据包上完成训练。
[0146]
9.将测试集中样本输入到当前的网络模型中,而后计算出当前网络模型的预测准确率。
[0147]
10.重复步骤5-9,直至conv4网络模型在测试集上的预测准确率达到预期,固定参数θ。
[0148]
11.将特征变换模块film和rsa分别添加到网络模型conv4的前两个卷积块和后两个卷积块中,再将非线性变换模块lla添加到conv4的输出端,并初始化新增模块的参数{α,ζ}。
[0149]
12.在目标域上构造的1000个小样本任务上依序抽取一个任务
[0150]
13.将抽取的当前小样本任务的支撑集s输入到网络模型中,通过下式计算模型预测损失关于参数{α,ζ}的梯度,并采用梯度下降法迭代更新参数{α,ζ},共迭代循环20次,以获得特定于该任务的参数:
[0151][0152]
式中f
θ,α,ζ
为加入特征变换模块后的conv4网络,σ()为lla变换,而后,计算出该支撑集s上各类的中心,其计算公式如下:
[0153][0154]
其中,j∈{1,2,

,n}为类别标签且本实施中n=5,1(yi=j)为指示函数,当yi的类别为j时返回1,否则0,k=5代表每个类别中心由5个同类的样本计算得到。最终,一共获得5个类别中心
[0155]
14.将当前小样本任务的测试集q中每张图片输入到特定于该任务的网络模型中,获取相应的特征。得到的特征与上述得到的各类别中心计算距离预测类别,而后计算测试集q中所有图片的平均预测精度。
[0156]
15.重复步骤12-13,将1000个目标域小样本任务的测试集的数据类别预测完毕后,计算所有任务平均预测精度acc和95%置信区间σ,获得模型的最终性能为:acc
±
σ。
[0157]
参考表1,表1给出了本实施例的方案与其他相关方法的性能比较结果,从表1可以发现本实施例的方案的评估精度优于其他几种方法。
[0158]
表1:5类各类5张训练样本下的评估精度(%),1000个任务上置信区间为95%的平均精度。
[0159][0160]
其中:[1]j.snell,k.swersky,and r.s.zemel,“prototypical networks for fewshot learning,”in nips,2017.
[0161]
[2]x.luo,j.xu,and z.xu,“channel importance matters in few-shot image classification,”2022.
[0162]
[3]w.-h.li,x.liu,and h.bilen,“cross-domain few-shot learning with task-specific adapters,”in cvpr,2022.
[0163]
本实施例的基于特征变换与统计校正的跨域小样本图像识别方法,通过在深度卷积网络的基础上在其上嵌入特征线性变换层film和残差非线性变换层rsa,以实现任务级别的特征变换;进一步的,使用一非参非线性激活函数laa,从统计上校正网络输出特征的激活状态,以实现数据集级别的特征变换。本实施例的方法,可以有效实现跨域小样本分类识别任务,即可以在目标任务仅有极少有标签训练数据情况下实现鲁棒分类识别。
[0164]
本实施例的方法,先借助其他大规模数据集(又称源域数据)预先优化模型,使模型具备一定的先验知识,而后通过采用目标任务上少量有标签数据对模型进行任务级与数据集级微调,使模型生成的特征适用于目标任务。本实施例的方法具有计算简单、优化高效、性能鲁棒的特点,且不要求源域数据具有与目标任务数据有相同或近似的分布特征,进一步扩大了本实施例方法的适用性。
[0165]
实施例二
[0166]
参考图10,本实施例公开了一种基于特征变换与统计校正的深度卷积网络模型训练方法,其包括如下步骤:
[0167]
s1,在源域训练第一深度卷积网络模型f
θ
,获取达到预设准确率的第一深度卷积网络模型f
θ
的参数θ;其中所述第一深度卷积网络模型f
θ
包括:num个卷积块级联而成,所述num为大于2的正整数,每个卷积块由卷积层、批处理归一化层bn、relu非线性激活层、以及最大化汇聚层依序级联;
[0168]
本实施例先使用包含有大量样本的源域对第一深度卷积网络模型f
θ
进行训练;
[0169]
在步骤s1的训练中,先对第一深度卷积网络模型f
θ
进行训练以获取第一深度卷积网络模型f
θ
的参数θ。在对第一深度卷积网络模型f
θ
的进行训练时,使用本领域中公知的对深度卷积网络进行训练的方法。例如,使用梯度下降学习方法。
[0170]
步骤s1对第一深度卷积网络模型f
θ
的训练可以采用下式的损失函数:
[0171][0172]
式中z表示训练集数据数量,l()为交叉熵损失函数,为来自训练集的数据和相应的类别标签,pw为分类器,该分类器在获取到最优θ后被移除,不再需要。
[0173]
在步骤s1中,需要先构建源域的数据集;假设源域上共有i张图像数据
分别来自c个不同类别,其中xi与yi分别表示图像和相应的类别标签,且yi∈{1,2,

,c}。每类中保留j张图像构建测试集用于模型评测,各类剩余图像构建为训练集用于模型学习。一般假设上各类图像数量充足,满足进行深度卷积网络模型训练要求。
[0174]
具体的,在源域数据上,采用深度神经网络模型f
θ
构建c类分类识别任务,在构建好的源域训练集数据进行常规梯度下降学习,并在测试集数据上进行模型评测,取在测试集数据上取得最佳性能的参数作为模型最优参数θ。
[0175]
s2,固定参数θ,在目标域对基于特征变换与统计校正的深度卷积网络模型进行训练获取所述film模块以及rsa模块的参数{α,ζ};其中所述特征变换与统计校正的深度卷积网络模型包括:
[0176]
一lla变换模块,所述lla变换模块接在所述第一深度卷积网络模型f
θ
之后,所述lla变换模块为:
[0177]
其中v为自变量,k》0为控制σ(v)一阶梯度的超参数,即表明lla在半开区间(-∞,0)和(0,+∞)上为lipschitz连续函数,且1+k为相应的lipschitz常量;
[0178]
在所述第一深度卷积网络模型的前num_film个卷积块的bn层后增加一特征变换模块film,所述特征变换模块用于对所述bn层的输出进行尺度伸缩变换;
[0179]
在所述第一深度卷积网络模型的后num_rsa个卷积块均增加一残差变换模块rsa,所述rsa模块用于对所述输入到num_rsa个卷积块的输入特征进行残差计算;
[0180]
一分类器,所述分类器用于对所述lla变换模块的输出进行分类以输出识别结果。
[0181]
具体的,步骤s2是在目标域上进行训练。其中目标域是小样本,一般不满足深度卷积网络模型的训练要求。本实施例预先使用源域的数据训练第一深度卷积网络模型,然后将其迁移到小样本上进行第二次训练。
[0182]
目标域小样本任务包含一个支撑集和一个测试集其中n表示类别数,k表示各类中有标签的数据数量,m表示从各类中取出的去除其标签后的数据。一般k《《m,如k=1,m=15;则任务的目标就是采用中数据进行模型学习,而后预测中数据的真实类别。
[0183]
由于目标域单个任务上的评估结果很难有效反应模型的真实性能,一般假设在目标域上可构建大量的目标任务,即为采样于目标域数据集任务分布中的一个具体任务,所以最终以模型在目标域上所有采样任务上的平均性能作为其最终性能。
[0184]
在目标域小样本任务上采用支撑集s中数据构建n类分类识别任务,并采用误差梯度修正特征变换模块
‑‑
film和rsa中的参数{α,ζ}。具体学习中,通过在支撑集上最小化以下目标函数:
[0185]
[0186]
式中(xi,yi)为来自任务支撑集中的图像和相应的类别标签,l()为交叉熵损失函数,σ()为lla变换,p为最近类中心分类器,f
θ,α,ζ
(xi)为所述基于特征变换与统计校正的深度卷积网络作用于输入对象xi,其中各类中心通过下式获取:
[0187][0188]
式中j∈{1,2,

,n}为类别标签,n为类别数,k为各类中训练样本数,σ()为lla变换,1(yi=j)为指示函数,当yi的类别为j时返回1,否则0。
[0189]
本实施例的基于特征变换与统计校正的跨域小样本图像识别方法,通过在深度卷积网络的基础上在其上嵌入特征线性变换层film和残差非线性变换层rsa,以实现任务级别的特征变换;进一步的,使用一非参非线性激活函数laa,从统计上校正网络输出特征的激活状态,以实现数据集级别的特征变换。本实施例通过特征线性变换层film和残差非线性变换层rsa以及非参非线性激活函数laa,可以很好的实现从大规模数据集到小样本数据集的迁移。
[0190]
实施例三
[0191]
本实施例公开了一种基于特征变换与统计校正的跨域小样本图像识别装置,其包括如下单元:
[0192]
图像获取单元,用于获取待识别图像;
[0193]
识别单元,用于将所述待识别的图像输入预先训练好的基于特征变换与统计校正的深度卷积网络模型并输出识别结果,所述基于特征变换与统计校正的深度卷积网络模型深度卷积网络模型包括:
[0194]
一第一深度卷积网络模型f
θ
,其中θ为其参数,且f
θ
由num个卷积块级联而成,所述num为大于2的正整数,每个卷积块由卷积层、批处理归一化层bn、relu非线性激活层、以及最大化汇聚层依序级联;
[0195]
一lla变换模块,所述lla变换模块接在所述第一深度卷积网络模型f
θ
之后,所述lla变换模块为:
[0196]
其中v为自变量,k》0为控制σ(v)一阶梯度的超参数,即表明lla在半开区间(-∞,0)和(0,+∞)上为lipschitz连续函数,且1+k为相应的lipschitz常量;
[0197]
在所述第一深度卷积网络模型的前num_film个卷积块的bn层后增加一特征变换模块film,所述特征变换模块用于对所述bn层的输出进行尺度伸缩变换;在所述第一深度卷积网络模型的后num_rsa个卷积块均增加一残差变换模块rsa,所述rsa模块用于对所述输入到num_rsa个卷积块的输入特征进行残差计算;
[0198]
一分类器,所述分类器用于对所述lla变换模块的输出进行分类以输出识别结果。
[0199]
实施例四
[0200]
参考图11,图11是本实施例的一种基于特征变换与统计校正的跨域小样本图像识
别设备的结构示意图。该实施例的一种基于特征变换与统计校正的跨域小样本图像识别设备20包括处理器21、存储器22以及存储在所述存储器22中并可在所述处理器21上运行的计算机程序。所述处理器21执行所述计算机程序时实现上述方法实施例中的步骤。或者,所述处理器21执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能。
[0201]
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器22中,并由所述处理器21执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述一种基于特征变换与统计校正的跨域小样本图像识别设备20中的执行过程。例如,所述计算机程序可以被分割成实施例二中的各个模块,各模块具体功能请参考上述实施例所述的装置的工作过程,在此不再赘述。
[0202]
所述一种基于特征变换与统计校正的跨域小样本图像识别设备20可包括,但不仅限于,处理器21、存储器22。本领域技术人员可以理解,所述示意图仅仅是一种基于特征变换与统计校正的跨域小样本图像识别设备20的示例,并不构成对一种基于特征变换与统计校正的跨域小样本图像识别设备20的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述一种基于特征变换与统计校正的跨域小样本图像识别设备20还可以包括输入输出设备、网络接入设备、总线等。
[0203]
所述处理器21可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器21是所述一种基于特征变换与统计校正的跨域小样本图像识别设备20的控制中心,利用各种接口和线路连接整个一种基于特征变换与统计校正的跨域小样本图像识别设备20的各个部分。
[0204]
所述存储器22可用于存储所述计算机程序和/或模块,所述处理器21通过运行或执行存储在所述存储器22内的计算机程序和/或模块,以及调用存储在存储器22内的数据,实现所述一种基于特征变换与统计校正的跨域小样本图像识别设备20的各种功能。所述存储器22可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器22可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0205]
其中,所述一种基于特征变换与统计校正的跨域小样本图像识别设备20集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器21执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形
式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0206]
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0207]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术特征:
1.一种基于特征变换与统计校正的跨域小样本图像识别方法,其包括如下步骤:s1,获取待识别图像;s2,将所述待识别的图像输入预先训练好的基于特征变换与统计校正的深度卷积网络模型并输出识别结果,所述基于特征变换与统计校正的深度卷积网络模型深度卷积网络模型包括:一第一深度卷积网络模型f
θ
,其中θ为其参数,且f
θ
由num个卷积块级联而成,所述num为大于2的正整数,每个卷积块由卷积层、批处理归一化层bn、relu非线性激活层、以及最大化汇聚层依序级联;一lla变换模块,所述lla变换模块接在所述第一深度卷积网络模型f
θ
之后,所述lla变换模块为:其中v为自变量,k>0为控制σ(v)一阶梯度的超参数,即表明lla在半开区间(-∞,0)和(0,+∞)上为lipschitz连续函数,且1+k为相应的lipschitz常量;在所述第一深度卷积网络模型的前num_film个卷积块的bn层后增加一特征变换模块film,所述特征变换模块用于对所述bn层的输出进行尺度伸缩变换;在所述第一深度卷积网络模型的后num_rsa个卷积块均增加一残差变换模块rsa,所述rsa模块用于对所述输入到num_rsa个卷积块的输入特征进行残差计算,其中num=num_film+num_rsa;一分类器,所述分类器用于对所述lla变换模块的输出进行分类以输出识别结果。2.根据权利要求1所述的方法,所述film模块具体为:film变换可表示为以下线性操作:u

l
=α

u
l
式中

表示元素广播点乘,即α的每一维度上的元素与u
l
中相对应维度上的所有h
l
×
w
l
个元素相乘;u
l
为第一深度卷积网络f
θ
第l个卷积块的bn层输出特征。3.根据权利要求1所述的方法,所述rsa模块具体为:rsa模块采用以下残差方式实现:u

l

=γ(u
l
′‑1;ζ
l

)+u
l

式中γ(u
l
′‑1;ζ
l

)为构建u
l
′‑1与u
l

间的残差连接,其为矩阵乘积操作,其中u
l
′‑1、u
l

分别是第l
′‑
1、l

第一深度卷积网络f
θ
第l

个卷积块的bn层输出特征。4.根据权利要求3所述的方法,所述基于特征变换与统计校正的深度卷积网络模型的训练过程如下:s21,在源域训练第一深度卷积网络模型f
θ
,获取达到预设准确率的第一深度卷积网络模型f
θ
的参数θ;s21,固定参数θ,在目标域对基于特征变换与统计校正的深度卷积网络模型进行训练获取所述film模块以及rsa模块的参数{α,ζ}。5.一种基于特征变换与统计校正的深度卷积网络模型训练方法,其包括如下步骤:s1,在源域训练第一深度卷积网络模型f
θ
,获取达到预设准确率的第一深度卷积网络模型f
θ
的参数θ;其中所述第一深度卷积网络模型f
θ
包括:num个卷积块级联而成,所述num
为大于2的正整数,每个卷积块由卷积层、批处理归一化层bn、relu非线性激活层、以及最大化汇聚层依序级联;s2,固定参数θ,在目标域对基于特征变换与统计校正的深度卷积网络模型进行训练获取film模块以及rsa模块的参数{α,ζ};其中所述特征变换与统计校正的深度卷积网络模型包括:一lla变换模块,所述lla变换模块接在所述第一深度卷积网络模型f
θ
之后,所述lla变换模块为:其中v为自变量,k>0为控制σ(v)一阶梯度的超参数,即表明lla在半开区间(-∞,0)和(0,+∞)上为lipschitz连续函数,且1+k为相应的lipschitz常量;在所述第一深度卷积网络模型的前num_film个卷积块的bn层后增加一特征变换模块film,所述特征变换模块用于对所述bn层的输出进行尺度伸缩变换;在所述第一深度卷积网络模型的后num_rsa个卷积块均增加一残差变换模块rsa,所述rsa模块用于对所述输入到num_rsa个卷积块的输入特征进行残差计算;一分类器,所述分类器用于对所述lla变换模块的输出进行分类以输出识别结果。6.根据权利要求5所述的方法,步骤s1中对第一深度卷积网络模型f
θ
的训练采用下式的损失函数:式中z表示训练集数据数量,l()为交叉熵损失函数,为来自训练集的数据和相应的类别标签,p
w
为分类器,该分类器在获取到最优θ后被移除。7.根据权利要求6所述的方法,所述步骤s2中对在目标域对基于特征变换与统计校正的深度卷积网络模型进行训练通过在支撑集上最小化以下目标函数:式中(x
i
,y
i
)为来自任务支撑集中的图像和相应的类别标签,l()为交叉熵损失函数,σ()为lla变换,p为最近类中心分类器,f
θ,α,ζ
(x
i
)为所述基于特征变换与统计校正的深度卷积网络作用于输入对象x
i
,其中各类中心通过下式获取:式中j∈{1,2,

,n}为类别标签,n为类别数,k为各类中训练样本数,σ()为lla变换,1(y
i
=j)为指示函数,当y
i
的类别为j时返回1,否则0。8.一种基于特征变换与统计校正的跨域小样本图像识别装置,其包括如下单元:
图像获取单元,用于获取待识别图像;识别单元,用于将所述待识别的图像输入预先训练好的基于特征变换与统计校正的深度卷积网络模型并输出识别结果,所述基于特征变换与统计校正的深度卷积网络模型深度卷积网络模型包括:一第一深度卷积网络模型f
θ
,其中θ为其参数,且f
θ
由num个卷积块级联而成,所述num为大于2的正整数,每个卷积块由卷积层、批处理归一化层bn、relu非线性激活层、以及最大化汇聚层依序级联;一lla变换模块,所述lla变换模块接在所述第一深度卷积网络模型f
θ
之后,所述lla变换模块为:其中v为自变量,k>0为控制σ(v)一阶梯度的超参数,即表明lla在半开区间(-∞,0)和(0,+∞)上为lipschitz连续函数,且1+k为相应的lipschitz常量;在所述第一深度卷积网络模型的前num_film个卷积块的bn层后增加一特征变换模块film,所述特征变换模块用于对所述bn层的输出进行尺度伸缩变换;在所述第一深度卷积网络模型的后num_rsa个卷积块均增加一残差变换模块rsa,所述rsa模块用于对所述输入到num_rsa个卷积块的输入特征进行残差计算;一分类器,所述分类器用于对所述lla变换模块的输出进行分类以输出识别结果。9.根据权利要求8所述的装置,所述film模块具体为:film变换可表示为以下线性操作:u

l
=α

u
l
式中

表示元素广播点乘,即α的每一维度上的元素与u
l
中相对应维度上的所有h
l
×
w
l
个元素相乘;u
l
为第一深度卷积网络f
θ
第l个卷积块的bn层输出特征;所述rsa模块具体为:rsa模块采用以下残差方式实现:u

l

=γ(u
l
′‑1;ζ
l

)+u
l

式中γ(u
l
′‑1;ζ
l

)为构建u
l
′‑1与u
l

间的残差连接,其为矩阵乘积操作,其中u
l
′‑1、u
l

分别是第l
′‑
1、l

第一深度卷积网络f
θ
第l

个卷积块的bn层输出特征。10.一种非易失性存储介质,所述非易失性存储介质上存储有指令,所述指令被处理器执行时,用于实现如权利要求1-4中任一项所述的一种基于特征变换与统计校正的跨域小样本图像识别方法或如权利要求5-7中任一项所述的基于特征变换与统计校正的深度卷积网络模型训练方法。

技术总结
本发明提供了一种基于特征变换与统计校正的跨域小样本图像识别方法,其包括如下步骤:S1,获取待识别图像;S2,将所述待识别的图像输入预先训练好的基于特征变换与统计校正的深度卷积网络模型并输出识别结果,所述基于特征变换与统计校正的深度卷积网络模型深度卷积网络模型包括:一第一深度卷积网络模型f


技术研发人员:骆威 刘佳钒
受保护的技术使用者:人工智能与数字经济广东省实验室(广州)
技术研发日:2023.07.03
技术公布日:2023/10/8
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐