一种用于提升网络性能的卷积神经网络构造方法
未命名
08-29
阅读:159
评论:0

1.本发明属于人工智能技术领域,涉及一种用于提升网络性能的卷积神经网络构造方法。
背景技术:
2.随着深度学习的不断发展,涌现了大量的高级模型,而基于深度学习技术的卷积神经网络模型凭借其极强的特征学习与表征能力而在诸多领域中得以广泛应用。目前相关学者始终致力于进一步挖掘卷积神经网络的潜力,并提升卷积神经网络的综合性能表现,而其中通过网络构造的方式进行网络性能的提升就是一种非常常用的技术手段。
3.目前在网络构造方面已有多种方式对神经网络的性能进行进一步增强。比如增加网络深度、增加网络宽度、提高卷积核尺寸、设置跳跃连接、优化损失函数等方式,这些方式可以帮助网络捕获更加复杂的特征与表达能力。然而,目前卷积神经网络依然难以实现感受野与特征捕获效果之间的平衡,以及网络深度与信息传递效率之间的平衡,使得卷积神经网络在性能与泛化能力等方面依然具有极大的提升空间。
4.卷积神经网络模型如今在计算机视觉领域中有着十分广泛的应用前景,但卷积神经网络的性能与如下两种因素高度相关:
5.(1)感受野与特征捕获效果之间的平衡问题:卷积神经网络中的感受野对网络性能有着很大影响,小感受野可以捕获并理解更细化的特征,但在处理高级别抽象问题时会出现误差;大感受野可以广泛捕获上下文信息,但在处理局部特征时的精度和效率并不突出。
6.(2)网络深度与信息传递效率之间的平衡问题:网络层数多的深层卷积神经网络可以有效地提高网络的特征表达能力与泛化能力,进而提升网络性能,但同时也会使得特征信息需要经过更多的卷积或池化等操作才能到达后面的层,使得信息传递效率降低,网络难以训练,且资源利用率降低。
技术实现要素:
7.为了解决上述问题,本发明采用的技术方案是:
8.一种用于提升网络性能的卷积神经网络构造方法,包括以下步骤:
9.根据不同低级计算机视觉的任务,选取相应的图像数据集,并划分为训练集和测试集;
10.将训练集中的图片进行预处理;
11.构建用于提升网络性能的通用泛化卷积神经网络;
12.基于预处理后的训练集图片,对所述通用泛化卷积神经网络进行训练,得到训练好的通用泛化卷积神经网络,实现图片不同低级计算机视觉任务。
13.进一步地,所述不同低级计算机视觉任务包括但不限于:图像增强、图像去噪、图像去雾和图像超分辨。
14.进一步地,所述用于提升网络性能的通用泛化卷积神经网络包括级联的多尺度空洞卷积特征预提取模块及三分支稠密交互连接模块。
15.进一步地,所述多尺度空洞卷积特征预提取模块包含两个空洞率为3的3*3空洞卷积层、两个空洞率为2的3*3空洞卷积层以及两个3*3普通卷积层,其中每个卷积层后均衔接批归一化层以及relu激活函数;然后通过残差连接的方式将第一个空洞卷积层的输入特征图引入到最后一个普通卷积层的输出部分。
16.进一步地,所述三分支稠密交互连接模块包括第1分支、第2分支和第3分支;所述第1分支中包括空洞率为3的3*3空洞卷积层、所述第2分支为空洞率为2的3*3空洞卷积层,所述第3分支中为包括3*3普通卷积层;
17.第1分支、第2分支和第3分支之间是通过稠密连接的方式进行交互连接的,即对于任意一个分支中任意一个3*3卷积层的输出特征图,其均会通过通道合并的方式与其他两个分支进行交互;在同一分支中任意的两个相邻3*3卷积层之间需要嵌入一个1*1卷积层。
18.进一步地,所述基于预处理后的训练集图片,对所述卷积神经网络进行训练,得到训练好的通用泛化卷积神经网络,实现图片不同低级计算机视觉任务的过程如下:
19.将预处理后训练集图像数据输入到多尺度空洞卷积特征预提取模块中,进行图像特征预提取,获得预提取特征图;
20.将预提取特征图输入到三分支稠密交互连接模块中,进行特征的全面提取与表征,以及特征信息的高效传递,获得网络的通用泛化卷积神经实际输出图像;
21.通过损失函数以比较通用泛化卷积神经网络的实际输出图像与训练集中的真值图像之间的差距,通过最小化损失函数的方式以优化卷积神经网络模型的参数,从而达到卷积神经网络模型训练的目的;
22.利用测试集图像数据对训练好的通用泛化卷积网络模型进行测试,当测试指标符合认定的标准后,即判定当前通用泛化神经网络模型进行实际应用,若未达到认定标准,需继续进行通用泛化卷积神经网络模型训练,直到达标为止。
23.进一步地,所述认定标准为:当损失函数的值趋向稳定或在收敛阈值附近时,亦或者损失函数在训练集上收敛的同时在测试集上也收敛。
24.进一步地,所述损失函数的选根据不同的低级计算机视觉任务进行确定。
25.本发明提供的一种用于提升网络性能的卷积神经网络构造方法,进而使网络具备多尺度的感受野以捕获并理解不同层次的特征针对问题(1),此外,该方法还通过构造多分支稠密交互连接的方式,有效促进特征信息在网络架构间的传递,使得提升网络的训练速度,大幅度增加网络的计算资源利用率,进一步帮助提升网络的性能与泛化能力针对问题(2)。
26.该方法具有以下优点:
27.通过构建多尺度空洞卷积特征预提取模块,可以对原始图像的特征进行深度的预先提取,带有不同空洞率的卷积以及普通卷积之间的结合,可以帮助网络提取到图像在不同尺度感受野下的特征,实现感受野与特征捕获效果之间的平衡。
28.通过构建三分支稠密交互连接模块,可以对利用多尺度空洞卷积特征预提取模块得到的预提取特征图进行更加深入的特征提取与特征表征,不同分支中所采用的不同形式的卷积方式进一步提升了网络中感受野的多元性,使不同尺度感受野下的特征能够被进一
步充分地表达;此外,三分支稠密交互连接的方式有效网络深度与信息传递效率之间的平衡问题,不同分支之间的特征借助稠密交互连接的方式进行交互,不仅能够有效地提高网络的特征表达能力与泛化能力,还能够显著提升信息传递效率,加速网络训练。
29.本发明所提出的卷积神经网络是一种通用模型,具体可应用于各种不同的低级计算机视觉任务,包括但不限于图像增强、图像去噪、图像去雾、图像超分辨等。
附图说明
30.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
31.图1为本发明的卷积神经网络训练与测试流程图;
32.图2为本发明所设计的多尺度空洞卷积整体框图;
33.图3为本发明所设计的多尺度空洞卷积特征预提取模块的过程图;
34.图4(a)是空洞率为3的空洞卷积图;(b)是空洞率为2的空洞卷积图;(c)是普通卷积示意图;
35.图5为本发明所设计的三分支稠密交互连接模块。
具体实施方式
36.需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合,下面将参考附图并结合实施例来详细说明本发明。
37.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
38.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
39.除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。同时,应当清楚,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。对于相关领域普通技术人员己知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中,任向具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
40.在本发明的描述中,需要理解的是,方位词如“前、后、上、下、左、右”、“横向、竖向、垂直、水平”和“顶、底”等所指示的方位或位置关系通常是基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,在未作相反说明的情况下,这些方位词并不指示和暗示所指的装置或元件必须具有特定的方位或者以特定的方位构造和操作,因此不能理解为对本发明保护范围的限制:方位词“内、外”是指相对于各部件本身的轮廓的内外。
41.为了便于描述,在这里可以使用空间相对术语,如“在
……
之上”、“在
……
上方”、“在
……
上表面”、“上面的”等,用来描述如在图中所示的一个器件或特征与其他器件或特征的空间位置关系。应当理解的是,空间相对术语旨在包含除了器件在图中所描述的方位之外的在使用或操作中的不同方位。例如,如果附图中的器件被倒置,则描述为“在其他器件或构造上方”或“在其他器件或构造之上”的器件之后将被定位为“在其他器件或构造下方”或“在其位器件或构造之下”。因而,示例性术语“在
……
上方”可以包括“在
……
上方”和“在
……
下方”两种方位。该器件也可以其他不同方式定位(旋转90度或处于其他方位),并且对这里所使用的空间相对描述作出相应解释。
42.此外,需要说明的是,使用“第一”、“第二”等词语来限定零部件,仅仅是为了便于对相应零部件进行区别,如没有另行声明,上述词语并没有特殊含义,因此不能理解为对本发明保护范围的限制。
43.一种用于提升网络性能的卷积神经网络构造方法,包括以下步骤:
44.s1:根据不同低级计算机视觉的任务,选取相应的图像数据集,并划分为训练集和测试集;
45.s2:将训练集中的图片进行预处理;
46.s3:构建用于提升网络性能的通用泛化卷积神经网络;
47.s4:基于预处理后的训练集图片,对所述通用泛化卷积神经网络进行训练,得到训练好的通用泛化卷积神经网络,实现图片不同低级计算机视觉任务。
48.所述不同低级计算机视觉任务包括但不限于:图像增强、图像去噪、图像去雾和图像超分辨等。
49.步骤s1/s2/s3/s4顺序执行;
50.进一步地,根据待解决的低级计算机视觉任务的不同,选取相应的图像数据集,并划分为训练集和测试集。即根据待解决的低级计算机视觉任务的不同,选择对应任务的网络公开数据集,然后将所选择的数据集内的图片随机划分。根据人工智能领域中常见的划分规律,训练集和测试集的数量比例一般可以设置为8:2、7:3、8.5:1.5等,也可以根据实际情况进行自行调整。
51.所述预处理采用随机裁剪的预处理方式,让网络能够更好的学习;而测试集不需要进行此操作;
52.所述用于提升网络性能的通用泛化卷积神经网络包括级联的多尺度空洞卷积特征预提取模块及三分支稠密交互连接模块。
53.所述多尺度空洞卷积特征预提取模块包含两个空洞率为3的3*3空洞卷积层、两个空洞率为2的3*3空洞卷积层以及两个3*3普通卷积层,其中每个卷积层后均衔接批归一化层以及relu激活函数;然后通过残差连接的方式将第一个空洞卷积层的输入特征图引入到最后一个普通卷积层的输出部分,从而使神经网络可以更好地学习输入图像中的复杂特
征,有效提升网络的训练效率,同时解决网络训练过程中可能出现的梯度消失以及梯度爆炸问题。
54.所述三分支稠密交互连接模块包括第1分支、第2分支和第3分支;所述第1分支中包括空洞率为3的3*3空洞卷积层、所述第2分支为空洞率为2的3*3空洞卷积层,所述第3分支中为包括3*3普通卷积层;
55.第1分支、第2分支和第3分支之间是通过稠密连接的方式进行交互连接的,即对于任意一个分支中任意一个3*3卷积层的输出特征图,其均会通过通道合并的方式与其他两个分支进行交互;在同一分支中任意的两个相邻3*3卷积层之间需要嵌入一个1*1卷积层。由于稠密连接的交互方式的本质在于对不同的输出特征图进行通道合并,因此会导致合并后的通道数过高(合并后的特征图通道数均为9)而影响计算效率,为解决这一问题,本模块在同一分支中任意的两个相邻3*3卷积层之间需要嵌入一个1*1卷积层,使得通道数由9降为3。最后,采用稠密连接的方式将三分支合并为一个分支,并通过1*1卷积层将通道数由9降为3。
56.进一步地:所述基于预处理后的训练集图片,对所述通用泛化卷积神经网络进行训练,得到训练好的通用泛化卷积神经网络,实现图片不同低级计算机视觉任务的过程如下:
57.将预处理后训练集图像数据输入到多尺度空洞卷积特征预提取模块中,进行图像特征预提取,获得预提取特征图;
58.将预提取特征图输入到三分支稠密交互连接模块中,进行特征的全面提取与表征,以及特征信息的高效传递,获得网络的卷积神经实际输出图像;
59.通过损失函数以比较通用泛化卷积神经网络的实际输出图像与训练集中的真值图像之间的差距(即模型误差),通过最小化损失函数的方式以优化通用泛化卷积神经网络模型的参数,从而达到通用泛化卷积神经网络模型训练的目的;
60.利用测试集图像数据对训练好的卷积网络模型进行测试,当测试指标符合认定的标准后,即判定当前神经网络模型进行实际应用,若未达到认定标准,需继续进行通用泛化卷积神经网络模型训练,直到达标为止。所述损失函数的选根据不同的低级计算机视觉任务进行确定。
61.所述认定标准为:当损失函数的值趋向稳定或在收敛阈值附近时,亦或者损失函数在训练集上收敛的同时在测试集上也收敛。收敛阈值可设定为如:0.001;0.004等较小的数字,在这个较小的数字上可以存在小误差(如3%、5%等等。
62.在训练过程中需要记录每轮的损失函数值并保存权重以便于测试时加载使用,训练的时常可以通过判定每轮损失函数是否符合认定标准,如果符合则可以停止训练加载权重进行测试,如若不符合则继续训练。
63.最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
技术特征:
1.一种用于提升网络性能的卷积神经网络构造方法,其特征在于:包括以下步骤:根据不同低级计算机视觉的任务,选取相应的图像数据集,并划分为训练集和测试集;将训练集中的图片进行预处理;构建用于提升网络性能的通用泛化卷积神经网络;基于预处理后的训练集图片,对所述通用泛化卷积神经网络进行训练,得到训练好的通用泛化卷积神经网络,实现图片不同低级计算机视觉任务。2.根据权利要求1所述的一种用于提升网络性能的卷积神经网络构造方法,其特征在于:所述不同低级计算机视觉任务包括但不限于:图像增强、图像去噪、图像去雾和图像超分辨。3.根据权利要求1所述的一种用于提升网络性能的卷积神经网络构造方法,其特征在于:所述用于提升网络性能的通用泛化卷积神经网络包括级联的多尺度空洞卷积特征预提取模块及三分支稠密交互连接模块。4.根据权利要求1所述的一种用于提升网络性能的卷积神经网络构造方法,其特征在于:所述多尺度空洞卷积特征预提取模块包含两个空洞率为3的3*3空洞卷积层、两个空洞率为2的3*3空洞卷积层以及两个3*3普通卷积层,其中每个卷积层后均衔接批归一化层以及relu激活函数;然后通过残差连接的方式将第一个空洞卷积层的输入特征图引入到最后一个普通卷积层的输出部分。5.根据权利要求1所述的一种用于提升网络性能的卷积神经网络构造方法,其特征在于:所述三分支稠密交互连接模块包括第1分支、第2分支和第3分支;所述第1分支中包括空洞率为3的3*3空洞卷积层、所述第2分支为空洞率为2的3*3空洞卷积层,所述第3分支中为包括3*3普通卷积层;第1分支、第2分支和第3分支之间是通过稠密连接的方式进行交互连接的,即对于任意一个分支中任意一个3*3卷积层的输出特征图,其均会通过通道合并的方式与其他两个分支进行交互;在同一分支中任意的两个相邻3*3卷积层之间需要嵌入一个1*1卷积层。6.根据权利要求3所述的一种用于提升网络性能的卷积神经网络构造方法,其特征在于:所述基于预处理后的训练集图片,对所述卷积神经网络进行训练,得到训练好的通用泛化卷积神经网络,实现图片不同低级计算机视觉任务的过程如下:将预处理后训练集图像数据输入到多尺度空洞卷积特征预提取模块中,进行图像特征预提取,获得预提取特征图;将预提取特征图输入到三分支稠密交互连接模块中,进行特征的全面提取与表征,以及特征信息的高效传递,获得网络的通用泛化卷积神经实际输出图像;通过损失函数以比较通用泛化卷积神经网络的实际输出图像与训练集中的真值图像之间的差距,通过最小化损失函数的方式以优化卷积神经网络模型的参数,从而达到卷积神经网络模型训练的目的;利用测试集图像数据对训练好的通用泛化卷积网络模型进行测试,当测试指标符合认定的标准后,即判定当前通用泛化神经网络模型进行实际应用,若未达到认定标准,需继续进行通用泛化卷积神经网络模型训练,直到达标为止。7.根据权利要求6所述的一种用于提升网络性能的卷积神经网络构造方法,其特征在于:所述认定标准为:当损失函数的值趋向稳定或在收敛阈值附近时,亦或者损失函数在训
练集上收敛的同时在测试集上也收敛。8.根据权利要求6所述的一种用于提升网络性能的卷积神经网络构造方法,其特征在于:所述损失函数的选根据不同的低级计算机视觉任务进行确定。
技术总结
本发明一种用于提升网络性能的卷积神经网络构造方法,属于人工智能技术领域,该方法包括以下步骤:根据不同低级计算机视觉的任务,选取相应的图像数据集,并划分为训练集和测试集;将训练集中的图片进行预处理;构建用于提升网络性能的通用泛化卷积神经网络;基于预处理后的训练集图片,对所述通用泛化卷积神经网络进行训练,得到训练好的通用泛化卷积神经网络,实现图片不同低级计算机视觉任务。该方法使卷积神经网络具备多尺度的感受野以捕获并理解不同层次的特征,此外,该方法还通过构造多分支稠密交互连接的方式,促进特征信息在网络架构间的传递,使得提升网络的训练速度,大幅度增加网络的计算资源利用率,提升网络的性能与泛化能力。络的性能与泛化能力。络的性能与泛化能力。
技术研发人员:纪勋 杨贺 郝立颖 王靖淇
受保护的技术使用者:大连海事大学
技术研发日:2023.06.14
技术公布日:2023/8/28
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:一种砂柱注浆渗透实验装置和使用方法与流程 下一篇:一种升降机的制作方法