一种基于ResNet的危险化学品识别方法、装置以及设备与流程
未命名
08-02
阅读:100
评论:0

一种基于resnet的危险化学品识别方法、装置以及设备
技术领域
1.本发明涉及检测技术领域,尤其涉及一种基于resnet的危险化学品识别方法、装置以及设备。
背景技术:
2.危险化学品的分类识别是化学品安全管理的重要一环,如何准确、快速地对危险化学品进行分类识别一直是一个难题。传统的化学品分类识别方法存在特征提取不充分、分类器设计不够优化等问题,随着化学品数据库的增加,分类精度难以保证,会导致随着化学品数据库的增加而出现分类识别精度下降的情况;而利用神经网络进行特征提取后比较数据库里数据相似度的算法又因为需要遍历数据库并计算数据库中数据与输入数据的余弦相似度而过于浪费时间,无法进行快速检测,从而导致计算时间过长,无法满足快速检测的需求。这些问题可能会导致对危险化学品的识别速度上、准确度和安全性的鉴别和管理存在误判或漏判的情况。
技术实现要素:
3.有鉴于此,本发明的目的在于提出一种基于resnet的危险化学品识别方法、装置以及设备,旨在解决现有对危险化学品的识别存在识别精度低以及速度慢等问题。
4.为实现上述目的,本发明提供一种基于resnet的危险化学品识别方法,所述方法包括:
5.采集危险化学品的光谱数据并进行预处理,将预处理后得到的光谱数据作为训练数据;
6.将所述训练数据输入基于resnet所构建的模型进行训练,得到识别模型,其中,所述识别模型的网络结构包括prenet模块、resblock模块、maxpool模块以及fc_net模块;
7.获取待识别危险化学品的光谱数据输入所述识别模型中进行危险化学品识别,得到包含对应危险化学品的概率值以及索引号的识别结果。
8.优选的,通过所述prenet模块对输入的光谱数据进行特征提取以及降采样操作;其中,所述prenet模块包括convrelu层,所述convrelu层包括卷积层和激活函数层。
9.优选的,通过所述resblock模块对所述prenet模块的输出数据进行残差学习;其中,所述resblock模块包括convbn层,所述convbn层包括卷积层和bn层。
10.优选的,通过所述maxpool模块对所述resblock模块的输出数据进行池化和批标准化操作;其中,所述maxpool模块包括卷积块以及pool层,所述卷积块包括卷积层、bn层以及激活函数层。
11.优选的,通过所述fc_net模块将主干卷积网络提取的特征输出数据进行展平后转换成长度等于危险化学品数量的向量;其中,所述主干卷积网络包括所述resblock模块以及所述maxpool模块。
12.优选的,所述采集危险化学品的光谱数据并进行预处理,包括:
13.对光谱数据进行去基线和去噪处理,并通过线性插值算法将每一光谱数据的数据点的个数插值为2048个。
14.优选的,在所述采集危险化学品的光谱数据并进行预处理之前,还包括:
15.将所采集的危险化学品的光谱数据按照预设方式进行存储以构建数据库,以及按照每一危险化学品的名称所分配的唯一索引号进行创建物质索引表。
16.为实现上述目的,本发明还提供一种基于resnet的危险化学品识别装置,所述装置包括:
17.预处理单元,用于采集危险化学品的光谱数据并进行预处理,将预处理后得到的光谱数据作为训练数据;
18.模型训练单元,用于将所述训练数据输入基于resnet所构建的模型进行训练,得到识别模型,其中,所述识别模型的网络结构包括prenet模块、resblock模块、maxpool模块以及fc_net模块;
19.识别单元,用于获取待识别危险化学品的光谱数据输入所述识别模型中进行危险化学品识别,得到包含对应危险化学品的概率值以及索引号的识别结果。
20.为了实现上述目的,本发明还提出一种基于resnet的危险化学品识别设备,包括处理器、存储器以及存储在所述存储器内的计算机程序,所述计算机程序被所述处理器执行以实现如上述实施例所述的一种基于resnet的危险化学品识别方法的步骤。
21.为了实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行以实现如上述实施例所述的一种基于resnet的危险化学品识别方法的步骤。
22.有益效果:
23.以上方案,通过对光谱数据进行预处理后,输入基于resnet所构建的模型进行训练后得到识别模型,resnet网络是一种深度卷积神经网络,在网络中增加了直连通道,能够有效地解决梯度消失和梯度爆炸,能够提高模型的性能,继而通过所得到识别模型对待识别危险化学品进行分类识别能够快速获得危险化学品的识别结果,大大提高识别的准确性。
24.以上方案,通过在网络中引入prenet对输入的光谱数据进行前处理,能够以便提取更好的特征;以及通过maxpool用来规范化卷积层的输出,避免过拟合,降低模型的计算复杂度。
附图说明
25.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
26.图1为本发明一实施例提供的一种基于resnet的危险化学品识别方法的流程示意图。
27.图2为本发明一实施例提供的识别模型的整体网络框架示意图。
28.图3为本发明一实施例提供的prenet模块的网络结构示意图。
29.图4为本发明一实施例提供的resblock模块的网络结构示意图。
30.图5为本发明一实施例提供的maxpool模块的网络结构示意图。
31.图6为本发明一实施例提供的fc_net模块的网络结构示意图。
32.图7为本发明一实施例提供的一种基于resnet的危险化学品识别装置的结构示意图。
33.发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
34.为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
35.以下结合实施例详细阐述本发明的内容。
36.传统用于化学品分类识别的算法主要包括以下几种:
37.主成分分析(pca):主成分分析是一种常用的数据降维方法,它可以将高维数据转化为低维空间,以减少数据维度和降低计算复杂度。在化学品分类识别中,pca可以将原始光谱数据进行降维处理,以提高分类准确度。但缺点是在处理非线性数据时表现较差,可能会忽略重要的信息,从而导致分类效果不佳。
38.支持向量机(svm):支持向量机是一种常用的分类算法,它可以通过构建最优的分离超平面来实现对不同化学品的分类。在化学品分类识别中,svm可以对光谱数据进行特征提取和分类建模,以实现较高精度的分类识别。但缺点是在处理大规模数据时计算复杂度较高,且对于数据噪声较为敏感,需要进行有效的数据处理和优化。
39.人工神经网络(ann):人工神经网络是一种模仿生物神经网络的计算模型,它可以通过学习和训练来实现对不同化学品的分类。在化学品分类识别中,ann可以对光谱数据进行特征提取和分类建模,以实现高精度的分类识别。缺点是输入数据经过特征提取后无法直接输出其概率值,只能遍历数据库中的数据计算二者的余弦相似度作为概率值,因此计算量较大,比较浪费时间。
40.基于此,本发明提出一种基于resnet的危险化学品识别方法,能够对千种以上的危险化学品的分类识别上具有较高的准确率和鲁棒性,识别准确率可以达到95%以上。
41.参照图1所示为本发明一实施例提供的一种基于resnet的危险化学品识别方法的流程示意图。
42.本实施例中,该方法包括:
43.s11,采集危险化学品的光谱数据并进行预处理,将预处理后得到的光谱数据作为训练数据。
44.其中,所述采集危险化学品的光谱数据并进行预处理,包括:
45.对光谱数据进行去基线和去噪处理,并通过线性插值算法将每一光谱数据的数据点的个数插值为2048个。
46.进一步的,在所述采集危险化学品的光谱数据并进行预处理之前,还包括:
47.将所采集的危险化学品的光谱数据按照预设方式进行存储以构建数据库,以及按照每一危险化学品的名称所分配的唯一索引号进行创建物质索引表。
48.在本实施例中,通过仪器(如光谱仪)采集的危险化学品的光谱数据存储为csv文件类型,该csv文件中的第一列表示拉曼位移,第二列表示强度,两列数据均有1501个数据点。对csv文件通过不同方式进行命名,如csv文件的命名方法为编号命名,不同的危险化学品物质有不同的编号,编号命名如“rm20220812-012_1.csv”,其中,“rm20220812-012”为编号,“_1”表示该种危险化学品物质采集的第1个数据,每种危险化学品物质最好采集20条及以上的数据,以便模型能够学习到充足的特征从而获得更好的结果。构建数据库的目的是存储数据并创建索引表,过程包括将同种危险化学品物质的csv文件放入对应的文件夹下,并按照预设方式对文件夹进行命名,如文件夹的命名从数字1开始,之后依次加一,文件夹名称就代表该危险化学品物质的id。在后续的模型训练阶段,以文件夹的名称来表示对应危险化学品物质的标签。在建库完成后,进一步建立危险化学品物质id表,危险化学品物质id表由文件夹名称列表、对应的物质编号和物质名称列表组成,作用是为后续模型输出提供危险化学品物质的编号(索引号),从而找到对应的危险化学品物质名称。
49.s12,将所述训练数据输入基于resnet所构建的模型进行训练,得到识别模型,其中,所述识别模型的网络结构包括prenet模块、resblock模块、maxpool模块以及fc_net模块。
50.如图2所示,识别模型的网络结构总体包括prenet(前处理模块)、resblock(残差块)、maxpool(池化块)以及fc_net(全连接层)。在本实施例中,网络架构设计resblock模块作为残差块,对卷积网络进行改进,通过引入了一些新的模块和组件包括prenet和maxpool,其中prenet模块可以用来对输入的光谱数据进行前处理,以便提取更好的特征;maxpool模块可以用来规范化卷积层的输出,避免过拟合。在训练时使用nn.crossentropyloss()作为损失函数,该损失函数适用于多分类问题,并且可以处理不平衡的分类数据,会将模型输出的概率向量与真实标签进行比较,计算出模型预测值和真实值之间的交叉熵损失,从而进行模型优化。
51.参照图3所示的prenet结构示意图。在prenet(前处理模块)中,prenet模块的作用是对所输入的预处理后的光谱数据进行特征提取和降采样操作。图中,input表示输入,output表示输出,prenet的输入是一个1通道的1d信号,形状大小为(batchsize,1,input_length),其中batchsize表示一批次输入了batch条数据,1表示通道数,input_length表示输入的数据的长度,此处input_length等于2048。卷积层(convolutional layer)和激活函数层(relu layer)的组合可以简称为convrelu层,用于提取特征并实现非线性映射。经过三个convrelu层后输出一个16通道的1d特征图,形状为(batchsize,16,1024),输出通道数增加,长度减半。shortcut是跳跃连接,借用了残差网络的思想,可以防止神经网络出现退化。
52.参照图4所示的resblock结构示意图。resblock(残差块)的作用是通过残差学习提升网络的性能。每个残差块接收一个形状为(batchsize,input_channel,input_length)
的数据张量,输出为一个形状为(batchsize,output_channel,input_length)的数据张量,通过使用不同大小的卷积核以及将input_channel和output_channel设计成不同的值,来增强网络的学习能力。增大卷积核可以使模型的感受野变大,所获得的全局特征越好,但也会带来计算量的增加,增大output_channel可以让网络学习到更多参数,但会增大网络大小,使网络响应时间变慢。模块bn(batch normalization)层,主要作用是通过对每个batch(经过前面卷积层后输出的一批训练数据)的特征进行归一化处理,使得网络模型在训练过程中更加稳定和快速。模块convolutional layer(卷积层)和batch normalization(bn层)组合在一起可以简称convbn层,可以提高网络的性能、加速训练,并增强网络的鲁棒性和可靠性。
53.参照图5所示的maxpool结构示意图。每个maxpool模块接收一个形状为(batchsize,input_channel,input_length)的数据张量,输出为一个形状为(batchsize,2*input_channel,input_length/2)的数据张量。输出通道数乘2,但是输出数据长度变为原来的一半。maxpool的作用是对resblock模块的输出进行池化和批标准化操作,减小特征图的大小,从而降低模型的计算复杂度。模块卷积层(convolutional layer)、bn层和激活函数层(relu layer)的组合可以简称为卷积块(convolutional block),主要功能是在深度学习神经网络中增加非线性,并加快训练速度,提高分类准确率。模块pool(pooling layer)层,作用是减小特征图的空间大小,降低模型的参数数量,从而缓解过拟合的情况。
54.参照图6所示的fc_net结构示意图。fc_net(全连接层)的作用是实现全连接层操作,目的是将由多个结构resblock(残差块)和结构maxpool(池化块)组合成的主干卷积网络所提取的特征输出(input)展平后转换成长度等于数据库中化学品种类的数量的向量(output),以便能够输出每种化学品对应的概率值。然后将此向量(output)输入激活函数sigmoid中,即可将向量output中的每个值映射到0,1之间,只需获得此output中最大值以及其位置索引,即可获得识别危险化学品物质的概率,并根据索引从id表中找到识别出的对应危险化学品物质。
55.在另一实施例中,可以通过增加一些额外的网络层,如在卷积块中增加池化层(pooling layer)、增加dropout层(随机失活层)等方法,以增加网络模型的鲁棒性和泛化能力。此外,在其他实施例中,也可以通过减少一些网络层,如去掉batchnormalization层、去掉激活函数层等方法,以简化网络结构从而提高训练速度。
56.s13,获取待识别危险化学品的光谱数据输入所述识别模型中进行危险化学品识别,得到包含对应危险化学品的概率值以及索引号的识别结果。
57.在本实施例中,将光谱仪采集的光谱数据序列通过预处理后(包括去基线和去噪处理,并通过线性插值算法将数据点插值成2048个),通过加载以.pt文件格式存储的识别模型,将光谱数据输入识别模型中,即可让识别模型输出索引值和概率值,通过索引值即可在id表找到对应识别出的危险化学品物质。基于上述方法能够快速获得危险化学品的识别结果,同时精度较传统方法提高很多,面对千种以上的危险化学品,识别率能够达到95%以上,可以有效解决精度低和速度慢等问题。
58.参照图7所示为本发明一实施例提供的一种基于resnet的危险化学品识别装置的结构示意图。
59.在本实施例中,该装置70包括:
60.预处理单元71,用于采集危险化学品的光谱数据并进行预处理,将预处理后得到的光谱数据作为训练数据;
61.模型训练单元72,用于将所述训练数据输入基于resnet所构建的模型进行训练,得到识别模型,其中,所述识别模型的网络结构包括prenet模块、resblock模块、maxpool模块以及fc_net模块;
62.识别单元73,用于获取待识别危险化学品的光谱数据输入所述识别模型中进行危险化学品识别,得到包含对应危险化学品的概率值以及索引号的识别结果。
63.该装置70的各个单元模块可分别执行上述方法实施例中对应步骤,故在此不对各单元模块进行赘述,详细请参见以上对应步骤的说明。
64.本发明实施例还提供一种设备,该设备包括如上所述的基于resnet的危险化学品识别装置,其中,基于resnet的危险化学品识别装置可以采用图7实施例的结构,其对应地,可以执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,详细可以参见上述实施例中的相关记载,此处不再赘述。
65.所述设备包括:手机、数码相机或平板电脑等具有拍照功能的设备,或者具有图像处理功能的设备,或者具有图像显示功能的设备。所述设备可包括存储器、处理器、输入单元、显示单元、电源等部件。
66.其中,存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(例如图像播放功能等)等;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器还可以包括存储器控制器,以提供处理器和输入单元对存储器的访问。
67.输入单元可用于接收输入的数字或字符或图像信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,本实施例的输入单元除了包括摄像头,还可包括触敏表面(例如触摸显示屏)以及其他输入设备。
68.显示单元可用于显示由用户输入的信息或提供给用户的信息以及设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元可包括显示面板,可选的,可以采用lcd(liquid crystal display,液晶显示器)、oled(organic light-emitting diode,有机发光二极管)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器以确定触摸事件的类型,随后处理器根据触摸事件的类型在显示面板上提供相应的视觉输出。
69.本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中的存储器中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。该计算机可读存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现图1所示的基于resnet的危险化学品识别方法。所述计算机可读存储介质可以是只读存储器,磁盘或光盘等。
70.需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重
点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例、设备实施例及存储介质实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
71.并且,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
72.上述说明示出并描述了本发明的优选实施例,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
技术特征:
1.一种基于resnet的危险化学品识别方法,其特征在于,所述方法包括:采集危险化学品的光谱数据并进行预处理,将预处理后得到的光谱数据作为训练数据;将所述训练数据输入基于resnet所构建的模型进行训练,得到识别模型,其中,所述识别模型的网络结构包括prenet模块、resblock模块、maxpool模块以及fc_net模块;获取待识别危险化学品的光谱数据输入所述识别模型中进行危险化学品识别,得到包含对应危险化学品的概率值以及索引号的识别结果。2.根据权利要求1所述的一种基于resnet的危险化学品识别方法,其特征在于,通过所述prenet模块对输入的光谱数据进行特征提取以及降采样操作;其中,所述prenet模块包括convrelu层,所述convrelu层包括卷积层和激活函数层。3.根据权利要求1所述的一种基于resnet的危险化学品识别方法,其特征在于,通过所述resblock模块对所述prenet模块的输出数据进行残差学习;其中,所述resblock模块包括convbn层,所述convbn层包括卷积层和bn层。4.根据权利要求1所述的一种基于resnet的危险化学品识别方法,其特征在于,通过所述maxpool模块对所述resblock模块的输出数据进行池化和批标准化操作;其中,所述maxpool模块包括卷积块以及pool层,所述卷积块包括卷积层、bn层以及激活函数层。5.根据权利要求1所述的一种基于resnet的危险化学品识别方法,其特征在于,通过所述fc_net模块将主干卷积网络提取的特征输出数据进行展平后转换成长度等于危险化学品数量的向量;其中,所述主干卷积网络包括所述resblock模块以及所述maxpool模块。6.根据权利要求1所述的一种基于resnet的危险化学品识别方法,其特征在于,所述采集危险化学品的光谱数据并进行预处理,包括:对光谱数据进行去基线和去噪处理,并通过线性插值算法将每一光谱数据的数据点的个数插值为2048个。7.根据权利要求1所述的一种基于resnet的危险化学品识别方法,其特征在于,在所述采集危险化学品的光谱数据并进行预处理之前,还包括:将所采集的危险化学品的光谱数据按照预设方式进行存储以构建数据库,以及按照每一危险化学品的名称所分配的唯一索引号进行创建物质索引表。8.一种基于resnet的危险化学品识别装置,其特征在于,所述装置包括:预处理单元,用于采集危险化学品的光谱数据并进行预处理,将预处理后得到的光谱数据作为训练数据;模型训练单元,用于将所述训练数据输入基于resnet所构建的模型进行训练,得到识别模型,其中,所述识别模型的网络结构包括prenet模块、resblock模块、maxpool模块以及fc_net模块;识别单元,用于获取待识别危险化学品的光谱数据输入所述识别模型中进行危险化学品识别,得到包含对应危险化学品的概率值以及索引号的识别结果。9.一种基于resnet的危险化学品识别设备,其特征在于,包括处理器、存储器以及存储在所述存储器内的计算机程序,所述计算机程序被所述处理器执行以实现如权利要求1至7任意一项所述的一种基于resnet的危险化学品识别方法的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机
程序,所述计算机程序被处理器执行以实现如权利要求1至7任意一项所述的一种基于resnet的危险化学品识别方法的步骤。
技术总结
本发明公开了一种基于ResNet的危险化学品识别方法、装置、设备及存储介质,其包括:采集危险化学品的光谱数据并进行预处理,将预处理后得到的光谱数据作为训练数据;将所述训练数据输入基于ResNet所构建的模型进行训练,得到识别模型,其中,所述识别模型的网络结构包括PreNet模块、ResBlock模块、MaxPool模块以及FC_Net模块;获取待识别危险化学品的光谱数据输入所述识别模型中进行危险化学品识别,得到包含对应危险化学品的概率值以及索引号的识别结果。能够快速获得危险化学品的识别结果,大大提高识别的准确性。大大提高识别的准确性。大大提高识别的准确性。
技术研发人员:唐河山 梁培
受保护的技术使用者:厦门市帕兰提尔科技有限公司
技术研发日:2023.04.13
技术公布日:2023/8/1
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/