产品的分类识别方法、分类终端及存储介质

未命名 08-02 阅读:100 评论:0


1.本发明涉及质检技术领域,尤其涉及一种产品的分类识别方法、分类终端及存储介质。


背景技术:

2.莜(y
ó
u)面是由莜麦加工而成的面粉,由于莜面的价格较高,因此很多商户在莜面中掺杂土豆淀粉、面粉等,以次充好。近红外光谱具有简便、快速、低成本、无污染、对样品无破坏等有点,能快速实现物品种类的识别,可用于莜面等产品的掺杂检测。
3.现有技术中,通常提取待检测样本的近红外光谱,采用单一神经网络模型进行分类识别。由于单一神经网络模型受模型本身限制及训练样本等影响,模型的准确度可能不够高,导致产品的分类识别准确度受影响。


技术实现要素:

4.本发明实施例提供了一种产品的分类识别方法、分类终端及存储介质,以解决采用单一神经网络模型通过近红外光谱识别产品,准确率受影响的问题。
5.第一方面,本发明实施例提供了一种产品的分类识别方法,包括:
6.获取目标样本的近红外光谱,并根据近红外光谱提取得到样本特征;
7.将样本特征输入集成分类器,得到目标样本的分类结果;
8.其中,集成分类器包括多个子分类模型;集成分类器用于将各个子分类模型的分类结果加权求和得到目标样本的分类结果。
9.可选的,在将样本特征输入集成分类器,得到目标样本的分类结果之前,方法还包括:
10.获取各个子分类模型的准确率;
11.根据各个子分类模型的准确率,确定各个子分类模型的投票权重,得到集成分类器。
12.可选的,根据各个子分类模型的准确率,确定各个子分类模型的投票权重,包括:
13.针对每个子分类模型,根据该子分类模型的准确率确定该子分类模型的模型价值度;
14.将各个子分类模型的模型价值度相加,得到总的模型价值度;
15.针对每个子分类模型,将该子分类模型的模型价值度除以总的模型价值度,得到该子分类模型的投票权重。
16.可选的,根据该子分类模型的准确率确定该子分类模型的模型价值度,包括:
17.根据该子分类模型的准确率,结合第一公式计算得到该子分类模型的模型价值度;
18.第一公式为:
19.20.其中,vi为第i个子分类模型对应的模型价值度,k为系数,pi为第i个子分类模型的准确率;i=1,2

,n,n为子分类模型的个数。
21.可选的,
22.可选的,各个子分类模型的类型均不同。
23.可选的,子分类模型的数量为4个;
24.4个子分类模型分别为:svm模型、knn模型、决策树模型及cnn模型。
25.可选的,在获取各个子分类模型的准确率之前,方法还包括:
26.采用训练样本集分别对各个初始子分类模型进行训练,得到各个子分类模型;
27.采用测试样本集分别对各个子分类模型进行测试,得到各个子分类模型的准确率。
28.第二方面,本发明实施例提供了一种分类终端,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上第一方面或第一方面的任一种可能的实现方式方法的步骤。
29.第三方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上第一方面或第一方面的任一种可能的实现方式方法的步骤。
30.本发明实施例提供一种产品的分类识别方法、分类终端及存储介质。该方法包括:获取目标样本的近红外光谱,并根据近红外光谱提取得到样本特征;将样本特征输入集成分类器,得到目标样本的分类结果;其中,集成分类器包括多个子分类模型;集成分类器用于将各个子分类模型的分类结果加权求和得到目标样本的分类结果。本发明实施例中基于近红外光谱建立集成分类模型。其中,集成分类模型包括多个子分类模型,各个子分类模型加权求和,综合各个子分类模型的优势,相对于单一模型的性能更优越,分类准确度更高,有效提高了产品的分类识别准确度。
附图说明
31.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
32.图1是本发明实施例提供的一种产品的分类识别方法的实现流程图;
33.图2是模型训练损失值变化曲线图;
34.图3是集成学习模型的原理示意图;
35.图4是集成学习模型的集成学习投票结果示意图;
36.图5是本发明实施例提供的模型价值度与准确率的关系示意图;
37.图6是本发明实施例中系数k对集成分类器的准确率的影响示意图;
38.图7是本发明实施例提供的集成分类器的结构示意图;
39.图8是各模型的准确率对比图;
40.图9是各模型的精确率对比图;
41.图10是各模型的召回率对比图;
42.图11是各模型的f1值对比图;
43.图12是本发明实施例提供的产品的分类识别装置的结构示意图;
44.图13是本发明实施例提供的分类终端的示意图。
具体实施方式
45.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
46.为使本发明的目的、技术方案和优点更加清楚,下面将结合附图通过具体实施例来进行说明。
47.参见图1,其示出了本发明实施例提供的产品的分类识别方法的实现流程图,详述如下:
48.上述方法包括:
49.s101:获取目标样本的近红外光谱,并根据近红外光谱提取得到样本特征;
50.近红外光(near infrared,nir)是介于可见光和中红外光之间的电磁波,按astm(美国试验和材料检测协会)定义是指波长在780~2526nm范围内的电磁波。红外光谱曲线图是分子能选择性吸收某些波长的红外线,而引起分子中振动能级和转动能级的跃迁,检测红外线被吸收的情况可得到物质的红外吸收光谱,又称分子振动光谱或振转光谱。近红外区域的吸收基本上均为红外区基准振动的倍频或合频振动所引起的,特别是以由氢原子相关联的o-h、n-h、c-h等官能基的吸收为主。
51.由以上可知,不同波长对于不同物质的反射率呈现一定的规律,相同物质具有相似的光谱结构,近红外光谱曲线反映了物质内部的成分。对于不同的物质,红外光谱特征会有所差异,不同物质在不同波数下的吸光度的差异部分可以作为不同物质的区分条件。基于此,本发明实施例中根据近红外光谱提取样本特征用于产品分类检测。
52.s102:将样本特征输入集成分类器,得到目标样本的分类结果;
53.其中,集成分类器包括多个子分类模型;集成分类器用于将各个子分类模型的分类结果加权求和得到目标样本的分类结果。
54.在模型训练过程中,若要提高模型的准确率,根据结构风险最小化原则,可通过增加样本数据量,或增加模型训练迭代次数来实现。参考图2,模型训练过程中平均损失值会随着训练迭代次数的增加而逐渐减少,模型平均损失值越接近0,模型的性能越优越。但随着迭代训练的进行,模型的拟合速度也在持续降低。例如损失值从最开始的1.5降至0.1需要20000次的模型迭代训练,但从0.1降至0.01需要超过100000次的迭代训练,模型的拟合速度在不断降低。也即,当模型性能较差时,只需要投入少量的训练资源,就可以达到不错的性能提升。但当模型性能已经达到一定高度时,再想提升性能,则需要投入非常大的训练资源,因此模型的准确率无法再得到较大的提升。
55.集成学习(ensemble learning)不是具体的一个单独算法,而是将多个机器学习算法作为子模型,通过组合多个子模型并构建一种投票方式来实现对样本的预测功能。参
考图3,模型1、模型2、模型n等都是参与集成学习的投票的子模型,wi表示第i个子模型的投票权重。待测样本通过各个子模型并得到该子模型的预测结果,子模型对待测样本发起投票表决,集成学习通过结合所有子模块的预测结果与投票权重,确定最终的模型预测结果。集成学习综合各个子模型的优势,将多个弱子模型组合变成强分类模型。
56.示例性的,若集成分类器包括三个子分类模型,若三个子分类模型的准确率相同均为p。当三个子分类模型均预测准确,或三个子分类模型中的两个预测准确时,集成分类器的准确率为
57.参考图4,上方的三个矩阵表示集成分类器的三个子分类模型,每个子分类模型都对测试集的10个样本给出预测结果。其中
‘△’

‘○’
表示样本的实际分类结果,
‘△’
表示实际为正样本,
‘○’
表示实际为负样本。深色区域表示子分类模型预测为正样本的范围,浅色区域表示子分类模型预测为负样本的范围。1号子分类模型对10个待测样本进行预测,其中预测2个样本为正样本,另外8个样本为负样本。最终共有7个样本预测正确,其中5个正样本有2个预测正确,5个负样本全部预测正确。2号子分类模型对10个待测样本进行预测,其中预测8个样本为正样本,另外2个样本为负样本。最终共有7个样本预测正确,其中5个正样本全部预测正确,5个负样本中有2个预测正确。3号子分类模型对10个待测样本进行预测,其中预测4个样本为正样本,另外6个样本为负样本。最终共有7个样本预测正确,其中5个正样本有3个预测正确,5个负样本有4个预测正确。
58.图4中下方的1个矩阵表集成分类器,通过集成学习进行投票并得到10个待测样本的预测结果,其中预测5个样本为正样本,预测另外5个样本为正样本,最终10个待测样本都预测正确。由此可知看出,集成分类器通过组合三个性能一般的子分类模型,以投票的方式得到最终的结果,可有效提高分类识别的准确度。
59.本发明实施例中采用近红外光谱提取目标样本的特征,可做到无接触检测,不破坏样本,成本低、效率高。同时本发明实施例采用集成分类模型进行分类识别,相对于单一模型的性能更优越,克服了单一模型准确率受限,无法继续提升的问题,进一步提高了模型的准确率,有效提高了产品的分类识别准确度。
60.其中,本技术中的目标样本可以为掺杂莜面、掺杂白面、掺杂绿豆面等,上述实施例中的方法适用于各种不同的产品的掺杂检测。
61.在一种可能的实施方式中,在s102之前,上述方法还可以包括:
62.s103:获取各个子分类模型的准确率;
63.s104:根据各个子分类模型的准确率,确定各个子分类模型的投票权重,得到集成分类器。
64.现有技术中,各个子分类模型的权重均相同,各个子分类模型的贡献相同。而本技术中,希望准确率高的模型贡献更大,因此,本技术基于子分类模型的准确率确定各个子模型的投票权重,进一步提高了集成分类器的准确度。
65.在一种可能的实施方式中,s104可以包括:
66.s1041:针对每个子分类模型,根据该子分类模型的准确率确定该子分类模型的模型价值度;
67.s1042:将各个子分类模型的模型价值度相加,得到总的模型价值度;
68.s1043:针对每个子分类模型,将该子分类模型的模型价值度除以总的模型价值
度,得到该子分类模型的投票权重。
69.本发明实施例中分别确定每个子分类模型的模型价值度,进而将各个模型价值度累加,确定各个子分类模型的投票权重,也即投票权重
70.其中,各个子分类模型的投票权重的和为1。
71.在一种可能的实施方式中,s1041可以包括:
72.根据该子分类模型的准确率,结合第一公式计算得到该子分类模型的模型价值度;
73.第一公式可以为:
[0074][0075]
其中,vi为第i个子分类模型对应的模型价值度,k为系数,pi为第i个子分类模型的准确率;i=1,2

,n,n为子分类模型的个数。
[0076]
本发明实施例中将子分类模型的价值度与其准确率设置为指数关系,准确率越高,该子分类模型的价值度越大。参考图5,子分类模型的准确率越接近1,说明子分类模型的性能越优越,其价值度的增加速度越快,充分发挥准确率高的子分类模型的优势,提高了集成分类器的准确度。
[0077]
在一种可能的实施方式中,
[0078]
参考图6,将的k增长梯度设置为0.02π,在k从0.02π增加到5.00π的过程中,k逐渐增大到某一临界值时集成分类器的准确率急剧下降。若k过大,会使得性能最优的子分类模型拥有很大的价值度,而其他子分类模型的价值度很小,集成分类器的性能将无限趋近于该子分类模型的性能,从而无法发挥集成分类器的优势,导致准确率的降低。
[0079]
基于此,参考图6,本发明实施例中将k的值设置为既不会太小影响最优性能的子分类器的优势的发挥,保证了集成分类器的优越性能,又不会因为过大影响集成分类器的准确度。
[0080]
具体的,
[0081]
示例性的,集成分类模型包括四个子分类模型,参考图7,假设四个子分类模型的预测准确率分别为0.7、0.8、0.9、0.8。
[0082]
(1)根据以上公式计算得到各个子分类模型的模型价值度分别为19.86、30.44、46.66、30.44。
[0083]
(2)集成分类模型的总价值度为19.86+30.44+46.66+30.44=127.4。
[0084]
(3)根据各个子分类模型的模型价值度计算各个子分类模型的投票权重,分别为0.1559,0.2389、0.3662、0.2389,总和为1。
[0085]
在一种可能的实施方式中,各个子分类模型的类型可以均不同。
[0086]
本发明实施例中为提高集成分类器的性能,各个子分类模型的类型可以均不同,
发挥不同模型的优势。
[0087]
在一种可能的实施方式中,参考图7,子分类模型的数量可以为4个;
[0088]
4个子分类模型可以分别为:svm模型、knn模型、决策树模型及cnn模型。
[0089]
具体的,模型的种类可根据实际应用需求设置。
[0090]
在一种可能的实施方式中,在s103之前,上述方法还可以包括:
[0091]
s105:采用训练样本集分别对各个初始子分类模型进行训练,得到各个子分类模型;
[0092]
s106:采用测试样本集分别对各个子分类模型进行测试,得到各个子分类模型的准确率。
[0093]
本发明实施例中,可以通过提高训练样本集的数量及迭代次数提高各个子分类器的准确率,从而提高集成分类器的准确率。可通过测试样本集直接测试得到各个子分类模型的准确率。
[0094]
下面结合具体实施例对上述方法进行说明。示例性的,参考图7,集成分类器包括四个子分类器,分别为svm模型、knn模型、决策树模型及cnn模型,
[0095]
目标样本包括纯净莜面样本、莜面掺杂10%浓度土豆淀粉样本、莜面掺杂20%浓度土豆淀粉样本、莜面掺杂30%浓度土豆淀粉样本、莜面掺杂40%浓度土豆淀粉样本、莜面掺杂50%浓度土豆淀粉样本。
[0096]
一、svm模型
[0097]
针对以上样本,采用svm模型进行分类识别,得到svm模型预测结果混淆矩阵数据表,参考表1。
[0098]
纯净莜面样本、莜面掺杂40%浓度土豆淀粉样本、莜面掺杂50%土豆淀粉样本都全部预测正确。在莜面掺杂10%浓度土豆淀粉的20个样本中,有11个样本正确预测为莜面掺杂10%浓度土豆淀粉样本,另外有9个样本被错误预测为纯净莜面样本。在莜面掺杂20%浓度土豆淀粉的18个样本中,只有9个样本正确预测为莜面掺杂20%浓度土豆淀粉样本,另外有3个样本被错误预测为莜面掺杂40%浓度土豆淀粉样本,还有6个样本被错误预测为莜面掺杂50%浓度土豆淀粉样本。在莜面掺杂30%浓度的22个样本中,全部样本都被预测错误,其中有8个样本被错误预测为莜面掺杂10%浓度土豆淀粉样本,还有14个样本被错误预测为莜面掺杂20%浓度土豆淀粉样本。
[0099]
表1svm模型预测结果混淆矩阵数据表
[0100][0101]
由以上数据可以看出,在对纯净莜面、莜面掺杂10%-50%浓度土豆淀粉样本的分类中,svm模型的性能并不好。
[0102]
二、knn模型
[0103]
针对同样的样本,采用knn模型进行分类识别,得到knn模型预测结果混淆矩阵数据表,参考表2。
[0104]
纯净莜面样本、莜面掺杂40%浓度土豆淀粉样本、莜面掺杂50%土豆淀粉样本都被全部预测正确。在莜面掺杂10%浓度土豆淀粉的20个样本中,有19个样本被正确预测为莜面掺杂10%浓度土豆淀粉样本,另外有1个样本被错误预测为纯净莜面样本。在莜面掺杂20%浓度土豆淀粉的18个样本中,有12个样本被正确预测为莜面掺杂20%浓度土豆淀粉样本,还有6个样本被错误预测为莜面掺杂50%浓度土豆淀粉样本。在莜面掺杂30%浓度土豆淀粉的22个样本中,有14个样本被正确预测为莜面掺杂30%浓度土豆淀粉样本,另外有1个样本被错误预测为莜面掺杂10%浓度土豆淀粉样本,还有7个样本被错误预测为莜面掺杂20%浓度土豆淀粉样本。
[0105]
表2knn模型预测结果混淆矩阵数据表
[0106][0107]
由以上数据可以看出,在对纯净莜面、莜面掺杂10%-50%浓度土豆淀粉样本的分类中,knn模型在纯净莜面或莜面掺杂土豆淀粉浓度较高的时候识别能力更强,而在莜面掺杂土豆淀粉浓度较低的时候识别能力略弱一些。
[0108]
三、决策树模型
[0109]
针对同样的样本,采用决策树模型进行分类识别,得到决策树模型预测结果混淆矩阵数据表,参考表3。
[0110]
纯净莜面样本、莜面掺杂30%浓度土豆淀粉样本、莜面掺杂40%土豆淀粉样本都被全部预测正确。在莜面掺杂10%浓度土豆淀粉的20个样本中,有19个样本被正确预测为莜面掺杂10%浓度土豆淀粉样本,有1个样本被错误预测为莜面掺杂20%浓度土豆淀粉样本。在莜面掺杂20%浓度土豆淀粉的18个样本中,有13个样本被正确预测为莜面掺杂20%浓度土豆淀粉样本,另外有4个样本被错误预测为莜面掺杂10%浓度土豆淀粉样本,还有1个样本被错误预测为莜面掺杂30%浓度土豆淀粉样本。在莜面掺杂50%浓度土豆淀粉的18个样本中,有16个样本被正确预测为莜面掺杂50%浓度土豆淀粉样本,另外有1个样本被错误预测为莜面掺杂10%浓度土豆淀粉样本,还有1个样本被错误预测为莜面掺杂40%浓度土豆淀粉样本。
[0111]
表3决策树模型预测结果混淆矩阵数据表
[0112][0113]
由以上数据可以看出,在对纯净莜面、莜面掺杂10%-50%浓度土豆淀粉样本的分类中,决策树模型相对于svm模型和knn模型的分类能力更优越一些。
[0114]
四、cnn模型
[0115]
针对同样的样本,采用cnn模型进行分类识别,得到cnn模型预测结果混淆矩阵数据表,参考表4。
[0116]
表4cnn模型预测结果混淆矩阵数据表
[0117][0118]
纯净莜面样本、莜面掺杂40%浓度土豆淀粉样本、莜面掺杂50%浓度土豆淀粉样本都被全部预测正确。在莜面掺杂10%浓度土豆淀粉的20个样本中,有16个样本被正确预测为莜面掺杂10%浓度土豆淀粉样本,另外有4个样本被错误预测为莜面掺杂30%浓度土豆淀粉样本。在莜面掺杂20%浓度土豆淀粉的18个样本中,只有6个样本被正确预测为莜面掺杂20%浓度土豆淀粉样本,另外有7个被错误预测为莜面掺杂30%浓度土豆淀粉样本,除此之外,还有5个样本被错误预测为莜面掺杂40%浓度土豆淀粉样本。在莜面掺杂30%浓度土豆淀粉的22个样本中,有17个样本被正确预测为莜面掺杂30%浓度土豆淀粉样本,有5个样本被错误预测为莜面掺杂40%浓度土豆淀粉样本。
[0119]
由以上数据可以看出,在对纯净莜面、莜面掺杂10%-50%浓度土豆淀粉样本的分类中,cnn模型在纯净莜面或掺杂土豆淀粉浓度较高的时候识别能力更强,而在掺杂浓度较低的时候识别能力弱一些。
[0120]
五、传统集成分类器
[0121]
利用上述四个模型组成传统集成分类器,各个子分类器的权重相同。针对同样的样本,采用传统集成分类器进行分类识别,得到传统集成分类器预测结果混淆矩阵数据表,参考表5。
[0122]
表5传统集成分类器预测结果混淆矩阵数据表
[0123][0124]
纯净莜面样本、莜面掺杂40%浓度土豆淀粉样本、莜面掺杂50%土豆淀粉样本都被全部预测正确。在莜面掺杂10%浓度土豆淀粉的20个样本中,有19个样本被正确预测为莜面掺杂10%浓度土豆淀粉样本,另外有1个样本被错误预测为纯净莜面样本。在莜面掺杂20%浓度土豆淀粉的18个样本中,有14个样本被正确预测为莜面掺杂20%浓度土豆淀粉样本,还有4个样本被错误预测为莜面掺杂50%浓度土豆淀粉样本。在莜面掺杂30%浓度土豆淀粉的22个样本中,有21个样本被正确预测为莜面掺杂30%浓度土豆淀粉样本,有1个样本被错误预测为莜面掺杂10%浓度土豆淀粉样本。
[0125]
由以上数据可以看出,在对纯净莜面、莜面掺杂10%-50%浓度土豆淀粉样本的分类中,传统集成分类器的性能比起单一的svm模型、knn模型、决策树模型、cnn模型,性能更优越。
[0126]
六、本技术的集成分类器
[0127]
利用上述四个模型组成传统集成分类器,各个子分类模型的权重为针对同样的样本,采用本技术的集成分类器进行分类识别,得到本技术的集成分类器预测结果混淆矩阵数据表,参考表6。
[0128]
纯净莜面样本、莜面掺杂10%浓度土豆淀粉样本、莜面掺杂30%浓度土豆淀粉样本、莜面掺杂40%浓度土豆淀粉样本和莜面掺杂50%土豆淀粉样本都被全部预测正确。在
莜面掺杂20%浓度土豆淀粉的18个样本中,有13个样本被正确预测为莜面掺杂20%浓度土豆淀粉,另外有1个样本被错误预测为莜面掺杂30%浓度土豆淀粉样本,还有4个样本被错误预测为莜面掺杂50%浓度土豆淀粉样本。
[0129]
表6本技术的集成分类器预测结果混淆矩阵数据表
[0130][0131]
由以上数据可以看出,在对纯净莜面、莜面掺杂10%-50%浓度土豆淀粉样本的分类中,本技术提供的集成分类器,相较于上述四类模型及传统集成分类器,性能均更优越。
[0132]
参考图8,对比上述6种模型的测试样本准确率,svm模型(svn)的准确率为64.6%,knn模型(knn)的准确率为86.73%,决策树模型(decision)的准确率为92.92%,cnn模型(cnn)的准确率为81.42%。传统集成分类器(equal-stack)的准确率达到了94.69%,本技术提供的集成分类器(vs1-stack)的准确率达到了95.58%。本技术提供的集成分类器的准确率最高。
[0133]
参考图9,对比上述6类模型的测试样本的精确率,其中svm模型的精确率为54.05%,knn模型的精确率为88.07%,决策树模型的精确率为93.57%,cnn模型的精确率为86.79%。传统集成分类器的精确率达到95.34%,而本技术提供的集成分类器的精确率达到了96.25%。本技术提供的集成分类器的精确率仍然最高。
[0134]
参考图10,对比上述6类模型的测试样本的召回率,其中svm模型的召回率为67.5%,knn模型的召回率为87.55%,决策树模型的召回率为92.69%,cnn模型的召回率为81.77%,传统集成分类器的召回率为94.71%,本技术提供的集成分类器的召回率为95.37%基于召回率,svm模型的性能最差,其次是cnn模型,再者是knn模型,决策树模型召
回率最高。本技术提供的集成分类器的召回率最高,仍然性能最优越。
[0135]
参考图11,对比上述6类模型的测试样本的预测f1值,其中svm模型的f1值为59.76%,knn模型的f1值为86.82%,决策树模型的f1值为92.71%,
[0136]
cnn模型的f1值为80.31%,传统集成分类器的f1值为94.62%,本技术提供的集成分类器的f1值为95.27%。本技术提供的集成分类器的f1值最高,性能最优越。
[0137]
基于以上,得到综合评估表,参考表7。
[0138]
表7各模型综合评估表
[0139]
模型名称精确率准确率召回率f1svm64.60%54.05%67.50%59.76%knn86.73%88.07%87.55%86.82%decision92.92%93.57%92.69%92.71%cnn81.42%86.79%81.77%80.31%equal_stack94.69%95.34%94.71%94.62%vs1_stack95.58%96.25%95.37%95.27%
[0140]
通过准确率、精确率、召回率、f1值四个评估指标对比可知,svm模型的整体性能较差,决策树模型的整体性能较好。两个集成分类器的整体性能均优于四个单一模型,同时本技术提供的集成分类器的整体性能优于传统集成分类器的整体性能。本技术提供的集成分类器相对于单一模型及传统集成分类器,模型的性能得到了极大的提升,应用于产品的分类识别准确率更高。
[0141]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0142]
以下为本发明的装置实施例,对于其中未详尽描述的细节,可以参考上述对应的方法实施例。
[0143]
图12示出了本发明实施例提供的产品的分类识别装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
[0144]
如图12所示,产品的分类识别方法装置包括:
[0145]
特征提取模块21,用于获取目标样本的近红外光谱,并根据近红外光谱提取得到样本特征;
[0146]
分类模型22,用于将样本特征输入集成分类器,得到目标样本的分类结果;
[0147]
其中,集成分类器包括多个子分类模型;集成分类器用于将各个子分类模型的分类结果加权求和得到目标样本的分类结果。
[0148]
在一种可能的实施方式中,上述装置还可以包括:
[0149]
准确率获取模块,用于获取各个子分类模型的准确率;
[0150]
集成分类器建立模块,用于根据各个子分类模型的准确率,确定各个子分类模型的投票权重,得到集成分类器。
[0151]
在一种可能的实施方式中,集成分类器建立模块可以包括:
[0152]
第一价值度确定单元,用于针对每个子分类模型,根据该子分类模型的准确率确定该子分类模型的模型价值度;
[0153]
第二价值度确定单元,用于将各个子分类模型的模型价值度相加,得到总的模型价值度;
[0154]
权重输出单元,用于针对每个子分类模型,将该子分类模型的模型价值度除以总的模型价值度,得到该子分类模型的投票权重。
[0155]
在一种可能的实施方式中,第一价值度确定单元可以具体用于:根据该子分类模型的准确率,结合第一公式计算得到该子分类模型的模型价值度;
[0156]
第一公式可以为:
[0157][0158]
其中,vi为第i个子分类模型对应的模型价值度,k为系数,pi为第i个子分类模型的准确率;i=1,2

,n,n为子分类模型的个数。
[0159]
在一种可能的实施方式中,
[0160]
在一种可能的实施方式中,各个子分类模型的类型均可以不同。
[0161]
在一种可能的实施方式中,子分类模型的数量可以为4个;
[0162]
4个子分类模型分别可以为:svm模型、knn模型、决策树模型及cnn模型。
[0163]
在一种可能的实施方式中,上述装置还可以包括:
[0164]
模型训练模块,用于采用训练样本集分别对各个初始子分类模型进行训练,得到各个子分类模型;
[0165]
准确率输出模块,用于采用测试样本集分别对各个子分类模型进行测试,得到各个子分类模型的准确率。
[0166]
图13是本发明实施例提供的分类终端的示意图。如图13所示,该实施例的分类终端3包括:处理器30和存储器31。存储器31用于存储计算机程序32,处理器30用于调用并运行存储器31中存储的计算机程序32,执行上述各个产品的分类识别方法实施例中的步骤,例如图1所示的步骤s101至s102。或者,处理器30用于调用并运行存储器31中存储的计算机程序32,实现上述各装置实施例中各模块/单元的功能,例如图12所示模块21至22的功能。
[0167]
示例性的,计算机程序32可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器31中,并由处理器30执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序32在分类终端3中的执行过程。例如,计算机程序32可以被分割成图12所示的模块/单元21至22。
[0168]
分类终端3可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。分类终端3可包括,但不仅限于,处理器30、存储器31。本领域技术人员可以理解,图13仅仅是分类终端3的示例,并不构成对分类终端3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如终端还可以包括输入输出设备、网络接入设备、总线等。
[0169]
所称处理器30可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器
等。
[0170]
存储器31可以是分类终端3的内部存储单元,例如分类终端3的硬盘或内存。存储器31也可以是分类终端3的外部存储设备,例如分类终端3上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,存储器31还可以既包括分类终端3的内部存储单元也包括外部存储设备。存储器31用于存储计算机程序以及终端所需的其他程序和数据。存储器31还可以用于暂时地存储已经输出或者将要输出的数据。
[0171]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0172]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0173]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0174]
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0175]
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0176]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0177]
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形
式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、电载波信号、电信信号以及软件分发介质等。
[0178]
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

技术特征:
1.一种产品的分类识别方法,其特征在于,包括:获取目标样本的近红外光谱,并根据所述近红外光谱提取得到样本特征;将所述样本特征输入集成分类器,得到所述目标样本的分类结果;其中,所述集成分类器包括多个子分类模型;所述集成分类器用于将各个子分类模型的分类结果加权求和得到所述目标样本的分类结果。2.根据权利要求1所述的产品的分类识别方法,其特征在于,在所述将所述样本特征输入集成分类器,得到所述目标样本的分类结果之前,所述方法还包括:获取各个子分类模型的准确率;根据各个子分类模型的准确率,确定各个子分类模型的投票权重,得到所述集成分类器。3.根据权利要求2所述的产品的分类识别方法,其特征在于,所述根据各个子分类模型的准确率,确定各个子分类模型的投票权重,包括:针对每个子分类模型,根据该子分类模型的准确率确定该子分类模型的模型价值度;将各个子分类模型的模型价值度相加,得到总的模型价值度;针对每个子分类模型,将该子分类模型的模型价值度除以所述总的模型价值度,得到该子分类模型的投票权重。4.根据权利要求3所述的产品的分类识别方法,其特征在于,所述根据该子分类模型的准确率确定该子分类模型的模型价值度,包括:根据该子分类模型的准确率,结合第一公式计算得到该子分类模型的模型价值度;所述第一公式为:其中,v
i
为第i个子分类模型对应的模型价值度,k为系数,p
i
为第i个子分类模型的准确率;i=1,2

,n,n为所述子分类模型的个数。5.根据权利要求4所述的产品的分类识别方法,其特征在于,6.根据权利要求1至5任一项所述的产品的分类识别方法,其特征在于,各个子分类模型的类型均不同。7.根据权利要求6所述的产品的分类识别方法,其特征在于,所述子分类模型的数量为4个;4个子分类模型分别为:svm模型、knn模型、决策树模型及cnn模型。8.根据权利要求2至5任一项所述的产品的分类识别方法,其特征在于,在获取各个子分类模型的准确率之前,所述方法还包括:采用训练样本集分别对各个初始子分类模型进行训练,得到各个子分类模型;采用测试样本集分别对各个子分类模型进行测试,得到各个子分类模型的准确率。9.一种分类终端,其特征在于,包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,执行如权利要求1至8中任一项所述的产品的分类识别方法。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在
于,所述计算机程序被处理器执行时实现如上的权利要求1至8中任一项所述产品的分类识别方法的步骤。

技术总结
本发明提供一种产品的分类识别方法、分类终端及存储介质。该方法包括:获取目标样本的近红外光谱,并根据近红外光谱提取得到样本特征;将样本特征输入集成分类器,得到目标样本的分类结果;其中,集成分类器包括多个子分类模型;集成分类器用于将各个子分类模型的分类结果加权求和得到目标样本的分类结果。本发明基于近红外光谱建立集成分类模型,相对于单一模型的性能更优越,分类准确度更高,有效提高了产品的分类识别准确度。了产品的分类识别准确度。了产品的分类识别准确度。


技术研发人员:李鸿强 卢海博 武小云 王佐承 葛泰 李子熠 张天宇 张诗欣 冯小东
受保护的技术使用者:河北建筑工程学院
技术研发日:2023.05.16
技术公布日:2023/8/1
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐