基于增量学习的模型推理方法及电子设备与流程
未命名
09-24
阅读:55
评论:0
1.本技术涉及人工智能技术领域,尤其涉及一种基于增量学习的模型推理方法及电子设备。
背景技术:
2.当前主流的深度学习会产生灾难性遗忘问题,即深度学习网络对新任务的再次训练会使得网络仅记住了当前任务的知识,而忘记之前任务所学习的内容,使得网络的推理准确性降低。
3.增量学习可以一定程度上解决灾难性遗忘问题,现有的增量学习技术可以分为三个部分:1)基于代表性记忆,2)基于神经元门控,3)限制参数权值的更新方向和大小,然而这些技术都有一定的局限性。例如,在代表性记忆方法中,分类网络的性能受到储存的样本大小的限制;基于神经元门控的方法需要初始一个很大的网络架构,不适合长期的增量学习;参数权值更新方法难以在增量早期提取准确的高阶语义特征。因此,现有技术不能完全解决灾难性遗忘问题,导致模型推理的准确性降低。
技术实现要素:
4.鉴于以上内容,本技术提供一种基于增量学习的模型推理方法及电子设备,其目的在于解决上述技术问题。
5.第一方面,本技术提供一种基于增量学习的模型推理方法,该方法包括:
6.每获取一批训练样本集,分别对每批的训练样本集执行聚类操作,根据聚类结果构建每批训练样本集对应的模板样本库;
7.利用所述每批训练样本集对初始模型进行训练,得到每批训练样本对应的目标模型,其中,所述初始模型包括利用预训练模型的权重对无权重的模型进行初始化后的模型,或者利用上一批训练样本集训练得到的权重对无权重的模型进行初始化后的模型;
8.获取测试样本集,计算所述测试样本集中的每个测试样本与每个所述模板样本库中每个模板样本的相似度值,确定所述相似度值中最大值对应的所述模板样本的目标模板样本库;
9.利用所述目标模板样本库对应的目标模型对所述测试样本集进行推理,得到每个所述测试样本的推理结果。
10.第二方面,本技术提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
11.存储器,用于存放计算机程序;
12.处理器,用于执行存储器上所存放的程序时,实现第一方面任一项实施例所述的基于增量学习的模型推理方法。
13.本技术实施例提供的上述技术方案与现有技术相比具有如下优点:
14.本技术通过每获取一批的训练样本集就执行聚类操作,根据聚类结果构建每批训
练样本集对应的模板样本库,由于相同类别的样本会聚集在同个聚类簇中,构建的模板样本库可以准确表征该批训练样本集特征,利用每批训练样本集对初始模型进行增量学习得到每批训练样本对应的目标模型,由于初始模型包括利用预训练模型的权重对无权重的模型进行初始化后的模型,或者利用上一批训练样本集训练得到的权重对无权重的模型进行初始化后的模型,且每个目标模型是不同批次的训练样本训练得到的,使得目标模型是相互独立的,通过计算测试样本集中的每个测试样本与每个模板样本库的相似度值,可以确定出与测试样本集最相似的目标模板样本库,由于测试样本集与目标模板样本库最相似,且进行推理的目标模型是目标模板样本库对应的训练样本集训练得到的,因此可以解决灾难性遗忘问题,提高了对测试样本集推理的准确性。
附图说明
15.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
16.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
17.图1为本技术基于增量学习的模型推理方法较佳实施例的流程图示意图;
18.图2为本技术基于增量学习的模型推理装置较佳实施例的模块示意图;
19.图3为本技术电子设备较佳实施例的示意图;
20.本技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
21.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本技术,并不用于限定本技术。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
22.需要说明的是,在本技术中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本技术要求的保护范围之内。
23.本技术提供一种基于增量学习的模型推理方法。参照图1所示,为本技术基于增量学习的模型推理方法的实施例的方法流程示意图。该方法可以由一个电子设备执行,该电子设备可以由软件和/或硬件实现。基于增量学习的模型推理方法包括:
24.步骤s10:每获取一批训练样本集,分别对每批的训练样本集执行聚类操作,根据聚类结果构建每批训练样本集对应的模板样本库;
25.步骤s20:利用所述每批训练样本集对初始模型进行训练,得到每批训练样本对应的目标模型,其中,所述初始模型包括利用预训练模型的权重对无权重的模型进行初始化
后的模型,或者利用上一批训练样本集训练得到的权重对无权重的模型进行初始化后的模型;
26.步骤s30:获取测试样本集,计算所述测试样本集中的每个测试样本与每个所述模板样本库中每个模板样本的相似度值,确定所述相似度值中最大值对应的所述模板样本的目标模板样本库;
27.步骤s40:利用所述目标模板样本库对应的目标模型对所述测试样本集进行推理,得到每个所述测试样本的推理结果。
28.本实施例中,样本可以是图像样本数据,例如,应用于安防、化工、加油站等场景的图像识别模型所需要的训练样本。以样本为图像数据为例对本技术的方案进行说明,可以理解的是,本技术的实际应用场景并不仅限于此,样本还可以是文本数据,例如,需要识别出文本所表达的情绪是正面情绪、中性情绪还是负面情绪的文本分类模型所需要的训练样本等。
29.每获取一批已标注样本,已标注样本可以是新增类别的样本,也可以是新场景相同类别的样本,可以理解的是,已标注样本可以是利用自动标注技术标注的样本,也可以是人工手动进行标注的样本。分别对每批的训练样本集执行聚类操作,执行聚类操作可以采用具有噪声的基于密度的聚类方法(density-based spatial clustering of applications with noise,dbscan),该聚类算法不需要预先确定聚类的数量,根据聚类结果构建每批训练样本集对应的模板样本库,假设有n批训练样本集,则可以构建n个模板样本库(模板图像库),例如,对第一批训练样本集执行聚类操作得到k1类的数据,从每个类选取一个样本(一张图像),构成第一批训练样本集对应的模板样本库1;对第二批训练样本集进行聚类,得到k2类的数据,从每个类选取一个样本(一张图像),构成第二批训练样本集对应的模板样本库2,直至构建出第n批训练样本集对应的模板样本库n。
30.dbscan算法是一种基于密度的聚类算法,该算法一般假定类别可以通过样本分布的紧密程度决定。同一类别的样本,他们之间是紧密相连的,也就是说,在该类别任意样本周围不远处一定有同类别的样本存在,通过将紧密相连的样本划为一类,这样就得到了一个聚类类别,通过将所有各组紧密相连的样本划为各个不同的类别,就得到最终的所有聚类类别结果。
31.构建出每批训练样本集对应的模板样本库后,利用每批训练样本集对初始模型进行训练,得到每批训练样本对应的目标模型,其中,初始模型包括利用预训练模型的权重对无权重的模型进行初始化后的模型,或者利用上一批训练样本集训练得到的权重对无权重的模型进行初始化后的模型,例如,若样本为图像样本,无权重的模型可以原始的图像检测模型(即未进行权重初始化的网络模型)。假设有n批训练样本集,可以训练得到n个目标模型,即每一批的训练样本集用于训练不同权重的初始模型,且获取训练样本集是从n批训练样本集中按顺序一批一批获取的。由于每个目标模型是由不同批次的训练样本集训练得到的,目标模型对与相应批次训练样本集相似度较高的测试样本进行推理时,可以提高推理的准确性。由于训练任务的样本批次是有限的,因此n的大小是由训练任务的样本集批次数量决定的。具体地,所述利用所述每批训练样本集对初始模型进行训练,得到每批训练样本对应的目标模型,包括:
32.利用所述预训练模型的权重对所述初始模型的权重进行初始化,并用获取的第一
批训练样本集对所述初始模型进行训练,得到所述第一批训练样本集对应的第一目标模型;
33.利用所述第一目标模型的权重对所述初始模型的权重进行初始化,并用获取的第二批训练样本集对所述初始模型进行训练,得到所述第二批训练样本集对应的第二目标模型,直至所述每批训练样本集均已参与训练,得到所述每批训练样本对应的目标模型。
34.初始模型可以是原始的无权重参数的图像检测模型,利用预训练模型的权重对图像检测模型的权重进行初始化,并用获取的第一批训练样本集对图像检测模型进行训练,得到第一批训练样本集对应的第一目标模型,记为图像检测模型1;
35.利用图像检测模型1的权重对图像检测模型的权重进行初始化,并用获取的第二批训练样本集对图像检测模型进行训练,得到第二批训练样本集对应的第二目标模型,记为图像检测模型2;
36.利用图像检测模型2的权重对图像检测模型的权重进行初始化,并用获取的第三批训练样本集对图像检测模型进行训练,得到第三批训练样本集对应的第三目标模型,记为图像检测模型3;
37.以此类推,利用图像检测模型n-1的权重对图像检测模型的权重进行初始化,并用获取的第n批训练样本集对图像检测模型进行训练,得到图像检测模型n,即直至第n批训练样本集均已参与训练,从而得到每批训练样本对应的目标模型。将图像检测模型n-1的权重对图像检测模型的权重进行初始化,可以在训练时加快图像检测模型的收敛速度以及防止过拟合。
38.得到每批训练样本对应的目标模型后,利用目标模型对测试样本集(测试图像集)进行推理。先计算测试样本集中的每个测试样本与每个模板样本库的相似度值,相似度值可以是结构相似度(structure similarity index measure,ssim)值,确定相似度值中最大值对应的目标模板样本库。例如,假设模板图像库1中有三张模板图像,计算出测试图像1与模板图像库1中三张模板图像的结构相似度值,并计算3个结构相似度值的最大值,将该最大值作为测试图像1与模板图像库1的相似度值,从而得到每张测试图像与每个模板图像库的相似度值,之后将相似度值中最大值对应的模板图像库作为目标模板图像库。
39.确定出目标模板样本库后,利用目标模板样本库对应的目标模型对测试样本集进行推理,得到每个测试样本的推理结果。具体地,利用所述目标模板样本库对应的目标模型对所述测试样本集进行推理,包括:
40.确定所述目标模板样本库对应的目标训练样本集,将所述目标训练样本集对应的目标模型作为所述目标模板样本库对应的目标模型;
41.利用所述目标模板样本库对应的目标模型对所述测试样本集进行推理。
42.由于目标模板样本库是由某一批次的训练样本集进行聚类操作后构建的,因此可以确定出目标模板样本库所对应的训练样本集(记为目标训练样本集),由于每批训练样本集均参与了模型训练,因此可以确定出目标训练样本集所训练的目标模型,例如,目标模板样本库为模板图像库3,则目标训练样本集为第三批训练样本集,模板图像库3对应的目标模型为图像检测模型3,利用图像检测模型3对测试样本集进行推理。由于每批次的训练样本集训练出的目标模型是相互独立的,通过计算测试样本与与每个模板样本库的相似度值,确定相似度值中最大值对应的目标模板样本库所对应的模型进行推理,可以从多个目
标模型中,选择场景最相似的目标模型对测试样本进行推理。
43.在一个实施例中,在每获取一批训练样本集之前,所述方法还包括:
44.获取原始训练样本集;
45.对所述原始训练样本集进行预处理操作;
46.将预处理后的原始训练样本集根据预设规则划分为多批训练样本集。
47.预处理操作包括上采样变换、亮度均衡处理及仿射变换中的至少一种操作,原始训练样本集是指未经预处理操作的训练样本集,以样本为图像样本数据为例,若原始训练样本集的图像比较模糊,可以对图像进行上采样变换,补充图像的信息,使图像变得更加适用于模型的识别。对于模型而言,光照会影响识别的效果,如果图像的某部分区域被强光照射或存在反光等现象,这样的待识别区域的图片就不利于识别出准确的结果,因此还可以对图像进行亮度均衡处理,通过仿射变换对图像进行旋转、平移、缩放等操作以达到数据增强的效果。将处理后的原始样本集根据预设比例随机划分为多批训练样本集,例如,划分为10个批次的训练样本集。也可以将处理后的原始样本集按照样本的获取时间的先后顺序进行划分,或者将处理后的原始样本集根据样本的所占内存空间的大小进行划分。
48.在一个实施例中,所述分别对每批的训练样本集执行聚类操作,根据聚类结果构建每批训练样本集对应的模板样本库,包括:
49.设置同一批所述训练样本集中每个训练样本之间的密度半径及所述密度半径内训练样本的最小数量;
50.基于所述密度半径及所述最小数量,从同一批所述训练样本集中迭代计算,得到核心训练样本、密度可达的训练样本以及边缘训练样本;
51.将得到的所述核心训练样本、所述密度可达的训练样本以及所述边缘训练样本聚集成至少一个聚类簇,得到同一批所述训练样本集的聚类结果;
52.分别从所述聚类结果的每个所述聚类簇中随机选取一个训练样本,根据选取的训练样本构建同一批所述训练样本集对应的模板样本库。
53.首先设置每个训练样本之间密度半径,及密度半径内最小的训练样本的数量,基于密度半径及最小的训练样本的数量,从该批训练样本集中迭代计算得到核心训练样本、密度可达的训练样本以及边缘训练样本,将得到的核心训练样本、密度可达的训练样本以及边缘训练样本聚集成聚类簇,密度聚类为较成熟的技术,在此不再赘述。通过对每批训练样本集进行聚类,使得相似类别的样本会聚集在同个聚类簇中,从而可以得到每批训练样本集中不同类别的样本分布情况。由于同一批训练样本集的聚类结果中,相同类别的样本会聚集在同个聚类簇中,从每个聚类簇中随机选取一个训练样本构建的模板样本库可以更准确地表征该批训练样本集的样本特征,例如,假设第一批训练样本集有三个聚类簇,从每个聚类簇中随机选取一个训练样本,将选取的三个训练样本构建模板样本库1。
54.在一个实施例中,所述计算所述测试样本集中的每个测试样本与每个所述模板样本库中每个模板样本的相似度值,确定所述相似度值中最大值对应的所述模板样本的目标模板样本库,包括:
55.分别计算每个所述测试样本与每个所述模板样本库中每个模板样本的相似度值;
56.确定每个所述测试样本与每个所述模板样本库中模板样本的最大相似度值;
57.将所述最大相似度值中最大值对应的模板样本库作为所述目标模板样本库。
58.假设模板样本库1(模板图像库1)中有三张模板图像,计算出测试样本1(测试图像1)与模板图像库1中三张模板图像的ssim值,得到3个ssim值,将3个ssim值中的最大值作为测试图像1与模板图像库1的ssim值。从每个模板图像库中分别取出最大的ssim值,可以得到n个键值对《模板图像库,ssim值》,对这n个ssim值进行降序排列,确定出ssim值中最大值的对应的模板图像库编号,之后将该模板图像库作为目标模板图像库。例如,若《模板图像库1,0.8》、《模板图像库2,0.83》、《模板图像库3,0.89》,则将模板图像库3作为目标模板图像库,若《模板图像库1,0.8》、《模板图像库2,0.9》、《模板图像库3,0.9》,则将模板图像库2和模板图像库3作为目标模板图像库。从而可以确定出每个测试样本最相似的模板样本库。
59.在一个实施例中,所述利用所述目标模板样本库对应的目标模型对所述测试样本集进行推理,包括:
60.若所述目标模板样本库对应的目标模型为两个以上的目标模型,分别利用所述两个以上的目标模型对所述测试样本集进行推理;
61.计算所述两个以上的目标模型输出结果的置信度平均值,根据所述置信度平均值确定每个所述测试样本的推理结果。
62.如果目标模板样本库对应的目标模型为一个,则直接利用该目标模型对测试样本集进行推理。如果目标模板样本库对应的目标模型为两个以上,即确定出两个以上的目标模板图像库,例如,目标模板样本库对应的目标模型分别是图像检测模型2和图像检测模型3,则分别利用图像检测模型2和图像检测模型3对测试样本1进行推理,计算图像检测模型2和目标模型3输出结果的置信度,并对两个置信度取平均值得到置信度平均值,根据置信度平均值确定测试样本1的推理结果。
63.在一个实施例中,所述两个以上的目标模型均为图像检测模型,所述分别利用所述两个以上的目标模型对所述测试样本集进行推理,包括:
64.对所述图像检测模型输出结果中的矩形框执行非极大值抑制操作,得到每个所述测试样本的目标矩形框。
65.如果目标模板样本库对应的目标模型为两个以上,即确定出两个以上的目标模板图像库,例如,目标模板样本库对应的目标模型分别是图像检测模型2和图像检测模型3,则分别利用图像检测模型2和图像检测模型3对测试样本1进行推理,对图像检测模型2和图像检测模型3输出结果中的矩形框执行非极大值抑制操作(non-maximum suppression,nms),得到测试样本1的目标矩形框。
66.在一个实施例中,在利用所述目标模板样本库对应的目标模型对所述测试样本集进行推理,得到每个所述测试样本的推理结果之后,所述方法还包括:
67.a1、判断所述测试样本的推理结果与预先配置的所述测试样本的标签是否相同;
68.a2、若否,将所述推理结果对应的目标模型的权重对所述初始模型进行初始化;
69.a3、随机获取一批训练样本集对所述初始模型进行训练,得到更新权重后的目标模型;
70.a4、利用所述更新权重后的目标模型对所述测试样本进行推理,得到所述测试样本的推理结果;
71.a5、重复执行上述步骤a1至a4,直至所述测试样本的推理结果与预先配置的所述测试样本的标签相同。
72.例如,图像检测模型3对测试样本a进行推理,判断测试样本a的推理结果与测试样本a预先标注的标签是否相同,若相同,说明图像检测模型3的推理结果准确。若不同,说明推理结果与预期不符,将图像检测模型3的权重对初始模型进行初始化,再随机获取一批训练样本集对权重初始化后的初始模型进行训练,得到更新权重后的图像检测模型3,利用更新权重后的图像检测模型3对测试样本a进行推理,得到测试样本a的推理结果,再判断测试样本a的推理结果与预先配置的测试样本的标签是否相同,直至测试样本的推理结果与预先配置的测试样本的标签相同。
73.参照图2所示,为本技术基于增量学习的模型推理装置100的功能模块示意图。
74.本技术所述基于增量学习的模型推理装置100可以安装于电子设备中。根据实现的功能,所述基于增量学习的模型推理装置100可以包括聚类模块110、训练模块120、计算模块130及推理模块140。本技术所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
75.在本实施例中,关于各模块/单元的功能如下:
76.聚类模块110:用于每获取一批训练样本集,分别对每批的训练样本集执行聚类操作,根据聚类结果构建每批训练样本集对应的模板样本库;
77.训练模块120:用于利用所述每批训练样本集对初始模型进行训练,得到每批训练样本对应的目标模型,其中,所述初始模型包括利用预训练模型的权重对无权重的模型进行初始化后的模型,或者利用上一批训练样本集训练得到的权重对无权重的模型进行初始化后的模型;
78.计算模块130:用于获取测试样本集,计算所述测试样本集中的每个测试样本与每个所述模板样本库中每个模板样本的相似度值,确定所述相似度值中最大值对应的所述模板样本的目标模板样本库;
79.推理模块140:用于利用所述目标模板样本库对应的目标模型对所述测试样本集进行推理,得到所述测试样本集的推理结果。
80.在一个实施例中,所述分别对每批的训练样本集执行聚类操作,包括:
81.设置同一批所述训练样本集中每个训练样本之间的密度半径及所述密度半径内训练样本的最小数量;
82.基于所述密度半径及所述最小数量,从同一批所述训练样本集中迭代计算,得到核心训练样本、密度可达的训练样本以及边缘训练样本;
83.将得到的所述核心训练样本、所述密度可达的训练样本以及所述边缘训练样本聚集成至少一个聚类簇,得到同一批所述训练样本集的聚类结果;
84.分别从所述聚类结果的每个所述聚类簇中随机选取一个训练样本,根据选取的训练样本构建同一批所述训练样本集对应的模板样本库。
85.在一个实施例中,基于增量学习的模型推理装置还包括划分模块,划分模块用于:
86.获取原始训练样本集;
87.对所述原始训练样本集进行预处理操作;
88.将预处理后的原始训练样本集根据预设规则划分为多批训练样本集。
89.在一个实施例中,所述利用所述每批训练样本集对初始模型进行训练,得到每批
训练样本对应的目标模型,包括:
90.利用所述预训练模型的权重对所述初始模型的权重进行初始化,并用获取的第一批训练样本集对所述初始模型进行训练,得到所述第一批训练样本集对应的第一目标模型;
91.利用所述第一目标模型的权重对所述初始模型的权重进行初始化,并用获取的第二批训练样本集对所述初始模型进行训练,得到所述第二批训练样本集对应的第二目标模型,直至所述每批训练样本集均已参与训练,得到所述每批训练样本对应的目标模型。
92.在一个实施例中,所述计算所述测试样本集中的每个测试样本与每个所述模板样本库中每个模板样本的相似度值,确定所述相似度值中最大值对应的所述模板样本的目标模板样本库,包括:
93.分别计算每个所述测试样本与每个所述模板样本库中每个模板样本的相似度值;
94.确定每个所述测试样本与每个所述模板样本库中模板样本的最大相似度值;
95.将所述最大相似度值中最大值对应的模板样本库作为所述目标模板样本库。
96.在一个实施例中,利用所述目标模板样本库对应的目标模型对所述测试样本集进行推理,包括:
97.确定所述目标模板样本库对应的目标训练样本集,将所述目标训练样本集对应的目标模型作为所述目标模板样本库对应的目标模型;
98.利用所述目标模板样本库对应的目标模型对所述测试样本集进行推理。
99.在一个实施例中,所述利用所述目标模板样本库对应的目标模型对所述测试样本集进行推理,包括:
100.若所述目标模板样本库对应的目标模型为两个以上的目标模型,分别利用所述两个以上的目标模型对所述测试样本集进行推理;
101.计算所述两个以上的目标模型输出结果的置信度平均值,根据所述置信度平均值确定每个所述测试样本的推理结果。
102.在一个实施例中,所述两个以上的目标模型均为图像检测模型,所述分别利用所述两个以上的目标模型对所述测试样本集进行推理,包括:
103.对所述图像检测模型输出结果中的矩形框执行非极大值抑制操作,得到每个所述测试样本的目标矩形框。
104.在一个实施例中,推理模块140还用于:
105.判断所述测试样本的推理结果与预先配置的所述测试样本的标签是否相同;
106.若否,将所述推理结果对应的目标模型的权重对所述初始模型进行初始化;
107.随机获取一批训练样本集对所述初始模型进行训练,得到更新权重后的目标模型;
108.利用所述更新权重后的目标模型对所述测试样本进行推理,得到所述测试样本的推理结果;
109.重复执行上述步骤,直至所述测试样本的推理结果与预先配置的所述测试样本的标签相同。
110.参照图3所示,为本技术电子设备1较佳实施例的示意图。
111.该电子设备1包括但不限于:存储器11、处理器12、显示器13及通信接口14。所述电
子设备1可以通过通信接口14连接网络。其中,所述网络可以是企业内部网(intranet)、互联网(internet)、全球移动通讯系统(global system of mobile communication,gsm)、宽带码分多址(wideband code division multiple access,wcdma)、4g网络、5g网络、蓝牙(bluetooth)、wi-fi、通话网络等无线或有线网络。
112.其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器11可以是所述电子设备1的内部存储单元,例如该电子设备1的硬盘或内存。在另一些实施例中,所述存储器11也可以是所述电子设备1的外部存储设备,例如该电子设备1配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。当然,所述存储器11还可以既包括所述电子设备1的内部存储单元也包括其外部存储设备。本实施例中,存储器11通常用于存储安装于所述电子设备1的操作系统和各类计算机程序,例如基于增量学习的模型推理程序10的程序代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
113.处理器12在一些实施例中可以是中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子设备1的总体操作,例如执行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行基于增量学习的模型推理程序10的程序代码等。
114.显示器13可以称为显示屏或显示单元。在一些实施例中显示器13可以是led显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(organic light-emitting diode,oled)触摸器等。显示器13用于显示在电子设备1中处理的信息以及用于显示可视化的工作界面。
115.通信接口14可选地可以包括标准的有线接口、无线接口(如wi-fi接口),该通信接口14通常用于在所述电子设备1与其它电子设备之间建立通信连接。
116.图3仅示出了具有组件11-14以及基于增量学习的模型推理程序10的电子设备1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
117.在上述实施例中,处理器12执行存储器11中存储的基于增量学习的模型推理程序10时可以实现如下步骤:
118.每获取一批训练样本集,分别对每批的训练样本集执行聚类操作,根据聚类结果构建每批训练样本集对应的模板样本库;
119.利用所述每批训练样本集对初始模型进行训练,得到每批训练样本对应的目标模型,其中,所述初始模型包括利用预训练模型的权重对无权重的模型进行初始化后的模型,或者利用上一批训练样本集训练得到的权重对无权重的模型进行初始化后的模型;
120.获取测试样本集,计算所述测试样本集中的每个测试样本与每个所述模板样本库中每个模板样本的相似度值,确定所述相似度值中最大值对应的所述模板样本的目标模板样本库;
121.利用所述目标模板样本库对应的目标模型对所述测试样本集进行推理,得到每个
所述测试样本的推理结果。
122.所述存储设备可以为电子设备1的存储器11,也可以为与电子设备1通讯连接的其它存储设备。
123.关于上述步骤的详细介绍,请参照上述图2关于基于增量学习的模型推理装置100实施例的功能模块图以及图1关于基于增量学习的模型推理方法实施例的流程图的说明。
124.此外,本技术实施例还提出一种计算机可读存储介质,所述计算机可读存储介质可以是非易失性的,也可以是易失性的。该计算机可读存储介质可以是硬盘、多媒体卡、sd卡、闪存卡、smc、只读存储器(rom)、可擦除可编程只读存储器(eprom)、便携式紧致盘只读存储器(cd-rom)、usb存储器等等中的任意一种或者几种的任意组合。所述计算机可读存储介质中包括存储数据区和存储程序区,存储程序区存储有基于增量学习的模型推理程序10,所述基于增量学习的模型推理程序10被处理器执行时实现如下操作:
125.每获取一批训练样本集,分别对每批的训练样本集执行聚类操作,根据聚类结果构建每批训练样本集对应的模板样本库;
126.利用所述每批训练样本集对初始模型进行训练,得到每批训练样本对应的目标模型,其中,所述初始模型包括利用预训练模型的权重对无权重的模型进行初始化后的模型,或者利用上一批训练样本集训练得到的权重对无权重的模型进行初始化后的模型;
127.获取测试样本集,计算所述测试样本集中的每个测试样本与每个所述模板样本库中每个模板样本的相似度值,确定所述相似度值中最大值对应的所述模板样本的目标模板样本库;
128.利用所述目标模板样本库对应的目标模型对所述测试样本集进行推理,得到每个所述测试样本的推理结果。
129.本技术之计算机可读存储介质的具体实施方式与上述基于增量学习的模型推理方法的具体实施方式大致相同,在此不再赘述。
130.需要说明的是,上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
131.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件仿真平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,电子装置,或者网络设备等)执行本技术各个实施例所述的方法。
132.以上仅为本技术的优选实施例,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。
技术特征:
1.一种基于增量学习的模型推理方法,其特征在于,所述方法包括:每获取一批训练样本集,分别对每批的训练样本集执行聚类操作,根据聚类结果构建每批训练样本集对应的模板样本库;利用所述每批训练样本集对初始模型进行训练,得到每批训练样本对应的目标模型,其中,所述初始模型包括利用预训练模型的权重对无权重的模型进行初始化后的模型,或者利用上一批训练样本集训练得到的权重对无权重的模型进行初始化后的模型;获取测试样本集,计算所述测试样本集中的每个测试样本与每个所述模板样本库中每个模板样本的相似度值,确定所述相似度值中最大值对应的所述模板样本的目标模板样本库;利用所述目标模板样本库对应的目标模型对所述测试样本集进行推理,得到每个所述测试样本的推理结果。2.如权利要求1所述的基于增量学习的模型推理方法,其特征在于,所述分别对每批的训练样本集执行聚类操作,根据聚类结果构建每批训练样本集对应的模板样本库,包括:设置同一批所述训练样本集中每个训练样本之间的密度半径及所述密度半径内训练样本的最小数量;基于所述密度半径及所述最小数量,从同一批所述训练样本集中迭代计算,得到核心训练样本、密度可达的训练样本以及边缘训练样本;将得到的所述核心训练样本、所述密度可达的训练样本以及所述边缘训练样本聚集成至少一个聚类簇,得到同一批所述训练样本集的聚类结果;分别从所述聚类结果的每个所述聚类簇中随机选取一个训练样本,根据选取的训练样本构建同一批所述训练样本集对应的模板样本库。3.如权利要求1所述的基于增量学习的模型推理方法,其特征在于,在每获取一批训练样本集之前,所述方法还包括:获取原始训练样本集;对所述原始训练样本集进行预处理操作;将预处理后的原始训练样本集根据预设规则划分为多批训练样本集。4.如权利要求1所述的基于增量学习的模型推理方法,其特征在于,所述利用所述每批训练样本集对初始模型进行训练,得到每批训练样本对应的目标模型,包括:利用所述预训练模型的权重对所述初始模型的权重进行初始化,并用获取的第一批训练样本集对所述初始模型进行训练,得到所述第一批训练样本集对应的第一目标模型;利用所述第一目标模型的权重对所述初始模型的权重进行初始化,并用获取的第二批训练样本集对所述初始模型进行训练,得到所述第二批训练样本集对应的第二目标模型,直至所述每批训练样本集均已参与训练,得到所述每批训练样本对应的目标模型。5.如权利要求1所述的基于增量学习的模型推理方法,其特征在于,所述计算所述测试样本集中的每个测试样本与每个所述模板样本库中每个模板样本的相似度值,确定所述相似度值中最大值对应的所述模板样本的目标模板样本库,包括:分别计算每个所述测试样本与每个所述模板样本库中每个模板样本的相似度值;确定每个所述测试样本与每个所述模板样本库中模板样本的最大相似度值;将所述最大相似度值中最大值对应的模板样本库作为所述目标模板样本库。
6.如权利要求1所述的基于增量学习的模型推理方法,其特征在于,所述利用所述目标模板样本库对应的目标模型对所述测试样本集进行推理,包括:确定所述目标模板样本库对应的目标训练样本集,将所述目标训练样本集对应的目标模型作为所述目标模板样本库对应的目标模型;利用所述目标模板样本库对应的目标模型对所述测试样本集进行推理。7.如权利要求6所述的基于增量学习的模型推理方法,其特征在于,所述利用所述目标模板样本库对应的目标模型对所述测试样本集进行推理,包括:若所述目标模板样本库对应的目标模型为两个以上的目标模型,分别利用所述两个以上的目标模型对所述测试样本集进行推理;计算所述两个以上的目标模型输出结果的置信度平均值,根据所述置信度平均值确定每个所述测试样本的推理结果。8.如权利要求7所述的基于增量学习的模型推理方法,其特征在于,所述两个以上的目标模型均为图像检测模型,所述分别利用所述两个以上的目标模型对所述测试样本集进行推理,包括:对所述图像检测模型输出结果中的矩形框执行非极大值抑制操作,得到每个所述测试样本的目标矩形框。9.如权利要求1所述的基于增量学习的模型推理方法,其特征在于,在利用所述目标模板样本库对应的目标模型对所述测试样本集进行推理,得到每个所述测试样本的推理结果之后,所述方法还包括:a1、判断所述测试样本的推理结果与预先配置的所述测试样本的预设标签是否相同;a2、若否,将所述推理结果对应的目标模型的权重对所述初始模型进行初始化;a3、随机获取一批训练样本集对所述初始模型进行训练,得到更新权重后的目标模型;a4、利用所述更新权重后的目标模型对所述测试样本进行推理,得到所述测试样本的推理结果;a5、重复执行上述步骤a1至a4,直至所述测试样本的推理结果与预先配置的所述测试样本的标签相同。10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现权利要求1至9中任一项所述的基于增量学习的模型推理方法。
技术总结
本申请涉及一种基于增量学习的模型推理方法及电子设备。所述方法包括:每获取一批训练样本集,分别对每批的训练样本集执行聚类操作,根据聚类结果构建每批训练样本集对应的模板样本库,利用每批训练样本集对初始模型进行训练,得到每批训练样本对应的目标模型,获取测试样本集,计算所述测试样本集中的每个测试样本与每个所述模板样本库中每个模板样本的相似度值,确定所述相似度值中最大值对应的所述模板样本的目标模板样本库,利用目标模板样本库对应的目标模型对测试样本集进行推理,得到每个测试样本的推理结果。本申请可以防止出现灾难性遗忘的问题,提高对测试样本集推理的准确性。准确性。准确性。
技术研发人员:赵景程 熊超 牛昕宇
受保护的技术使用者:深圳鲲云信息科技有限公司
技术研发日:2023.03.23
技术公布日:2023/9/22
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/