目标检测模型的训练样本的获取及训练方法、装置及设备与流程

未命名 10-26 阅读:76 评论:0


1.本发明涉及人工智能技术领域,尤其涉及一种目标检测模型的训练样本的获取及训练方法、装置及设备。


背景技术:

2.随着人工智能技术的大力发展,工程质检等生产场景广泛应用目标检测能力。目标检测模型在开发中往往存在两种极端情况:采集样本偏少,需要使用数据增强方法;采集样本过多,需要去掉冗余数据样本以提高标注效率。另外,目标检测模型在部署投入到生产环境后,为了持续地提高模型识别精度,需要从每天处理的数据中自动地提取模型优化的数据。
3.目前,对于数据样本的优化主要采用数据增强技术,即从图像集中选取图像数据进行旋转、亮度/对比度等处理,产生新的样本数据。为了确保数据增强的输出与原始数据有区别,使用生成对抗网络方法进行核验,然而处理过程复杂性导致效率降低,并且对增强输出的数据样本的有效性也缺乏评估,从而模型泛化能力较低,影响模型优化的效率。


技术实现要素:

4.本发明提供一种目标检测模型的训练样本的获取及训练方法、装置及设备,用以解决现有技术中数据样本的有效性缺乏评估的缺陷,实现选择合理、有效的数据样本进行模型训练,提升模型泛化能力,提高模型优化的效率。
5.本发明提供一种目标检测模型的训练样本的获取方法,包括:
6.利用目标检测模型对指定生产场景的未标注数据样本进行目标检测,获取目标检测结果;
7.对所述目标检测结果进行不确定性评估,以获取所述目标检测结果的不确定信息量;
8.依据所述不确定信息量确定所述未标注数据样本是否作为优化所述目标检测模型的训练样本。
9.根据本发明提供的一种目标检测模型的训练样本的获取方法,所述不确定信息量包括分类不确定度和位置不确定度,所述分类不确定度用于表征目标对象的分类的不确定性,所述位置不确定度用于表征所述目标对象在图像中的位置的不确定性。
10.根据本发明提供的一种目标检测模型的训练样本的获取方法,获取所述位置不确定度的步骤包括:
11.将所述目标检测结果中的位置检测结果输入至高斯混合模型,获取所述高斯混合模型的模型参数;
12.利用评分函数对所述模型参数进行评分,获取评分结果,以基于所述评分结果确定所述位置不确定度。
13.根据本发明提供的一种目标检测模型的训练样本的获取方法,
14.所述高斯混合模型的模型参数包括高斯混合模型的均值、方差及权重系数,所述评分函数的公式为:
[0015][0016]
其中,x表示未标注数据样本中的目标对象,v(x)表示所述高斯混合模型的方差,u(x)表示所述高斯混合模型的均值,k表示高斯分布的个数,a(x)表示所述高斯混合模型的权重系数。
[0017]
本发明还提供一种目标检测模型的训练方法,包括:
[0018]
根据指定生产场景的未标注数据样本的不确定信息量选择至少部分所述未标注数据样本作为训练数据,其中,所述不确定信息量为基于目标检测结果进行不确定性评估得到的,所述目标检测结果为利用目标检测模型对所述未标注数据样本进行目标检测得到的;
[0019]
利用标注后的所述训练样本训练所述目标检测模型。
[0020]
本发明还提供一种目标检测模型的训练样本的获取装置,包括:
[0021]
第一获取模块,用于利用目标检测模型对指定生产场景的未标注数据样本进行目标检测,获取目标检测结果;
[0022]
第二获取模块,用于对所述目标检测结果进行不确定性评估,获取所述目标检测结果的不确定信息量;
[0023]
确定模块,用于依据所述不确定信息量用于确定所述未标注数据样本是否作为优化所述目标检测模型的训练样本。
[0024]
本发明还提供一种目标检测模型的训练装置,包括:
[0025]
选择模块,用于根据指定生产场景的未标注数据样本的不确定信息量选择至少部分所述未标注数据样本作为训练数据;
[0026]
其中,所述不确定信息量为基于目标检测结果进行不确定性评估得到的,所述目标检测结果为利用目标检测模型对所述未标注数据样本进行目标检测得到的;
[0027]
训练模块,用于利用标注后的所述训练样本训练所述目标检测模型。
[0028]
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述目标检测模型的训练样本的获取方法或者所述目标检测模型的训练方法。
[0029]
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述目标检测模型的训练样本的获取方法或者所述目标检测模型的训练方法。
[0030]
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述目标检测模型的训练样本的获取方法或者所述目标检测模型的训练方法。
[0031]
本发明提供的一种目标检测模型的训练样本的获取及训练方法、装置及设备,通过目标检测模型对指定生产场景的未标注数据样本进行目标检测,得到的目标检测结果进行不确定性评估,得到每个目标检测结果的不确定信息量,基于不确定信息量确定未标注
数据样本中哪些数据可以作为目标检测模型的训练样本,这些训练数据进行标注后可以提供目标检测模型进行训练,从而向目标检测模型提供了有效的训练样本,提高目标检测模型的泛化能力,具有更高的检测精度,同时提高了标注效率和模型优化效率。在数据样本过多的场景中,可以通过本发明的方法获取训练样本,对未标注数据样本进行筛选,获取更有效、能提高目标检测模型泛化能力的训练样本。
附图说明
[0032]
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0033]
图1是本发明提供的目标检测模型的训练样本的获取方法的流程示意图;
[0034]
图2是本发明提供的目标检测模型的训练方法的流程示意图;
[0035]
图3是本发明提供的目标检测模型的训练样本的获取及训练方法的流程示意图之一;
[0036]
图4是本发明提供的目标检测模型的训练样本的获取及训练方法的流程示意图之二;
[0037]
图5是本发明提供的目标检测模型的训练样本的获取装置的结构示意图;
[0038]
图6是本发明提供的目标检测模型的训练装置的结构示意图;
[0039]
图7是本发明提供的电子设备的结构示意图。
具体实施方式
[0040]
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0041]
需要说明的是,在本发明实施例的描述中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0042]
此外,“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0043]
下面结合图1-图4描述本发明的目标检测模型的训练样本的获取方法以及目标检测模型的训练方法。
[0044]
图1为本发明提供的一种目标检测模型的训练样本的获取方法的流程示意图。如图1所示,该方法包括:
[0045]
步骤110,利用目标检测模型对指定生产场景的未标注数据样本进行目标检测,获取目标检测结果。
[0046]
具体地,目标检测模型可以是已有的用于检测指定生产场景的目标检测模型,至少可以是初始的目标检测模型。指定生产场景可以是各种领域的生产场景,目标检测模型则是用于对这些生产场景中的生产数据进行目标检测,例如对无线基站的天线的检测、对人体肺部结节异常的检测等等。那么,未标注数据样本则是从指定生产场景中收集的生产数据。如上述例子中的天线图像、临床肺部医学影像等等。利用目标检测模型对这些未标注数据样本进行目标检测,可以得到目标检测结果。目标检测结果可以包括未标注数据样本中目标对象的分类和位置,根据当前目标检测模型的检测能力,目标检测结果中每个图像包括至少一个目标对象,每个目标对象包括至少一个分类和至少一个位置。
[0047]
在一个实施例中,所述目标检测模型可以是以ssd模型为框架构建的模型。在另一个实施例中,所述目标检测模型可以是以yolo模型为框架构建的模型。在一个例子中,所述目标检测模型可以是以yolov5模型为框架构建的模型。
[0048]
步骤120,对所述目标检测结果进行不确定性评估,获取所述目标检测结果的不确定信息量。
[0049]
具体地,所述不确定信息量可以包括分类不确定度和位置不确定度,其中,所述分类不确定度用于表征目标对象的分类的不确定性,所述位置不确定度用于表征所述目标对象在图像中的位置的不确定性。不确定信息量融合了目标对象的分类不确定度和位置不确定度两个信息,分别计算分类不确定度和位置不确定度即可获取不确定信息量。
[0050]
在一个实施例中,目标检测结果包括分类检测结果和位置检测结果,具体地,分类检测结果可以包括目标对象的分类信息、每个分类信息对应的概率等。位置检测结果可以包括目标对象在图像中的包围框的坐标、宽度、长度以及对应的概率等信息。
[0051]
在一个实施例中,获取所述分类不确定度的步骤包括:对所述目标检测结果中的分类检测结果进行平均值或者熵值计算,获取计算结果,以基于所述计算结果确定所述所述分类不确定度。
[0052]
在一个实施例中,可以利用位置检测结果获取概率分布参数,根据概率分布参数计算目标对象的位置不确定度。具体地,概率分布包括但不限于高斯混合模型、均匀分布、指数分布等。
[0053]
下面主要以高斯混合模型为例,描述如何获取位置不确定度。
[0054]
在一个实施例中,获取所述位置不确定度的步骤包括:将所述目标检测结果中的位置检测结果输入至高斯混合模型,获取所述高斯混合模型的模型参数;利用评分函数对所述模型参数进行评分,获取评分结果,以基于所述评分结果确定所述位置不确定度。
[0055]
具体地,位置检测结果可以包括目标对象在图像中的包围框的坐标、宽度、长度等信息。针对图像二维的特点,可以采用二维高斯混合模型(gmm模型)计算基于目标对象的位置的概率密度分布,将所述目标检测结果中的位置检测结果输入高斯混合模型,从而根据位置检测结果学习出高斯混合模型的模型参数。高斯混合模型的概率密度函数的具体公式如下:
[0056][0057]
其中,x表示未标注数据样本中的目标对象,k表示高斯分布的个数(未标注数据样
本的个数),d为数据的维度数目,t为矩阵转置运算,u为高斯混合模型的均值,v为高斯混合模型的方差,ak为多个高斯分布的权重系数。
[0058]
可以利用em算法(expectation-maximization algorithm,最大期望算法)获取到高斯混合模型的模型参数:均值(u
x
,uy,uw,uh)、方差(v
x
,vy,vw,vh)和权重系数(a
x
,ay,aw,ah),其中,x,y分别表示未标注数据样本(图像)中目标对象的包围框的横坐标、纵坐标,w,h分别表示目标对象的包围框的宽度、长度。
[0059]
利用高斯混合模型的模型参数,可以对图像中每个目标对象的位置不确定性进行打分,评分函数可以对图像中每个目标对象输出一个值来表示该目标对象的位置不确定度,评分结果即为目标对象的不确定度。需要理解的是,位置不确定度的大小实际上反映了数据依赖于模型和参数的不确定度,因此,目标对象的位置不确定度与高斯混合模型的均值、方差、权重系数有关。具体地,评分函数的计算公式如下:
[0060][0061]
其中,sp为目标对象的位置不确定度,v(x)为基于目标对象位置概率密度分布的高斯混合模型的方差,u(x)为基于目标对象位置概率密度分布的高斯混合模型的均值,k表示高斯分布的个数,a(x)为基于目标对象位置概率密度分布的高斯混合模型的权重系数。
[0062]
融合目标对象的分类不确定度和位置不确定度,即可得到不确定信息量:
[0063]
s=sp+sp
[0064]
其中,s为目标对象的不确定信息量,sp为目标对象的位置不确定度,sc为目标对象的分类不确定度。
[0065]
步骤130,依据所述不确定信息量确定所述未标注数据样本是否作为优化所述目标检测模型的训练样本。
[0066]
具体地,在进行目标检测模型的训练之前,可以根据未标注数据样本的不确定信息量确定是否具有代表性的能够优化目标检测模型的训练样本。
[0067]
在一个实施例中,在所述利用目标检测模型对指定生产场景的未标注数据样本进行目标检测的步骤之前,还包括:对所述未标注数据样本进行数据增强处理。
[0068]
具体地,当收集到的未标注数据样本的数量较少时,可以通过对原始的未标注数据样本进行数据增强处理,生成新的未标注数据样本再对新的未标注数据样本进行目标检测及不确定性评估。数据增强后的未标注数据样本,其通过目标检测和不确定性评估后的不确定信息量可以有所改变,因此,可以从新的未标注数据样本再进行筛选,补充训练样本。
[0069]
需要理解的是,在获取未标注数据样本的不确定信息量之后,可以根据不确定信息量来筛选至少部分未标注数据样本作为目标检测模型的训练样本。
[0070]
通过目标检测模型对指定生产场景的未标注数据样本进行目标检测,得到的目标检测结果进行不确定性评估,得到每个目标检测结果的不确定信息量,基于不确定信息量确定未标注数据样本中哪些数据可以作为目标检测模型的训练样本,这些训练数据进行标注后可以提供目标检测模型进行训练,从而向目标检测模型提供了有效的训练样本,提高目标检测模型的泛化能力,具有更高的检测精度,同时提高了标注效率和模型优化效率。尤
其是在具体的持续生产过程中,会产生大量新的数据样本,利用本发明的方法可以完成数据样本的优化,能够选择合理的具有代表性的数据样本投入到目标检测模型的训练。
[0071]
在数据样本过多的场景中,可以通过本发明的方法获取训练样本,对未标注数据样本进行筛选,获取更有效、能提高目标检测模型泛化能力的训练样本,例如在生产过程中,新的数据样本大量出现,及时地选择合理的数据样本能够提高后续模型优化的效率;在数据样本不足的场景中,可以对原始未标注数据样本进行数据增强处理,获取新的未标注数据样本,并可以根据新的未标注数据样本的不确定信息量确定是否作为训练样本,从而解决数据样本不足的问题,增加数据样本,且不需要重新收集其他未标注数据样本。也就是说,本发明的目标检测模型的训练样本的获取方法同时适用于数据样本过多和数据样本不足的场景。
[0072]
图2为本发明提供的一种目标检测模型的训练方法的流程示意图。如图2所示,该方法包括:
[0073]
步骤210,根据指定生产场景的未标注数据样本的不确定信息量选择至少部分所述未标注数据样本作为训练样本,其中,所述不确定信息量为基于目标检测结果进行不确定性评估得到的,所述目标检测结果为利用目标检测模型对所述未标注数据样本进行目标检测得到的。
[0074]
具体地,可以根据不确定信息量来筛选至少部分未标注数据样本作为目标检测模型的训练样本。
[0075]
在一个实施例中,可以按照不确定信息量的数值大小对未标注数据样本进行排序,将不确定信息量满足预设阈值的未标注数据样本确定为训练样本。
[0076]
在一个实施例中,可以按照不确定信息量的数值大小对未标注数据样本进行排序,将满足预设数量的未标注数据样本确定为训练样本。例如,从不确定信息量从大到小的排序中,选择前1000张图像作为训练样本。可以理解的是,1000张的数量只是距离,具体预设数量的数值可以按照目标检测模型的规模、训练工作的需求等因素设定,本发明不作具体的限定。
[0077]
在一个实施例中,也可以按照不确定信息量的数值大小对未标注数据样本进行排序,将满足预设阈值和预设数量的未标注数据样本确定为训练样本。
[0078]
可以理解的是,不确定信息量的数值越低,则表示其通过目标检测模型进行目标检测已可达到较精准的分类、定位。不确定信息量的数值越大,表示数据样本中目标对象的不确定性越高,这些数据样本往往更具有代表性,采用这些样本数据作为训练样本,有利于目标检测模型进行训练,提高泛化能力。
[0079]
在一个实施例中,如果按照预设阈值或者预设数量筛选出的未标注数据样本的数量未达到训练需求数量,则可以对原始的未标注数据样本进行数据增强处理,生成新的未标注数据样本再对新的未标注数据样本进行目标检测及不确定性评估,再根据不确定信息量从新的未标注数据样本中筛选出新的训练样本。
[0080]
步骤220,利用标注后的所述训练样本训练所述目标检测模型。
[0081]
具体地,对筛选后的未标注数据样本进行标注,成为待训练的训练样本。在一个实施例中,可以通过人工对训练样本进行标注工作。在另一个实施例中,可以通过电子设备完成对训练样本的标注工作。
[0082]
可以理解,通过不确定信息量筛选出训练样本再进行标注,有效提高了标注效率。
[0083]
需要理解的是,如上文所述,目标检测模型可以是已有的用于检测指定生产场景的目标检测模型,至少可以是初始的目标检测模型。
[0084]
在一个实施例中,所述目标检测模型可以是以ssd模型为框架构建的模型。在另一个实施例中,所述目标检测模型可以是以yolo模型为框架构建的模型。在一个例子中,所述目标检测模型可以是以yolov5模型为框架构建的模型。
[0085]
在一个实施例中,获取初始的目标检测模型的步骤包括:利用指定生产场景已有的标注数据样本对目标检测模型框架进行训练,获取初始的目标检测模型。这样,使得初始的目标检测模型具有一定的检测指定生产场景生产数据的能力,从而加快指定生产场景的目标检测模型的初始部署。
[0086]
下面通过两个具体生产场景的应用对本发明的目标检测模型的训练样本的获取及训练方法进行详细描述。
[0087]
图3是本发明提供的目标检测模型的训练样本的获取及训练方法的流程示意图之一。本实施例是以移动通讯无线基站的天线检测为例进行说明,在本实施例中,需要识别基站已安装的不同种类的天线,如4g天线、5g天线、gps天线等。
[0088]
本实施例分三个阶段:初始模型训练、数据收集和优化、模型在训练。
[0089]
初始模型训练:使用公开的第一天线图像进行标注,使用标注后的第一天线图像对yolov5模型进行训练,得到初始目标检测模型。
[0090]
数据收集和优化:为了识别新安装的5g天线,可以收集不同供应商已安装在铁塔的天线的第二天线图像(假如有5000张),由于安装的地点、拍摄角度的不同,可以收集到大量的第二天线图像作为未标注数据样本,使用初始目标检测模型进行目标检测,根据目标检测结果进行不确定性评估,获取每张第二天线图像对应的不确定信息量。
[0091]
模型再训练:按照不确定信息量的数值从大到小对第二天线图像进行排序,选择前1000张第二天线图像进行标注,作为训练样本,利用这1000张标注好的第二天线图像对初始目标检测模型进行训练,从而可以得到满足识别5g天线精度的目标检测模型。
[0092]
图4是本发明提供的目标检测模型的训练样本的获取及训练方法的流程示意图之二。本实施例是以人体肺部结节异常检测为例进行说明,在本实施例中,需要识别医学影像中特别形态的肺部结节,行业内已有公开的人体肺部结节异常检测模型。
[0093]
本实施例分两个阶段:数据收集和优化、模型再训练。
[0094]
数据收集和优化:收集临床肺部医学影像,利用已有的人体肺部结节异常检测模型对临床肺部医学影像进行目标检测,根据目标检测结果进行不确定性评估,获取每张临床肺部医学影像对应的不确定信息量。
[0095]
模型再训练:按照不确定信息量的数值从大到小对临床肺部医学影像进行排序,选择不确定信息大于预设阈值的临床肺部医学影像加入到待标注数据集中,如果待标注数据的数量还不满足训练的预设数量,则对原始的临床肺部医学影像进行数据增强处理(如对识别的目标对象进行旋转、位置偏移、修改对比度等),从而获得新的临床肺部医学影像,再对新的临床肺部医学影像进行目标检测和不确定性评估,根据不确定信息量在进行排序,筛选满足预设阈值的新的临床肺部医学影像加入到待标注数据集中,直到待标注数据集中的临床肺部医学影像满足预设数量。对待标注数据集中的临床肺部医学影像进行标
注,作为训练样本,利用这些标注好的临床肺部医学影像对已有的人体肺部结节异常检测模型进行再训练,从而可以得到满足临床使用的人体肺部结节异常检测模型。
[0096]
从上述两个实施例可以得出,本发明提供的目标模型的数据优化及训练方法,可以应用于目标检测模型构建初期的训练中,也可以应用于目标检测模型后续的训练中。
[0097]
下面对本发明提供的目标检测模型的训练样本的获取装置进行描述,下文描述的目标检测模型的训练样本的获取装置与上文描述的目标检测模型的训练样本的获取方法可相互对应参照。
[0098]
图5为本发明提供的一种目标检测模型的训练样本的获取装置的结构示意图。如图5所示,该目标检测模型的训练样本的获取装置,包括:
[0099]
第一获取模块510,用于利用目标检测模型对指定生产场景的未标注数据样本进行目标检测,获取目标检测结果;
[0100]
第二获取模块520,用于对所述目标检测结果进行不确定性评估,以获取所述目标检测结果的不确定信息量;
[0101]
确定模块530,用于依据所述不确定信息量用于确定所述未标注数据样本是否作为优化所述目标检测模型的训练样本。
[0102]
下面对本发明提供的目标检测模型的训练装置进行描述,下文描述的目标检测模型的训练装置与上文描述的目标检测模型的训练方法可相互对应参照。
[0103]
图6为本发明提供的一种目标检测模型的训练装置的结构示意图。如图6所示,该目标检测模型的训练装置,包括:
[0104]
选择模块610,用于根据指定生产场景的未标注数据样本的不确定信息量选择至少部分所述未标注数据样本作为训练样本;
[0105]
其中,所述不确定信息量为基于目标检测结果进行不确定性评估得到的,所述目标检测结果为利用目标检测模型对所述未标注数据样本进行目标检测得到的;
[0106]
训练模块620,用于利用标注后的所述训练样本训练所述目标检测模型。
[0107]
可以理解的是,目标检测模型的训练样本的获取装置和目标检测模型的训练装置可以是两个独立的装置,也可以是一个集成装置中的两个装置。
[0108]
图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(communications interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行目标检测模型的训练样本的获取方法,该方法包括:利用目标检测模型对指定生产场景的未标注数据样本进行目标检测,获取目标检测结果;对所述目标检测结果进行不确定性评估,获取所述目标检测结果的不确定信息量;依据所述不确定信息量用于确定所述未标注数据样本是否作为优化所述目标检测模型的训练样本;和/或,
[0109]
以执行目标检测模型的训练方法,该方法包括:根据指定生产场景的未标注数据样本的不确定信息量选择至少部分所述未标注数据样本作为训练样本;其中,所述不确定信息量为基于目标检测结果进行不确定性评估得到的,所述目标检测结果为利用目标检测模型对所述未标注数据样本进行目标检测得到的;利用标注后的所述训练样本训练所述目标检测模型。
[0110]
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0111]
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的目标检测模型的训练样本的获取方法,该方法包括:利用目标检测模型对指定生产场景的未标注数据样本进行目标检测,获取目标检测结果;对所述目标检测结果进行不确定性评估,获取所述目标检测结果的不确定信息量;依据所述不确定信息量用于确定所述未标注数据样本是否作为优化所述目标检测模型的训练样本;和/或,
[0112]
能够执行上述所提供的目标检测模型的训练方法,该方法包括:根据指定生产场景的未标注数据样本的不确定信息量选择至少部分所述未标注数据样本作为训练样本;其中,所述不确定信息量为基于目标检测结果进行不确定性评估得到的,所述目标检测结果为利用目标检测模型对所述未标注数据样本进行目标检测得到的;利用标注后的所述训练样本训练所述目标检测模型。
[0113]
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的目标检测模型的训练样本的获取方法,该方法包括:利用目标检测模型对指定生产场景的未标注数据样本进行目标检测,获取目标检测结果;对所述目标检测结果进行不确定性评估,获取所述目标检测结果的不确定信息量;依据所述不确定信息量用于确定所述未标注数据样本是否作为优化所述目标检测模型的训练样本;和/或,
[0114]
能够执行上述所提供的目标检测模型的训练方法,该方法包括:根据指定生产场景的未标注数据样本的不确定信息量选择至少部分所述未标注数据样本作为训练样本;其中,所述不确定信息量为基于目标检测结果进行不确定性评估得到的,所述目标检测结果为利用目标检测模型对所述未标注数据样本进行目标检测得到的;利用标注后的所述训练样本训练所述目标检测模型。
[0115]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0116]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该
计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0117]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术特征:
1.一种目标检测模型的训练样本的获取方法,其特征在于,包括:利用目标检测模型对指定生产场景的未标注数据样本进行目标检测,获取目标检测结果;对所述目标检测结果进行不确定性评估,获取所述目标检测结果的不确定信息量;依据所述不确定信息量确定所述未标注数据样本是否作为优化所述目标检测模型的训练样本。2.根据权利要求1所述的目标检测模型的训练样本的获取方法,其特征在于,所述不确定信息量包括分类不确定度和位置不确定度,所述分类不确定度用于表征目标对象的分类的不确定性,所述位置不确定度用于表征所述目标对象在图像中的位置的不确定性。3.根据权利要求2所述的目标检测模型的训练样本的获取方法,其特征在于,获取所述位置不确定度的步骤包括:将所述目标检测结果中的位置检测结果输入至高斯混合模型,获取所述高斯混合模型的模型参数;利用评分函数对所述模型参数进行评分,获取评分结果,以基于所述评分结果确定所述位置不确定度。4.根据权利要求3所述的目标检测模型的训练样本的获取方法,其特征在于,所述高斯混合模型的模型参数包括高斯混合模型的均值、方差及权重系数,所述评分函数的公式为:其中,x表示未标注数据样本中的目标对象,v(x)表示所述高斯混合模型的方差,u(x)表示所述高斯混合模型的均值,k表示高斯分布的个数,a(x)表示所述高斯混合模型的权重系数。5.一种目标检测模型的训练方法,其特征在于,包括:根据指定生产场景的未标注数据样本的不确定信息量选择至少部分所述未标注数据样本作为训练样本;其中,所述不确定信息量为基于目标检测结果进行不确定性评估得到的,所述目标检测结果为利用目标检测模型对所述未标注数据样本进行目标检测得到的;利用标注后的所述训练样本训练所述目标检测模型。6.一种目标检测模型的训练样本的获取装置,其特征在于,包括:第一获取模块,用于利用目标检测模型对指定生产场景的未标注数据样本进行目标检测,获取目标检测结果;第二获取模块,用于对所述目标检测结果进行不确定性评估,获取所述目标检测结果的不确定信息量;确定模块,用于依据所述不确定信息量确定所述未标注数据样本是否作为优化所述目标检测模型的训练样本。7.一种目标检测模型的训练装置,其特征在于,包括:选择模块,用于根据指定生产场景的未标注数据样本的不确定信息量选择至少部分所述未标注数据样本作为训练样本;
其中,所述不确定信息量为基于目标检测结果进行不确定性评估得到的,所述目标检测结果为利用目标检测模型对所述未标注数据样本进行目标检测得到的;训练模块,用于利用标注后的所述训练样本训练所述目标检测模型。8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述目标检测模型的训练样本的获取方法或者所述目标检测模型的训练方法。9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述目标检测模型的训练样本的获取方法或者所述目标检测模型的训练方法。10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述目标检测模型的训练样本的获取方法或者所述目标检测模型的训练方法。

技术总结
本发明提供一种目标检测模型的训练样本的获取及训练方法、装置及设备,包括:利用目标检测模型对指定生产场景的未标注数据样本进行目标检测,获取目标检测结果;对目标检测结果进行不确定性评估,获取目标检测结果的不确定信息量;依据不确定信息量确定未标注数据样本是否作为优化目标检测模型的训练样本。根据不确定信息量选择至少部分未标注数据样本作为训练样本;利用标注后的训练样本训练目标检测模型。通过目标检测结果进行不确定性评估,基于不确定信息量确定哪些数据可以作为训练数据,这些训练数据进行标注后提供目标检测模型进行训练,提供了有效的训练数据,提高目标检测模型的泛化能力,同时提高标注效率和模型优化效率。优化效率。优化效率。


技术研发人员:张志鹏 马文婷 郝源 袁晓航 罗亚丹 柴鑫刚 何应腾 陈嘉敏 魏捷 喻朝新 答嘉曦 陈金悬 唐弘毅 汪啸林 崔金刚 李飞彬 连丽娜
受保护的技术使用者:中国移动粤港澳大湾区(广东)创新研究院有限公司 中国移动通信有限公司研究院 中国移动通信集团有限公司
技术研发日:2022.11.23
技术公布日:2023/10/20
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐