一种用于机器学习的图片的获取方法、装置、设备终端和可读存储介质与流程

未命名 10-19 阅读:72 评论:0


1.本发明属于图像处理技术领域,具体涉及一种用于机器学习的图片的获取方法、装置、设备终端和可读存储介质。


背景技术:

2.人体识别在视频监控、视频/图像搜索、人体跟踪等领域具有广泛的应用。在图片中主要的研究为行人识别,目前最有效的行人识别算法是基于深度卷积神经网络的识别算法,但是当现有技术中的图片背景复杂或人群数量较密时,该模型对于人体识别的效果差,远远不能满足人体搜索、人体跟踪等需求,为此还需要对模型进行训练,因此需要提供大量用于模型训练的图片集。一般用于对模型训练的图片要求准确率高,传统采用人工标注,但是人工标注工作效率低,现基于yolo算法代替人工标注,但是该算法的准确度依然达不到训练模型准确度的要求,需要进行人工审核,但是图片数量繁多,特征目标分布广泛,导致人工审核量大且效率低。


技术实现要素:

3.鉴于此,本技术提供一种用于机器学习的图片的获取方法、装置、设备终端和可读存储介质,能够利用人工审核后的图片作为训练图片,根据获取到的准确度信息对比准确度信息阈值,如准确度信息大于准确度信息阈值,待用图片集生成,并存储至服务器;如准确度信息小于准确度信息阈值,则继续训练。本技术方案能够加强模型的人体识别,提高目标图片中人体识别的准确度,从而减少人工审核量,提高人工审核的效率。
4.为实现上述目的,本发明采用以下方案:
5.一种用于机器学习的图片的获取方法,包括:
6.步骤1:获取图片集;
7.步骤2:采用人体识别模型获取图片集中的图片的特征目标的坐标信息;
8.步骤3:采用画框模型,基于坐标信息对图片中的特征目标进行画框标注;
9.步骤4:对标注后的图片进行人工审核,计算机设备获取人工审核后的图片集,所述该图片集为训练图片集;
10.步骤5:基于所述训练图片集对所述人体识别模型进行训练,得到更新的人体识别模型;
11.步骤6:采用更新的人体识别模型获取图片集中的图片的特征目标的准确度信息;
12.步骤7:判断准确度信息是否大于准确度信息阈值,如否,重复步骤二至步骤六;
13.步骤8:根据步骤七中,所述“判断准确度信息是否大于准确度信息阈值”,如是,生成待用图片集,并存储。
14.优选的,步骤四中,所述“对标注后的图片进行审核,计算机设备获取审核后的图片集”包括以下步骤:
15.采用人体识别模型获取图片中特征目标的坐标信息及第一数量信息;
16.采用人群密度检测模型获取图片中特征目标的第二数量信息;
17.根据所述第一数量信息和第二数量信息对图片进行分组,得到至少两个图片子集,并对图片子集进行人工审核,得到审核后的图片集。
18.优选的,所述“根据所述第一数量信息和第二数量信息对图片进行分组”,包括以下步骤:
19.计算所述第一数量信息和所述第二数量信息的偏差值;
20.根据所述偏差值在第一条件约束下,对图片分组。
21.优选的,所述人体识别模型为damoyolo高性能通用模型。
22.优选的,所述画框标签采用javascript-canvas画框标签。
23.优选的,所述人群密度检测模型采用hrnet-crowd-counting模型。
24.本发明还提供一种用于机器学习的图片的获取装置,其特征在于,所述装置包括:
25.图片集获取模块,用于获取图片集;
26.特征目标的坐标信息获取模块,用于基于训练模型获取图片中特征目标的坐标信息;
27.画框标注模块,用于基于坐标信息对图片中的特征目标进行画框标注;
28.训练图片集获取模块,用于对标注后的图片进行人工审核,计算机设备获取人工审核后的图片集,所述该图片集为训练图片集;
29.更新的人体识别模型获取模块,用于基于所述训练图片集对所述人体识别模型进行训练,得到更新的人体识别模型;
30.准确度信息获取模块,用于采用更新的人体识别模型获取图片集中的图片的特征目标的准确度信息;
31.准确度信息判断模块,用于判断准确度信息是否大于准确度信息阈值,如否,重复步骤二至步骤六;
32.图片集存储模块,用于步骤七中,所述“判断准确度信息是否大于准确度信息阈值”,如是,生成待用图片集,并存储。
33.优选的,所述训练图片集获取模块包括:
34.第一数量信息获取单元,用于采用人体识别模型获取图片中特征目标的坐标信息及第一数量信息;
35.第二数量信息获取单元,用于采用人群密度检测模型获取图片中特征目标的第二数量信息;
36.图片分组单元,根据所述第一数量信息和第二数量信息对图片进行分组,得到至少两个图片子集,并对图片子集进行人工审核。
37.本发明还提供一种设备终端,其特征在于,所述设备终端包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述设备终端执行上述中任意一项所述的用于机器学习的图片的获取方法。
38.本发明还提供一种可读存储介质,其特征在于,所述可读存储介质存储有计算机程序,所述计算机程序在被处理器执行上述中任意一项所述的用于机器学习的图片的获取方法。
39.本技术采用的技术方案能够达到以下有益效果:
40.本发明利用人工审核后的图片作为训练图片,根据获取到的准确度信息对比准确度信息阈值,如准确度信息大于准确度信息阈值,待用图片集生成,并存储至服务器;如准确度信息小于准确度信息阈值,则继续训练。本技术方案能够加强模型的人体识别,提高目标图片中人体识别的准确度,从而减少人工审核量,提高人工审核的效率。
附图说明
41.图1为本发明的流程图
具体实施方式
42.为了便于理解本技术,下面将结合附图对本技术进行更全面的描述。并且给出了本技术的较佳实施方式。但是,本技术可以以许多不同的形式来实现,并不限于本文所描述的实施方式。相反地,提供这些实施方式的目的是使对本技术的公开内容理解的更加透彻全面。
43.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中在本技术的说明书中所使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本技术。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
44.请参看图1,本发明提供用于机器学习的图片的获取方法,具体包括以下步骤:
45.步骤1:获取图片集;
46.步骤2:采用人体识别模型获取图片集中的图片的特征目标的坐标信息;
47.步骤3:采用画框模型,基于坐标信息对图片中的特征目标进行画框标注;
48.步骤4:对标注后的图片进行人工审核,计算机设备获取人工审核后的图片集,所述该图片集为训练图片集;
49.步骤5:基于所述训练图片集对所述人体识别模型进行训练,得到更新的人体识别模型;
50.步骤6:采用更新的人体识别模型获取图片集中的图片的特征目标的准确度信息;
51.步骤7:判断准确度信息是否大于准确度信息阈值,如否,重复步骤二至步骤六;
52.步骤8:根据步骤七中,所述“判断准确度信息是否大于准确度信息阈值”,如是,生成待用图片集,并存储。
53.在本实施例中,首先由计算机设备获取图片集,获取后的图片集转换图片格式,服务器接收转换格式后的图片集,通过解码器还原图片后传给训练模型,训练模型获取图片中特征目标的坐标信息;接下来调用画框模型,基于坐标信息对图片中的特征目标进行画框标注处理,标注后的图片用于人工审核,将人工审核后的图片存储至服务器,作为训练图片集,所述训练图片集用于对人体识别模型进行训练,得到更新后的人体识别模型,更新后的人体识别模型获取图片集中的图片的特征目标的准确度信息。设定准确度信息阈值与准确度信息进行对比,如准确度信息大于准确度信息阈值,待用图片集生成,并存储至服务器;如准确度信息小于准确度信息阈值,则重复上述步骤。
54.例如设定准确度信息阈值为θ=9.5,那么基于所述模型得到的准确度信息大于
9.5,则所述训练结束待用图片集生成;如果基于所述模型得到的准确度信息小于9.5,则则重复上述训练步骤。
55.进一步的,步骤四中,所述“对标注后的图片进行审核,计算机设备获取审核后的图片集”包括以下步骤:
56.采用人体识别模型获取图片中特征目标的坐标信息及第一数量信息;
57.采用人群密度检测模型获取图片中特征目标的第二数量信息;
58.根据所述第一数量信息和第二数量信息对图片进行分组,得到至少两个图片子集,并对图片子集进行人工审核,得到审核后的图片集。
59.其中,计算机设备获取图片集,获取后的图片集转换图片格式,服务器接收转换格式后的图片集,通过解码器还原图片后传给damoyolo高性能通用模型,该模型具有高效的网络架构和先进的训练阶段,所述该模型获取到图片集后,通过调参数对图片集进行反复训练以获取准确度信息和图片集特征识别第一数量信息。接下来调用画框模型,所述画框模型最好采用javascript-canvas画框标签,根据图片点位坐标数据,用于对特征目标进行画框标注,标注后的图片集存储至服务器。接下来调用人群密度检测模型,通过对人群密度的检测输出图片中人群数量的总值,由此,可获取到所述第二数量信息。因此,根据所述第一数量信息和第二数量信息对所述图片集进行分组,得到至少两个图片子集,此图片子集由人工审核。
60.进一步的,所述“根据所述第一数量信息和第二数量信息对图片进行分组”,包括以下步骤:
61.计算所述第一数量信息和所述第二数量信息的偏差值;
62.根据所述偏差值在第一条件约束下,对图片分组。
63.其中,在本实施中,为更好的理解本技术方案,提供以下数据具体说明:
64.应用以下公式计算偏差:
[0065][0066]
公式中:x0为偏差、a0为第一数量信息、b0为第二数量信息。
[0067]
例如,当通用人体识别模型输出第一数量信息为15,人体密度监测模型输出第二数量信息为20时,得到第一偏差值x0=0.25;
[0068]
当通用人体识别模型输出第一数量信息为10,人体密度监测模型输出第二数量信息为20时,得到第一偏差值x0=0.5;
[0069]
当通用人体识别模型输出第一数量信息为5,人体密度监测模型输出第二数量信息为20时,得到第一偏差值x0=0.75。
[0070]
例如根据不同偏差值采用第一约束条件,得到以下图片组:
[0071]
当0≤x0<0.5时,落入第一图片组;
[0072]
当0.5≤x0<0.8时,落入第二图片组;
[0073]
当0.8≤x0≤1时,落入第三图片组;
[0074]
综上可知,所述第一数量信息和第二数量信息的偏差值越小,所述图片组中图片的信息越简单,越容易审核;所述第一数量信息和第二数量信息的偏差值越大,所述图片组中图片的信息越复杂,审核难度较高。因此,根据所述第一图片组,第二图片组以及第三图
片组可选择放弃或针对不同专业度的人员进行审核,以提高人工审核效率。
[0075]
进一步的,所述人体识别模型为damoyolo高性能通用模型。
[0076]
其中,在本实施例中,所述damoyolo高性能通用模型建立在卷积神经网络,用于识别图片中的人体位置,能对图片中包含的大部分前景物体进行定位,用于识别图片中的人体位置,用于获取图片中第一数量信息。
[0077]
进一步的,所述画框标签采用javascript-canvas画框标签。
[0078]
在本实施例中,采用javascript-canvas画框标签,根据画框坐标在图片中画出矩形,对异常物品进行标注。
[0079]
进一步的,所述人群密度检测模型采用hrnet-crowd-counting模型。
[0080]
在本实施例中,采用hrnet-crowd-counting模型,给定图片,能够输出图片中人群数量的总值,由此,可获取到所述第二数量信息。
[0081]
本发明还提供一种用于机器学习的图片的获取装置,其特征在于,所述装置包括:
[0082]
图片集获取模块,用于获取图片集;
[0083]
特征目标的坐标信息获取模块,用于基于训练模型获取图片中特征目标的坐标信息;
[0084]
画框标注模块,用于基于坐标信息对图片中的特征目标进行画框标注;
[0085]
训练图片集获取模块,用于对标注后的图片进行人工审核,计算机设备获取人工审核后的图片集,所述该图片集为训练图片集;
[0086]
更新的人体识别模型获取模块,用于基于所述训练图片集对所述人体识别模型进行训练,得到更新的人体识别模型;
[0087]
准确度信息获取模块,用于采用更新的人体识别模型获取图片集中的图片的特征目标的准确度信息;
[0088]
准确度信息判断模块,用于判断准确度信息是否大于准确度信息阈值,如否,重复步骤二至步骤六;
[0089]
图片集存储模块,用于步骤七中,所述“判断准确度信息是否大于准确度信息阈值”,如是,生成待用图片集,并存储。
[0090]
优选的,所述训练图片集获取模块包括:
[0091]
第一数量信息获取单元,用于采用人体识别模型获取图片中特征目标的坐标信息及第一数量信息;
[0092]
第二数量信息获取单元,用于采用人群密度检测模型获取图片中特征目标的第二数量信息;
[0093]
图片分组单元,根据所述第一数量信息和第二数量信息对图片进行分组,得到至少两个图片子集,并对图片子集进行人工审核。
[0094]
在本实施例中,其中,所述用于机器学习的图片的获取装置用于实现上述用于机器学习的图片的获取方法。
[0095]
本发明还提供一种设备终端,所述设备终端包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述设备终端执行上述中任一项所述的用于机器学习的图片的获取方法。
[0096]
本发明还提供一种可读存储介质,所述可读存储介质存储有计算机程序,所述计
算机程序在被处理器执行时实施上述中任一项所述的用于机器学习的图片的获取方法。
[0097]
本发明由于能够利用人工审核后的图片作为训练图片,根据获取到的准确度信息对比准确度信息阈值,如准确度信息大于准确度信息阈值,待用图片集生成,并存储至服务器;如准确度信息小于准确度信息阈值,则继续训练。本技术方案能够加强模型的人体识别,提高目标图片中人体识别的准确度,从而减少人工审核量,提高人工审核的效率。
[0098]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

技术特征:
1.一种用于机器学习的图片的获取方法,其特征在于,包括如下步骤:步骤一:获取图片集;步骤二:采用人体识别模型获取图片集中的图片的特征目标的坐标信息;步骤三:采用画框模型,基于坐标信息对图片中的特征目标进行画框标注;步骤四:对标注后的图片进行人工审核,计算机设备获取人工审核后的图片集,所述该图片集为训练图片集;步骤五:基于所述训练图片集对所述人体识别模型进行训练,得到更新的人体识别模型;步骤六:采用更新的人体识别模型获取图片集中的图片的特征目标的准确度信息;步骤七:判断准确度信息是否大于准确度信息阈值,如否,重复步骤二至步骤六;步骤八:步骤七中,所述“判断准确度信息是否大于准确度信息阈值”,如是,生成待用图片集,并存储。2.根据权利要求1所述的用于机器学习的图片的获取方法,其特征在于,步骤四中,所述“对标注后的图片进行审核,计算机设备获取审核后的图片集”包括以下步骤:采用人体识别模型获取图片中特征目标的坐标信息及第一数量信息;采用人群密度检测模型获取图片中特征目标的第二数量信息;根据所述第一数量信息和第二数量信息对图片进行分组,得到至少两个图片子集,并对图片子集进行人工审核,得到审核后的图片集。3.根据权利要求2所述的用于机器学习的图片的获取方法,其特征在于,所述“根据所述第一数量信息和第二数量信息对图片进行分组”,包括以下步骤:计算所述第一数量信息和所述第二数量信息的偏差值;根据所述偏差值在第一条件约束下,对图片分组。4.根据权利要求2所述的用于机器学习的图片的获取方法,其特征在于,所述人体识别模型为damoyolo高性能通用模型。5.根据权利要求2所述的用于机器学习的图片的获取方法,其特征在于,所述画框标签采用javascript-canvas画框标签。6.根据权利要求2所述的用于机器学习的图片的获取方法,其特征在于,所述人群密度检测模型采用hrnet-crowd-counting模型。7.一种用于机器学习的图片的获取装置,其特征在于,所述该装置包括:图片集获取模块,用于获取图片集;特征目标的坐标信息获取模块,用于基于训练模型获取图片中特征目标的坐标信息;画框标注模块,用于基于坐标信息对图片中的特征目标进行画框标注;训练图片集获取模块,用于对标注后的图片进行人工审核,计算机设备获取人工审核后的图片集,所述该图片集为训练图片集;更新的人体识别模型获取模块,用于基于所述训练图片集对所述人体识别模型进行训练,得到更新的人体识别模型;准确度信息获取模块,用于采用更新的人体识别模型获取图片集中的图片的特征目标的准确度信息;准确度信息判断模块,用于判断准确度信息是否大于准确度信息阈值,如否,重复步骤
二至步骤六;图片集存储模块,用于步骤七中,所述“判断准确度信息是否大于准确度信息阈值”,如是,生成待用图片集,并存储。8.根据权利7所述的用于机器学习的图片的获取装置,其特征在于,所述训练图片集获取模块包括:第一数量信息获取单元,用于采用人体识别模型获取图片中特征目标的坐标信息及第一数量信息;第二数量信息获取单元,用于采用人群密度检测模型获取图片中特征目标的第二数量信息;图片分组单元,根据所述第一数量信息和第二数量信息对图片进行分组,得到至少两个图片子集,并对图片子集进行人工审核。9.一种设备终端,其特征在于,所述设备终端包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述设备终端执行权利要求1至6中任一项所述的用于机器学习的图片的获取方法。10.一种可读存储介质,其特征在于,所述可读存储介质存储有计算机程序,所述计算机程序在被处理器执行时实施权利要求1至6中任一项所述的用于机器学习的图片的获取方法。

技术总结
本申请涉及图像处理技术领域,具体涉及一种用于机器学习的图片的获取方法、装置、设备终端和可读存储介质。本申请由于利用人工审核后的图片作为训练图片,根据获取到的准确度信息对比准确度信息阈值,如准确度信息大于准确度信息阈值,待用图片集生成,并存储至服务器;如准确度信息小于准确度信息阈值,则继续训练。本技术方案能够加强模型的人体识别,提高目标图片中人体识别的准确度,从而减少人工审核量,提高人工审核的效率。提高人工审核的效率。提高人工审核的效率。


技术研发人员:马小雨 杨海波 纳嵘 宋超 马俊峰
受保护的技术使用者:百斯威(宁夏)大数据科技有限公司
技术研发日:2023.05.29
技术公布日:2023/10/15
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐