一种图像识别方法、装置和设备与流程
未命名
10-21
阅读:54
评论:0
1.本技术涉及图像识别技术领域,尤其涉及一种图像识别方法、装置和设备。
背景技术:
2.随着深度学习技术的发展,计算机视觉随之逐步发展,图像识别技术作为计算机视觉的重要部分,在安防监控、医疗诊断、自动驾驶、工业质检等领域均有广泛的应用。
3.传统的图像识别算法一般是基于分类器的思想来实现图像识别的,其在进行图像识别时,由于图像中常常出现物体与背景在外观、颜色甚至纹理上极为相似的情况,这种相似性使得传统的图像识别算法在区分物体与背景时显得捉襟见肘,准确性较差。
技术实现要素:
4.有鉴于此,本技术提供一种图像识别方法、装置和设备,用以提高图像识别的准确性。
5.具体地,本技术是通过如下技术方案实现的:
6.本技术第一方面提供一种图像识别方法,所述方法包括:
7.对待识别图像进行背景识别,得到所述待识别图像的背景信息;
8.从所述待识别图像中检测目标物体类别所对应的目标物体,得到所述待识别图像的检测结果;
9.根据所述检测结果,确定是否为所述待识别图像添加物体属性信息;
10.若否,将所述背景信息作为所述待识别图像的识别结果;
11.若是,根据所述检测结果确定所述待识别图像的物体属性信息,并将所述背景信息和所述物体属性信息的组合作为所述待识别图像的识别结果。
12.本技术第二方面提供一种图像识别装置,所述装置包括识别模块、检测模块、确定模块和处理模块;其中,
13.所述识别模块,用于对待识别图像进行背景识别,得到所述待识别图像的背景信息;
14.所述检测模块,用于从所述待识别图像中检测目标物体类别所对应的目标物体,得到所述待识别图像的检测结果;
15.所述确定模块,用于根据所述检测结果,确定是否为所述待识别图像添加物体属性信息;
16.所述处理模块,用于在所述确定模块确定不为所述待识别图像添加物体属性信息时,将所述背景信息作为所述待识别图像的识别结果;
17.所述处理模块,还用于在所述确定模块确定为所述待识别图像添加物体属性信息时,根据所述检测结果确定所述待识别图像的物体属性信息,并将所述背景信息和所述物体属性信息的组合作为所述待识别图像的识别结果。
18.本技术第三方面提供一种图像识别设备,包括存储器、处理器及存储在所述存储
器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本技术第一方面提供的任一项所述方法的步骤。
19.本技术第四方面提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本技术第一方面提供的任一项所述方法的步骤。
20.本技术提供的图像识别方法、装置和设备,通过对待识别图像进行背景识别,得到待识别图像的背景信息,并从待识别图像中检测目标物体类别所对应的目标物体,得到待识别图像的检测结果,进而根据检测结果,确定是否为待识别图像添加物体属性信息,并在确定不为待识别图像添加物体属性信息时,将背景信息作为待识别图像的识别结果,而在确定为待识别图像添加物体属性信息时,根据检测结果确定待识别图像的物体属性信息,并将背景信息和物体属性信息的组合作为待识别图像的识别结果。这样,在对待识别图像进行识别时,从背景识别和目标检测两个维度进行识别,由于识别维度较多,且是从背景识别和目标检测两个维度进行识别,这样,可以将图像中的背景和物体区分出来,可以提高识别的准确率,进而使得识别结果能够更准确、更全面的、更丰富的表达待识别图像。
附图说明
21.图1为本技术提供的图像识别方法实施例一的流程图;
22.图2为本技术提供的图像识别方法实施例二的流程图;
23.图3为本技术提供的图像识别方法实施例三的流程图;
24.图4为本技术图像识别装置所在图像识别设备的一种硬件结构图;
25.图5为本技术提供的图像识别装置的结构示意图。
具体实施方式
26.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
27.在本技术使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本技术。在本技术和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
28.应当理解,尽管在本技术可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本技术范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
29.本技术提供一种图像识别方法、装置和设备,用以提高图像识别的准确性。
30.本技术提供的图像识别方法、装置和设备,通过对待识别图像进行背景识别,得到待识别图像的背景信息,并从待识别图像中检测目标物体类别所对应的目标物体,得到待识别图像的检测结果,进而根据检测结果,确定是否为待识别图像添加物体属性信息,并在
确定不为待识别图像添加物体属性信息时,将背景信息作为待识别图像的识别结果,而在确定为待识别图像添加物体属性信息时,根据检测结果确定待识别图像的物体属性信息,并将背景信息和物体属性信息的组合作为待识别图像的识别结果。这样,在对待识别图像进行识别时,从背景识别和目标检测两个维度进行识别,由于识别维度较多,且是从背景识别和目标检测两个维度来识别的,这样,可以将图像中的背景和物体区分出来,可以提高识别的准确率,进而使得识别结果能够更准确、更全面的、更丰富的表达待识别图像。
31.下面给出具体的实施例,用以详细介绍本技术的技术方案。
32.图1为本技术提供的图像识别方法实施例一的流程图。请参照图1,本实施例提供的方法,可以包括:
33.s101、对待识别图像进行背景识别,得到所述待识别图像的背景信息。
34.具体的,背景信息用于表征待识别图像所处的环境或场景。例如,在识别出某个待识别图像的背景信息为大面积路面时,可以认为该待识别图像所处的环境或场景为室外。再例如,在识别出另一个待识别图像的背景信息为大面积白色时,可以认为该待识别图像所处的环境或场景为室内。
35.优选的,在本技术一可能的实现方式中,可以使用预先训练好的背景识别模型来对待识别图像进行背景识别,以获取该待识别图像的背景信息。
36.具体实现时,可以将待识别图像输入到预先训练好的背景识别模型,以由背景识别模型对待识别图像进行特征提取,得到待识别图像的特征向量,并根据特征向量确定待识别图像属于各个预设背景类别的置信度,并将置信度最大的目标预设背景类别确定为待识别图像的背景信息。
37.需要说明的是,待识别图像的特征向量可以用来表征待识别图像的背景特征,预先训练好的背景识别模型可基于待识别图像的特征向量,得到待识别图像属于各个预设背景类别的置信度。
38.具体的,预设背景类别所包含的具体类别是根据实际需要设定的,本实施例中,不对预设背景类别所包含的具体类别进行限定。例如,在一种可能的实现方式中,预设背景类别所包含的具体类别可以包括:室内、室外。再例如,另一可能的实现方式中,预设背景类别所包含的具体类别可以包括:天空、马路、大海。再例如,在再一可能的实现方式中,预设背景类别所包含的具体类别可以包括:大面积路面、大面积墙体、大面积白色。下面以“预设背景类别所包含的具体类别包括室内和室外为例”进行说明。
39.进一步地,待识别图像属于某个预设背景类别的置信度用于表征待识别图像属于该预设背景类别的概率,置信度越大,表示待识别图像属于该预设背景类别的概率就越大。需要说明的是,将待识别图像输入到预先训练好的背景识别模型后,背景识别模型将输出其属于各个预设背景类别的置信度,进而选取置信度最大的预设背景类别作为待识别图像的背景信息。
40.需要说明的是,参见前面的描述,可以理解的是,背景识别模型为一个基于分类器思想所实现的模型。其可以是一个独立的模型,也可以是与目标检测模型集成在一起的模型,本实施例中,不对此进行限定。
41.结合上面的例子,例如,针对待识别图像1,对其进行背景识别时,背景识别模型确定其属于室内的置信度为80%、其属于室外的置信度为20%,此时,确定该待识别图像的背
景信息为室内。
42.s102、从所述待识别图像中检测目标物体类别所对应的目标物体,得到所述待识别图像的检测结果。
43.具体的,目标物体类别所包含的具体类别是根据实际需要预先设定的,本实施例中,不对目标物体类别所包含的具体类别进行限定。例如,一实施例中,针对草原场景,目标物体类别所包含的具体类别可以包括牛、青草、树木、河流和石块。再例如,另一实施例中,针对室内安检场景,目标物体类别所包含的具体类别可以包括刀具、斧头和打火机。下面以“目标物体类别所包含的具体类别包括刀具、斧头和打火机”为例进行说明。
44.具体实现时,可以基于预先训练好的目标检测模型对待识别图像进行目标检测,以识别该待识别图像是否包含目标物体。
45.需要说明的是,目标检测模型可以是基于物体检测思路所实现的模型,其主要用于检测图像中出现的各目标物体。此外,检测结果采用动态方式,检测到待识别图像中有几个目标物体就返回几个目标物体,若待识别图像中没有目标物体,则返回结果为空。
46.参见前面的描述,换言之,对待识别图像进行目标检测时,若其中不存在目标物体,此时,其对应的检测结果为空;进一步的,若其中存在至少一个目标物体,其对应的检测结果可以包括其包含的至少一个目标物体、以及各个目标物体的位置信息及置信度。
47.结合上面的例子,例如,在目标物体类别为“刀具、斧头和打火机”时,本步骤中,就从待识别图像中检测“刀具、斧头和打火机”,得到该待识别图像的检测结果。此时,例如,在一种可能的实现方式中,若待识别图像1中仅包含一个充电宝,此时,待识别图像1的检测结果为空。进一步的,再例如,在另一种可能的实现方式中,若待识别图像2中包含一把刀和一个手机,此时,该待识别图像2的检测结果为:(刀、位置信息、置信度)。再例如,在再一实施例中,若待识别图像3中包含一把刀、一个打火机、一个充电宝和一个手机,此时,该待识别图像3的检测结果可以如表1所示:
48.表1
49.目标物体位置信息置信度刀位置1
……
打火机位置2
……
50.需要说明的是,预先训练好的目标检测模型和预先训练好的背景识别模型可以是两个相互独立的模型,也可以是集成在一起的一个图像识别模型(该图像识别模型为一个两任务模型,其中一个任务为背景识别任务,另外一个任务为目标检测任务。换言之,该图像识别模型可以同时对待识别图像进行背景识别和目标检测,输出待识别图像的背景信息和检测结果),本实施例中,不对其进行限定。
51.需要说明的是,在图像识别模型为集成背景识别任务和目标检测任务的两任务模型时,若针对背景识别任务,其预设背景类别包括n个类别,则该图像识别模型的输出结果至少包括n个值,且输出结果中的前n个值为待识别图像属于各个预设背景类别的置信度。进一步的,若输出结果仅包含n个值,则说明目标检测对应的检测结果为空,类似的,若输出结果包含的值的数目大于n,则前n个值之后剩余的值,即为目标检测对应的检测结果。
52.s103、根据所述检测结果,确定是否为所述待识别图像添加物体属性信息。
53.具体的,物体属性信息用于标识待识别图像所包含的物体。例如,在一可能的实现
方式中,可以在所述检测结果表征所述待识别图像不包含目标物体时,确定不为所述待识别图像添加物体属性信息,而在所述检测结果表征所述待识别图像包含至少一个目标物体时,确定为所述待识别图像添加物体属性信息。
54.结合上面的例子,例如,针对待识别图像1,其检测结果表征其不包含目标物体,本步骤中,确定不为待识别图像1添加物体属性信息。再例如,针对待识别图像2,检测结果表征其包含至少一个目标物体,本步骤中,确定为其添加物体属性信息。
55.s104、若否,将所述背景信息作为所述待识别图像的识别结果。
56.具体的,若不为待识别图像添加物体属性信息,则仅将背景信息作为待识别图像的识别结果。例如,结合上面的例子,针对待识别图像1,其背景信息为室内,且确定不为其添加物体属性信息,此时,待识别图像1的识别结果为:室内。
57.需要说明的是,在本技术一可能的实现方式中,在确定不为待识别图像添加物体属性信息时,除了将背景信息作为该待识别图像的识别结果之外,还可以在识别结果中添加用于指示待识别图像不包含目标物体的指示信息,例如,在识别结果中添加如下信息:无目标物体。此时,结合上面的例子,待识别图像1的识别结果为:室内,无目标物体。
58.s105、若是,根据所述检测结果确定所述待识别图像的物体属性信息,并将所述背景信息和所述物体属性信息的组合作为所述待识别图像的识别结果。
59.可选的,在一种可能的实现方式中,在确定待识别图像的物体属性信息时,可以将检测结果包含的至少一个目标物体中、面积最大的目标物体所属的物体类别确定为待识别图像的物体属性信息。
60.此外,在本技术另一种可能的实现方式中,在确定待识别图像的物体属性信息时,也可以将检测结果包含的至少一个目标物体中、置信度最高的目标物体所属的类别确定为待识别图像的物体属性信息。
61.当然,在本技术再一种可能的实现方式中,在确定待识别图像的物体属性信息时,也可以将检测结果包含的至少一个目标物体中的所有目标物体所属的类别确定为待识别图像的物体属性信息。
62.下面以“在确定待识别图像的物体属性信息时,将检测结果包含的至少一个目标物体中、面积最大的目标物体所属的物体类别确定为待识别图像的物体属性信息”为例进行说明,结合上面的例子,例如,针对待识别图像3,其检测结果包含2个目标物体,这两个目标物体分别为刀和打火机,且根据这两个目标物体的位置信息,确定刀的面积大于打火机的面积,此时,确定该待识别图像3的物体属性信息为刀。
63.需要说明的是,若确定为待识别图像添加物体属性信息,此时,就将背景信息和确定出的物体属性信息的组合作为待识别图像的识别结果。例如,结合上面的例子,若待识别图像3的背景信息为室内,此时,经过识别,得到待识别图像3的识别结果为:室内、刀。
64.本实施例提供的图像识别方法,通过对待识别图像进行背景识别,得到待识别图像的背景信息,并从待识别图像中检测目标物体类别所对应的目标物体,得到待识别图像的检测结果,进而根据检测结果,确定是否为待识别图像添加物体属性信息,并在确定不为待识别图像添加物体属性信息时,将背景信息作为待识别图像的识别结果,而在确定为待识别图像添加物体属性信息时,根据检测结果确定待识别图像的物体属性信息,并将背景信息和物体属性信息的组合作为待识别图像的识别结果。这样,在对待识别图像进行识别
时,从背景识别和目标检测两个维度进行识别,由于识别的维度更多,且分别从背景识别和目标检测两个维度进行识别,这样,可以将图像中的背景和物体区分出来,可以提高识别的准确率,进而使得识别结果能够更准确、更全面的、更丰富的表达待识别图像。
65.图2为本技术提供的图像识别方法实施例二的流程图。请参照图2,在上述实施例的基础上,所述根据所述检测结果,确定是否为所述待识别图像添加物体属性信息,包括:
66.s201、在所述检测结果表征所述待识别图像不包含目标物体时,确定不为所述待识别图像添加物体属性信息。
67.例如,一实施例中,目标物体类别所包含的具体类别为牛、青草、树木、河流和石块,而待识别图像仅包含一个气球,此时,对待识别图像进行目标检测时,未检测到目标物体,检测结果为空,本步骤中,就确定不为待识别图像添加物体属性信息。
68.s202、在所述检测结果表征所述待识别图像包含至少一个目标物体时,根据所述至少一个目标物体的位置信息,确定所述至少一个目标物体占所述待识别图像的占比,并根据所述占比,确定是否为所述待识别图像添加物体属性信息。
69.具体的,在待识别图像包含目标物体时,此时,检测结果包括待识别图像所包含的目标物体以及目标物体的位置信息,检测结果表征待识别图像包含至少一个目标物体。本步骤中,就进一步根据至少一个目标物体的位置信息确定所述至少一个目标物体占待识别图像的占比,进而根据所述占比,确定是否为所述待识别图像添加物体属性信息。
70.具体实现时,可先根据各个目标物体的位置信息计算各个目标物体在待识别图像中所占的面积,进而在获取到各个目标物体在待识别图像中所占的面积后,从而根据各个目标物体在待识别图像中所占的面积,计算所有目标物体在占待识别图像的占比,最后依据该占比确定是否为待识别图像添加物体属性信息。
71.具体的,有关“基于目标物体的位置信息计算目标物体在待识别图像中所占的面积”的具体实现原理和实现过程可以参见相关技术中的描述,此处不再赘述。
72.例如,一实施例中,待识别图像4的检测结果、以及待识别图像4所包含的各个目标物体在待识别图像4中所占的面积如表2所示:
73.表2
74.目标物体在待识别图像中所占的面积/cm2菜刀16螺丝刀2枪5打火机2
75.结合表2所示示例,例如,一实施例中,待识别图像4的面积为70cm2,待识别图像4的检测结果表征待识别图像4中存在菜刀、螺丝刀、枪和打火机,且经过计算确定待识别图像4中的目标物体占待识别图像的占比为36%(其中,36%=(16+2+5+2)/70)。
76.需要说明的是,在根据占比判断是否为待识别图像添加物体属性信息时,可以基于预设阈值来进行判断。
77.可选的,在本技术一可能的实现方式中,可以在该占比大于或者等于预设阈值时,确定为待识别图像添加物体属性信息,而在该占比小于预设阈值时,确定不为待识别图像添加物体属性信息。
78.具体的,预设阈值的具体值是基于实际需要设定的,本实施例中,不对预设阈值的具体数值进行限定。例如,在一种可能的实现方式中,预设阈值可以为15%。
79.例如,结合上面的例子,在预设阈值为15%时,针对待识别图像4,计算出的该识别图像4对应的占比为36%,此时,确定为该待识别图像4添加物体属性信息。
80.本实施例提供的方法,在确定是否为待识别图像添加物体属性信息时,基于目标物体占待识别图像的占比来确定,仅在占比大时,才确定为其添加物体属性信息,这样,仅在前景(目标物体)相比背景占比大时,才添加物体属性信息,可有效的将背景和物体区分出来,可进一步提高识别的准确性。
81.下面给出一个更具体的实施例,用以详细介绍本技术的技术方案。图3为本技术提供的图像识别方法实施例三的流程图。本实施例提供的方法,可以包括:
82.s301、对待识别图像进行背景识别,得到所述待识别图像的背景信息。
83.s302、从所述待识别图像中检测目标物体类别所对应的目标物体,得到所述待识别图像的检测结果。
84.例如,一实施例中,背景识别任务和目标检测任务是通过一个集成背景识别任务和目标检测任务的图像识别模型实现的。进一步的,该图像识别模型中,针对背景识别任务,预设背景类别包括大面积白色、大面积路面、大面积墙体;类似的,该图像识别模型中,针对目标检测任务,其预设的目标物体类别可以包括树叶、帐篷、横幅、树干、电线、雨伞等。
85.本实施例中,将待识别图像输入到该图像识别模型中后,该图像识别模型对该待识别模型进行背景识别,输出该待识别模型属于大面积白色、大面积路面、大面积墙体的置信度,进一步的,选取置信度最大的预设背景类别作为其背景信息。例如,一实施例中,大面积路面对应的置信度最大,此时,确定该待识别图像的背景信息为大面积路面。
86.同时,该图像识别模型对该待识别图像进行目标检测,输出对应的检测结果为:树叶-位置信息1、帐篷-位置信息2、横幅-位置信息3、树干-位置信息4、电线-位置信息5。
87.s303、判断所述检测结果是否为空,若否,执行步骤s304,若是,执行步骤s310。
88.结合上面的例子,若检测结果不为空,即待识别图像中存在目标物体,此时,执行步骤s304。进一步的,若检测结果为空,即待识别图像中不包含目标物体,此时,直接执行步骤s310。
89.s304、根据所述检测结果包含的至少一个目标物体中的每个目标物体的位置信息,确定所述每个目标物体在所述待识别图像中所占的面积。
90.结合上面的例子,例如,针对识别出的树叶、帐篷、横幅、树干和电线,计算树叶在待识别图像中所占的面积为area1;帐篷在待识别图像中所占的面积为area2;横幅在待识别图像中所占的面积为area3;树干在待识别图像中所占的面积为area4;电线在待识别图像中所占的面积为area5。
91.s305、根据所述每个目标物体在所述待识别图像中所占的面积,计算所述至少一个目标物体在所述待识别图像中所占的总面积。
92.具体的,总面积等于所有目标物体在待识别图像中所占的面积的和值。结合上面的例子,总面积a=area1+area2+area3+area4+area5。
93.s306、根据所述总面积和所述待识别图像的图像面积,计算所述至少一个目标物体占所述待识别图像的占比。
94.具体的,图像面积area=图像像素宽度*图像像素高度,进一步的,占比等于总面积除以图像面积。
95.结合上面的例子,占比=(area1+area2+area3+area4+area5)/area。
96.s307、判断所述占比是否大于预设阈值,若是,执行步骤s308,若否,执行步骤s310。
97.参见前面的描述,预设阈值是根据实际需要设定的,本实施例中,不对其进行限定,下面以预设阈值为15%为例进行说明。
98.s308、确定为所述待识别图像添加物体属性信息,将所述检测结果包含的至少一个目标物体中、面积最大的目标物体所属的物体类别确定为所述待识别图像的物体属性信息。
99.例如,一实施例中,计算得到的占比为23%,此时,占比大于预设阈值,确定为所述待识别图像添加物体属性信息。进一步,结合上面的例子,例如,在待识别图像检测出的5个目标物体中,area2最大,此时,则确定待识别图像的物体属性信息为帐篷。
100.s309、将所述背景信息和所述物体属性信息的组合作为所述待识别图像的识别结果。
101.结合上面的例子,本步骤中,就确定待识别图像的识别结果为:大面积路面、帐篷。
102.s310、确定不为所述待识别图像添加物体属性信息,将所述背景信息作为所述待识别图像的识别结果。
103.参见前面的描述,若目标检测时,检测结果为空、未检测到目标物体,或者,检测结果不为空、检测到目标物体,但是经过判断,确定占比小于预设阈值,此时,则确定不为待识别图像添加物体属性信息,直接将背景信息作为待识别图像的识别结果。
104.本实施例提供的方法,在对待识别图像进行识别时,从背景识别和目标检测两个维度进行识别,由于维度更多,且是从背景识别和目标检测这两个维度来识别时,这样,可以将图像中的背景和目标区分出来,提高识别的准确率。此外,本实施例提供的方法,在对图像进行识别时,不同维度采用不同的识别手段,可进一步提高识别的准确度。进一步的,本实施例提供的方法,在确定是否为待识别图像添加物体属性信息时,基于目标物体占待识别图像的占比来确定,仅在占比大时,才确定为其添加物体属性信息,这样,仅在前景(目标物体)相比背景占比大时,才添加物体属性信息,可进一步提高识别的准确性。
105.与前述一种图像识别方法的实施例相对应,本技术还提供了一种图像识别装置的实施例。
106.本技术一种图像识别装置的实施例可以应用在图像识别设备上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在图像识别设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图4所示,为本技术图像识别装置所在图像识别设备的一种硬件结构图,除了图4所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的图像识别设备通常根据该图像识别装置的实际功能,还可以包括其他硬件,对此不再赘述。
107.图5为本技术提供的图像识别装置实施例一的结构示意图。请参照图5,本实施例提供的装置,包括识别模块510、检测模块520、确定模块530和处理模块540;其中,
108.所述识别模块510,用于对待识别图像进行背景识别,得到所述待识别图像的背景信息;
109.所述检测模块520,用于从所述待识别图像中检测目标物体类别所对应的目标物体,得到所述待识别图像的检测结果;
110.所述确定模块530,用于根据所述检测结果,确定是否为所述待识别图像添加物体属性信息;
111.所述处理模块540,用于在所述确定模块确定不为所述待识别图像添加物体属性信息时,将所述背景信息作为所述待识别图像的识别结果;
112.所述处理模块540,还用于在所述确定模块确定为所述待识别图像添加物体属性信息时,根据所述检测结果确定所述待识别图像的物体属性信息,并将所述背景信息和所述物体属性信息的组合作为所述待识别图像的识别结果。
113.本实施例的装置,可用于执行图1所示方法实施例的步骤,具体实现原理和实现过程类似,此处不再赘述。
114.可选的,所述确定模块530,具体用于在所述检测结果表征所述待识别图像不包含目标物体时,确定不为所述待识别图像添加物体属性信息;
115.所述确定模块530,还具体用于在所述检测结果表征所述待识别图像包含至少一个目标物体时,根据所述至少一个目标物体的位置信息,确定所述至少一个目标物体占所述待识别图像的占比,并根据所述占比,确定是否为所述待识别图像添加物体属性信息。
116.请继续参照图4,本技术还提供一种图像识别设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本技术第一方面提供的任一项所述方法的步骤。
117.本技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本技术提供的任一项所述方法的步骤。
118.上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
119.对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本技术方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
120.以上所述仅为本技术的较佳实施例而已,并不用以限制本技术,凡在本技术的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本技术保护的范围之内。
技术特征:
1.一种图像识别方法,其特征在于,所述方法包括:对待识别图像进行背景识别,得到所述待识别图像的背景信息;从所述待识别图像中检测目标物体类别所对应的目标物体,得到所述待识别图像的检测结果;根据所述检测结果,确定是否为所述待识别图像添加物体属性信息;若否,将所述背景信息作为所述待识别图像的识别结果;若是,根据所述检测结果确定所述待识别图像的物体属性信息,并将所述背景信息和所述物体属性信息的组合作为所述待识别图像的识别结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述检测结果,确定是否为所述待识别图像添加物体属性信息,包括:在所述检测结果表征所述待识别图像不包含目标物体时,确定不为所述待识别图像添加物体属性信息;在所述检测结果表征所述待识别图像包含至少一个目标物体时,根据所述至少一个目标物体的位置信息,确定所述至少一个目标物体占所述待识别图像的占比,并根据所述占比,确定是否为所述待识别图像添加物体属性信息。3.根据权利要求2所述的方法,其特征在于,所述根据所述至少一个目标物体的位置信息,确定所述至少一个目标物体占所述待识别图像的占比,包括:根据所述至少一个目标物体中的每个目标物体的位置信息,确定所述每个目标物体在所述待识别图像中所占的面积;根据所述每个目标物体在所述待识别图像中所占的面积,计算所述至少一个目标物体在所述待识别图像中所占的总面积;根据所述总面积和所述待识别图像的图像面积,计算所述至少一个目标物体占所述待识别图像的占比。4.根据权利要求2或3所述的方法,其特征在于,所述根据所述占比,确定是否为所述待识别图像添加物体属性信息,包括:在所述占比大于或者等于预设阈值时,确定为所述待识别图像添加物体属性信息;在所述占比小于所述预设阈值时,确定不为所述待识别图像添加物体属性信息。5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述检测结果确定所述待识别图像的物体属性信息,包括:将所述检测结果包含的至少一个目标物体中、面积最大的目标物体所属的物体类别确定为所述待识别图像的物体属性信息。6.根据权利要求1所述的方法,其特征在于,所述对待识别图像进行背景识别,得到所述待识别图像的背景信息,包括:将所述待识别图像输入到预先训练好的背景识别模型,以由所述背景识别模型对所述待识别图像进行特征提取,得到所述待识别图像的特征向量;根据所述特征向量确定所述待识别图像属于各个预设背景类别的置信度,并将置信度最大的目标预设背景类别确定为所述待识别图像的背景信息。7.一种图像识别装置,其特征在于,所述装置包括识别模块、检测模块、确定模块和处理模块;其中,
所述识别模块,用于对待识别图像进行背景识别,得到所述待识别图像的背景信息;所述检测模块,用于从所述待识别图像中检测目标物体类别所对应的目标物体,得到所述待识别图像的检测结果;所述确定模块,用于根据所述检测结果,确定是否为所述待识别图像添加物体属性信息;所述处理模块,用于在所述确定模块确定不为所述待识别图像添加物体属性信息时,将所述背景信息作为所述待识别图像的识别结果;所述处理模块,还用于在所述确定模块确定为所述待识别图像添加物体属性信息时,根据所述检测结果确定所述待识别图像的物体属性信息,并将所述背景信息和所述物体属性信息的组合作为所述待识别图像的识别结果。8.根据权利要求7所述的装置,其特征在于,所述确定模块,具体用于在所述检测结果表征所述待识别图像不包含目标物体时,确定不为所述待识别图像添加物体属性信息;所述确定模块,还具体用于在所述检测结果表征所述待识别图像包含至少一个目标物体时,根据所述至少一个目标物体的位置信息,确定所述至少一个目标物体占所述待识别图像的占比,并根据所述占比,确定是否为所述待识别图像添加物体属性信息。9.一种图像识别设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-6任一项所述方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1-6任一项所述方法的步骤。
技术总结
本申请提供一种图像识别方法、装置和设备。本申请提供的图像识别方法,包括:对待识别图像进行背景识别,得到所述待识别图像的背景信息;从所述待识别图像中检测目标物体类别所对应的目标物体,得到所述待识别图像的检测结果;根据所述检测结果,确定是否为所述待识别图像添加物体属性信息;若否,将所述背景信息作为所述待识别图像的识别结果;若是,根据所述检测结果确定所述待识别图像的物体属性信息,并将所述背景信息和所述物体属性信息的组合作为所述待识别图像的识别结果。本申请提供的图像识别方法、装置和设备,可提高图像识别的准确性。的准确性。的准确性。
技术研发人员:王欣
受保护的技术使用者:深圳云天励飞技术股份有限公司
技术研发日:2023.08.23
技术公布日:2023/10/19
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/