检测框的确定方法、装置、电子设备和可读存储介质与流程
未命名
10-21
阅读:58
评论:0
1.本技术属于计算机技术领域,具体涉及一种检测框的确定方法、装置、电子设备和可读存储介质。
背景技术:
2.当前,主流的视频人体关键点检测方法分为两个阶段:第一个阶段进行人体检测与跟踪,第二个阶段是将检测到的人体进行裁剪,通过算法进行关键点检测。移动端的视频关键点检测受限于硬件,无法同时进行人体跟踪检测算法和关键点算法,因此通常是通过基于上一帧的关键点检测结果推导出下一帧的人体检测框,而这样推导出的检测框的宽高比和中心点位置波动较大,影响了关键点检测结果,造成关键点检测结果准确度不高。
技术实现要素:
3.本技术实施例提供了一种检测框的确定方法、装置、电子设备和可读存储介质,能够解决相关技术中关键点检测结果准确度不高的问题。
4.第一方面,本技术实施例提供了一种检测框的确定方法,包括:
5.在视频的首张图像帧中确定至少一个预设检测框;
6.根据目标检测框对当前图像帧中的目标对象进行关键点检测,并根据所述关键点检测的结果确定针对所述目标对象的第一检测框,所述当前图像帧为所述视频的图像帧中的任一张图像帧;
7.从所述至少一个预设检测框中获取与所述第一检测框匹配的第二检测框;
8.将所述第二检测框作为用于对所述当前图像帧的下一张图像帧中目标对象进行关键点检测的目标检测框;
9.其中,所述目标检测框用于进行目标对象检测或关键点检测。
10.第二方面,本技术实施例提供了一种检测框的确定装置,包括:
11.第一确定模块,用于在视频的首张图像帧中确定至少一个预设检测框;
12.检测模块,用于根据目标检测框对当前图像帧中的目标对象进行关键点检测,并根据所述关键点检测的结果确定针对所述目标对象的第一检测框,所述当前图像帧为所述视频的图像帧中的任一张图像帧;
13.获取模块,用于从所述至少一个预设检测框中获取与所述第一检测框匹配的第二检测框;
14.第二确定模块,用于将所述第二检测框作为用于对所述当前图像帧的下一张图像帧中目标对象进行关键点检测的目标检测框;
15.其中,所述目标检测框用于进行目标对象检测或关键点检测。
16.第三方面,本技术实施例提供了一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的检测框的确定方法的步骤。
17.第四方面,本技术实施例提供了一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的检测框的确定方法的步骤。
18.本技术实施例中,通过从至少一个预设检测框中确定出目标检测框,即使目标对象发生抖动或波动,预设检测框也并不会发生波动,且至少一个预设检测框中总能找到与目标对象的第一检测框匹配的检测框,这样也就能更有效地确保基于目标检测框进行关键点检测的准确性,提升了关键点检测的准确度。
附图说明
19.图1是本技术实施例提供的一种检测框的确定方法的流程图;
20.图2是本技术实施例中预设检测框的示意图;
21.图3是本技术实施例提供的另一种检测框的确定方法的流程图;
22.图4是本技术实施例提供的一种检测框的确定装置的结构图;
23.图5是本技术实施例提供的一种电子设备的结构图。
具体实施方式
24.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本技术保护的范围。
25.本技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
26.目前,随着时代的发展,大数据时代的来临,人工智能的应用落地已经成为当前科技发展的重要趋势之一。其中,人体关键点检测算法是应用较为广泛的算法,其已经被应用于各大领域,尤其是视频中的人体关键点检测。而在人体关键点检测中,首先需要确定检测框,以将需要进行关键点检测的对象框出来,检测框的确定也就成为了关键点检测中较为重要的一环。
27.下面结合附图,通过具体的实施例及其应用场景对本技术实施例提供的检测框的确定方法、装置及电子设备进行详细地说明。
28.请参照图1,图1是本技术实施例提供的一种检测框的确定方法的流程图,所述方法可以是应用于如手机、平板电脑、计算机、智能穿戴设备等电子设备,后续实施例中以电子设备作为本技术实施例方法的执行主体,对本技术实施例的技术方案进行解释说明。
29.如图1所示,本技术实施例提供的检测框的确定方法包括以下步骤:
30.步骤101、在视频的首张图像帧中确定至少一个预设检测框。
31.可以理解地,所述首张图像帧也即视频的第一张图像帧或者说第一帧图像。
32.本技术实施例中,所述预设检测框可以是预先设定了尺寸大小的检测框。例如,所
述预设检测框的大小可以是与视频图像帧中目标对象的大小相匹配,所述目标对象可以是视频图像帧中的人物、车辆、建筑物、路牌等等。
33.可选地,在所述至少一个预设检测框的数量为两个或两个以上的情况下,任意两个预设检测框的尺寸大小可以是不同的,这样也就能够在视频的首张图像帧中确定出尺寸大小不同的多个预设检测框,进而可以通过这些尺寸大小不同的预设检测框来定位视频图像帧中尺寸不同的目标对象。
34.步骤102、根据目标检测框对当前图像帧中的目标对象进行关键点检测,并根据所述关键点检测的结果确定针对所述目标对象的第一检测框。
35.其中,所述当前图像帧为所述视频的图像帧中的任一张图像帧,例如可以是首张图像帧,也可以是首张图像帧之后的图像帧,如第二张图像帧、第三张图像帧等。
36.本技术实施例中,所述目标检测框用于进行目标对象检测或关键点检测。其中,所述目标对象可以是指视频图像帧中的人物、车辆、建筑物等等,后续将以目标对象为视频对象中的人物为例对本技术的技术方案进行解释说明。
37.可选地,在所述当前图像帧为视频的首张图像帧的情况下,所述目标检测框可以是基于对首张图像帧中的目标人物进行人体框检测后得到的针对该目标人物的检测框,则基于该检测框对首张图像帧中的目标人物进行关键点检测,并根据关键点检测结果确定针对该目标人物的第一检测框。例如,该第一检测框可以是根据目标对象在所述首张图像帧中的大小,在目标检测框的基础上进行一定的缩放后得到的检测框。
38.或者,所述当前图像帧不为所述视频的首张图像帧,如第二图像帧,所述目标检测框可以是用于进行关键点检测的检测框,该目标检测框可以是基于所述预设检测框得到的,后续步骤会进行详细说明,此处不做具体描述。同样地,基于目标检测框对当前图像帧中的目标对象进行关键点检测,并根据所述关键点检测的结果确定针对该目标对象的第一检测框,如该第一检测框可以是在目标检测框的基础上进行一定的缩放后得到的检测框。
39.步骤103、从所述至少一个预设检测框中获取与所述第一检测框匹配的第二检测框。
40.可以理解地,所述第二检测框也即某一个预设检测框,例如所述第二检测框可以是所述至少一个预设检测框中与第一检测框的尺寸大小最接近的一个,或者是所述至少一个预设检测框中与第一检测框位置最接近的一个,等。
41.步骤104、将所述第二检测框作为用于对所述当前图像帧的下一张图像帧中目标对象进行关键点检测的目标检测框。
42.示例性地,以当前图像帧为首张图像帧为例,基于对首张图像帧中的目标人物进行人体框检测后得到的针对该目标人物的检测框,基于该检测框对首张图像帧中的目标人物进行关键点检测,并根据关键点检测结果确定针对该目标人物的第一检测框a1,从所述至少一个预设检测框中获取与该第一检测框a1匹配的第二检测框b1,例如从所述至少一个预设检测框中获取与该第一检测框a1尺寸大小最接近的一个作为第二检测框b1,则该第二检测框b1作为对第二张图像帧中目标人物进行关键点检测的目标检测框。进而,针对第二张图像帧,基于该第二检测框b1对目标人物进行关键点检测,并根据关键点检测结果确定针对所述目标人物的新的第一检测框a2,然后从所述至少一个预设检测框中获取与该第一检测框a2匹配的第二检测框b2,则该第二检测框b2作为第三张图像帧中对目标人物进行关
键点检测的目标检测框
……
按照这样的流程依次执行,也就能够确定出每一张图像帧中针对目标人物进行关键点检测的目标检测框。
43.可以理解地,所述目标检测框是从所述至少一个预设检测框中确定出来的与第一检测框匹配的一个,也即所述目标检测框实际为预设检测框,这样也就无需对每一张图像帧都进行目标对象检测来确定目标检测框。
44.本技术实施例中,在基于从预设检测框中确定出的目标检测框对当前图像帧中的目标对象进行关键点检测后,根据关键点检测结果确定第一检测框,然后从至少一个预设检测框中获取与该第一检测框匹配的第二检测框,将该第二检测框作为下一张图像帧中用于目标对象关键点检测的目标检测框,相比于现有技术中需要根据上一张图像帧的关键点检测结果推导计算得到下一张图像帧的检测框,本技术能够直接从预设检测框中确定出下一张图像帧的目标检测框,无需基于关键点检测结果进行推导计算,有效节省了电子设备的计算流程,使得对于检测框的确定过程更为简单快捷,能够有效节省电子设备的硬件成本。并且,通过从至少一个预设检测框中确定出目标检测框,即使目标对象发生抖动或波动,预设检测框并不会发生波动,且至少一个预设检测框中总能找到与目标对象的第一检测框匹配的检测框,这样也就能更有效地确保基于目标检测框进行关键点检测的准确性,提升了关键点检测的准确度,从而提升关键点检测的稳定性,减少了关键点的抖动问题。
45.可选地,所述步骤101可以包括:
46.对所述视频的首张图像帧进行网格划分,并基于划分后的网格确定所述至少一个预设检测框。
47.其中,电子设备可以是根据首张图像帧的尺寸大小来对首张图像帧进行网格划分,例如将首张图像帧划分为一定数量的网格。或者,也可以是根据首张图像帧中目标对象的尺寸大小来进行网格划分,以目标对象能够位于划分后的一个或预设数量的网格中。
48.本技术实施例中,电子设备首先对视频的首张图像帧进行网格划分,然后基于划分后的网格来确定至少一个预设检测框,例如所述预设检测框的大小可以是与划分后的网格大小接近或相同。这样,也就使得对于预设检测框的确定更加快捷。
49.可选地,所述对所述视频的首张图像帧进行网格划分,包括:
50.对所述视频的首张图像帧中的所述目标对象进行对象框检测,得到针对所述目标对象的第三检测框;
51.根据所述第三检测框和所述首张图像帧的尺寸,对所述首张图像帧进行网格划分,其中,划分后的网格的尺寸与所述第三检测框匹配。
52.示例性地,以所述目标对象为首张图像帧中的目标人物为例,对首张图像帧中的所述目标人物进行人体框检测,得到针对该目标人物的人体检测框(也即所述第三检测框),根据该人体检测框与所述首张图像帧的尺寸,对所述首张图像帧进行网格划分,以使得划分后的网格的尺寸与该人体检测框匹配,例如划分后的网格的尺寸与该人体检测框的尺寸接近或相同。
53.示例性地,假设首张图像帧的宽和高分别为w和h,人体检测框(也即第三检测框)的宽和高分别为w1和h1,则划分后得到的网格为(m,n),其中m=w/w1,n=h/h1。例如,m和n均为6,也即划分后的网格数量为6
×
6共36个。
54.本技术实施例中,通过对首张图像帧中的目标对象进行对象框检测后得到第三检
测框,然后基于第三检测框来对首张图像帧进行网格划分,以使得划分后的网格的尺寸与第三检测框匹配,而预设检测框是基于划分后的网格确定的,这样也就能够确保后续得到的预设检测框更加接近真实的检测框,从而以确保后续的目标检测框也就更加接近真实的检测框,从而有效确保后续图像帧中关键点检测的准确性。
55.可选地,在所述当前图像帧为所述首张图像帧的情况下,所述根据目标检测框对当前图像帧中的目标对象进行关键点检测,包括:
56.根据所述第三检测框对当前图像帧中的目标对象进行关键点检测。
57.本技术实施例中,以目标对象为视频图像帧中的目标人物为例,对于首张图像帧,对该首张图像帧中的所述目标人物进行人体框检测,得到针对该目标人物的人体检测框(也即所述第三检测框),基于该人体检测框对首张图像帧中的目标人物进行关键点检测。例如,可以是基于该人体检测框对所述目标人物进行裁剪,将裁剪后的包括所述目标人物的图像输入关键点网络模型进行关键点检测,获取该网络模型输出的关键点检测结果。
58.本技术实施例中,对于视频的首张图像帧,能够基于对目标人物进行人体框检测后的得到的第三检测框来进行关键点检测,从而以有效确保后续流程的实施,也保障了视频图像帧中每一张图像帧都能够得到对应的关键点检测结果。
59.可选地,所述基于划分后的网格确定所述至少一个预设检测框,包括:
60.获取网格划分后的每一个网格的第一网格中心;
61.根据所述第一网格中心确定所述每一个网格对应的至少一个第一预设检测框,所述至少一个预设检测框包括所述至少一个第一预设检测框;
62.其中,目标网格的所述第一网格中心与所述目标网格对应的所述第一预设检测框的中心重合,所述目标网格为所述划分后的网格中的任一个,每一个网格对应的所述至少一个第一预设检测框中,任意两个第一预设检测框的尺寸不同。
63.需要说明地,所述第一网格中心也即划分后的网格的中心,针对划分后的网格,根据每个网格的第一网格中心确定该网格的至少一个第一预设检测框,且每一个第一预设检测框的中心与该网格的第一网格中心重合,且该网格的任意两个第一预设检测框的尺寸不同。
64.示例性地,如图2所示,在确定某个网格的第一网格中心后,可以是基于该第一网格中心,设置不同比例的第一预设检测框,从而得到该网格对应的多个第一预设检测框。其中,需要设置的包括第一预设检测框的宽高比例和缩放比例,所述宽高比例是指与该网格的宽高的比例,所述缩放比例是指针对该网格的缩放比例;例如,设置宽高比例如[1.0,1.0]、[1.2,1.2]、[1.0,1.5]、[1.5,1.0],缩放比例如0.8,0.9,1.0等,针对同一个宽高比例,可以是基于每一个缩放比例进行缩放得到对应的一个第一预设检测框,假设设置的宽高比例数量为4个,缩放比例数量为3个,也就会得到总共12个第一预设检测框,从而也就有效丰富了第一预设检测框的数量和尺寸。
[0065]
本技术实施例中,划分后的每一个网格对应至少一个第一预设检测框,进而对于首张图像帧中的不同位置处的网格,该网格都对应了至少一个不同尺寸的第一预设检测框,有效丰富了预设检测框的数量和尺寸,从而也就更有助于从至少一个预设检测框中得到与第一检测框相匹配的目标检测框,也就有助于提升基于目标检测框进行关键点检测的准确性。
[0066]
可选地,所述根据所述第一网格中心确定所述每一个网格对应的至少一个第一预设检测框之后,所述方法还包括:
[0067]
获取所述目标网格的偏移量;
[0068]
根据所述偏移量确定偏移网格及所述偏移网格的第二网格中心;
[0069]
根据所述第二网格中心确定所述偏移网格对应的至少一个第二预设检测框,所述至少一个预设检测框包括所述至少一个第一预设检测框和所述至少一个第二预设检测框。
[0070]
本技术实施例中,在得到划分后的网格以及每一个网格对应的至少一个第一预设检测框后,针对其中的任一个网格,确定该网格的偏移量,例如可以是基于用户的输入来确定偏移量,所述偏移量也就用于表示在该网格的基础上需要偏移多少;基于偏移量也就能够确定在该网格的基础上进行偏移后的偏移网格,以及该偏移网格的第二网格中心。需要说明的是,原来的网格并不会发生位置改变,所述偏移网格可以是复制原来的网格后再进行偏移。
[0071]
进一步地,根据所述第二网格中心确定偏移网格对应的至少一个第二预设检测框,所述至少一个第二预设检测框的确定方式可以是参照上述至少一个第一预设检测框的确定方式,此处不再做过多描述。其中,同一个偏移网格对应的至少一个第二预设检测框中,任意两个第二预设检测框的尺寸不同。
[0072]
本技术实施例中,基于划分后的网格确定偏移网格,每一个偏移网格对应至少一个第二预设检测框,这样也就更加有效丰富了预设检测框的数量和尺寸,也使得图像帧中的不同位置都能够尽可能地覆盖有预设检测框,提升了预设检测框的丰富性,进而也就能够更有助于从至少一个预设检测框中得到与第一检测框相匹配的目标检测框,有效提升了预设检测框与第一检测框的匹配度,从而提升关键点检测的准确性,并且,对于不同图像帧中目标对象的移动也能够更平滑地匹配到预设检测框,从而以保证基于目标检测框进行关键点检测的稳定性。
[0073]
可选地,在所述当前图像帧不为所述首张图像帧的情况下,所述将所述第二检测框作为用于对所述当前图像帧的下一张图像帧进行关键点检测的目标检测框之后,所述方法还包括:
[0074]
获取所述目标检测框的尺寸与所述第三检测框的尺寸的比值;
[0075]
在所述比值大于预设阈值的情况下,根据所述目标检测框对所述首张图像帧或所述当前图像帧进行网格划分,并基于划分后的网格重新确定至少一个预设检测框。
[0076]
例如,假设当前图像帧为第二张图像帧,根据首张图像帧确定的目标检测框对第二张图像帧中的目标对象进行关键点检测,根据关键点检测结果确定第二张图像帧中针对目标对象的第一检测框,并从至少一个预设检测框中确定出与该第一检测框匹配的第二检测框,将该第二检测框作为第三张图像帧中对目标对象进行关键点检测的目标检测框。此时,可以判断匹配得到的目标检测框的尺寸与第三检测框(也即对首张图像帧中目标对象进行对象框检测得到的)的尺寸的比值,若该比值大于预设阈值,说明当前图像帧中目标对象的尺寸比例相对于目标对象在首张图像帧中的尺寸比例发生了变化。例如视频中人物在从远到近或从近到远的过程中,不同图像帧中人物的尺寸比例会发生改变,则根据所述目标检测框对首张图像帧或当前图像帧进行网格划分,重新确定划分后的网格,划分后的网格的尺寸可以是与目标检测框的尺寸相匹配,例如尺寸相近,然后基于划分后的网格重新
确定至少一个预设检测框,对于后续图像帧中目标检测框的确定,也就从重新确定的至少一个预设检测框中来进行匹配和确定。这样,也就使得后续确定的目标检测框能够更加接近目标对象的尺寸,从而能够更有效地确保基于目标检测框进行关键点检测的准确性。
[0077]
可选地,本技术实施例中,所述步骤102可以包括:
[0078]
根据所述目标检测框对所述当前图像帧中的目标对象进行裁剪,得到包括所述目标对象的第一图像;
[0079]
对所述第一图像进行关键点检测,并根据所述关键点检测的结果确定最小外界框;
[0080]
将所述最小外界框作为针对所述目标对象的第一检测框。
[0081]
本技术实施例中,在确定当前图像帧的目标检测框后,根据所述目标检测框对目标对象进行裁剪。可以理解地,所述目标检测框为目标对象的包围框,可以是基于该目标检测框将其所覆盖的图像裁剪出来,从而得到包括目标对象的第一图像。进一步地,对该第一图像进行关键点检测,例如目标对象为人物,也即进行针对人物的人体关键点检测,并根据检测得到的各关键点的坐标确定最小外界框,也即这些关键点中能够将目标人物包围的最小外界框,如最小外界矩形框,将该最小外界矩形框作为针对所述目标对象的第一检测框。
[0082]
可选地,在得到最小外界框后,还可以是对该最小外界框进行缩放,将缩放后的最小外界框作为所述第一检测框。
[0083]
本技术实施例中,通过目标检测框对所述当前图像帧中的目标对象进行裁剪,然后对裁剪后的第一图像进行关键点检测,这样也就无需对整个当前图像帧都进行关键点检测,能够有效节省电子设备的计算资源,也使得对于关键点检测更具针对性,有助于提升关键点检测的准确性。
[0084]
可选地,本技术实施例中,所述步骤103可以包括:
[0085]
获取所述至少一个预设检测框中每一个预设检测框与所述第一检测框的交并比值;
[0086]
将所述至少一个预设检测框中交并比值最大的预设检测框确定为所述第二检测框。
[0087]
本技术实施例中,在确定至少一个预设检测框,以及根据对当前图像帧中目标对象的关键点检测结果确定第一检测框后,获取所述至少一个预设检测框中每一个预设检测框与所述第一检测框的交并比(intersection over union,iou)值,将其中交并比值最大的预设检测框作为第二检测框,也即用于对下一张图像帧中目标对象进行关键点检测的目标检测框。这样,也就能够从多个预设检测框中得到与第一检测框最为匹配的目标检测框,从而有助于提升关键点检测的准确性。
[0088]
请参照图3,图3是本技术实施例提供的另一种检测框的确定方法的流程图,如图3所示,所述方法包括以下流程:对视频的第一图像帧(也即首张图像帧)进行人体对象检测,得到初始检测框,基于该初始检测框确定适配的预设检测框,并根据该初始检测框对人体对象进行裁剪,得到裁剪后的人像,对该人像进行关键点检测,基于关键点检测的结果确定推导检测框,对预设检测框与推导检测框进行iou计算,根据iou计算结果从预设检测框中确定出与推导检测框最为匹配的新的检测框,基于该新的检测框对下一张图像帧也即第二图像帧进行人像裁剪,得到裁剪后的人像,同样对该人像进行关键点检测,基于关键点检测
的结果确定推导检测框,对预设检测框与该推导检测框进行iou计算,根据iou计算结果从预设检测框中确定出与该推导检测框最为匹配的新的检测框,该新的检测框用于对下一张图像帧进行人像裁剪,以进行关键点检测
……
依照这样的流程,依次完成对视频图像帧的关键点检测和检测框的确定。
[0089]
本技术实施例中,能够直接从预设检测框中确定出下一张图像帧中用于关键点检测的目标检测框,无需基于关键点检测结果进行推导计算,有效节省了电子设备的计算流程,使得对于检测框的确定过程更为简单快捷。
[0090]
请参照图4,图4是本技术实施例提供的一种检测框的确定装置的结构图,如图4所示,检测框的确定装置400包括:
[0091]
第一确定模块401,用于在视频的首张图像帧中确定至少一个预设检测框;
[0092]
检测模块402,用于根据目标检测框对当前图像帧中的目标对象进行关键点检测,并根据所述关键点检测的结果确定针对所述目标对象的第一检测框,所述当前图像帧为所述视频的图像帧中的任一张图像帧;
[0093]
获取模块403,用于从所述至少一个预设检测框中获取与所述第一检测框匹配的第二检测框;
[0094]
第二确定模块404,用于将所述第二检测框作为用于对所述当前图像帧的下一张图像帧中目标对象进行关键点检测的目标检测框;
[0095]
其中,所述目标检测框用于进行目标对象检测或关键点检测。
[0096]
可选地,所述第一确定模块401还用于:
[0097]
对所述视频的首张图像帧进行网格划分,并基于划分后的网格确定所述至少一个预设检测框。
[0098]
可选地,所述第一确定模块401还用于:
[0099]
对所述视频的首张图像帧中的所述目标对象进行对象框检测,得到针对所述目标对象的第三检测框;
[0100]
根据所述第三检测框和所述首张图像帧的尺寸,对所述首张图像帧进行网格划分,其中,划分后的网格的尺寸与所述第三检测框匹配。
[0101]
可选地,所述第一确定模块401还用于:
[0102]
获取网格划分后的每一个网格的第一网格中心;
[0103]
根据所述第一网格中心确定所述每一个网格对应的至少一个第一预设检测框,所述至少一个预设检测框包括所述至少一个第一预设检测框;
[0104]
其中,目标网格的所述第一网格中心与所述目标网格对应的所述第一预设检测框的中心重合,所述目标网格为所述划分后的网格中的任一个,每一个网格对应的所述至少一个第一预设检测框中,任意两个第一预设检测框的尺寸不同。
[0105]
可选地,所述第一确定模块401还用于:
[0106]
获取所述目标网格的偏移量;
[0107]
根据所述偏移量确定偏移网格及所述偏移网格的第二网格中心;
[0108]
根据所述第二网格中心确定所述偏移网格对应的至少一个第二预设检测框,所述至少一个预设检测框包括所述至少一个第一预设检测框和所述至少一个第二预设检测框。
[0109]
可选地,在所述当前图像帧为所述首张图像帧的情况下,所述检测模块402还用
于:
[0110]
根据所述第三检测框对当前图像帧中的目标对象进行关键点检测。
[0111]
可选地,在所述当前图像帧不为所述首张图像帧的情况下,所述获取模块403还用于:
[0112]
获取所述目标检测框的尺寸与所述第三检测框的尺寸的比值;
[0113]
所述装置还包括划分模块,用于在所述比值大于预设阈值的情况下,根据所述目标检测框对所述首张图像帧或所述当前图像帧进行网格划分,并基于划分后的网格重新确定至少一个预设检测框。
[0114]
可选地,所述检测模块402还用于:
[0115]
根据所述目标检测框对所述当前图像帧中的目标对象进行裁剪,得到包括所述目标对象的第一图像;
[0116]
对所述第一图像进行关键点检测,并根据所述关键点检测的结果确定最小外界框;
[0117]
将所述最小外界框作为针对所述目标对象的第一检测框。
[0118]
可选地,所述获取模块403还用于:
[0119]
获取所述至少一个预设检测框中每一个预设检测框与所述第一检测框的交并比值;
[0120]
将所述至少一个预设检测框中交并比值最大的预设检测框确定为所述第二检测框。
[0121]
本技术实施例中,所述装置通过从至少一个预设检测框中确定出目标检测框,即使目标对象发生抖动或波动,预设检测框也并不会发生波动,且至少一个预设检测框中总能找到与目标对象的第一检测框匹配的检测框,这样也就能更有效地确保基于目标检测框进行关键点检测的准确性,提升了关键点检测的准确度。
[0122]
本技术实施例中的检测框的确定装置400可以是电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性的,电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、移动上网装置(mobile internet device,mid)、增强现实(augmented reality,ar)/虚拟现实(virtual reality,vr)设备、机器人、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,umpc)、上网本或者个人数字助理(personal digital assistant,pda)等,本技术实施例不作具体限定。
[0123]
本技术实施例中的检测框的确定装置400可以为具有操作系统的装置。该操作系统可以为安卓(android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本技术实施例不作具体限定。
[0124]
本技术实施例提供的检测框的确定装置400能够实现图1所述方法实施例实现的各个过程,并能达到相同的技术效果,为避免重复,这里不再赘述。
[0125]
本技术实施例还提供了一种电子设备。请参见图5,图5是本技术实施例提供的一种电子设备的结构图,如图5所示,所述电子设备包括:处理器500、存储器520及存储在所述存储器520上并可在所述处理器500上运行的程序或指令,处理器500,用于读取存储器520中的程序或指令;所述电子设备还包括总线接口和收发机510。
[0126]
收发机510,用于在处理器500的控制下接收和发送数据。
[0127]
其中,在图5中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器300代表的一个或多个处理器和存储器520代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。收发机510可以是多个元件,即包括发送机和收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器500负责管理总线架构和通常的处理,存储器520可以存储处理器500在执行操作时所使用的数据。
[0128]
其中,处理器500,用于读取存储器520中的程序或指令,执行如下步骤:
[0129]
在视频的首张图像帧中确定至少一个预设检测框;
[0130]
根据目标检测框对当前图像帧中的目标对象进行关键点检测,并根据所述关键点检测的结果确定针对所述目标对象的第一检测框,所述当前图像帧为所述视频的图像帧中的任一张图像帧;
[0131]
从所述至少一个预设检测框中获取与所述第一检测框匹配的第二检测框;
[0132]
将所述第二检测框作为用于对所述当前图像帧的下一张图像帧中目标对象进行关键点检测的目标检测框;
[0133]
其中,所述目标检测框用于进行目标对象检测或关键点检测。
[0134]
可选地,处理器500,还用于读取存储器520中的程序或指令,执行如下步骤:
[0135]
对所述视频的首张图像帧进行网格划分,并基于划分后的网格确定所述至少一个预设检测框。
[0136]
可选地,处理器500,还用于读取存储器520中的程序或指令,执行如下步骤:
[0137]
对所述视频的首张图像帧中的所述目标对象进行对象框检测,得到针对所述目标对象的第三检测框;
[0138]
根据所述第三检测框和所述首张图像帧的尺寸,对所述首张图像帧进行网格划分,其中,划分后的网格的尺寸与所述第三检测框匹配。
[0139]
可选地,处理器500,还用于读取存储器520中的程序或指令,执行如下步骤:
[0140]
获取网格划分后的每一个网格的第一网格中心;
[0141]
根据所述第一网格中心确定所述每一个网格对应的至少一个第一预设检测框,所述至少一个预设检测框包括所述至少一个第一预设检测框;
[0142]
其中,目标网格的所述第一网格中心与所述目标网格对应的所述第一预设检测框的中心重合,所述目标网格为所述划分后的网格中的任一个,每一个网格对应的所述至少一个第一预设检测框中,任意两个第一预设检测框的尺寸不同。
[0143]
可选地,处理器500,还用于读取存储器520中的程序或指令,执行如下步骤:
[0144]
获取所述目标网格的偏移量;
[0145]
根据所述偏移量确定偏移网格及所述偏移网格的第二网格中心;
[0146]
根据所述第二网格中心确定所述偏移网格对应的至少一个第二预设检测框,所述至少一个预设检测框包括所述至少一个第一预设检测框和所述至少一个第二预设检测框。
[0147]
可选地,在所述当前图像帧为所述首张图像帧的情况下,处理器500,还用于读取存储器520中的程序或指令,执行如下步骤:
[0148]
根据所述第三检测框对当前图像帧中的目标对象进行关键点检测。
[0149]
可选地,在所述当前图像帧不为所述首张图像帧的情况下,处理器500,还用于读取存储器520中的程序或指令,执行如下步骤:
[0150]
获取所述目标检测框的尺寸与所述第三检测框的尺寸的比值;
[0151]
在所述比值大于预设阈值的情况下,根据所述目标检测框对所述首张图像帧或所述当前图像帧进行网格划分,并基于划分后的网格重新确定至少一个预设检测框。
[0152]
可选地,处理器500,还用于读取存储器520中的程序或指令,执行如下步骤:
[0153]
根据所述目标检测框对所述当前图像帧中的目标对象进行裁剪,得到包括所述目标对象的第一图像;
[0154]
对所述第一图像进行关键点检测,并根据所述关键点检测的结果确定最小外界框;
[0155]
将所述最小外界框作为针对所述目标对象的第一检测框。
[0156]
可选地,处理器500,还用于读取存储器520中的程序或指令,执行如下步骤:
[0157]
获取所述至少一个预设检测框中每一个预设检测框与所述第一检测框的交并比值;
[0158]
将所述至少一个预设检测框中交并比值最大的预设检测框确定为所述第二检测框。
[0159]
需要说明地,本技术实施例提供的电子设备能够实现图1所述方法实施例实现的各个过程,并能达到相同的技术效果,为避免重复,这里不再赘述。
[0160]
本技术实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述图1所述方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0161]
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等。
[0162]
本技术实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述图1所述方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0163]
应理解,本技术实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
[0164]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本技术实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
[0165]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本技术各个实施例所述的方法。
[0166]
上面结合附图对本技术的实施例进行了描述,但是本技术并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本技术的启示下,在不脱离本技术宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本技术的保护之内。
技术特征:
1.一种检测框的确定方法,其特征在于,包括:在视频的首张图像帧中确定至少一个预设检测框;根据目标检测框对当前图像帧中的目标对象进行关键点检测,并根据所述关键点检测的结果确定针对所述目标对象的第一检测框,所述当前图像帧为所述视频的图像帧中的任一张图像帧;从所述至少一个预设检测框中获取与所述第一检测框匹配的第二检测框;将所述第二检测框作为用于对所述当前图像帧的下一张图像帧中目标对象进行关键点检测的目标检测框;其中,所述目标检测框用于进行目标对象检测或关键点检测。2.根据权利要求1所述的方法,其特征在于,所述在视频的首张图像帧中确定至少一个预设检测框,包括:对所述视频的首张图像帧进行网格划分,并基于划分后的网格确定所述至少一个预设检测框。3.根据权利要求2所述的方法,其特征在于,所述对所述视频的首张图像帧进行网格划分,包括:对所述视频的首张图像帧中的所述目标对象进行对象框检测,得到针对所述目标对象的第三检测框;根据所述第三检测框和所述首张图像帧的尺寸,对所述首张图像帧进行网格划分,其中,划分后的网格的尺寸与所述第三检测框匹配。4.根据权利要求2所述的方法,其特征在于,所述基于划分后的网格确定所述至少一个预设检测框,包括:获取网格划分后的每一个网格的第一网格中心;根据所述第一网格中心确定所述每一个网格对应的至少一个第一预设检测框,所述至少一个预设检测框包括所述至少一个第一预设检测框;其中,目标网格的所述第一网格中心与所述目标网格对应的所述第一预设检测框的中心重合,所述目标网格为所述划分后的网格中的任一个,每一个网格对应的所述至少一个第一预设检测框中,任意两个第一预设检测框的尺寸不同。5.根据权利要求4所述的方法,其特征在于,所述根据所述第一网格中心确定所述每一个网格对应的至少一个第一预设检测框之后,所述方法还包括:获取所述目标网格的偏移量;根据所述偏移量确定偏移网格及所述偏移网格的第二网格中心;根据所述第二网格中心确定所述偏移网格对应的至少一个第二预设检测框,所述至少一个预设检测框包括所述至少一个第一预设检测框和所述至少一个第二预设检测框。6.根据权利要求3所述的方法,其特征在于,在所述当前图像帧为所述首张图像帧的情况下,所述根据目标检测框对当前图像帧中的目标对象进行关键点检测,包括:根据所述第三检测框对当前图像帧中的目标对象进行关键点检测。7.根据权利要求3所述的方法,其特征在于,在所述当前图像帧不为所述首张图像帧的情况下,所述将所述第二检测框作为用于对所述当前图像帧的下一张图像帧进行关键点检测的目标检测框之后,所述方法还包括:
获取所述目标检测框的尺寸与所述第三检测框的尺寸的比值;在所述比值大于预设阈值的情况下,根据所述目标检测框对所述首张图像帧或所述当前图像帧进行网格划分,并基于划分后的网格重新确定至少一个预设检测框。8.根据权利要求1-7中任一项所述的方法,其特征在于,所述根据目标检测框对当前图像帧中的目标对象进行关键点检测,并根据所述关键点检测的结果确定针对所述目标对象的第一检测框,包括:根据所述目标检测框对所述当前图像帧中的目标对象进行裁剪,得到包括所述目标对象的第一图像;对所述第一图像进行关键点检测,并根据所述关键点检测的结果确定最小外界框;将所述最小外界框作为针对所述目标对象的第一检测框。9.根据权利要求1-7中任一项所述的方法,其特征在于,所述从所述至少一个预设检测框中获取与所述第一检测框匹配的第二检测框,包括:获取所述至少一个预设检测框中每一个预设检测框与所述第一检测框的交并比值;将所述至少一个预设检测框中交并比值最大的预设检测框确定为所述第二检测框。10.一种检测框的确定装置,其特征在于,包括:第一确定模块,用于在视频的首张图像帧中确定至少一个预设检测框;检测模块,用于根据目标检测框对当前图像帧中的目标对象进行关键点检测,并根据所述关键点检测的结果确定针对所述目标对象的第一检测框,所述当前图像帧为所述视频的图像帧中的任一张图像帧;获取模块,用于从所述至少一个预设检测框中获取与所述第一检测框匹配的第二检测框;第二确定模块,用于将所述第二检测框作为用于对所述当前图像帧的下一张图像帧中目标对象进行关键点检测的目标检测框;其中,所述目标检测框用于进行目标对象检测或关键点检测。11.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-9中任一项所述的检测框的确定方法的步骤。12.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-9中任一项所述的检测框的确定方法的步骤。
技术总结
本申请公开了一种检测框的确定方法、装置、电子设备和可读存储介质,涉及计算机技术领域。本申请提供的检测框的确定方法包括:在视频的首张图像帧中确定至少一个预设检测框;根据目标检测框对当前图像帧中的目标对象进行关键点检测,并根据所述关键点检测的结果确定针对所述目标对象的第一检测框,所述当前图像帧为所述视频的图像帧中的任一张图像帧;从所述至少一个预设检测框中获取与所述第一检测框匹配的第二检测框;将所述第二检测框作为用于对所述当前图像帧的下一张图像帧中目标对象进行关键点检测的目标检测框;其中,所述目标检测框用于进行目标对象检测或关键点检测。测。测。
技术研发人员:利啟东
受保护的技术使用者:中国移动通信集团有限公司
技术研发日:2023.07.13
技术公布日:2023/10/19
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/