信息处理装置以及信息处理方法与流程
未命名
09-24
阅读:84
评论:0
1.本发明涉及信息处理装置以及信息处理方法。
背景技术:
2.作为从动态图像检测运动物体的技术,已知有如下的方法:通过用运动体差分(帧间差分、背景差分)处理动态图像来提取在图像内处于运动的像素作为运动物体区域。专利文献1公开了基于在具有移动的物体中检测位置等的物理量信息来区分检测对象和检测对象以外的运动物体并识别的技术。
3.现有技术文献
4.专利文献
5.专利文献1:日本特开2000-105835号公报
技术实现要素:
6.发明要解决的课题
7.然而,通过运动体差分法提取出的差分区域由于移动速度或移动方式的不同而会发生偏移。根据运动体差分法的差分区域虽然能够追随最新时刻的变化并输出检测矩形(检测框),但存在由于帧间差分或背景差分的精度的影响,提取的运动物体区域不稳定的情况。例如,非移动地进行作业的人体在时刻的变化的同时运动部分变化,因此难以稳定地输出运动物体的矩形尺寸。
8.本发明在一个方面,目的在于提供改善动态图像中的运动物体的检测精度、稳定地输出检测框的技术。
9.用于解决课题的手段
10.本发明为实现上述目的而采用以下结构。
11.本发明的第一个方面的信息处理装置具备:检测部,根据动态图像的各帧图像来检测运动体;计算部,计算被检测的运动体是规定的被拍摄体的可靠度;以及决定部,根据基于与在第一帧中被检测的第一运动体外接的框的第一运动体的可靠度、以及基于在第一帧之前的第二帧中被检测的第二运动体的检测框的在第一帧中的第一运动体的可靠度,来决定第一运动体的检测框,并记录到记录部。
12.对于在当前帧中(第一帧)中被检测的运动体(第一运动体),信息处理装置根据基于在前一帧(第二帧)中被检测的运动体(第二运动体)的检测框的可靠度,来决定第一运动体的检测框。通过采用可靠度更高的检测框,信息处理装置能够改善运动体的检测精度,并稳定地输出检测框。“规定的被拍摄体”是人体等检测对象的运动体。
13.信息处理装置还可以具备判定部,该判定部判定在第二帧中被检测的多个运动体中的、与第一运动体相同的被拍摄体即第二运动体。通过更正确地判定在第二帧中被检测的运动体中与第一运动体相同的被拍摄体的运动体,从而信息处理装置能够稳定地输出对于相同的被拍摄体的检测框。
14.也可以是,判定部基于与第一运动体外接的框和在第二帧中被检测的各运动体的检测框的中心间距离,来判定与第一运动体相同的被拍摄体即第二运动体。通过用简单的方法判定与第一运动体相同的被拍摄体即第二运动体,从而信息处理装置能够减轻处理负担。
15.也可以是,判定部基于相对于与第一运动体外接的框和在第二帧中检测的各运动体的检测框所占的区域的重叠的区域的比例,来判定与第一运动体相同的被拍摄体即第二运动体。通过用简单的方法判定与第一运动体相同的被拍摄体即第二运动体,从而信息处理装置能够减轻处理负担。
16.也可以是,判定部使用基于机器学习的匹配的算法来匹配第一运动体和在第二帧中检测出的各运动体,从而判定与第一运动体相同的被拍摄体即第二运动体。信息处理装置能够高精度地判定与第一运动体相同的被拍摄体即第二运动体。
17.也可以是,判定部在各个帧中判定在第一帧之前的多个帧中被检测的运动体中的、与第一运动体相同的被拍摄体是哪一个运动体,在基于在各帧中被判定为与第一运动体相同的被拍摄体的运动体的各个检测框的第一运动体的可靠度中最大的可靠度大于基于与第一运动体外接的框的第一运动体的可靠度的情况下,决定部将被计算出最大的可靠度的检测框决定为第一运动体的检测框。信息处理装置通过回溯到多个帧之前并采用可靠度更高的检测框,从而基于输出的检测框的可靠度得以改善,能够输出稳定的检测框。
18.也可以是,在基于与第一运动体外接的框的第一运动体的可靠度大于第一阈值的情况下,决定部将与第一运动体外接的框决定为第一运动体的检测框。在基于外接框的可靠度大于第一阈值的情况下,信息处理装置由于不进行与基于前一帧的检测框的可靠度的比较就决定检测框,从而能够减轻处理负担。
19.也可以是,在基于第二运动体的检测框的第一运动体的可靠度大于基于与第一运动体外接的框的第一运动体的可靠度的情况下,决定部将第二运动体的检测框决定为第一运动体的检测框。信息处理装置通过采用可靠度更高的检测框,从而能够改善运动体的检测精度。
20.也可以是,在基于所决定的第一运动体的检测框的可靠度大于第二阈值的情况下,决定部将第一运动体的检测框记录到记录部。信息处理装置由于可靠度在第二阈值以下的框没有被记录到记录部,从而能够输出稳定的检测框。
21.也可以是,在基于第二运动体的检测框的第一运动体的可靠度大于基于与第一运动体外接的框的第一运动体的可靠度的情况下,即在与第一运动体外接的框和第二运动体的检测框的差分大于第三阈值的帧的连续数在规定数以下的情况下,决定部将第二运动体的检测框决定为第一运动体的检测框,并将第一运动体的检测框记录到记录部。差分例如既可以是从第二运动体的检测框到与第一运动体外接的框的面积变化,也可以是相对于第二运动体的检测框的面积的该面积变化的比例。信息处理装置在当前帧中的外接框和前一帧中的检测框的差分大于第三阈值的帧连续的情况下,通过不记录对于第一运动体的检测框,从而能够减少由于误检测的检测框的输出。
22.信息处理装置还可以具备输出部,该输出部使被记录到记录部的第一运动体的检测框与第一帧重叠并输出。在动态图像中的运动物体的检测精度得以改善,信息处理装置能够输出稳定的检测框。
23.也可以是,在基于被记录到记录部的第一运动体的检测框的可靠度大于第二阈值的情况下,输出部输出第一运动体的检测框。信息处理装置能够稳定地输出可靠度大于第二阈值的检测框。
24.也可以是,在基于第二运动体的检测框的第一运动体的可靠度大于基于与第一运动体外接的框的第一运动体的可靠度的情况下,即在与第一运动体外接的框和第二运动体的检测框的差分大于第三阈值的帧的连续数在规定数以下的情况下,输出部输出被记录到记录部的第一运动体的检测框。信息处理装置在当前帧中的外接框和前一帧的检测框的差分大于第三阈值的帧连续的情况下,通过控制使对于第一运动体的检测框不输出,能够减少由于误检测的检测框的输出。
25.也可以是,在基于所决定的第一运动体的检测框的可靠度大于第一阈值的帧的连续数多于规定数的情况下,输出部输出第一运动体的检测框。信息处理装置在根据第一运动体的检测框的可靠度大于第一阈值的帧连续的情况下,通过控制使对于第一运动体的检测框输出,能够继续输出高可靠度的检测框。
26.信息处理装置还可以具备校正部,该校正部基于第二运动体的检测框、和被判定为在第二帧之前的帧中是与第一运动体相同的被拍摄体的运动体的检测框的位置以及大小的变化量,来校正第二运动体的检测框。校正部125通过校正在前一帧中被检测出的运动体的检测框,从而能够改善将校正框应用到当前帧的情况下的运动体的可靠度。
27.也可以是,检测部通过帧间差分法以及背景差分法的至少任意一个来检测运动体。也可以是,计算部通过基于神经网络(neural network)、提升算法(boosting)、支持向量机(support vector machine)的至少任意一个的识别器来计算被检测的运动体是规定的被拍摄体的可靠度。
28.本发明的第二个方面的信息处理方法,使计算机包括:检测步骤,从被包含在动态图像中的第一帧检测第一运动体;计算步骤,使用与第一运动体外接的框、以及被记录于记录部的检测框即使用在第一帧之前的第二帧中被检测的第二运动体的检测框,计算第一运动体是规定的被拍摄体的可靠度;以及决定步骤,根据基于与第一运动体外接的框的第一运动体的可靠度、以及基于第二运动体的检测框的在第一帧中的第一运动体的可靠度,决定第一运动体的检测框,并记录到记录部。
29.本发明也能够理解为用于通过计算机实现该方法的程序、非暂时性地记录该程序的记录介质。另外,上述单元以及处理分别能够尽可能地相互组合而构成本发明。
30.发明效果
31.根据本发明,能够改善在动态图像中的运动物体的检测精度、稳定地输出检测框。
附图说明
32.图1是说明实施方式所涉及的信息处理装置的应用例的图。
33.图2是例示信息处理装置的硬件结构的图。
34.图3是例示信息处理装置的功能结构的图。
35.图4是表示检测矩形输出处理的例子的流程图。
36.图5a~图5c是说明被拍摄体的相同判定方法的图。
37.图6是表示实施方式2所涉及的检测矩形输出处理的例子的流程图。
38.图7是表示实施方式3所涉及的检测矩形输出处理的例子的流程图。
39.图8是表示实施方式3所涉及的检测矩形输出处理的另一例的流程图。
40.图9a以及图9b是说明应用实施方式4的状况的图。
41.图10是表示实施方式4所涉及的检测矩形输出处理的例子的流程图。
42.图11是表示实施方式4所涉及的检测矩形输出处理的另一例的流程图。
43.图12是表示实施方式5所涉及的检测矩形输出处理的例子的流程图。
44.图13是表示实施方式6所涉及的检测矩形输出处理的例子的流程图。
45.图14是例示实施方式7所涉及的信息处理装置的功能结构的图。
46.图15是说明实施方式7所涉及的检测矩形的校正的图。
47.图16是表示实施方式7所涉及的检测矩形输出处理的例子的流程图。
具体实施方式
48.以下,基于附图,对本发明的一个方面所涉及的实施方式进行说明。
49.《应用例》
50.图1是说明实施方式所涉及的信息处理装置的应用例的图。信息处理装置取得从相机输入的动态图像,并根据所取得的动态图像的各图像帧来检测运动物体(以下也称为运动体)。相机例如被设想为监控相机等固定相机。
51.信息处理装置例如能够通过提取在帧图像和预先准备的背景图像之间变化的区域的背景差分法、提取在帧之间变化的区域的帧间差分法、或这两方,来提取运动体区域。图1的例子表示运动体a1在时刻t被提取的例子。信息处理装置生成与所提取的运动体a1外接的矩形a2。另外,在本应用例以及以下的各实施方式的说明中,以设表示运动体区域的框的形状是矩形来进行说明,但是不限于矩形,只要是利用椭圆、多角形、与运动体外接的曲线等来包围运动体区域的形状即可。
52.信息处理装置例如通过向机器学习的识别器输入检测出的运动体来取得运动体的可靠度。图1的例子中的可靠度是人体相似度的可靠度。外接矩形a2包括将除人体的头部以外的部分提取为运动体区域的区域。因此,向识别器输入被外接矩形a2包围的区域的图像的情况下的可靠度为500。
53.在当前帧中检测出的物体的可靠度在规定的阈值以下的情况下,信息处理装置使用在前一帧中检测出的相同的被拍摄体的检测矩形来计算从当前帧截取的图像的可靠度。信息处理装置将计算出的可靠度与根据在当前帧中检测出的运动体的外接矩形的可靠度进行比较。
54.在图1的例子中,若设定规定的阈值为700,则根据时刻t(当前帧)的基于外接矩形a2的运动体a1的可靠度500低于规定的阈值700。因此,信息处理装置使用针对与在时刻t-1(前一帧)的运动体a1相同的被拍摄体的检测矩形a3来计算在时刻t的当前帧中截取的图像的可靠度。计算出的可靠度1000高于根据在时刻t检测出的运动体a1的外接矩形a2的可靠度。
55.在根据前一帧中的检测矩形的可靠度高于根据在当前帧中的外接矩形的可靠度的情况下,信息处理装置将在前一帧中的检测矩形决定为在当前帧中检测出的运动体的检测矩形。在图1的例子中,根据在时刻t-1的检测矩形a3的可靠度1000高于在时刻t的可靠度
500,因此信息处理装置将检测矩形a3决定为在时刻t的当前帧中检测出的运动体a1的检测矩形。通过采用可靠度变得更高的检测矩形a3而不是包围未包含人体的头部的区域的外接矩形a2,从而在时刻t的检测精度得以改善。
56.如上所述,信息处理装置基于根据在当前帧中检测出的运动体的外接矩形的可靠度、以及根据在前一帧中检测出的相同运动物体的检测矩形的可靠度来决定该运动体的检测矩形。信息处理装置通过将可靠度变得更高的矩形采用为检测矩形,从而能够改善运动体检测的精度。并且,即使是在动态图像中运动体停止了移动的情况下、或者几乎没有运动体的移动的情况下,信息处理装置也能够通过采用前一帧的检测矩形来输出稳定的检测矩形。因此,即使在通过帧间差分法来检测运动体的情况下,静态物体的检测精度也得以提高。
57.《实施方式1》
58.(硬件结构)
59.参照图2,对信息处理装置1的硬件结构的一例进行说明。图2是例示信息处理装置1的硬件结构的图。信息处理装置1具备处理器101、主存储装置102、辅助存储装置103、通信接口(i/f)104以及输出装置105。处理器101通过将辅助存储装置103中存储的程序读出到主存储装置102并执行,来实现作为在图3说明的各功能结构的功能。通信接口104是用于进行有线或者无线通信的接口。输出装置105例如是显示器等的用于进行输出的装置。
60.信息处理装置1既可以是个人计算机、服务器计算机、平板终端、智能手机等的通用型的计算机,也可以是车载计算机等的嵌入式的计算机。信息处理装置1例如既可以通过根据多台的计算机装置的分布式计算来实现,也可以通过云服务器来实现各功能部的一部分。此外,信息处理装置1的各功能部的一部分也可以通过fpga或asic等的专用的硬件装置来实现。
61.信息处理装置1被有线(usb线缆、lan线缆等)或无线(wifi等)地连接到相机2,接收由相机2拍摄到的图像数据。相机2是具有包括透镜的光学系统以及摄像元件(ccd、cmos等的图像传感器)的摄像装置。
62.另外,信息处理装置1也可以与相机2被一体地构成。此外,也可以在相机2上执行针对拍摄图像的运动体检测、人体判定处理等信息处理装置1的处理的一部分。进一步地,也可以将基于信息处理装置1的人体检测的结果发送到外部的装置并提示给用户。
63.(功能结构)
64.图3是例示信息处理装置1的功能结构的图。信息处理装置1包括图像取得部11、处理部12、检测矩形数据库(db)13、以及输出部14。处理部12包括检测部121、计算部122、判定部123、以及决定部124。
65.图像取得部11向处理部12发送从相机2取得的动态图像数据。处理部12的检测部121针对从图像取得部11接收到的动态图像的每个帧来检测运动体。检测部121例如能够通过背景差分法或帧间差分法来检测运动体。
66.计算部122计算被检测出的运动体是规定的被拍摄体(例如人体)的可靠度。计算部122能够通过例如cnn(convolution neural network,卷积神经网络)等的神经网络的算法来计算可靠度。此外,计算部122也可以使用提升算法、支持向量机(svm,support vector machine)等的基于机器学习的识别器来计算可靠度。
67.判定部123判定在前一帧中被检测出的运动体中与在当前帧中检测出的运动体相同的被拍摄体是哪一个运动体。在前一帧中被检测出的运动体以及对应的检测矩形的信息被存储在检测矩形数据库13中。判定部123例如基于与在当前帧中检测出的运动体外接的矩形和在前一帧中被检测出的运动体的检测矩形的中心间距离来判定在当前帧中检测出的运动体与在前一帧中被检测出的运动体是否是相同的被拍摄体。
68.决定部124基于通过计算部122计算出的可靠度,决定针对在当前帧中被检测出的运动体的检测矩形并注册到检测矩形数据库13。例如,在基于在当前帧中被检测出的运动体的外接矩形的可靠度大于规定的阈值的情况下,决定部124决定为以该外接矩形作为该运动体的检测矩形,并注册到检测矩形数据库13。
69.此外,在基于在当前帧中的外接矩形的可靠度在规定的阈值以下的情况下,决定部124将在前一帧中被检测出的相同的被拍摄体的检测矩形应用到当前帧并计算可靠度。决定部124将在当前帧中的外接矩形以及前一帧中的相同的被拍摄体的检测矩形中可靠度变得更高的矩形决定为在当前帧中被检测出的运动体的检测矩形,并注册到检测矩形数据库13。
70.检测矩形数据库13将在动态图像的各帧中被检测出的运动体与决定部124所决定的各个检测矩形对应地存储。检测矩形数据库13例如存储在帧内的检测矩形的位置以及大小的信息,作为检测矩形的信息。此外,检测矩形数据库13也可以存储由计算部122计算出的基于检测矩形的该运动体的可靠度,作为检测矩形的信息。检测矩形数据库13是记录部的一例。
71.输出部14基于被检测矩形数据库13中存储的运动体以及对应的检测矩形的信息来使被检测出的运动体的检测矩形重叠到各帧的图像,并输出到显示器等的输出装置105。
72.(检测矩形输出处理)
73.参照图4对检测矩形输出处理的总体的流程进行说明。图4是表示检测矩形输出处理的例子的流程图。检测矩形输出处理例如通过图像取得部11取得的动态图像的各帧被发送到处理部而开始。图4所示的检测矩形输出处理是针对动态图像的每个帧而被执行的处理。
74.在s101中,检测部121根据从图像取得部11接收到的处理对象的帧(以下称为当前帧)的图像而检测运动体。检测部121能够通过提取在帧图像和预先准备的背景图像之间变化的区域的背景差分法、提取在帧之间变化的区域的帧间差分法来检测运动体。
75.在s102中,检测部121生成与在当前帧中检测出的各运动体外接的矩形。对于在当前帧中被检测出的运动体i(i=1,
…
,n),重复从s103至s109的处理。
76.在s103中,计算部122根据在s102中被生成的外接矩形来计算从当前帧截取的图像的可靠度。可靠度是截取到的图像内的运动体i是规定的被拍摄体、例如人物的可靠度。计算部122能够例如使用cnn等的神经网络的算法、提升算法、svm等的基于机器学习的识别器来计算可靠度。
77.在s104中,决定部124判定根据在s103中被计算出的外接矩形的可靠度是否大于规定的阈值th1(第一阈值)。在基于外接矩形的可靠度大于th1的情况(s104:是)下,处理进入s109。在基于外接矩形的可靠度在th1以下的情况(s104:否)下,处理从s105进入s108的循环处理l2。
78.在循环处理l2中,计算部122使用在前面的帧(以下,也称为前一帧)中被检测出的运动体j(j=1,
…
,m)中与当前帧的运动体i相同的被拍摄体的运动体jm的检测矩形来计算运动体i的可靠度。决定部124基于计算出的可靠度、以及根据运动体i的外接矩形的可靠度来决定在当前帧中的运动体i的检测矩形。以下,具体说明各步骤的处理。
79.在s105中,判定部123判定在前一帧中检测出的运动体j的被拍摄体与当前帧的运动体i的被拍摄体是否相同。在判定为在前一帧中检测出的运动体j的被拍摄体与当前帧的运动体i的被拍摄体相同的情况(s106:是)下,处理进入s107。在判定为不同的情况(s106:否)下,处理进入对于下一个运动体j+1的检测矩形的循环处理l2。
80.其中,参照图5a~图5c对在s105以及s106中判定前一帧的运动体j与当前帧的运动体i是否是相同的被拍摄体的相同判定方法的三个例子进行说明。另外,也可以在可能的范围内组合以下例示的3个方法来判定被拍摄体是否相同。
81.图5a表示第一个相同判定方法的例子。判定部123基于与当前帧的运动体i外接的矩形a512和前一帧的运动体j的检测矩形a511的中心间距离d,来判定在前一帧中检测出的运动体j的被拍摄体与当前帧的运动体i的被拍摄体是否相同。
82.例如在中心间距离d小于规定的阈值的情况下,判定部123判定为在前一帧中检测出的运动体j的被拍摄体与当前帧的运动体i的被拍摄体相同。对于中心间距离d的规定的阈值例如能够设置为与当前帧的运动体i外接的矩形a512的宽度的1/2。
83.图5b表示第二个相同判定方法的例子。判定部123基于与当前帧的运动体i外接的矩形a522和前一帧的运动体j的检测矩形a521的iou(intersection over union,交并比)来判定在前一帧中检测出的运动体j的被拍摄体与当前帧的运动体i的被拍摄体是否相同。iou是相对于与当前帧的运动体i外接的矩形a522和前一帧的运动体j的检测矩形a532所占的区域(和的区域)的两矩形的重合的区域的比例。
84.例如在iou大于规定的阈值的情况下,判定部123判定为在前一帧中检测出的运动体j的被拍摄体与当前帧的运动体i的被拍摄体相同。对于iou的规定的阈值例如能够设置为80%。
85.图5c表示第三个相同判定方法的例子。判定部123通过使用根据机器学习的匹配的算法(re-id(re-identification,再识别))来匹配当前帧的运动体i和前一帧的运动体j,以此判定在前一帧中检测出的运动体j的被拍摄体与当前帧的运动体i的被拍摄体是否相同。
86.在图5c的例子中,相对于在时刻t被检测出的运动体a532,被判定在时刻t-1被检测出的运动体a531以及运动体a541中的、运动体a531是相同的被拍摄体。此外,相对于在时刻t被检测出的运动体a542,被判定运动体a541是相同的被拍摄体。通过使用基于机器学习的匹配的算法,判定部123能够高精度地判定相同的被拍摄体。
87.判定部123例如分别取得在当前帧中检测出的运动体与在前一帧中检测出的多个运动体的相似度。判定部123能够判定为在相似度在阈值(例如,在将1作为最大值的情况下是0.5)以上的运动体中相似度最高的运动体与在当前帧中检测出的运动体是相同的被拍摄体。
88.在图4的s107中,计算部122根据被判定为与当前帧的运动体i的被拍摄体相同的运动体jm的检测矩形来计算从当前帧截取的运动体i的可靠度。
89.在s108中,决定部124比较在s107中计算出的基于前一帧的运动体jm的检测矩形的可靠度和在s103中计算出的根据外接矩形的可靠度。在基于当前帧的运动体i的外接矩形的可靠度高于根据前一帧的运动体jm的检测矩形的可靠度的情况下,决定部124决定为以外接矩形作为当前帧的运动体i的检测矩形。另一方面,在基于前一帧的运动体jm的检测矩形的可靠度高于根据外接矩形的可靠度的情况下,决定部124决定为以前一帧的运动体jm的检测矩形作为当前帧的运动体i的检测矩形。
90.另外,在存在前一帧中的运动体j中的多个被判定为与当前帧的运动体i相同的被拍摄体的运动体jm的情况下,采用在s107中计算出的可靠度最高的检测矩形、并与在s103中计算出的根据外接矩形的可靠度进行比较即可。
91.在s109中,决定部124将在s108中作为当前帧的运动体i的检测矩形而决定的检测矩形的信息记录到检测矩形数据库13。检测矩形的信息包括运动体i的图像信息、被决定的检测矩形的位置以及大小、基于被决定的检测矩形的运动体i的可靠度的值。
92.在s109中被记录到检测矩形数据库13的当前帧的运动体i的检测矩形被用于计算在下一帧中被检测出的运动体的可靠度。对于在当前帧中被检测出的各运动体,若从s103至s109的循环处理l1结束,则处理进入s110。
93.在s110中,输出部14使在s108中决定的检测矩形重叠到当前帧的图像并输出。对于当前帧的检测矩形输出处理结束。
94.(作用效果)
95.在上述的实施方式1中,信息处理装置1比较基于与当前帧的运动体外接的矩形的该运动体的可靠度以及根据在前一帧中检测出的相同的被拍摄体的检测矩形的在当前帧中的该运动体的可靠度。信息处理装置1决定为以比较了可靠度的矩形中可靠度更高的矩形作为在当前帧中的该运动体的检测矩形。由于可靠度更高的检测矩形被采用,所以信息处理装置1能够改善运动体的检测精度,并稳定地输出检测矩形。
96.此外,在根据在当前帧中的外接矩形的运动体的可靠度大于规定的阈值(第一阈值)的情况下,信息处理装置1将外接矩形记录为该运动体的检测矩形。在可靠度大于规定的阈值的情况下,由于不进行与根据前一帧的检测矩形的可靠度的比较,所以信息处理装置1能够减轻处理负担。
97.此外,在图4所示的检测矩形输出处理的s105以及s106的处理中,信息处理装置1判定在当前帧中检测出的运动体与前一帧中的运动体是否是相同的被拍摄体。与在图5c中说明的基于机器学习的相同判定方法相比,在图5a中说明的使用中心间距离的相同判定方法以及在图5b中说明的使用iou的相同判定方法能够更低负荷地判定是否是相同的被拍摄体。此外,与使用中心间距离或iou的相同判定方法相比,在图5c中说明的基于机器学习的相同判定方法能够高精度地判定是否是相同的被拍摄体。
98.《实施方式2》
99.在实施方式1中,在基于在当前帧中检测出的外接矩形的可靠度大于规定的阈值的情况下,信息处理装置1将以在当前帧中的外接矩形决定为检测出的运动体的检测矩形,而不与根据在前一帧中的检测矩形的可靠度进行比较。与此相对,在实施方式2中,与基于在当前帧中检测出的运动体的外接矩形的可靠度无关地,信息处理装置1进行与根据在前一帧中检测出的运动物体的检测矩形的可靠度的比较,并将以可靠度高的矩形决定为在当
前帧中检测出的运动体的检测矩形。
100.由于实施方式2所涉及的信息处理装置1的硬件结构以及功能结构与实施方式1相同,因此省略说明。图6是表示实施方式2所涉及的检测矩形输出处理的例子的流程图。实施方式2所涉及的检测矩形输出处理与图4所示的实施方式1的检测矩形输出处理在没有s104的判定处理的点上不同。对于与图4所示的实施方式1的检测矩形输出处理相同的处理,标注相同的符号并省略说明。另外,图6的实施方式2所涉及的检测矩形输出处理也能够通过在图4的检测矩形输出处理中将s104的阈值th1设定为可靠度的最大值来实现。
101.在实施方式2中,与根据运动体i的外接矩形的可靠度是否大于阈值th1无关地,判定部123将基于外接矩形的可靠度与基于在前一帧中检测出的运动体j的检测矩形的运动体i的可靠度进行比较。由于与根据运动体i的外接矩形的可靠度无关,并采用包括在前一帧中的检测矩形的可靠度更高的矩形,所输出的检测矩形的精度得以改善。
102.《实施方式3》
103.实施方式3是在根据由决定部124决定的检测矩形的可靠度在规定的阈值以下的情况下不输出检测矩形、在大于规定的阈值的情况下输出决定的检测矩形的实施方式。通过在可靠度在规定的阈值以下的情况下不输出检测矩形,信息处理装置1能够继续输出稳定的可靠度的检测矩形。
104.由于实施方式3所涉及的信息处理1的硬件结构以及功能结构与实施方式1相同,因此省略说明。图7以及图8是表示实施方式3所涉及的检测矩形输出处理的例子的流程图。相对于图4所示的实施方式1的检测矩形输出处理,实施方式3所涉及的检测矩形输出处理追加了基于检测矩形的可靠度是否大于规定的阈值的判定处理(s701、s801)。对于与图4所示的实施方式1的检测矩形输出处理相同的处理,标注相同的符号并省略说明。
105.在图7的检测矩形输出处理与图8的检测矩形输出处理中,判定检测矩形的可靠度是否大于规定的阈值th2(第二阈值)的定时不同。在图7中,检测矩形的可靠度是否大于规定的阈值th2是在s109中检测矩形的信息被存储到检测矩形数据库13之前被判定的。即,在检测矩形的可靠度在规定的阈值th2以下的情况下,检测矩形既不被存储到检测矩形数据库13也不被输出。与此相对地,在图8中,检测矩形的可靠度是否大于规定的阈值th2是在s110中检测矩形被输出前被判定的。即,在检测矩形的可靠度在规定的阈值th2以下的情况下,检测矩形虽然被存储到检测矩形数据库13,但不被输出。
106.在图7的例子中,若在循环处理l2中对于运动体i的检测矩形被决定,则处理进入s701。在s701中,决定部124判定基于所决定的检测矩形的可靠度是否大于规定的阈值th2。规定的阈值th2例如能够设定为阈值th1以下的值。在基于所决定的检测矩形的可靠度大于规定的阈值th2的情况(s701:是)下,处理进入s109。在基于所决定的检测矩形的可靠度在规定的阈值th2以下的情况(s701:否)下,处理进入对于下一个运动体i+1的循环处理l1。
107.在s109中,基于所决定的检测矩形的可靠度大于规定的阈值th2的检测矩形的信息被存储到检测矩形数据库13。在s110中,对于在当前帧中被检测出的运动体,输出部14输出被存储在检测矩形数据库13的检测矩形。即,输出部14输出在s104中的可靠度大于规定的阈值th1的运动体i的外接矩形、以及在s701中被判定为可靠度大于规定的阈值th2的检测矩形。通过不输出可靠度在规定的阈值以下的矩形,信息处理装置1能够继续输出稳定的可靠度的检测矩形。
108.在图8的例子中,若在循环处理l1中,对于在当前帧中被检测出的各运动体的检测矩形被记录到检测矩形数据库13,则处理进入s801。在s801中,输出部14判定基于被记录在检测矩形数据库13的各运动体的检测矩形的可靠度是否大于规定的阈值th2。
109.对于可靠度大于规定的阈值th2的运动体(s801:是),处理进入s110。对于可靠度在规定的阈值th2以下的运动体(s801:否),检测矩形不被输出,图8所示的当前帧的检测矩形输出处理结束。
110.在s110中,输出部14输出被存在在检测矩形数据库13的检测矩形中的在s801中被判定为可靠度大于规定的阈值th2的检测矩形。通过不输出可靠度在规定的阈值以下的矩形,从而信息处理装置1能够继续输出稳定的可靠度的检测矩形。
111.《实施方式4》
112.实施方式4是用于消除对于静态物体的检测矩形为了比当前帧的运动体的外接矩形的可靠度变高而被采用为运动体的检测矩形并残留的状况的实施方式。由于实施方式4所涉及的信息处理1的硬件结构以及功能结构与实施方式1相同,因此省略说明。
113.在当前帧中检测出的运动体的外接矩形和在前一帧中被判定为使相同的被拍摄体的运动体的检测矩形的差分大于规定的阈值的帧的连续数超过规定数情况下,信息处理装置1使检测矩形不输出。差分例如既可以是从前一帧的检测矩形向当前帧的外接矩形的面积变化,也可以是相对于前一帧的检测矩形的面积的该面积变化的比例。即,在当前帧中的运动体的外接矩形和在前一帧中的检测矩形的差分大于规定的阈值的帧在规定数以下的情况下,信息处理装置1将由决定部124决定的检测矩形记录为运动体的检测矩形。由此,信息处理装置1能够控制使被作为运动体的检测矩形而被错误采用的静态物体的检测矩形在以后的帧中不被采用。
114.参照图9a以及图9b来说明应用实施方式4的状况。图9a表示从帧图像中检测作为检测对象的人体的例子。物体902是作为运动体而被检测得到的电风扇等的物体。物体903是被与物体902重叠拍摄且可能被误检测为人体的物体。物体903例如被设想为机器人、拍摄人体的海报、外套衣架、墙壁的花纹等与物体902重叠并可能被判定为人体的物体。图9a例示应用本实施方式的场合。人体901从相机2的位置看与物体902重叠地通过。
115.图9b例示在图9a的场合下从时刻t-1至时刻t+1的运动体的检测结果。时刻t是人体901刚刚通过从相机2的位置看与物体902重叠的位置之后的时刻。
116.在时刻t-1的帧图像中,人体901在物体902的周围被检测,检测矩形a91作为人体901的检测矩形被记录到检测矩形数据库13。若在t时刻物体902被检测,则能够考虑判定部123根据物体902的外接矩形a92和人体901的检测矩形a91的中心间距离,将在时刻t-1的人体901判定为是与物体902相同的被拍摄体。在这种情况下,计算部122使用人体901的检测矩形a91来计算物体902的可靠度。基于检测矩形a91的物体902的可靠度(是人体的可靠度)由于物体903存在而变得高于基于物体902的外接矩形a92的可靠度。从而,决定部124将以在时刻t-1的检测矩形a91决定为物体902的检测矩形。
117.在物体903是静态物体的情况下,即使到了时刻t+1,与时刻t的情况同样地,决定部124将以在时刻t-1以及时刻t的检测矩形a91决定为物体902的检测矩形。时刻t+1以后也同样,误检测的检测矩形a91被作为物体902的检测矩形记录到检测矩形数据库13。
118.为了规避这种状况,在当前帧中的外接矩形和前一帧的检测矩形的差分变得大于
规定的阈值th3的帧连续了规定数的情况下,信息处理装置1控制不将检测矩形a91记录到检测矩形数据库13。
119.例如,图9b的例子中的差分能够设为从检测矩形a91向外接矩形a92的面积相对于前一帧的检测矩形a91的面积的变化的比例。在这种情况下,在差分大于作为规定的阈值th3的50%的帧连续了多于5帧的情况下,信息处理装置1能够控制不将检测矩形a91记录到检测矩形数据库13。即,如果差分大于作为规定的阈值th3的50%的帧的连续数在5帧以下,信息处理装置1记录检测矩形a91。通过基于前一帧的检测矩形和当前帧的外接矩形的差分来控制是否记录检测矩形,信息处理装置1能够规避误检测的检测矩形多于规定数地连续而被输出。
120.图10以及图11是表示实施方式4所涉及的检测矩形输出处理的例子的流程图。相对于图4所示的实施方式1的检测矩形输出处理,实施方式4所涉及的检测矩形输出处理追加了对于矩形的差分大于规定的阈值的帧的连续数的判定处理(s1001~s1004、s1101~s1104)。对于与图4所示的实施方式1的检测矩形输出处理相同的处理,标注相同的符号并省略说明。
121.在图10的检测矩形输出处理与图11的检测矩形输出处理中,判定矩形的差分大于规定的阈值th3(第三阈值)的帧的连续数是否大于规定数th4的定时不同。在图10中,连续数是否大于规定数th4是在s109中检测矩形的信息被存储到检测矩形数据库13之前被判定的。即,在连续数在规定数以下的情况下,检测矩形既不被存储到检测矩形数据库13也不被输出。与此相对,在图11中,在s110中检测矩形被输出之前判定连续数是否大于规定数th4。即,在连续数在规定数th4以下的情况下,检测矩形虽然被存储到检测矩形数据库13,但不被输出。
122.在图10的例子中,若在循环处理l2中对于运动体i的检测矩形被决定,则处理进入s1001。在s1001中,前一帧的检测矩形和当前帧的外接矩形的差分被计算。矩形的差分例如能够作为运动体i的外接矩形和在s108中被决定的运动体i的检测矩形的面积的变化量来进行计算。另外,矩形的差分与检测矩形的信息一起被记录到检测矩形数据库13。
123.决定部124判定运动体i的矩形的差分是否大于规定的阈值th3。在运动体i的矩形的差分大于规定的阈值th3的情况(s1001:是)下,处理进入s1002。在运动体i的矩形的差分在规定的阈值th3以下的情况(s1001:否)下,处理进入s1003。在s1003中,决定部124初始化运动体i的矩形的差分变化量大于规定的阈值th3的帧的连续数f1。处理进入s109,在s108中被决定的对应于运动体i的检测矩形被记录到检测矩形数据库13。
124.在s1002中,决定部124将运动体i的矩形的差分大于规定的阈值th3的帧的连续数f1增加1。运动体i的矩形的差分大于规定的阈值th3的帧的连续数f1被记录到检测矩形数据库13,并在各帧的处理中被参照。
125.在s1004中,决定部124判定连续数f1是否超过规定数th4。在连续数f1超过规定数th4的情况(s1004:是)下,对应于运动体i的检测矩形不被记录到检测矩形数据库13,处理进入下一个循环处理l1。在连续数f1在规定数th4以下的情况(s1004:否)下,处理进入s109,对应于运动体i的检测矩形被记录到检测矩形数据库13。
126.在矩形的差分变得大于规定的阈值的帧的连续数超过规定数的情况下,信息处理装置1通过使检测矩形不输出,从而能够减少由于误检测的检测矩形的输出。
127.在图11的例子中,从s1101至s1103的处理分别与图10的s1001以及s1003相同。决定部124在s1102中将连续数f1增加1后、或者在s1103中将f1初始化为0后,将连续数f1记录到检测矩形数据库13。在s109中,与连续数f1的值无关地,决定部124将运动体i以及对应的检测矩形的信息记录到检测矩形数据库13。
128.若对于在当前帧中被检测出的各运动体的检测矩形被记录到检测矩形数据库13,则处理进入s1104。在s1104中,输出部14判定连续数f1是否超过规定数th4。
129.对于连续数f1超过规定数th4的运动体i(s1104:是),不输出检测矩形,图11所示的当前帧的检测矩形输出处理结束。在这种情况下,输出部14将对于被记录到检测矩形数据库13的运动体i的连续数f1初始化为0。对于连续数f1在规定数th4以下的运动体i(s1104:否),处理进入s110。
130.在s110中,输出部14输出在未被存储在检测矩形数据库13的检测矩形中的、在s1104中被判定为连续数f1在规定数th4以下的检测矩形。在矩形的差分变得大于规定的阈值的帧的连续数超过规定数的情况下,信息处理装置1通过使检测矩形不输出,从而能够减少由于误检测的检测矩形的输出。
131.《实施方式5》
132.实施方式5是在可靠度变得大于规定的阈值的帧连续了规定数的情况下输出检测矩形的实施方式。通过在可靠度在规定的阈值以下的情况下使检测矩形不输出,从而信息处理装置1能够继续输出稳定的可靠度的检测矩形。
133.实施方式5所涉及的信息处理装置1的硬件结构以及功能结构与实施方式1相同,因此省略说明。图12是表示实施方式5所涉及的检测矩形输出处理的例子的流程图。相对于图4所示的实施方式1的检测矩形输出处理,实施方式5所涉及的检测矩形输出处理追加了对于可靠度大于规定的阈值的帧的连续数的判定处理(s1201~s1204)。对于与图4所示的实施方式1的检测矩形输出处理相同的处理,标注相同的符号并省略说明。
134.在图12的例子中,在s104中,在基于外接矩形的可靠度大于规定的阈值th1的情况(s104:是)下,处理进入s1202。
135.在s1202中,决定部124将可靠度大于规定的阈值的帧的连续数f2增加1。可靠度大于规定的阈值的帧的连续数f2被记录到检测矩形数据库13,并在各帧的处理中被参照。
136.此外,若在图12的循环处理l2中对于运动体i的检测矩形被决定,则处理进入s1201。在s1201中,决定部124判定基于在循环处理l2中决定的检测矩形的运动体i的可靠度是否大于规定的阈值th1。在基于所决定的检测矩形的可靠度大于规定的阈值th1的情况(s1201:是)下,处理进入s1202。在基于所决定的检测矩形的可靠度在th1以下的情况(s1201:否)下,处理进入s109。
137.在s1202中,决定部124将可靠度大于规定的阈值的帧的连续数f2增加1。在s109中,与连续数f2的值无关地,将运动体i以及对应的检测矩形的信息记录到检测矩形数据库13。
138.在s1203中,由于在s1201中被判定为可靠度在th1以下且可靠度大于规定的阈值的帧变得不连续,决定部124将对于物体i的连续数f2初始化为0。
139.若对于在当前帧被检测出的各运动体的检测矩形被记录到检测矩形数据库13,则处理进入s1204。在s1204中,输出部14判定连续数f2是否超过规定数th5。
140.对于连续数f2超过规定数th5的运动体i(s1204:是),处理进入s110。对于连续数f2在规定数th5以下的运动体i(s1204:否),不输出检测矩形,图12所示的当前帧的检测矩形输出处理结束。
141.在s110中,输出部14输出在未被存储在检测矩形数据库13的检测矩形中的、在s1204中被判定为连续数f2超过规定数th5的检测矩形。在连续数f2在规定数th5以下的情况下,信息处理装置1通过使检测矩形不输出,从而能够继续输出高可靠度的检测矩形。
142.《实施方式6》
143.在上述的各实施方式中,根据当前帧的运动体的外接矩形的可靠度被与根据在前一帧中检测出的相同的被拍摄体的检测矩形的可靠度进行比较。与此相对,实施方式6是将根据当前帧的运动体的外接矩形的可靠度与根据回溯到多个帧之前而被检测出的相同的被拍摄体的各检测矩形的可靠度进行比较的实施方式。在实施方式6中,信息处理装置1将在当前帧的外接矩形以及到多个帧之前的检测矩形中的可靠度更高的矩形作为当前帧的运动体的检测矩形并输出。
144.实施方式6所涉及的信息处理装置1的硬件结构以及功能结构与实施方式1相同,因此省略说明。图13是表示实施方式6所涉及的检测矩形输出处理的例子的流程图。相对于图4所示的实施方式1的检测矩形输出处理,实施方式6所涉及的检测矩形输出处理追加了回溯帧的循环处理l3。对于与图4所示的实施方式1的检测矩形输出处理相同的处理,标注相同的符号并省略说明。
145.在图13的例子中,s105、s106、s1301的循环处理l4在到k帧(k=1,
…
,l)前的各帧中被反复。回溯帧数l例如设为5帧的程度,根据处理时间以及处理负担来决定即可。在s1301中,与图4的s107同样地,计算部122根据被判定为与当前帧的运动体i的被拍摄体相同的运动体jm的检测矩形来计算从当前帧截取的运动体i的可靠度。
146.在s1302中,决定部124比较在回溯的各帧中被计算的可靠度与在s103计算的根据外接矩形的可靠度。决定部124将比较出的可靠度中最高可靠度的矩形决定为运动体i的检测矩形。另外,s1302的比较可靠度的处理也可以在s1301的可靠度计算后进行。
147.在实施方式6中,信息处理装置1将根据回溯到多个帧之前所得到的检测矩形的可靠度与基于在当前帧中的外接矩形的可靠度进行比较。通过回溯到不限于前一帧的多个帧之前,根据输出的检测矩形的可靠度得以改善,信息处理装置1能够输出稳定的检测矩形。
148.《实施方式7》
149.实施方式7是校正前一帧的检测矩形的位置以及大小、并使用校正后的检测矩形来计算在当前帧中检测出的运动体的可靠度的实施方式。即使通过从前一帧的移动来将前一帧中的检测矩形应用到当前帧,在当前帧中被检测出的运动体也有可能无法得到期望的可靠度。因此,信息处理装置1通过校正前一帧中的检测矩形的位置或者大小来改善基于前一帧中的检测矩形的可靠度。
150.实施方式7所涉及的信息处理装置1的硬件结构与实施方式1相同,因此省略说明。图14是例示实施方式7所涉及的信息处理装置的功能结构的图。在图3所示的实施方式1中的功能结构的基础上,实施方式7所涉及的信息处理装置1具备校正部125。对于与图3相同的功能结构,标注相同的符号并省略说明。
151.校正部125校正对于与在当前帧中被检测出的运动体相同的被拍摄体的在前一帧
中的检测矩形。其中,参照图15对检测矩形的校正进行说明。时刻t、时刻t-1、时刻t-2分别是当前帧、上一帧、上上一帧的摄像时刻。矩形a151是在上上一帧中被检测出的运动体的检测矩形。矩形a152是在上一帧中被检测出的运动体的检测矩形。矩形a151以及矩形a152的信息被存储在检测矩形数据库13。矩形a153是在当前帧中被检测出的运动体的外接矩形。在图15的例子中,人体的头部未被作为运动体识别,矩形a153成为包围除去头部的部分的矩形。
152.上一帧的矩形a152若无校正地应用到当前帧,则由于运动体的移动,会产生与当前帧中的运动体的位置的偏移。因此,根据矩形a152的可靠度有可能比基于头部未被作为运动体识别的矩形a153的可靠度低。
153.校正部125将上一帧的矩形a152的位置及大小合并到当前帧中的运动体的位置来进行校正。校正部125例如能够基于上一帧的矩形a152以及上上一帧的矩形a151的宽度、高度、中心坐标等的变化量来计算当前帧中的矩形的宽度、高度、中心坐标的推定值。
154.具体地,校正部125能够通过上上一帧以及上一帧的检测矩形的中心坐标来推定物体移动的方向和移动距离,并计算在当前帧中的中心坐标。此外,校正部125能够以上上一帧以及上一帧的检测矩形的宽度、高度的平均值作为在当前帧中的宽度、高度来计算。校正部125能够基于计算出的推定值来生成校正矩形a154。
155.通过利用校正矩形a154来计算在当前帧中的运动体的可靠度,信息处理装置1能够输出可靠度更高的检测矩形。另外,不限于上一帧以及上上一帧,校正矩形也可以基于当前帧的外接矩形以及回溯到多个帧之前所得到的的检测矩形的信息而被生成。
156.图16是表示实施方式7所涉及的检测矩形输出处理的例子的流程图。取代图4所示的实施方式1的检测矩形输出处理的s107、s108,实施方式7所涉及的检测矩形输出处理追加了校正前一帧中的检测矩形并根据校正后的矩形来计算可靠度的处理(从s1601至s1603)。对于与图4所示的实施方式1的检测矩形输出处理相同的处理,标注相同的符号并省略说明。
157.在图16的例子中,在s106中,对于被判定为与当前帧的运动体i的被拍摄体相同的物体jm,处理进入s1601。在s1601中,校正部125基于运动体jm的检测矩形和被判定为与在前一帧之前的帧中的运动体i相同的被拍摄体的运动体的检测矩形的位置以及大小的变化量,校正运动体jm的检测矩形。
158.在s1602中,计算部122通过在s1601中被校正的校正矩形来计算从当前帧截取的运动体i的可靠度。在s1603中,决定部124比较在s1602中计算出的可靠度和在s103中计算出的基于外接矩形的可靠度。在基于当前帧的运动体i的外接矩形的可靠度高于根据校正矩形的可靠度的情况下,决定部124将外接矩形决定为当前帧的运动体i的检测矩形。另一方面,在基于校正矩形的可靠度高于基于外接矩形的可靠度的情况下,决定部124将校正矩形决定为当前帧的运动体i的检测矩形。
159.在实施方式7中,校正部125基于在前一帧之前的帧中的检测矩形来校正在前一帧中被检测出的运动体的检测矩形。通过校正在前一帧中的检测矩形,信息处理装置1能够改善在应用校正矩形到当前帧的情况下的运动体的可靠度。
160.《其他》
161.上述实施方式仅仅是示例性地说明本发明的构成例。各实施方式的构成不限定于
上述的具体的方式,能够在本发明的技术思想的范围内适宜地组合并利用。此外,本发明在不脱离该技术思想的范围内能够有各种变形。
162.另外,在上述的各实施方式中,以像人体的程度的可靠度作为是不特定的人体的可靠度进行了说明,但是并不限定于此。可靠度也可以是作为检测对象的特定的人物的可靠度。
163.此外,在上述的各实施方式中,以在回溯到前一帧或者多个帧之前的情况下按顺序回溯连续的帧的例子进行了说明,但是并不限定于此。信息处理装置1也可以间隔2帧、3帧等的多个帧地回溯到前面的帧,以可靠度更高的矩形作为当前帧的检测矩形加以输出。
164.此外,在上述的各实施方式中,使用在当前帧之前的帧中被检测出的运动体的检测矩形来计算当前帧的运动体的可靠度,但是并不限定于此。在拍摄结束的动态图像中,信息处理装置1也可以使用在当前帧之后的帧中被检测出的运动体的外接矩形来计算当前帧的运动体的可靠度。在这种情况下,在使用在之后的帧中被检测出的运动体的外接矩形而计算出的可靠度大于根据当前帧中的运动体的外接矩形的可靠度的情况下,信息处理装置能够将之后的帧的外接矩形决定为在当前帧中的检测矩形。
165.《附记》
166.(1)一种信息处理装置(1),具备:
167.检测部(121),根据动态图像的各帧图像来检测运动体;
168.计算部(122),计算所述被检测的运动体是规定的被拍摄体的可靠度;以及
169.决定部(124),根据基于与在第一帧中被检测的第一运动体外接的框的所述第一运动体的可靠度、以及基于在所述第一帧之前的第二帧中被检测的第二运动体的检测框的在所述第一帧中的所述第一运动体的可靠度,来决定所述第一运动体的检测框,并记录到记录部。
170.(2)一种信息处理方法,计算机包括:
171.检测步骤(s101),从被包含在动态图像中的第一帧检测第一运动体;
172.计算步骤(s103、s107),使用与所述第一运动体外接的框、以及被记录于记录部的检测框即使用在所述第一帧之前的第二帧中被检测的第二运动体的检测框,计算所述第一运动体是规定的被拍摄体的可靠度;以及
173.决定步骤(s108、s109),根据基于与所述第一运动体外接的框的所述第一运动体的可靠度、以及基于所述第二运动体的检测框的在所述第一帧中的所述第一运动体的可靠度,决定所述第一运动体的检测框,并记录到所述记录部。
174.附图标记说明
175.1:信息处理装置;2:相机;11:图像取得部;12:处理部;121:检测部;122:计算部;123:判定部;124:决定部;125:校正部;13:检测矩形数据库;14:输出部。
技术特征:
1.一种信息处理装置,具备:检测部,根据动态图像的各帧图像来检测运动体;计算部,计算被检测的所述运动体是规定的被拍摄体的可靠度;以及决定部,根据基于与在第一帧中被检测的第一运动体外接的框的所述第一运动体的可靠度、以及基于在所述第一帧之前的第二帧中被检测的第二运动体的检测框的在所述第一帧中的所述第一运动体的可靠度,来决定所述第一运动体的检测框,并记录到记录部。2.根据权利要求1所述的信息处理装置,其中,还具备判定部,该判定部判定在所述第二帧中被检测的多个运动体中的、与所述第一运动体相同的被拍摄体即所述第二运动体。3.根据权利要求2所述的信息处理装置,其中,所述判定部基于与所述第一运动体外接的框和在所述第二帧中被检测的各运动体的检测框的中心间距离,来判定与所述第一运动体相同的被拍摄体即第二运动体。4.根据权利要求2或3所述的信息处理装置,其中,所述判定部基于相对于与所述第一运动体外接的框和在所述第二帧中检测的各运动体的检测框所占的区域的重叠的区域的比例,来判定与所述第一运动体相同的被拍摄体即所述第二运动体。5.根据权利要求2~4中任一项所述的信息处理装置,其中,所述判定部使用基于机器学习的匹配的算法来匹配所述第一运动体和在所述第二帧中检测出的各运动体,从而判定与所述第一运动体相同的被拍摄体即所述第二运动体。6.根据权利要求2~5中任一项所述的信息处理装置,其中,所述判定部在各个帧中判定在所述第一帧之前的多个帧中被检测的运动体中的、与所述第一运动体相同的被拍摄体是哪一个运动体,在基于在各帧中被判定为与所述第一运动体相同的被拍摄体的运动体的各个检测框的所述第一运动体的可靠度中最大的可靠度大于基于与所述第一运动体外接的框的所述第一运动体的可靠度的情况下,所述决定部将被计算出所述最大的可靠度的检测框决定为所述第一运动体的检测框。7.根据权利要求1~6中任一项所述的信息处理装置,其中,在基于与所述第一运动体外接的框的所述第一运动体的可靠度大于第一阈值的情况下,所述决定部将与所述第一运动体外接的框决定为所述第一运动体的检测框。8.根据权利要求1~7中任一项所述的信息处理装置,其中,在基于所述第二运动体的检测框的所述第一运动体的可靠度大于基于与所述第一运动体外接的框的所述第一运动体的可靠度的情况下,所述决定部将所述第二运动体的检测框决定为所述第一运动体的检测框。9.根据权利要求1~8中任一项所述的信息处理装置,其中,在基于所述所决定的所述第一运动体的检测框的可靠度大于第二阈值的情况下,所述决定部将所述第一运动体的检测框记录到所述记录部。10.根据权利要求1~9中任一项所述的信息处理装置,其中,在基于所述第二运动体的检测框的所述第一运动体的可靠度大于基于与所述第一运动体外接的框的所述第一运动体的可靠度的情况下,即在与所述第一运动体外接的框和所
述第二运动体的检测框的差分大于第三阈值的帧的连续数在规定数以下的情况下,所述决定部将所述第二运动体的检测框决定为所述第一运动体的检测框,并将所述第一运动体的检测框记录到所述记录部。11.根据权利要求1~10中任一项所述的信息处理装置,其中,还具备输出部,该输出部使被记录到所述记录部的所述第一运动体的检测框与所述第一帧重叠并输出。12.根据权利要求11所述的信息处理装置,其中,在基于被记录到所述记录部的所述第一运动体的检测框的可靠度大于第二阈值的情况下,所述输出部输出所述第一运动体的检测框。13.根据权利要求11或12所述的信息处理装置,其中,在基于所述第二运动体的检测框的所述第一运动体的可靠度大于基于与所述第一运动体外接的框的所述第一运动体的可靠度的情况下,即在与所述第一运动体外接的框和所述第二运动体的检测框的差分大于第三阈值的帧的连续数在规定数以下的情况下,所述输出部输出被记录到所述记录部的所述第一运动体的检测框。14.根据权利要求11~13中任一项所述的信息处理装置,其中,在基于所述所决定的所述第一运动体的检测框的可靠度大于第一阈值的帧的连续数多于规定数的情况下,所述输出部输出所述第一运动体的检测框。15.根据权利要求1~14中任一项所述的信息处理装置,其中,还具备校正部,该校正部基于所述第二运动体的检测框、和被判定为在所述第二帧之前的帧中是与所述第一运动体相同的被拍摄体的运动体的检测框的位置以及大小的变化量,来校正所述第二运动体的检测框。16.根据权利要求1~15中任一项所述的信息处理装置,其中,所述检测部通过帧间差分法以及背景差分法的至少任意一个来检测运动体。17.根据权利要求1~16中任一项所述的信息处理装置,其中,所述计算部通过基于神经网络、提升算法、支持向量机的至少任意一个的识别器,计算所述被检测的运动体是规定的被拍摄体的可靠度。18.一种信息处理方法,计算机包括:检测步骤,从被包含在动态图像中的第一帧检测第一运动体;计算步骤,使用与所述第一运动体外接的框、以及被记录于记录部的检测框即使用在所述第一帧之前的第二帧中被检测的第二运动体的检测框,计算所述第一运动体是规定的被拍摄体的可靠度;以及决定步骤,根据基于与所述第一运动体外接的框的所述第一运动体的可靠度、以及基于所述第二运动体的检测框的在所述第一帧中的所述第一运动体的可靠度,决定所述第一运动体的检测框,并记录到所述记录部。19.一种程序,用于使计算机执行根据权利要求18所述的方法的各步骤。
技术总结
信息处理装置具备:检测部,根据动态图像的各帧图像来检测运动体;计算部,计算被检测的所述运动体是规定的被拍摄体的可靠度;以及决定部,根据基于与在第一帧中被检测的第一运动体外接的框的所述第一运动体的可靠度、以及基于在所述第一帧之前的第二帧中被检测的第二运动体的检测框的在所述第一帧中的所述第一运动体的可靠度,来决定所述第一运动体的检测框,并记录到记录部。并记录到记录部。并记录到记录部。
技术研发人员:杉尾淳一 田中清明 高山贵宏
受保护的技术使用者:欧姆龙株式会社
技术研发日:2021.09.14
技术公布日:2023/9/23
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/