图像处理方法、装置、电子设备和存储介质与流程
未命名
09-24
阅读:64
评论:0
1.本公开涉及人工智能技术领域,尤其涉及深度学习技术领域和图像处理技术领域,可应用于图像处理场景下。更具体地,本公开提供了一种图像处理方法、装置、电子设备和存储介质。
背景技术:
2.随着人工智能技术的发展,利用人工智能技术对二维或三维的图像进行处理已经得到了广泛的应用。
技术实现要素:
3.本公开提供了一种图像处理方法、装置、设备以及存储介质。
4.根据本公开的一方面,提供了一种图像处理方法,该方法包括:根据目标图像的检测结果和所述目标图像的分割结果,在所述目标图像中确定多个目标子区域;根据所述多个目标子区域之间的距离,对所述多个目标子区域进行融合,得到目标区域;以及根据所述目标区域和所述分割结果,得到目标信息。
5.根据本公开的另一方面,提供了一种图像处理装置,该装置包括:确定模块,用于根据目标图像的检测结果和所述目标图像的分割结果,在所述目标图像中确定多个目标子区域;融合模块,用于根据所述多个目标子区域之间的距离,对所述多个目标子区域进行融合,得到目标区域;以及获得模块,用于根据所述目标区域和所述分割结果,得到目标信息。
6.根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据本公开提供的方法。
7.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行根据本公开提供的方法。
8.根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开提供的方法。
9.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
10.附图用于更好地理解本方案,不构成对本公开的限定。其中:
11.图1是根据本公开的一个实施例的可以应用图像处理方法和装置的示例性系统架构示意图;
12.图2是根据本公开的一个实施例的图像处理方法的流程图;
13.图3是根据本公开的另一个实施例的图像处理方法的流程图;
14.图4是根据本公开的一个实施例的图像处理方法的原理图;
15.图5是根据本公开的另一个实施例的图像处理方法的流程图;
16.图6是根据本公开的另一个实施例的图像处理方法的原理图;
17.图7是根据本公开的一个实施例的图像处理装置的框图;以及
18.图8是根据本公开的一个实施例的可以应用图像处理方法的电子设备的框图。
具体实施方式
19.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
20.对三维图像进行语义分割,可以得到至少一个掩码信息。例如,基于ct(computed tomography,计算机断层扫面)图像,可以确定例如肝脏内是否存在病灶。在一个示例,可以对存在病灶的肝脏ct图像进行语义分割,可以得到至少一个病灶区域。但仅基于语义分割的结果,可能会存在漏检情况。
21.图1是根据本公开一个实施例的可以应用图像处理方法和装置的示例性系统架构示意图。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
22.如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
23.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
24.服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
25.需要说明的是,本公开实施例所提供的图像处理方法一般可以由服务器105执行。相应地,本公开实施例所提供的图像处理装置一般可以设置于服务器105中。本公开实施例所提供的图像处理方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的图像处理装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
26.图2是根据本公开的一个实施例的图像处理方法的流程图。
27.如图2所示,该方法200可以包括操作s210至操作s230。
28.在操作s210,根据目标图像的检测结果和目标图像的分割结果,在目标图像中确定多个目标子区域。
29.例如,目标图像可以是包括肝脏的ct图像。可以理解,目标图像也可以是包括其他
目标对象的ct图像或荧光成像图像,本公开实施例不对此进行限制。
30.例如,对目标图像进行目标检测,可以得到检测结果。在一个示例中,可以利用病灶检测模型对目标图像进行目标检测。病灶检测模型可以是基于cnn(convolutional neural network,卷积神经网络)模型构建的深度学习模型。
31.又例如,根据检测结果,可以在目标图像中确定至少一个目标子区域。
32.例如,对目标图像进行图像分割(例如语义分割),可以得到分割结果。在一个示例中,可以利用病灶分割模型对目标图像进行图像分割。病灶分割模型可以是基于u-net(u型网络)模型构建的深度学习模型。
33.又例如,根据分割结果,可以在目标图像中确定至少一个目标子区域。
34.例如,根据由检测结果确定的至少一个目标子区域和由分割结果确定的至少一个目标子区域,可以得到多个目标子区域。
35.在操作s220,根据多个目标子区域之间的距离,对多个目标子区域进行融合,得到目标区域。
36.例如,目标区域可以为k个,k为大于或等于1的整数。
37.例如,可以确定多个目标子区域的中心点之间的欧式距离,作为多个目标子区域之间的距离。可以利用各种方式多个目标子区域进行融合,以得到k个目标区域。在一个示例中,可以将距离小于预设距离阈值的至少两个目标子区域融合,得到一个目标区域。
38.在操作s230,根据目标区域和分割结果,得到目标信息。
39.例如,目标信息可以包括与每个目标区域对应的掩码信息。在一个示例中,分割结果可以与至少一个掩码信息对应。在根据分割结果在目标图像中确定目标子区域时,可以将掩码信息对应地添加到由分割结果确定的目标子区域中。相应地,在k个目标区域中,k个目标区域中至少一部分目标区域可以具有掩码信息。
40.在一个示例中,对于k个目标区域中不具有掩码信息的目标区域,可以利用各种方式确定其掩码信息,本公开对此不做限制。
41.通过本公开实施例,融合了目标检测和语义分割两种图像处理方式,可以准确地在目标图像中确定目标区域。例如,可以准确地确定包含肝脏的ct图像中肝脏病灶所处的区域,避免部分病灶被漏检。
42.在一些实施例中,根据目标图像的检测结果和目标图像的分割结果,在目标图像中确定多个目标子区域包括:对目标图像进行目标检测,得到检测结果,其中,检测结果包括至少一个子检测框;根据至少一个子检测框和分割结果,在目标图像中确定多个目标子区域。
43.在一些实施例中,根据目标图像的检测结果和目标图像的分割结果,在目标图像中确定多个目标子区域包括:对目标图像进行第一图像分割处理,得到至少一个第一掩码信息;根据至少一个第一掩码信息,得到分割结果,其中,分割结果包括根据至少一个第一掩码信息确定的至少一个子包围框;根据检测结果和至少一个子包围框,在目标图像中确定多个目标子区域。
44.下面将结合图3进行详细说明。
45.图3是根据本公开的另一个实施例的图像处理方法的流程图。
46.如图3所示,该方法310可以根据目标图像的检测结果和目标图像的分割结果,在
目标图像中确定多个目标子区域。下面将结合操作s311至操作s314进行详细说明。
47.在操作s311,对目标图像进行目标检测,得到检测结果。
48.例如,检测结果包括至少一个子检测框。
49.例如,如上文所述,可以利用病灶检测模型对目标图像进行目标检测。
50.例如,病灶检测模型可以是基于3d cnn模型构建的。该病灶检测模型可以按照例如[sz,sy,s
x
]的步长和尺寸为[wz,wy,w
x
]的立体窗口对目标图像进行目标检测。检测结果可以包括至少一个子检测框。每个子检测框具有一个中心点(z_d,y_d,x_d)。进而,可以确定中心点至子检测框顶点的距离d_d。每个子检测框可以用[z_d,y_d,x_d,d_d,p]来表示。p为每个子检测框的置信度。在一个示例中,病灶检测模型输出的每个子检测框的置信度p>0.5。
[0051]
在操作s312,对目标图像进行第一图像分割处理,得到至少一个第一掩码信息。
[0052]
例如,如上文所述,可以利用病灶分割模型对目标图像进行第一图像分割处理。
[0053]
例如,病灶分割模型可以是基于3d unet模型构建的。该病灶分割模型可以按照例如[s
′z,s
′y,s
′
x
]的步长和尺寸为[w
′z,w
′y,w
′
x
]的立体窗口对目标图像进行语义分割,得到至少一个掩码信息。
[0054]
在操作s313,根据至少一个第一掩码信息,得到分割结果。
[0055]
例如,分割结果包括根据至少一个第一掩码信息确定的至少一个子包围框。
[0056]
又例如,可以根据至少一个掩码信息,可以确定至少一个子包围框,作为分割结果。即,分割结果包括至少一个子包围框。每个子包围框具有一个中心点(z_s,y_s,x_s)。进而,可以确定中心点至子包围框顶点的距离d_s。每个子包围框可以用[z_s,y_s,x_s,d_s]来表示。在一个示例中,w
′z=w
′y=w
′
x
=3。
[0057]
在操作s314,根据至少一个子检测框和至少一个子包围框,在目标图像中确定多个目标子区域。
[0058]
例如,可以将至少一个子检测框和至少一个子包围框映射到目标图像所在的图像空间中。将至少一个子检测框确定的区域作为至少一个目标子区域。将至少一个子包围框确定的区域也作为至少一个目标子区域。进而,可以在目标图像中确定多个目标子区域。
[0059]
需要说明的是,可以先执行操作s311,再执行操作s312~操作s313,但是本公开的实施例不限于此,这两组操作也可以按照其他顺序来执行,例如操作s311与操作s312~操作s313可以是并行执行的,或者先执行操作s312~操作s313,再执行操作s311。
[0060]
在一些实施例中,如上文所述,在利用病灶分割模型进行语义分割时,可以按照例如[s
′z,s
′y,s
′
x
]的步长和尺寸为[w
′z,w
′y,w
′
x
]的立体窗口对目标图像进行语义分割,确定立体窗口内每个体素点的类别(病灶或背景)。根据类别为病灶的体素点,计算连通域,得到至少一个连通域,以获得至少一个第一掩码信息。
[0061]
在一些实施例中,与方法310不同之处在于,病灶检测模型也可以是基于2d cnn模型构建的。可以沿深度方向,将目标图像划分为多个2d的切片图像。利用该病灶检测模型对每个切片图像进行目标检测,得到切片图像的检测结果。再利用每个切片图像在目标图像中的深度信息,根据多个切片图像的检测结果,得到目标图像的检测结果。
[0062]
在另一些实施例中,根据检测结果和至少一个子包围框,在目标图像中确定多个目标子区域包括:对于由至少一个子包围框确定的至少一个目标子区域中的每个目标子区
域,将对应每个子包围框的每个第一掩码信息添加至由该每个子包围框确定的每个目标子区域中。
[0063]
或者,在另一些实施例中,根据至少一个子检测框和至少一个子包围框,在目标图像中确定多个目标子区域包括:将每个子包围框和对应每个子包围框的第一掩码信息映射到目标图像所在的图像空间中,得到由每个子包围框确定的每个目标子区域。
[0064]
通过本公开实施例,由子包围框确定的目标子区域中可以包含掩码信息。
[0065]
图4是根据本公开的一个实施例的图像处理方法的原理图。
[0066]
如图4所示,目标图像401可以输入病灶分割模型410,得到分割结果。目标图像401也可以输入病灶检测模型420,得到检测结果。根据检测结果和分割结果,可以得到目标信息402。如图4所示,目标图像可以是包含肝脏的图像。
[0067]
在一些实施例中,所述目标区域为k个,k为大于或等于1的整数,根据多个目标子区域之间的距离,对多个目标子区域进行融合,得到目标区域包括:根据多个目标子区域之间的距离,确定k个目标子区域组,其中,每个目标子区域组中的每个目标子区域与其他目标子区域组中的目标子区域之间的距离大于预设距离阈值;对k个目标子区域组中每个目标子区域组进行融合,得到k个目标区域。
[0068]
例如,如上文所述,可以确定多个目标子区域的中心点之间的欧式距离,作为多个目标子区域之间的距离。进而可以确定k个目标子区域组,每个目标子区域组中可以包括至少一个目标子区域。每个目标子区域组中每个目标子区域与其他目标子区域组中的目标子区域之间的距离大于预设距离阈值d。在一个示例中,对于包括至少两个目标子区域的目标子区域组,其组内的至少两个目标子区域之间的距离小于另一预设距离阈值d。
[0069]
又例如,目标子区域可以是一个小型立方体状的区域。
[0070]
又例如,在对包括至少两个目标子区域的目标子区域组进行融合时,可以根据其组内至少两个目标子区域的中心点,确定该目标子区域组的中心点(z,y,x)。可以从其组内的至少两个目标子区域中确定到该目标子区域组的中心点(z,y,x)的距离最大的一个点p。基于该点p和目标子区域组的中心点(z,y,x),确定一个距离值d_ori。基于该中心点的坐标(z,y,x)和距离值d_ori,构建一个大型立方体状的区域,作为一个目标区域。在一个示例中,可以从至少一个目标区域的距离值d_ori冲选出一个最大值d_max。基于该最大值d_max和每个目标子区域组的中心点,构建每个正方体区域,作为每个目标区域。
[0071]
在一些实施例中,所述目标区域为k个,k为大于或等于1的整数,根据目标区域和分割结果,得到目标信息包括:将预设掩码信息添加至k个目标区域中不包含第一掩码信息的n个目标区域中,得到n个目标子信息;根据n个目标子信息和至少一个第一掩码信息,得到目标信息。
[0072]
例如,如上文所述,根据子包围框确定的目标子区域中可以包含第一掩码信息。而由子检测框确定的目标子区域中是不含第一掩码信息的,进而,根据至少一个由子检测框确定的目标子区域融合而成的目标区域中也可能不包含第一掩码信息。这些不含第一掩码信息的目标区域可以为n个。n为大于或等于1的整数,n为小于或等于k的整数。
[0073]
又例如,可以根据目标区域的中心点和预设距离值d_preset,构建一个预设正方体区域。该正方体区域的中心点为目标区域的中心点。该正方体区域的顶点到中心点的距离为上文所述的预设距离值d_preset。在一个示例中,预设距离值d_preset小于或等于上
文所述的最大值d_max。
[0074]
接下来,可以将处于该正方体区域内的体素的值设置为预设掩码值,以将预设掩码信息添加至不含第一掩码信息的一个目标区域中。
[0075]
在另一个示例中,也可以根据目标区域的中心点和预设距离值d_preset,构建一个球体。该球体的中心点为目标区域的中心点。该球体半径为上文所述的预设距离值d_preset。
[0076]
在一些实施例中,所述目标区域为k个,k为大于或等于1的整数,根据目标区域和分割结果,得到目标信息包括:对k个目标区域进行分类,得到分类结果;根据分类结果,从k个目标区域中确定类别为预设类别的m个目标区域,其中,m为大于或等于1的整数;根据m个目标区域和分割结果,得到目标信息。下面将结合图5进行详细说明。
[0077]
图5是根据本公开的另一个实施例的图像处理方法的流程图。
[0078]
如图5所示,该方法530可以根据目标区域和分割结果,得到目标信息,下面将结合操作s531至操作s536进行详细说明。
[0079]
在操作s531,对第i个目标区域进行分类,得到第i个类别值。
[0080]
例如,可以利用一个分类模型对第i个目标区域进行分类,得到第i个类别值。在一个示例中,分类模型可以是基于3d cnn模型构建的。
[0081]
在操作s532,确定第i个类别值是否大于或等于预设类别阈值。
[0082]
在本公开实施例中,响应于确定第i个类别值大于或等于预设类别阈值,执行操作s533。
[0083]
在本公开实施例中,响应于确定第i个类别值小于预设类别阈值,执行操作s536,删除第i个目标区域。
[0084]
例如,预设类别阈值为0.5。
[0085]
下面将以第i个类别值大于预设类别阈值为示例,结合操作s534至操作s535进行详细说明。
[0086]
在操作s533,确定第i个目标区域是否包含第一掩码信息。
[0087]
在本公开实施例中,响应于确定第i个目标区域包含第一掩码信息,执行操作s534。
[0088]
例如,融合形成第i个目标区域的至少一个目标子区域中存在一个由子包围框确定的目标子区域,可以确定第i个目标区域包含至少一个第一掩码信息。
[0089]
在本公开实施例中,响应于确定第i个目标区域未包含第一掩码信息,执行操作s535。
[0090]
例如,融合形成第i个目标区域的至少一个目标子区域均为由子检测框确定的目标子区域,可以确定第i个目标区域不包含第一掩码信息。
[0091]
在操作s534,根据第i个目标区域包含的至少一个第一掩码信息,得到第i个目标子信息。
[0092]
例如,在第i个目标区域包含第一掩码信息的情况下,可以根据第i个目标区域内包含的第一掩码信息,确定第i个目标子信息。
[0093]
在操作s535,将预设掩码信息添加至第i个目标区域,得到第i个目标子信息。
[0094]
例如,如上文所述,可以根据第i个目标区域的中心点和预设距离值d_preset,构
建一个正方体区域。该正方体区域的中心点为第i个目标区域的中心点。该正方体区域的顶点到中心点的距离为上文所述的预设距离值d_preset。
[0095]
接下来,可以将处于该正方体区域内的体素的值设置为预设掩码值,以将预设掩码信息添加至第i个目标区域中。
[0096]
接下来,可以根据第i个目标区域内包含的预设掩码信息,确定第i个目标子信息。
[0097]
在一些实施例中,i=1,......k。例如,可以依次对k个目标区域执行方法530,以得到m个目标子信息。
[0098]
在一些实施例中,根据目标图像的检测结果和目标图像的分割结果,在目标图像中确定多个目标子区域包括:根据原始图像中各体素的灰度值,确定局部图像;对局部图像进行第二图像分割处理,得到第二掩码信息;根据第二掩码信息,确定目标包围框;根据目标包围框和原始图像,确定目标图像。下面将结合图6进行详细说明。
[0099]
图6是根据本公开的一个实施例的图像处理方法的原理图。
[0100]
例如,原始图像可以包含对象全部器官的原始ct图像。原始图像中每个器官的体素的灰度值的范围是不同的。
[0101]
例如,原始图像为一个三维图像,其尺寸为z
ori
,y
ori
,x
ori
。在一个示例中,z
ori
=y
ori
=x
ori
=512。
[0102]
与肝脏对应的灰度值的范围为[hu
min
,hu
max
],可以根据该范围,对原始图像进行裁剪,保留与该范围对应图像区域,并对该图像区域内的灰度值进行归一化,以确定包含肝脏的局部图像603。局部图像603的尺寸为z
ls
,y
ls
,x
ls
。
[0103]
在一个示例中,可以通过以下公式对该图像区域内的每个灰度值hu进行归一化:
[0104][0105]
hu’为每个归一化后的灰度值。hu
min
为与肝脏对应的最小灰度值,hu
max
为与肝脏对应的最大灰度值。
[0106]
可以将局部图像603输入肝脏提取模型600,得到第二掩码信息604。再根据第二掩码信息604确定一个原始包围框,使得第二掩码信息604可以处于该原始包围框中。再对该原始包围框进行外扩。在一个示例中,原始包围框是一个立方体状的的包围框。原始包围框的右下顶点为[z0,y0,x0],原始包围框的左上顶点为[z1,y1,x1]。可以利用外扩系数和外扩参数w进行外扩。外扩后的右下顶点为外扩后的左上顶点为基于外扩后右下顶点和左上顶点,可以确定一个立方体状的目标包围框。
[0107]
可以根据目标包围框,对原始图像进行裁剪,得到一个图像区域。可以对该图像区域进行调整,使得调整后的图像区域的尺寸为z
ls
,y
ls
,x
ls
。在一个示例中,可以对该图像区域进行裁剪或补充灰度值为0的体素,使得调整后的图像区域的尺寸为z
ls
,y
ls
,x
ls
。根据第二掩码信息,将处于调整后的图像区域中的不是与肝脏对应的体素的灰度值调整为0,以得到目标图像601。
[0108]
需要说明的是,上文所述的各个实施例中的目标图像以包含肝脏的图像为示例。但本公开中的目标图像不限于此,目标图像还可以是例如包括肺、肾或心脏等器官的图像。
[0109]
图7是根据本公开的一个实施例的图像处理装置的框图。
[0110]
如图7所示,该装置700可以包括确定模块710、融合模块720和获得模块730。
[0111]
确定模块710,用于根据目标图像的检测结果和所述目标图像的分割结果,在所述目标图像中确定多个目标子区域。
[0112]
融合模块720,用于根据所述多个目标子区域之间的距离,对所述多个目标子区域进行融合,得到目标区域。
[0113]
获得模块730,用于根据所述目标区域和所述分割结果,得到目标信息。
[0114]
在一些实施例中,所述确定模块包括:目标检测子模块,用于对所述目标图像进行目标检测,得到所述检测结果,其中,所述检测结果包括至少一个子检测框;以及第一确定子模块,用于根据所述至少一个子检测框和所述分割结果,在所述目标图像中确定所述多个目标子区域。
[0115]
在一些实施例中,所述确定模块包括:第一图像分割子模块,用于对所述目标图像进行第一图像分割处理,得到至少一个第一掩码信息;第一获得子模块,用于根据所述至少一个第一掩码信息,得到所述分割结果,其中,所述分割结果包括根据所述至少一个第一掩码信息确定的至少一个子包围框;以及第二确定子模块,用于根据所述检测结果和所述至少一个子包围框,在所述目标图像中确定所述多个目标子区域。
[0116]
在一些实施例中,所述目标区域为k个,k为大于或等于1的整数,所述获得模块包括:添加子模块,用于将预设掩码信息分别添加至k个目标区域中不包含所述第一掩码信息的n个目标区域中,得到n个目标子信息,其中,n为大于或等于1的整数,n为小于或等于k的整数;以及第二获得子模块,用于根据所述n个目标子信息和所述至少一个第一掩码信息,得到所述目标信息。
[0117]
在一些实施例中,所述目标区域为k个,k为大于或等于1的整数,所述融合模块包括:第三确定子模块,用于根据所述多个目标子区域之间的距离,确定k个目标子区域组,其中,每个目标子区域组中的每个目标子区域与其他目标子区域组中的目标子区域之间的距离大于预设距离阈值;以及融合子模块,用于对所述k个目标子区域组中每个目标子区域组进行融合,得到k个目标区域。
[0118]
在一些实施例中,所述目标区域为k个,k为大于或等于1的整数,所述获得模块包括:分类子模块,用于对k个目标区域进行分类,得到分类结果;第四确定子模块,用于根据所述分类结果,从所述k个目标区域中确定类别为预设类别的m个目标区域,其中,m为大于或等于1的整数;以及第三获得子模块,用于根据所述m个目标区域和所述分割结果,得到所述目标信息。
[0119]
在一些实施例中,所述确定模块包括:第五确定子模块,用于根据原始图像中各体素的灰度值,确定局部图像;第二图像分割子模块,用于对所述局部图像进行第二图像分割处理,得到第二掩码信息;第六确定子模块,用于根据所述第二掩码信息,确定目标包围框;以及第七确定子模块,用于根据所述目标包围框和所述原始图像,确定所述目标图像。
[0120]
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
[0121]
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
[0122]
图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0123]
如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(rom)802中的计算机程序或者从存储单元808加载到随机访问存储器(ram)803中的计算机程序,来执行各种适当的动作和处理。在ram 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、rom 802以及ram 803通过总线804彼此相连。输入/输出(i/o)接口805也连接至总线804。
[0124]
设备800中的多个部件连接至i/o接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0125]
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如图像处理方法。例如,在一些实施例中,图像处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由rom 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到ram 803并由计算单元801执行时,可以执行上文描述的图像处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图像处理方法。
[0126]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0127]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件
包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0128]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0129]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0130]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
[0131]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
[0132]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
[0133]
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
技术特征:
1.一种图像处理方法,包括:根据目标图像的检测结果和所述目标图像的分割结果,在所述目标图像中确定多个目标子区域;根据所述多个目标子区域之间的距离,对所述多个目标子区域进行融合,得到目标区域;以及根据所述目标区域和所述分割结果,得到目标信息。2.根据权利要求1所述的方法,其中,所述根据目标图像的检测结果和所述目标图像的分割结果,在所述目标图像中确定多个目标子区域包括:对所述目标图像进行目标检测,得到所述检测结果,其中,所述检测结果包括至少一个子检测框;以及根据所述至少一个子检测框和所述分割结果,在所述目标图像中确定所述多个目标子区域。3.根据权利要求1或2所述的方法,其中,所述根据目标图像的检测结果和所述目标图像的分割结果,在所述目标图像中确定多个目标子区域包括:对所述目标图像进行第一图像分割处理,得到至少一个第一掩码信息;根据所述至少一个第一掩码信息,得到所述分割结果,其中,所述分割结果包括根据所述至少一个第一掩码信息确定的至少一个子包围框;以及根据所述检测结果和所述至少一个子包围框,在所述目标图像中确定所述多个目标子区域。4.根据权利要求3所述的方法,其中,所述目标区域为k个,k为大于或等于1的整数,所述根据所述目标区域和所述分割结果,得到目标信息包括:将预设掩码信息分别添加至k个目标区域中不包含所述第一掩码信息的n个目标区域中,得到n个目标子信息,其中,n为大于或等于1的整数,n为小于或等于k的整数;以及根据所述n个目标子信息和所述至少一个第一掩码信息,得到所述目标信息。5.根据权利要求1所述的方法,其中,所述目标区域为k个,k为大于或等于1的整数,所述根据所述多个目标子区域之间的距离,对所述多个目标子区域进行融合,得到目标区域包括:根据所述多个目标子区域之间的距离,确定k个目标子区域组,其中,每个目标子区域组中的每个目标子区域与其他目标子区域组中的目标子区域之间的距离大于预设距离阈值;以及对所述k个目标子区域组中每个目标子区域组进行融合,得到k个目标区域。6.根据权利要求1所述的方法,其中,所述目标区域为k个,k为大于或等于1的整数,所述根据所述目标区域和所述分割结果,得到目标信息包括:对k个目标区域进行分类,得到分类结果;根据所述分类结果,从所述k个目标区域中确定类别为预设类别的m个目标区域,其中,m为大于或等于1的整数;以及根据所述m个目标区域和所述分割结果,得到所述目标信息。7.根据权利要求1所述的方法,其中,所述根据目标图像的检测结果和所述目标图像的分割结果,在所述目标图像中确定多个目标子区域包括:
根据原始图像中各体素的灰度值,确定局部图像;对所述局部图像进行第二图像分割处理,得到第二掩码信息;根据所述第二掩码信息,确定目标包围框;以及根据所述目标包围框和所述原始图像,确定所述目标图像。8.一种图像处理装置,包括:确定模块,用于根据目标图像的检测结果和所述目标图像的分割结果,在所述目标图像中确定多个目标子区域;融合模块,用于根据所述多个目标子区域之间的距离,对所述多个目标子区域进行融合,得到目标区域;以及获得模块,用于根据所述目标区域和所述分割结果,得到目标信息。9.根据权利要求8所述的装置,其中,所述确定模块包括:目标检测子模块,用于对所述目标图像进行目标检测,得到所述检测结果,其中,所述检测结果包括至少一个子检测框;以及第一确定子模块,用于根据所述至少一个子检测框和所述分割结果,在所述目标图像中确定所述多个目标子区域。10.根据权利要求8或9所述的装置,其中,所述确定模块包括:第一图像分割子模块,用于对所述目标图像进行第一图像分割处理,得到至少一个第一掩码信息;第一获得子模块,用于根据所述至少一个第一掩码信息,得到所述分割结果,其中,所述分割结果包括根据所述至少一个第一掩码信息确定的至少一个子包围框;以及第二确定子模块,用于根据所述检测结果和所述至少一个子包围框,在所述目标图像中确定所述多个目标子区域。11.根据权利要求10所述的装置,其中,所述目标区域为k个,k为大于或等于1的整数,所述获得模块包括:添加子模块,用于将预设掩码信息分别添加至k个目标区域中不包含所述第一掩码信息的n个目标区域中,得到n个目标子信息,其中,n为大于或等于1的整数,n为小于或等于k的整数;以及第二获得子模块,用于根据所述n个目标子信息和所述至少一个第一掩码信息,得到所述目标信息。12.根据权利要求8所述的装置,其中,所述目标区域为k个,k为大于或等于1的整数,所述融合模块包括:第三确定子模块,用于根据所述多个目标子区域之间的距离,确定k个目标子区域组,其中,每个目标子区域组中的每个目标子区域与其他目标子区域组中的目标子区域之间的距离大于预设距离阈值;以及融合子模块,用于对所述k个目标子区域组中每个目标子区域组进行融合,得到k个目标区域。13.根据权利要求8所述的装置,其中,所述目标区域为k个,k为大于或等于1的整数,所述获得模块包括:分类子模块,用于对k个目标区域进行分类,得到分类结果;
第四确定子模块,用于根据所述分类结果,从所述k个目标区域中确定类别为预设类别的m个目标区域,其中,m为大于或等于1的整数;以及第三获得子模块,用于根据所述m个目标区域和所述分割结果,得到所述目标信息。14.根据权利要求8所述的装置,其中,所述确定模块包括:第五确定子模块,用于根据原始图像中各体素的灰度值,确定局部图像;第二图像分割子模块,用于对所述局部图像进行第二图像分割处理,得到第二掩码信息;第六确定子模块,用于根据所述第二掩码信息,确定目标包围框;以及第七确定子模块,用于根据所述目标包围框和所述原始图像,确定所述目标图像。15.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至7中任一项所述的方法。16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1至7中任一项所述的方法。17.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1至7中任一项所述的方法。
技术总结
本公开提供了一种图像处理方法,涉及人工智能技术领域,尤其涉及深度学习技术领域和图像处理技术领域,可应用于图像处理场景下。具体实现方案为:根据目标图像的检测结果和目标图像的分割结果,在目标图像中确定多个目标子区域;根据多个目标子区域之间的距离,对多个目标子区域进行融合,得到目标区域;以及根据目标区域和分割结果,得到目标信息。本公开还提供了一种图像处理装置、电子设备和存储介质。质。质。
技术研发人员:孙钦佩 王晓荣
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2022.03.10
技术公布日:2023/9/22
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/