生成元数据的方法、图像处理方法、电子设备和程序产品与流程
未命名
08-03
阅读:75
评论:0

1.本公开的实施例涉及视频传输领域,并且更具体地,涉及生成元数据的方法、图像处理方法、电子设备和计算机程序产品。
背景技术:
2.现今,视频内容占据全球互联网业务的很大比例。这使得减少带宽占用成为推动互联网发展的关键因素之一。通常,视频传输是骨干网和互联网服务提供商的主要压力。近年来,许多视频内容提供商降低了其服务的流媒体视频质量,以减轻了互联网服务提供商的压力。然而,为了将视频重建为高质量视频,用户侧及其边缘节点仍然存在较大的算力需求和时延。
技术实现要素:
3.本公开的实施例提供了视频处理的方案。
4.在本公开的第一方面中,提供了一种生成元数据的方法。该方法可以包括将具有第一分辨率的第一图像划分为多个图像块。该方法还可以包括利用多个候选转换模型,将多个图像块中的每个图像块转换为具有第二分辨率的图像块,第二分辨率高于第一分辨率。进一步地,该方法可以包括确定经转换的每个图像块的对应于多个候选转换模型的多个质量因子。此外,该方法可以包括基于多个质量因子以及多个候选转换模型的计算量因子,从多个候选转换模型中为每个图像块选择转换模型,并且基于每个图像块的位置信息以及为每个图像块选择的转换模型,生成用于将第一图像转换为具有第二分辨率的第二图像的元数据。
5.在本公开的第二方面中,提供了一种图像处理方法。该方法包括接收具有第一分辨率的第一图像和用于图像转换的元数据,第一图像包含多个图像块,并且元数据用于指示多个转换模型中用于转换多个图像块中的每个图像块所使用的相应转换模型。该方法还可以包括基于元数据,将多个图像块分别转换为具有第二分辨率的多个图像块,第二分辨率高于第一分辨率。此外,该方法可以包括基于经转换的多个图像块,生成具有第二分辨率的第二图像。
6.在本公开的第三方面中,提供了一种电子设备,包括:处理器;以及与所述处理器耦合的存储器,所述存储器具有存储于其中的指令,所述指令在被处理器执行时使所述电子设备执行动作,所述动作包括:将具有第一分辨率的第一图像划分为多个图像块;利用多个候选转换模型,将所述多个图像块中的每个图像块转换为具有第二分辨率的图像块,所述第二分辨率高于所述第一分辨率;确定经转换的每个图像块的对应于所述多个候选转换模型的多个质量因子;基于所述多个质量因子以及所述多个候选转换模型的计算量因子,从所述多个候选转换模型中为每个图像块选择转换模型;以及基于每个图像块的位置信息以及为每个图像块选择的转换模型,生成用于将所述第一图像转换为具有所述第二分辨率的第二图像的所述元数据。
7.在本公开的第四方面中,提供了一种电子设备,包括:处理器;以及与所述处理器耦合的存储器,所述存储器具有存储于其中的指令,所述指令在被处理器执行时使所述电子设备执行动作,所述动作包括:接收具有第一分辨率的第一图像和用于图像转换的元数据,所述第一图像包含多个图像块,并且所述元数据用于指示多个转换模型中用于转换所述多个图像块中的每个图像块所使用的相应转换模型;基于所述元数据,将所述多个图像块分别转换为具有第二分辨率的多个图像块,所述第二分辨率高于所述第一分辨率;以及基于经转换的多个图像块,生成具有所述第二分辨率的第二图像。
8.在本公开的第五方面中,提供了一种计算机程序产品,计算机程序产品被有形地存储在计算机可读介质上并且包括机器可执行指令,机器可执行指令在被执行时使机器执行根据第一、第二方面的方法。
9.提供发明内容部分是为了简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或主要特征,也无意限制本公开的范围。
附图说明
10.通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同或相似的参考标号通常代表相同或相似的部件。在附图中:
11.图1示出了根据本公开的实施例的示例环境的示意图;
12.图2示出了根据本公开的实施例的生成元数据的过程的流程图;
13.图3示出了根据本公开的实施例的将图像划分为多个图像块的示意图;
14.图4示出了根据本公开的实施例的图像处理的过程的流程图;
15.图5示出了根据本公开的实施例的将视频从视频提供方传输至视频请求方的过程的高级别管道图;以及
16.图6示出了可以用来实施本公开的实施例的示例设备的框图。
具体实施方式
17.下面将参考附图中示出的若干示例实施例来描述本公开的原理。
18.在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“一组示例实施例”。术语“另一实施例”表示“一组另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
19.如上所讨论的,视频提供方为了节约带宽资源,减少网络延迟,通常会将具有高分辨率的图像或视频转换为具有低分辨率的图像或视频,再将经转换的图像或视频传输至视频请求方。利用已经提出的诸如视频超分辨率(vsr,video super resolution)技术,视频请求方或者与其邻近的边缘节点可以对接收到的具有低分辨率的图像进行高分辨率或超高分辨率重建。
20.传统的诸如vsr技术的视频重建技术的发展在多个领域出现了应用。例如,在远程
游戏中,游戏引擎只需要在边缘节点或用户侧渲染每帧图像并使用vsr技术将具有低分辨率的图像重建为具有高分辨率(或高清)的图像,这样可以显著地节省游戏引擎的计算和带宽成本,也可以改善延迟。
21.然而,视频重建技术通常依赖于复杂度较高的图像重建或图像转换模型,并且基于深度学习的超分辨率模型的训练和推理操作所需的计算成本较高。传统的视频重建技术所遇到的瓶颈主要包括如下两个方面。
22.首先,虽然基于深度学习或机器学习的超分辨率图像转换模型所输出的图像或视频在质量方面是先进的,并且质量优于由非深度学习算法得到的图像或视频,但是,更好的质量是以更高的计算需求为代价的。超分辨率图像转换模型可以包含数目巨大的参数,而深度学习模型主要由卷积运算组成,这些运算本质上是非常复杂的运算。为了高效地执行这些运算,需要使用诸如gpu和tpu等的专用加速器来运行超分辨率图像转换模型。即便使用了诸如gpu的加速器,超分辨率图像转换模型的重建速度仍然很慢。因此,目前的诸如vsr技术的视频重建技术仅可以应用于诸如视频离线传输的离线应用,而对于在线视频交付、高清视频会议、和高清远程游戏等需要实时重建的应用,目前的重建速度很难满足要求。
23.其次,相应地,为了高效地执行深度学习中的卷积运算,需要购买大量gpu。应理解,与cpu相比,诸如gpu的加速器的价格更为昂贵。如果为了实现视频重建而需要购买大量价格昂贵的加速器,这对于视频提供商和用户均是不可接受的。
24.为了至少部分地解决上述缺点,本公开的实施例提供了一种新颖的图像处理方案。在该方案中,视频提供方在传输具有低分辨率的视频之前,先对视频中的每帧图像进行处理。具体地,视频提供方先将每帧图像均划分为多个均匀的图像块(patch),并且利用至少两个图像转换模型(例如,一个速度较快、但转换后的图像质量较低的模型以及一个速度较慢、但转换后的图像质量较高的模型)分别对每个图像块进行图像转换。由此,可以求得每个图像块经高清转换后的图像质量。通过虑及处理速度(或计算量)和图像质量两个方面,可以为每帧图像中的每个图像块选择一个适合的模型,并将具体信息记录在元数据中。由此,视频请求方或与其邻近的边缘节点就可以基于接收到的具有低分辨率的视频以及其对应的元数据重建具有高分辨率的视频。
25.以下将参照附图来具体描述本公开的实施例。图1示出了根据本公开的实施例的示例环境100的示意图。如图1所示,环境100包括视频提供方110、边缘节点120和视频请求方130。视频提供方110可以是例如云服务器、数据中心等。视频提供方110可以对视频进行处理(例如,降低分辨率),然后发送经处理的视频,以减小网络带宽占用。
26.视频请求方130可以与用户(未图示)交互。视频请求方130可以是例如手机、平板电脑、台式计算机、膝上型计算机、游戏机等。在一些实施例中,视频请求方130和边缘节点120可以被布置在一起。在一些实施例中,视频请求方130可以与边缘节点120分开布置,但可以彼此通信。视频请求方130可以与视频提供方110直接通信,也可以经由边缘节点120与视频提供方110通信。
27.边缘节点120可以是一个或多个边缘设备,其可以用于边缘存储和边缘计算。例如当视频请求方130向视频提供方110发出视频传输的请求时,所请求的视频可以在由视频提供方110处理(例如,降低分辨率)后,发送给视频请求方130邻近的边缘节点120。边缘节点120对所接收的视频进行重建或转换处理,然后传输给视频请求方130。但并不限定于此,所
请求的视频也可以由视频提供方110处理后直接发送给视频请求方130,视频在视频请求方130处被重建或转换。
28.应当理解,仅出于示例性的目的描述环境100的结构和功能,而不暗示对于本公开的范围的任何限制。例如,本公开的实施例还可以被应用到与环境100不同的环境中。为了更清楚地解释上述方案的原理,下文将参考图2和图4来分别在视频提供方侧以及视频接收方(即,边缘节点或视频请求方)侧更详细地描述图像处理的过程。
29.图2示出了根据本公开的实施例的生成元数据的过程200的流程图。在某些实施例中,过程200可以在图1中的视频提供方110中实现。现参照图2并结合图1描述根据本公开实施例的对图像进行处理以生成元数据的过程200。为了便于理解,在下文描述中提及的具体实例均是示例性的,并不用于限定本公开的保护范围。
30.在202,视频提供方110可以将具有第一分辨率的第一图像划分为多个图像块。应理解,本公开描述的第一图像可以是一个图像,也可以是包含多帧图像的视频。在某些实施例中,视频提供方110可以先将具有高分辨率的视频转换为具有低分辨率的视频,该低分辨率即为上述第一分辨率。之后,视频提供方110可以将具有低分辨率的视频中的每帧图像划分为多个数据块。还应理解,视频提供方110也可以直接将具有低分辨率的视频的每帧图像划分为多个数据块,而不存在降低分辨率的图像转换的操作。
31.图3示出了根据本公开的实施例的将图像300划分为多个图像块的示意图。如图3所示,视频提供方110可以将图像300划分为多个图像块,包括图像块301、图像块302、以及其他图像块。应理解,经划分的每个图像块均具有在上述具有低分辨率的视频中的位置的信息,即,位置信息。作为示例,图像块301的位置信息可以表示为[f1,l1,r1],并且图像块302的位置信息可以表示为[f2,l2,r2],f1、f2用于表示图像块所处的帧,l1、l2用于表示图像块在帧中的列(横坐标),r1、r2用于表示图像块在帧中的行(纵坐标)。
[0032]
从图3中可以看出,图像300中的每个图像块具有不同的复杂程度。对整个图像执行高分辨率或超分辨率的重建过程是低效的。为了实现高效的高分辨率重建,本公开的实施例将图像300划分成多个图像块,并在后续的处理中利用复杂度高的转换模型来重建复杂度高的图像块(例如,图像块301所包含的马头的部分),并且利用复杂度低的转换模型来重建复杂度低的图像块(例如,图像块302所包含的空白的部分)。
[0033]
回到图2,在204,视频提供方110可以利用多个候选转换模型,将上述多个图像块中的每个图像块转换为具有第二分辨率的图像块。应理解,第二分辨率高于上文描述的第一分辨率,并且第二分辨率可以是上述高分辨率。
[0034]
在某些实施例中,上述多个候选转换模型可以至少包含两个转换模型,即,具有第一计算量的第一转换模型和具有第二计算量的第二转换模型,并且第一计算量小于第二计算量。以此方式,提升了图像重建的效率,节约了算力,并且缩短了图像重建的处理时间。应理解,本公开仅考虑具有较高计算量的转换模型必然会输出较高质量的重建图像的情况,对于具有较高计算量的转换模型输出了较低质量的重建图像的情况,本公开的实施例不予考虑。
[0035]
作为示例,第一转换模型可以是诸如双三次(bicubic)插值的简单算法,并且第二转换模型可以是深度学习模型。因此,第一转换模型的操作时长较短(计算量较小),但经第一转换模型转换的图像的质量较低。相应地,第二转换模型的操作时长较长(计算量较大),
但经第二转换模型转换的图像的质量较高。
[0036]
作为另一示例,上述多个候选转换模型可以包含三个转换模型,即,具有第一计算量的第一转换模型、具有第二计算量的第二转换模型和具有第三计算量的第三转换模型,并且第一计算量小于第二计算量,第二计算量小于第三计算量。第一转换模型可以是诸如双三次(bicubic)插值的简单算法,第二转换模型可以是结构较简单的深度学习模型,并且第三转换模型可以是结构较复杂的深度学习模型。
[0037]
应理解,经过上述操作,可以得到视频中的每帧图像中的每个图像块的对应于多个转换模型的转换结果,即,具有第二分辨率的图像块。因此,需要建立一个模型选择的决策方式来为每帧图像选择一个最为合适的转换模型,以便在视频接收方的图像重建操作中使用。
[0038]
在206,视频提供方110可以确定经转换的每个图像块的对应于上述多个候选转换模型的多个质量因子。以图3中的图像300为例,当图像块被三种不同的转换模型处理时,可以确定图像块301的三个转换结果的质量因子[a1、b1、c1]以及图像块302的三个转换结果的质量因子[a2、b2、c2]。应理解,质量因子a1、a2可以对应于上述第一转换模型的转换结果,质量因子b1、b2可以对应于上述第二转换模型的转换结果,质量因子c1、c2可以对应于上述第三转换模型的转换结果。
[0039]
在某些实施例中,质量因子可以是诸如峰值信噪比psnr、结构相似度ssim等的指标,用于确定经重建或转换的图像与原高分辨率图像(即真值图像)的相近程度。应理解,被重建的图像与原高分辨率图像越相近,其质量因子就越高。
[0040]
在208,视频提供方110可以基于上述多个质量因子以及上述多个候选转换模型的计算量因子,从这些候选转换模型中为每个图像块选择转换模型。应理解,计算量因子用于表示各候选转换模型执行图像转换或图像重建操作所需的运算量、算力、或者操作时长。为了更高效地实现高分辨率图像重建,可以为复杂度较低、或者还可以理解为质量要求较低的图像块选择计算量较低、操作时间较短的转换模型,并且可以为复杂度较高、或者还可以理解为质量要求较高的图像块选择计算量较高、操作时间较长的转换模型。以此方式,可以减少整个图像后者整个视频的重建操作时长。
[0041]
应理解,可以为模型的选择确定若干决策方式来为相应的图像块选择最合适的转换模型。在某些实施例中,针对每个图像块,如果确定该图像块的对应于第二转换模型的第二质量因子与该图像块的对应于第一转换模型的第一质量因子的差小于或等于第一预定阈值,则为该图像块选择第一转换模型。换言之,如果该图像块被两个转换模型转换的图像的质量相近,则可以为该图像块选择计算量较低、操作时间较短的第一转换模型。否则,可以为该图像块选择计算量较高、操作时间较长的第二转换模型。
[0042]
在某些实施例中,针对每个图像块,如果确定该图像块的对应于第二转换模型的第二质量因子与该图像块的对应于第一转换模型的第一质量因子的差相对于第一质量因子的比率小于或等于第二预定阈值,则为该图像块选择第一转换模型。在该实施例中,考虑了两种转换模型的转换结果的质量因子的变化程度。也就是说,如果第一质量因子和第二质量因子均具有很高的得分,这是即便第一质量因子和第二质量因子具有一定的差异,也可以认为第一质量因子和第二质量因子的质量因子的变化幅度不大。在这种情况下,仍然可以为该图像块选择计算量较低、操作时间较短的第一转换模型。否则,可以为该图像块选
择计算量较高、操作时间较长的第二转换模型。应理解,上述方案可以扩展至三个转换模型、四个转换模型、甚至更多转换模型的情况。还应理解,上述选择策略还可以基于用户的偏好进行调整。作为示例,当用户更倾向于保证重建图像的质量后者更倾向于缩短重建处理时间时,可以调整上述第一预定阈值或第二预定阈值。
[0043]
在210,视频提供方110可以基于每个图像块的位置信息以及为每个图像块选择的转换模型,生成用于将第一图像转换为具有第二分辨率的第二图像的元数据。以图3为例,视频提供方110可以在元数据中记录视频中的图像300的图像块301所对应的转换模型,即,[f1,l1,r2,m2],f1用于表示图像块所处的帧,l1用于表示图像块在帧中的列(横坐标),r1用于表示图像块在帧中的行(纵坐标),m2用于表示上述第二转换模型。
[0044]
在某些实施例中,第一图像可以是包含多帧图像的第一视频,并且第二图像可以是包含多帧图像的第二视频。以图1为例,视频提供方110可以将第一视频和上述元数据发送至视频请求方130,以将第一视频转换为第二视频。备选地或附加地,视频提供方110可以将第一视频和上述元数据发送至边缘节点120,以将第一视频转换为第二视频,并且边缘节点120可以将具有高分辨率的第二视频发送至视频请求方130。
[0045]
与图2相对应地,图4示出了根据本公开的实施例的图像处理的过程400的流程图。在某些实施例中,过程400可以在图1中的边缘节点120或视频请求方130中实现。现参照图4并结合图1描述根据本公开实施例的对图像进行高分辨率重建的过程400。为了便于理解,在下文描述中提及的具体实例均是示例性的,并不用于限定本公开的保护范围。
[0046]
在402,边缘节点120或视频请求方130可以接收具有第一分辨率的第一图像和用于图像转换的元数据。应理解,该第一图像包含多个图像块,并且该元数据用于指示多个转换模型中用于转换上述多个图像块中的每个图像块所使用的相应转换模型。
[0047]
在某些实施例中,元数据可以是基于每个图像块的位置信息以及为每个图像块选择的转换模型而生成的,并且上述多个候选转换模型可以至少包括具有第一计算量的第一转换模型和具有第二计算量的第二转换模型,且第一计算量小于第二计算量。以此方式,可以提升图像转换的效率,节约了算力,并且缩短了因重建产生的时延。
[0048]
在某些实施例中,针对每个图像块,如果确定该图像块的对应于第二转换模型的第二质量因子与该图像块的对应于第一转换模型的第一质量因子的差小于或等于第一预定阈值,则可以确定为该图像块选择的转换模型是第一转换模型。
[0049]
在某些实施例中,针对每个图像块,如果确定该图像块的对应于第二转换模型的第二质量因子与该图像块的对应于第一转换模型的第一质量因子的差相对于第一质量因子的比率小于或等于第二预定阈值,则可以确定为每个图像块选择的转换模型是第一转换模型。
[0050]
在404,边缘节点120或视频请求方130可以基于上述元数据,将多个图像块分别转换为具有第二分辨率的多个图像块,第二分辨率高于第一分辨率。
[0051]
并且,在406,边缘节点120或视频请求方130可以基于经转换的多个图像块,生成具有较高的第二分辨率的第二图像。
[0052]
为了更为清晰地展示本公开的主要思路,图5示出了根据本公开的实施例的将视频从视频提供方传输至视频请求方的过程500的高级别管道图。
[0053]
如图5所示,当诸如视频网站、游戏引擎等的视频提供方510在向视频请求方530发
送具有较低分辨率的视频之前,视频提供方510需要预先生成501元数据,该元数据中记录了上述具有较低分辨率的视频中的每帧图像中的每个图像块所对应的转换模型。如上文所述,该转换模型可以基于多个候选转换模型的计算量因子以及经转换的图像块的质量因子来从这些候选转换模型中选择。
[0054]
之后,视频提供方510可以响应于视频请求方530的请求(未示出)向与视频请求方530邻近的边缘节点520传输502具有较低分辨率的视频,并且同时地或顺次地,向边缘节点520传输503上述元数据。边缘节点520在收到具有较低分辨率的视频以及元数据后,并非逐帧、而是逐图像块地利用元数据中为每个图像块选择的转换模型来执行图像重建504。当图像重建完成后,边缘节点520将重建好的图像传输505给视频请求方530。备选地或附加地,可以不经由边缘节点520,而直接利用视频请求方530来执行图像重建。
[0055]
通过上述各实施例,与传统的按帧重建高分辨率视频的方式不同,本公开按图像块来重建高分辨率视频,并且本公开利用了不同复杂程度的多个候选模型来有选择地进行图像块的重建。因此,本公开实现了在更细力度上的图像重建的算力调度,从而可以更有效率的利用有限的算力资源。此外,由于节约了算力,故同样缩短了图像重建的处理时间,因此可以使高分辨率视频或图像的重建应用于实时通信领域。此外,本公开还提供了为图像块选择合适的转换模型的多个方式,从而可以提升图像、视频的重建效率,使得重建的图像在质量和时延方面均满足用户需求,提升用户体验。
[0056]
图6示出了可以用来实现本公开的实施例的示例电子设备600的示意性框图。例如,电子设备600可被用于实现图1中所示的计算设备120。如图所示,电子设备600包括中央处理单元(cpu)601,其可以根据存储在只读存储器(rom)602中的计算机程序指令或者从存储单元608加载到随机访问存储器(ram)603中的计算机程序指令,来执行各种适当的动作和处理。在ram 603中,还可存储设备600操作所需的各种程序和数据。cpu 601、rom 602以及ram 603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。
[0057]
设备600中的多个部件连接至i/o接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0058]
处理单元601执行上文所描述的各个方法和处理,例如过程200、400。例如,在一些实施例中,上文所描述的各个方法和处理可以被实现为计算机软件程序或计算机程序产品,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由rom 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到ram 603并由cpu 601执行时,可以执行上文描述的任何过程中的一个或多个步骤。备选地,在其他实施例中,cpu 601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行诸如过程200、400的过程。
[0059]
本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
[0060]
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备、任意的非暂时性存储设备或者上述的任意合适的组
合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
[0061]
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
[0062]
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c++等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
[0063]
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
[0064]
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
[0065]
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
[0066]
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0067]
以上已经描述了本公开的各实施方式,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施方式。在不偏离所说明的各实施方式的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施方式的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施方式。
技术特征:
1.一种生成元数据的方法,包括:将具有第一分辨率的第一图像划分为多个图像块;利用多个候选转换模型,将所述多个图像块中的每个图像块转换为具有第二分辨率的图像块,所述第二分辨率高于所述第一分辨率;确定经转换的每个图像块的对应于所述多个候选转换模型的多个质量因子;基于所述多个质量因子以及所述多个候选转换模型的计算量因子,从所述多个候选转换模型中为每个图像块选择转换模型;以及基于每个图像块的位置信息以及为每个图像块选择的转换模型,生成用于将所述第一图像转换为具有所述第二分辨率的第二图像的所述元数据。2.根据权利要求1所述的方法,其中所述多个候选转换模型至少包括具有第一计算量的第一转换模型和具有第二计算量的第二转换模型,所述第一计算量小于所述第二计算量。3.根据权利要求2所述的方法,其中为每个图像块选择转换模型包括:针对每个图像块,如果确定该图像块的对应于所述第二转换模型的第二质量因子与该图像块的对应于所述第一转换模型的第一质量因子的差小于或等于第一预定阈值,为该图像块选择所述第一转换模型。4.根据权利要求2所述的方法,其中为每个图像块选择转换模型包括:针对每个图像块,如果确定该图像块的对应于所述第二转换模型的第二质量因子与该图像块的对应于所述第一转换模型的第一质量因子的差相对于所述第一质量因子的比率小于或等于第二预定阈值,为该图像块选择所述第一转换模型。5.根据权利要求1所述的方法,其中所述第一图像是包含多帧图像的第一视频,所述第二图像是包含多帧图像的第二视频,所述方法还包括:将所述第一视频和所述元数据发送至视频请求方,以将所述第一视频转换为所述第二视频。6.根据权利要求5所述的方法,其中所述位置信息指示每个图像块在所述第一视频和所述第二视频的相应帧中的位置。7.一种图像处理方法,包括:接收具有第一分辨率的第一图像和用于图像转换的元数据,所述第一图像包含多个图像块,并且所述元数据用于指示多个转换模型中用于转换所述多个图像块中的每个图像块所使用的相应转换模型;基于所述元数据,将所述多个图像块分别转换为具有第二分辨率的多个图像块,所述第二分辨率高于所述第一分辨率;以及基于经转换的多个图像块,生成具有所述第二分辨率的第二图像。8.根据权利要求7所述的方法,其中所述元数据是基于每个图像块的位置信息以及为每个图像块选择的转换模型而生成的,并且所述多个候选转换模型至少包括具有第一计算量的第一转换模型和具有第二计算量的第二转换模型,所述第一计算量小于所述第二计算量。9.根据权利要求8所述的方法,其中针对每个图像块:如果确定该图像块的对应于所述第二转换模型的第二质量因子与该图像块的对应于
所述第一转换模型的第一质量因子的差小于或等于第一预定阈值,为该图像块选择的转换模型是所述第一转换模型。10.根据权利要求8所述的方法,其中针对每个图像块:如果确定该图像块的对应于所述第二转换模型的第二质量因子与该图像块的对应于所述第一转换模型的第一质量因子的差相对于所述第一质量因子的比率小于或等于第二预定阈值,为该图像块选择的转换模型是所述第一转换模型。11.一种电子设备,包括:处理器;以及与所述处理器耦合的存储器,所述存储器具有存储于其中的指令,所述指令在被处理器执行时使所述电子设备执行动作,所述动作包括:将具有第一分辨率的第一图像划分为多个图像块;利用多个候选转换模型,将所述多个图像块中的每个图像块转换为具有第二分辨率的图像块,所述第二分辨率高于所述第一分辨率;确定经转换的每个图像块的对应于所述多个候选转换模型的多个质量因子;基于所述多个质量因子以及所述多个候选转换模型的计算量因子,从所述多个候选转换模型中为每个图像块选择转换模型;以及基于每个图像块的位置信息以及为每个图像块选择的转换模型,生成用于将所述第一图像转换为具有所述第二分辨率的第二图像的所述元数据。12.根据权利要求11所述的电子设备,其中所述多个候选转换模型至少包括具有第一计算量的第一转换模型和具有第二计算量的第二转换模型,所述第一计算量小于所述第二计算量。13.根据权利要求12所述的电子设备,其中为每个图像块选择转换模型包括:针对每个图像块,如果确定该图像块的对应于所述第二转换模型的第二质量因子与该图像块的对应于所述第一转换模型的第一质量因子的差小于或等于第一预定阈值,为该图像块选择所述第一转换模型。14.根据权利要求12所述的电子设备,其中为每个图像块选择转换模型包括:针对每个图像块,如果确定该图像块的对应于所述第二转换模型的第二质量因子与该图像块的对应于所述第一转换模型的第一质量因子的差相对于所述第一质量因子的比率小于或等于第二预定阈值,为该图像块选择所述第一转换模型。15.根据权利要求11所述的电子设备,其中所述第一图像是包含多帧图像的第一视频,所述第二图像是包含多帧图像的第二视频,所述方法还包括:将所述第一视频和所述元数据发送至视频请求方,以将所述第一视频转换为所述第二视频。16.根据权利要求15所述的电子设备,其中所述位置信息指示每个图像块在所述第一视频和所述第二视频的相应帧中的位置。17.一种电子设备,包括:处理器;以及与所述处理器耦合的存储器,所述存储器具有存储于其中的指令,所述指令在被处理器执行时使所述电子设备执行动作,所述动作包括:
接收具有第一分辨率的第一图像和用于图像转换的元数据,所述第一图像包含多个图像块,并且所述元数据用于指示多个转换模型中用于转换所述多个图像块中的每个图像块所使用的相应转换模型;基于所述元数据,将所述多个图像块分别转换为具有第二分辨率的多个图像块,所述第二分辨率高于所述第一分辨率;以及基于经转换的多个图像块,生成具有所述第二分辨率的第二图像。18.根据权利要求17所述的电子设备,其中所述元数据是基于每个图像块的位置信息以及为每个图像块选择的转换模型而生成的,并且所述多个候选转换模型至少包括具有第一计算量的第一转换模型和具有第二计算量的第二转换模型,所述第一计算量小于所述第二计算量。19.根据权利要求18所述的电子设备,其中针对每个图像块:如果确定该图像块的对应于所述第二转换模型的第二质量因子与该图像块的对应于所述第一转换模型的第一质量因子的差小于或等于第一预定阈值,为该图像块选择的转换模型是所述第一转换模型。20.根据权利要求18所述的电子设备,其中针对每个图像块:如果确定该图像块的对应于所述第二转换模型的第二质量因子与该图像块的对应于所述第一转换模型的第一质量因子的差相对于所述第一质量因子的比率小于或等于第二预定阈值,为该图像块选择的转换模型是所述第一转换模型。21.一种计算机程序产品,所述计算机程序产品被有形地存储在计算机可读介质上并且包括机器可执行指令,所述机器可执行指令在被执行时使机器执行根据权利要求1至10中的任一项所述的方法。
技术总结
本公开提供了生成元数据的方法、图像处理方法、电子设备和程序产品。该方法可以包括将具有第一分辨率的第一图像划分为多个图像块,利用多个候选转换模型,将多个图像块中的每个图像块转换为具有第二分辨率的图像块,第二分辨率高于第一分辨率。该方法可以包括确定经转换的每个图像块的对应于多个候选转换模型的多个质量因子。该方法可以包括基于多个质量因子以及多个候选转换模型的计算量因子,从多个候选转换模型中为每个图像块选择转换模型,并且基于每个图像块的位置信息以及为每个图像块选择的转换模型,生成用于将第一图像转换为具有第二分辨率的第二图像的元数据。本公开的实施例能够提升图像重建的效率,节约算力,减少时延,提升用户体验。提升用户体验。提升用户体验。
技术研发人员:陈强 P
受保护的技术使用者:戴尔产品有限公司
技术研发日:2022.01.21
技术公布日:2023/8/1
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/