一种HEVC帧内预测模式快速选择方法、装置及介质与流程
未命名
09-22
阅读:58
评论:0
一种hevc帧内预测模式快速选择方法、装置及介质
技术领域
1.本发明涉及视频编码技术领域,特别涉及一种hevc帧内预测模式快速选择方法、装置及介质。
背景技术:
2.随着高清、超高清视频应用逐步走进人们的生活,视频应用的高清化使现有的视频编码技术面临巨大挑战。为此,作为下一代视频编码技术——高效视频编码(hevc)正式发布,在hevc标准中,帧内预测模式的选择过程采用粗选模式过程(rough mode decision,rmd)和率失真优化(rdo)相结合的方式,选择最优的帧内预测模式。但是,目前的预测模式数量较多,编码时间较长,编码复杂度的急剧增加。
技术实现要素:
3.本发明提供了一种hevc帧内预测模式快速选择方法、装置及介质,可以减少编码时间。
4.根据本发明的一方面,本发明一实施例提供的hevc帧内预测模式快速选择方法,包括:获取预测单元的尺寸;当所述预测单元的尺寸小于或等于预设尺寸时,计算所述预测单元与相邻预测单元的结构相似性指数;当所述结构相似性指数大于预设阈值时,将大于预设阈值的所述结构相似性指数对应的预测模式加入到集合中;以及根据所述集合中的所述预测模式以及率失真代价值最小原则,确定最优预测模式。
5.在一实施例中,在所述计算所述预测单元与相邻预测单元的结构相似性指数之后,所述hevc帧内预测模式快速选择还包括:当所述结构相似性指数小于或等于所述预设阈值时,计算所述预测单元在预设方向上的梯度幅度值;根据所述梯度幅度值,获取对应预设的预测模式集合;按照代价值由小到大排列所述预测模式集合中的所述预测模式;根据所述预测单元的尺寸,选择对应数量的所述预测模式作为候选模式;其中,所述根据所述集合中的所述预测模式以及率失真代价值最小原则,确定最优预测模式包括:根据所述候选模式以及率失真代价值最小原则,确定所述最优预测模式。
6.在一实施例中,在所述根据所述集合中的所述预测模式以及率失真代价值最小原则,确定最优预测模式之前,所述hevc帧内预测模式快速选择还包括:当所述预测单元的尺寸大于所述预设尺寸时,计算所述预测单元在预设方向上的梯度幅度值;根据所述梯度幅度值,获取对应预设的预测模式集合;按照代价值由小到大排列所述预测模式集合中的所述预测模式;根据所述预测单元的尺寸,选择对应数量的所述预测模式作为候选模式;其中,所述根据所述集合中的所述预测模式以及率失真代价值最小原则,确定最优预测模式包括:根据所述候选模式以及率失真代价值最小原则,确定所述最优预测模式。
7.在一实施例中,所述预设方向包括:垂直方向,水平方向,π/4方向,3π/4方向,垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向;其中,所述当所述预测单元的尺寸大于所述预设尺寸时,计算所述预测单元在预设方向上的梯度幅度值包括:
当所述预测单元的尺寸大于所述预设尺寸时,计算所述预测单元在垂直方向,水平方向,π/4方向,3π/4方向,垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向上的8个梯度幅度值。
8.在一实施例中,所述根据所述梯度幅度值,获取对应预设的预测模式集合包括:对比多个所述梯度幅度值与预设参数,获取小于所述预设参数的所述梯度幅度值对应的所述预测模式集合;其中,所述预测模式包括33种角度预测模式,所述预测模式集合包括33种角度预测模式根据垂直方向,水平方向,π/4方向,3π/4方向,垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向划分的多个集合。
9.在一实施例中,所述预设参数与所述梯度幅度值之和正相关,所述预设参数与所述梯度幅度值的数量负相关;其中,所述梯度幅度值之和包括所述预测单元在每个所述预设方向上的梯度值之和,所述梯度幅度值的数量包括所述预测单元在每个所述预设方向上的梯度值的数量之和。
10.在一实施例中,所述根据所述候选模式以及率失真代价值最小原则,确定所述最优预测模式包括:分别计算多个所述候选模式的率失真代价值;从多个所述候选模式中选择所述率失真代价值最小的所述候选模式,作为所述最优预测模式。
11.在一实施例中,所述预设尺寸包括4
×
4尺寸;其中,所述当所述预测单元的尺寸小于或等于预设尺寸时,计算所述预测单元与相邻预测单元的结构相似性指数包括:当所述预测单元的尺寸小于或等于4
×
4尺寸时,计算所述预测单元与第一相邻预测单元的所述结构相似性指数、第二相邻预测单元的所述结构相似性指数和第三相邻预测单元的所述结构相似性指数;其中,所述第一相邻预测单元位于所述预测单元相邻的左边,所述第二相邻预测单元位于所述预测单元相邻的左上边,所述第三相邻预测单元位于所述预测单元相邻的上边。
12.根据本发明的另一方面,本发明一实施例提供的一种hevc帧内预测模式快速选择装置,包括:获取模块,用于获取预测单元的尺寸;计算模块,用于当所述预测单元的尺寸小于或等于预设尺寸时,计算所述预测单元与相邻预测单元的结构相似性指数;添加模块,用于当所述结构相似性指数大于预设阈值时,将大于预设阈值的所述结构相似性指数对应的预测模式加入到集合中;以及确定模块,用于根据所述集合中的所述预测模式以及率失真代价值最小原则,确定最优预测模式。
13.根据本发明的另一方面,本发明一实施例提供的计算机可读介质,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行上述任一实施例所述的hevc帧内预测模式快速选择方法。
14.本发明实施例提供的hevc帧内预测模式快速选择方法、装置及介质,利用相邻预测单元之间的空间相关性,跳过复杂选择过程,通过计算相邻预测单元的结构相似性指数,快速地确定预测单元最优预测模式,降低帧内编码的复杂度。
附图说明
15.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据
这些附图获得其他的附图。
16.图1是本发明一个实施例提供的一种hevc帧内预测模式快速选择方法的流程示意图。
17.图2是本发明另一个实施例提供的一种hevc帧内预测模式快速选择方法的流程示意图。
18.图3是本发明一个实施例提供的帧内预测的35种预测模式的结构示意图。
19.图4是本发明一个实施例提供的预测单元的梯度幅度值计算示意图。
20.图5是本发明一个实施例提供的一种预测单元与相邻预测单元的结构示意图。
21.图6是本发明一个实施例提供的一种hevc帧内预测模式快速选择方法的原理示意图。
22.图7是本发明一个实施例提供的一种hevc帧内预测模式快速选择装置的结构示意图。
23.图8是本发明另一个实施例提供的一种hevc帧内预测模式快速选择装置的结构示意图。
具体实施方式
24.随着高清、超高清视频应用逐步走进人们的生活,视频app也进入智能冰箱领域,如分辨率达4k
×
2k、8k
×
4k的大视频应用,视频应用的高清化使现有的视频编码技术面临巨大挑战。为此,正式发布的视频编码技术——高效视频编码(hevc)相比于上一代视频编码技术h.264/avc,压缩效率提高近一倍,而且在保证视频图像质量的前提下,视频编码码率减少了50%左右。hevc采用了许多新的编码技术,如基于四叉树的递归分割结构、不同角度的帧内预测模式和样点自适应补偿等。为了更加灵活有效地适应视频内容,hevc在视频图像的块划分上定义了编码单元(cu)、预测单元(pu)和变换单元(tu)。为了更加准确地反映高清视频纹理特性,hevc帧内编码中采用了35种预测模式,具体包括planar、dc和33种角度预测模式。虽然增加预测模式能够有效地去除空间冗余,达到更好的预测效果,但是却带来了编码的复杂度,一一遍历35种预测模式需要耗费大量时间。
25.因此,本发明提供一种hevc帧内预测模式快速选择方法、装置及介质,利用相邻预测单元之间的空间相关性,跳过复杂选择过程,通过计算相邻预测单元的结构相似性指数,快速地确定预测单元最优预测模式,降低帧内编码的复杂度。
26.图1是本发明一个实施例提供的一种hevc帧内预测模式快速选择方法的流程示意图,如图1所示,该hevc帧内预测模式快速选择方法包括:
27.步骤100:获取预测单元的尺寸。
28.hevc帧内预测模式快速选择方法包括基于结构相似性指数的帧内预测模式快速选择方法和基于梯度幅度的帧内预测模式快速选择方法,根据预测单元的尺寸可以选择对应的预测模式快速选择方法,从而减少编码时间,降低hevc帧内预测模式选择的复杂度。例如,尺寸大小为4
×
4的预测单元,可以利用相邻预测单元单元之间的空间相关性,通过计算相互之间的结构相似性指数,快速地确定最优预测模式,而尺寸大于4
×
4(如8
×
8到64
×
64)的预测单元,可以选择基于梯度幅度的帧内预测模式快速选择方法,通过梯度幅度值确定预测模式集合,减少了经过粗选模式过程(rough mode decision,rmd)的预测模式的个
数,降低帧内编码的复杂度。
29.步骤200:当预测单元的尺寸小于或等于预设尺寸时,计算预测单元与相邻预测单元的结构相似性指数。
30.预设尺寸可以设置为4
×
4尺寸,当预测单元的尺寸小于或等于4
×
4时,定义预测模式集合r并进行初始化,然后计算尺寸大小为4
×
4的预测单元与相邻的左边,左上边,上边尺寸大小为4
×
4的预测单元的结构相似性指数(structural similarity index measure,ssim)。在计算帧内预测单元结构相似性指数时,可以将每个预测单元看作一幅图像,然后计算它与相邻图像之间的ssim值。两个预测单元的结构相似性指数越高,它们之间的误差就越小,表示它们的预测效果更好。若预测单元的尺寸大于预设尺寸,则可以选择基于梯度幅度的帧内预测模式快速选择方法。
31.步骤300:当结构相似性指数大于预设阈值时,将大于预设阈值的结构相似性指数对应的预测模式加入到集合中。
32.获得结构相似性指数之后,根据对不同的视频序列进行测试,可设置预设阈值,如果结构相似性指数大于预设阈值,则将结构相似性指数对应的预测单元的最优预测模式加入到集合r中。若结构相似性指数小于或等于预设阈值,则可以选择基于梯度幅度的帧内预测模式快速选择方法。
33.步骤400:根据集合中的预测模式以及率失真代价值最小原则,确定最优预测模式。
34.基于率失真代价值的计算公式,计算集合r中的预测模式的代价值,从集合中选择代价值最小的预测模式,作为最终的最优预测模式实施。代价值最小的预测模式在给定数据传输速率和失真度量的情况下,可以使数据能够以最小的失真度传输,在最大限度地压缩数据、减少数据传输的成本和存储空间的需求的同时,保持数据的质量。
35.本实施例提供的hevc帧内预测模式快速选择方法,利用相邻预测单元之间的空间相关性,跳过复杂选择过程,通过计算相邻预测单元的结构相似性指数,快速地确定预测单元最优预测模式,降低帧内编码的复杂度。
36.图2是本发明另一个实施例提供的一种hevc帧内预测模式快速选择方法的流程示意图,如图2所示,在上述步骤200之后,hevc帧内预测模式快速选择还可以包括:
37.步骤500:当结构相似性指数小于或等于预设阈值时,计算预测单元在预设方向上的梯度幅度值。
38.在结构相似性指数小于或等于预设阈值的情况下,可以选择基于梯度幅度的帧内预测模式快速选择方法。即计算预测单元在预设方向上的梯度幅度值,预设方向可以包括在垂直方向,水平方向,π/4方向(即45度方向),3π/4方向(即135度方向),垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向,这八个方向的梯度幅度值。计算多个方向的梯度幅度值可以更准确地描述图像中的边缘方向,利于后续其他的图像处理任务。
39.步骤600:根据梯度幅度值,获取对应预设的预测模式集合。
40.hevc帧内编码中采用了35种预测模式,具体包括planar、dc和33种角度预测模式,将33种角度预测模也按照垂直方向,水平方向,π/4方向(即45度方向),3π/4方向(即135度方向),垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向分为8组
模式集合,每组集合包括多个预测模式。将planar模式和dc模式也加入到模式集合中。分别对比每个梯度幅度值与平均梯度幅度值,如果存在梯度幅度值小于平均梯度幅度值,则将小于平均梯度幅度值且是其中的最小值所对应的模式集合作为预测模式集合。
41.步骤700:按照代价值由小到大排列预测模式集合中的预测模式。
42.基于,分别计算预测模式集合中每个预测模式的satd(sum of absolute transformed difference,绝对误差和)代价值,并按照satd代价值由小到大的排列顺序来排列该集合中的所有预测模式。
43.步骤800:根据预测单元的尺寸,选择对应数量的预测模式作为候选模式。
44.例如,预测单元的尺寸为4
×
4和8
×
8,则对应数量的值为8;pu尺寸大小为16
×
16,32
×
32和64
×
64,则对应数量的值为3,选择对应数量的预测模式作为率失真优化(rdo)的候选模式。
45.其中,上述步骤400可以包括:
46.步骤410:根据候选模式以及率失真代价值最小原则,确定最优预测模式。
47.基于率失真代价值的计算公式,计算确定的候选模式的率失真代价值,从候选模式中选择代价值最小的候选模式对应的预测模式,作为最终的最优预测模式实施。代价值最小的预测模式在给定数据传输速率和失真度量的情况下,可以使数据能够以最小的失真度传输,在最大限度地压缩数据、减少数据传输的成本和存储空间的需求的同时,保持数据的质量。
48.将预测单元的角度预测模式分为不同的8组模式集合,由预测单元的梯度幅度值确定预测模式集合的方式,能够有效地减少经过粗选模式过程(rough mode decision,rmd)的次数,减少hevc帧内编码所需要的时间。
49.在一实施例中,如图2所示,在上述步骤400之前,hevc帧内预测模式快速选择还可以包括:
50.步骤900:当预测单元的尺寸大于预设尺寸时,计算预测单元在预设方向上的梯度幅度值。
51.若预测单元的尺寸大于4
×
4(如8
×
8到64
×
64)的预测单元,可以选择基于梯度幅度的帧内预测模式快速选择方法。通过将预测单元的角度预测模式分为不同的8组模式集合,由预测单元的梯度幅度值确定预测模式集合的方式,能够有效地减少经过粗选模式过程(rough mode decision,rmd)的次数,减少hevc帧内编码所需要的时间。
52.步骤600:根据梯度幅度值,获取对应预设的预测模式集合。
53.hevc帧内编码中采用了35种预测模式,具体包括planar、dc和33种角度预测模式,将33种角度预测模也按照垂直方向,水平方向,π/4方向(即45度方向),3π/4方向(即135度方向),垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向分为8组模式集合,每组集合包括多个预测模式。将planar模式和dc模式也加入到模式集合中。分别对比每个梯度幅度值与平均梯度幅度值,如果存在梯度幅度值小于平均梯度幅度值,则将小于平均梯度幅度值且是其中的最小值所对应的模式集合作为预测模式集合。
54.步骤700:按照代价值由小到大排列预测模式集合中的预测模式。
55.基于,分别计算预测模式集合中每个预测模式的satd(sum of absolute transformed difference,绝对误差和)代价值,并按照satd代价值由小到大的排列顺序来
排列该集合中的所有预测模式。
56.步骤800:根据预测单元的尺寸,选择对应数量的预测模式作为候选模式。
57.例如,预测单元的尺寸为4
×
4和8
×
8,则对应数量的值为8;pu尺寸大小为16
×
16,32
×
32和64
×
64,则对应数量的值为3,选择对应数量的预测模式作为率失真优化(rdo)的候选模式。
58.其中,上述步骤400可以包括:
59.步骤410:根据候选模式以及率失真代价值最小原则,确定最优预测模式。
60.基于率失真代价值的计算公式,计算确定的候选模式的率失真代价值,从候选模式中选择代价值最小的候选模式对应的预测模式,作为最终的最优预测模式实施。代价值最小的预测模式在给定数据传输速率和失真度量的情况下,可以使数据能够以最小的失真度传输,在最大限度地压缩数据、减少数据传输的成本和存储空间的需求的同时,保持数据的质量。
61.例如,使用编码视频序列其中一帧时得到尺寸8
×
8的预测单元的亮度值分布,此时基于结构相似度的预测模式快速选择方法不能确定率失真优化(rdo)过程的候选模式集合,需进行基于梯度幅度的预测模式快速选择方法。首先,图3是本发明一个实施例提供的帧内预测的35种预测模式的结构示意图,图4是本发明一个实施例提供的预测单元的梯度幅度值计算示意图,如图3和图4所示将35种角度预测模式按垂直方向,水平方向,π/4方向,3π/4方向,垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向分为8组模式集合,分别得到模式集合s1,s2,s3,s4,s5,s6,s7,s8,分别计算预测单元在上述8个方向的梯度值幅度值,得到预测单元的梯度幅度值gv,gh,g
45
°
,g
135
°
,g
h-u
,g
h-d
,g
v-r
,g
v-l
分别为12.01,9.14,12.25,12.22,6.33,10.38,8.54,9.08,此时梯度幅度值最小值为g
h-u
,比较g
h-u
与预设参数的关系,若此时预设参数根据不同的视频序列进行测试后设置为7,则g
h-u
小于7,选择g
h-u
对应的模式集合s6作为预测模式集合,将planar模式和dc模式加入到集合s6中,作为经过粗选模式过程(rough mode decision,rmd)的候选模式。根据satd代价值的计算公式计算集合s6中所有预测模式的satd代价值,选择代价指值最小的前8种预测模式,在经过率失真优化(rdo)过程最终确定当前预测单元的最优预测模式。satd代价值的计算公式为:j
satd
=satd+λ
×
b;其中,satd表示为残差经过哈达玛变换后系数的绝对值和,λ表示拉格朗日系数,b表示编码当前模式所需要的比特数。
62.通过基于梯度幅度的预测模式快速选择方法,可以避免对当前预测单元进行35种预测模式的全遍历,减少了经过粗选模式过程的次数,节省了编码时间。
63.在一实施例中,预设方向可以包括:垂直方向,水平方向,π/4方向,3π/4方向,垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向;其中,上述步骤900可以包括:当预测单元的尺寸大于预设尺寸时,计算预测单元在垂直方向,水平方向,π/4方向,3π/4方向,垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向上的8个梯度幅度值。
64.若预测单元的尺寸大于4
×
4(如8
×
8到64
×
64)的预测单元,可以选择基于梯度幅度的帧内预测模式快速选择方法。hevc帧内编码中采用了35种预测模式,具体包括planar、dc和33种角度预测模式,将33种角度预测模也按照垂直方向,水平方向,π/4方向(即45度方向),3π/4方向(即135度方向),垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水
平向下π/8方向分为8组模式集合,每组集合包括多个预测模式。通过将预测单元的角度预测模式分为不同的8组模式集合,分别计算预测单元在8个方向上的梯度幅度值,由预测单元的梯度幅度值确定预测模式集合的方式,能够有效地减少经过粗选模式过程(rough mode decision,rmd)的次数,减少hevc帧内编码所需要的时间。
65.计算梯度幅度值的计算公式可以采用:
[0066][0067][0068][0069][0070][0071][0072][0073][0074]
其中,gv表示预测单元在垂直方向的梯度幅度值,gh表示预测单元在水平方向的梯度幅度值,g
45
°
表示预测单元在π/4方向(即45度方向)的梯度幅度值,g
135
°
表示预测单元在3π/4方向(即135度方向)的梯度幅度值,g
v-r
表示预测单元在垂直向右π/8方向的梯度幅度值,g
v-l
表示预测单元在垂直向左π/8方向的梯度幅度值,g
h-u
表示预测单元在水平向上π/8方向的梯度幅度值,g
h-d
表示预测单元在水平向下π/8上的梯度幅度值,p
i,j
为像素点在(i,j)处的亮度值,n可以等于4。
[0075]
对于尺寸大小为8
×
8,16
×
16,32
×
32和64
×
64的预测单元,可将其分为4、16、64、256个4
×
4大小的子pu单元,梯度幅度值如下所示:
[0076][0077]
其中gi为4
×
4子预测单元在垂直方向,水平方向,π/4方向(即45度方向),3π/4方向(即135度方向),垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向上的梯度幅度值,j表示为8
×
8,16
×
16,32
×
32和64
×
64的预测单元,大小分别为1,2,3,4。
[0078]
在一实施例中,上述步骤600可以包括:对比多个梯度幅度值与预设参数,获取小于预设参数的梯度幅度值对应的预测模式集合;其中,预测模式包括33种角度预测模式,预
测模式集合包括33种角度预测模式根据垂直方向,水平方向,π/4方向,3π/4方向,垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向划分的多个集合。
[0079]
hevc帧内编码中采用了35种预测模式,具体包括planar、dc和33种角度预测模式,将33种角度预测模也按照垂直方向,水平方向,π/4方向(即45度方向),3π/4方向(即135度方向),垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向分为8组模式集合,每组集合包括多个预测模式。将planar模式和dc模式也加入到模式集合中。预设参数可以包括平均梯度幅度值,分别对比每个梯度幅度值与平均梯度幅度值,如果存在梯度幅度值小于平均梯度幅度值,则将小于平均梯度幅度值且是其中的最小值所对应的模式集合作为预测模式集合。
[0080]
在一实施例中,预设参数与梯度幅度值之和正相关,预设参数与梯度幅度值的数量负相关;其中,梯度幅度值之和包括预测单元在每个预设方向上的梯度值之和,梯度幅度值的数量包括预测单元在每个预设方向上的梯度值的数量之和。
[0081]
预设参数的计算公式可以采用:
[0082][0083]
其中,α为预设参数,λ为调节因子,8为梯度幅度值的数量,gv为预测单元在垂直方向的梯度幅度值,gh为预测单元在水平方向的梯度幅度值,g
45
°
为预测单元在π/4方向(即45度方向)的梯度幅度值,g
135
°
为预测单元在3π/4方向(即135度方向)的梯度幅度值,g
v-r
为预测单元在垂直向右π/8方向的梯度幅度值,g
v-l
为预测单元在垂直向左π/8方向的梯度幅度值,g
h-u
为预测单元在水平向上π/8方向的梯度幅度值,g
h-d
为预测单元在水平向下π/8上的梯度幅度值。根据对不同的视频序列进行测试后,可以设置λ为不同数值。
[0084]
在一实施例中,上述步骤410可以包括:分别计算多个候选模式的率失真代价值;从多个候选模式中选择率失真代价值最小的候选模式,作为最优预测模式。
[0085]
率失真代价值的计算公式可以采用:
[0086]
j=sse+λr×rmode
[0087]
其中,sse为重建图像与原始图像的误差平方和,λr为拉格朗日系数,r
mode
为图像编码所需要的比特数。
[0088]
在一实施例中,预设尺寸包括4
×
4尺寸;其中,上述步骤200可以包括:当预测单元的尺寸小于或等于4
×
4尺寸时,计算预测单元与第一相邻预测单元的结构相似性指数、第二相邻预测单元的结构相似性指数和第三相邻预测单元的结构相似性指数;其中,第一相邻预测单元位于预测单元相邻的左边,第二相邻预测单元位于预测单元相邻的左上边,第三相邻预测单元位于预测单元相邻的上边。
[0089]
结构相似性指数可以通过如下公式确定:
[0090]
ssim(x,y)=l(x,y)c(x,y)s(x,y)
[0091][0092]
[0093][0094]
其中,ssim表示结构相似性指数,x,y分别表示两个像素块,l(x,y),c(x,y),s(x,y)分别为x,y的亮度函数、对比函数和结构函数,u,σ,σ
xy
分别为x,y的均值,方差,协方差;c1,c2,c3为常数。
[0095]
例如,图5是本发明一个实施例提供的一种预测单元与相邻预测单元的结构示意图,在如图5所示的一帧中,得到当前4
×
4尺寸大小的预测单元与相邻尺寸大小4
×
4的预测单元像素亮度值分布。当前预测单元进行预测模式选择时,首先会计算预测单元与图中相邻预测单元的结构相似性指数。通过上述结构相似性指数计算公式,可得到当前预测单元与左边相邻预测单元的结构相似性指数ssim
pu_l
=0.832,当前预测单元与左上相邻预测单元的结构相似性指数ssim
pu_lu
=0.838,当前预测单元与上边相邻预测单元的结构相似性指数ssim
pu_u
=0.05。
[0096]
将上述得到的结构相似度与预设阈值比较,此时左边相邻的预测单元,上边相邻预测单元和左上边相邻预测单元的最优预测模式分别为29,22,0;若相邻预测单元之间的结构相似性指数大于预设阈值,则将对应相邻预测单元的最优预测模式加入到模式集合r。例如,根据对不同的视频序列进行测试后,可设置预设阈值为0.8,此时预测模式集合r为{0,29};将集合r作为率失真优化(rdo)过程的候选模式集合,根据率失真代价值最小原则可选择出最优的预测模式,此步跳过了粗选模式过程(rough mode decision,rmd),减少编码时间,降低帧内编码的复杂度。
[0097]
图6是本发明一个实施例提供的一种hevc帧内预测模式快速选择方法的原理示意图,如图6所示,开始预测单元的预测模式选择,判断pu(预测单元)尺寸是否为4
×
4尺寸(步骤21),若预测单元尺寸是4
×
4尺寸,则计算相邻pu(预测单元)之间的结构相似性指数,并初始化模式集合r(步骤22),计算完成后判断相邻pu(预测单元)之间的结构相似性指数是否大于预设阈值(步骤23),若预测单元与相邻预测单元的结构相似性指数大于预设阈值,则将相邻pu(预测单元)的最优预测模式加入到预测模式集合r(步骤24),最后根据率失真代价值最小原则,选择最优预测模式(步骤31),确定代价值最小的预测模式作为预测单元的最优预测模式(步骤32)。
[0098]
若预测单元尺寸不为4
×
4尺寸,例如大于4
×
4尺寸,则首先计算pu(预测单元)内各像素点分别在8个主要方向的梯度幅度值(步骤25),选择梯度幅度值最小值所在的集合作为预测模式集合s(步骤26),判断梯度幅度值是否小于预设参数(步骤27),若没有梯度幅度值小于预设参数,则进行正常的rmd(粗选模式)过程(步骤28)。若存在梯度幅度值小于预设参数,先将planar和dc模式加入到模式集合s(步骤29),计算集合s中基于satd的代价值,得到前n种代价值最小的预测模式(步骤30),基于,分别计算预测模式集合中每个预测模式的satd(sum of absolute transformed difference,绝对误差和)代价值,并按照satd代价值由小到大的排列顺序来排列该集合中的所有预测模式,n的取值与pu的尺寸大小有关,若pu尺寸大小为4
×
4和8
×
8,则n的值为8;pu尺寸大小为16
×
16,32
×
32和64
×
64,则n的值为3。最后根据率失真代价值最小原则,选择最优预测模式(步骤31),确定代价值最小的预测模式作为预测单元的最优预测模式(步骤32)。
[0099]
图7是本发明一个实施例提供的一种hevc帧内预测模式快速选择装置的结构示意
图,如图7所示,本发明一实施例提供的一种hevc帧内预测模式快速选择装置8,包括:获取模块81,用于获取预测单元的尺寸;计算模块82,用于当预测单元的尺寸小于或等于预设尺寸时,计算预测单元与相邻预测单元的结构相似性指数;添加模块83,用于当结构相似性指数大于预设阈值时,将大于预设阈值的结构相似性指数对应的预测模式加入到集合中;以及确定模块84,用于根据集合中的预测模式以及率失真代价值最小原则,确定最优预测模式。
[0100]
本发明实施例提供的hevc帧内预测模式快速选择装置,利用相邻预测单元之间的空间相关性,跳过复杂选择过程,通过计算相邻预测单元的结构相似性指数,快速地确定预测单元最优预测模式,降低帧内编码的复杂度。
[0101]
图8是本发明另一个实施例提供的一种hevc帧内预测模式快速选择装置的结构示意图,如图8所示,hevc帧内预测模式快速选择装置8还可以配置为:第一计算模块85,用于当结构相似性指数小于或等于预设阈值时,计算预测单元在预设方向上的梯度幅度值;第二获取模块86,用于根据梯度幅度值,获取对应预设的预测模式集合;排列模块87,用于按照代价值由小到大排列预测模式集合中的预测模式;选择模块88,用于根据预测单元的尺寸,选择对应数量的预测模式作为候选模式;其中,上述确定模块84可以对应配置为:确定单元841,用于根据候选模式以及率失真代价值最小原则,确定最优预测模式。
[0102]
在一实施例中,如图8所示,hevc帧内预测模式快速选择装置8还可以配置为:第二计算模块89,用于当预测单元的尺寸大于预设尺寸时,计算预测单元在预设方向上的梯度幅度值;第二获取模块86,用于根据梯度幅度值,获取对应预设的预测模式集合;排列模块87,用于按照代价值由小到大排列预测模式集合中的预测模式;选择模块88,用于根据预测单元的尺寸,选择对应数量的预测模式作为候选模式;其中,上述确定模块84可以对应配置为:确定单元841,用于根据候选模式以及率失真代价值最小原则,确定最优预测模式。
[0103]
在一实施例中,预设方向可以包括:垂直方向,水平方向,π/4方向,3π/4方向,垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向;其中,上述第二计算模块89可以配置为:当预测单元的尺寸大于预设尺寸时,计算预测单元在垂直方向,水平方向,π/4方向,3π/4方向,垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向上的8个梯度幅度值。
[0104]
在一实施例中,上述第二获取模块86可以包括:对比多个梯度幅度值与预设参数,获取小于预设参数的梯度幅度值对应的预测模式集合;其中,预测模式包括33种角度预测模式,预测模式集合包括33种角度预测模式根据垂直方向,水平方向,π/4方向,3π/4方向,垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向划分的多个集合。
[0105]
在一实施例中,hevc帧内预测模式快速选择装置8还可以配置为:预设参数包括多个梯度幅度值的平均值;其中,预设参数与梯度幅度值之和正相关,预设参数与梯度幅度值的数量负相关;其中,梯度幅度值之和包括预测单元在每个预设方向上的梯度值之和,梯度幅度值的数量包括预测单元在每个预设方向上的梯度值的数量之和。
[0106]
在一实施例中,上确定单元841可以配置为:分别计算多个候选模式的率失真代价值;从多个候选模式中选择率失真代价值最小的候选模式,作为最优预测模式。
[0107]
在一实施例中,预设尺寸包括4
×
4尺寸;其中,上述计算模块82可以配置为:当预
测单元的尺寸小于或等于4
×
4尺寸时,计算预测单元与第一相邻预测单元的结构相似性指数、第二相邻预测单元的结构相似性指数和第三相邻预测单元的结构相似性指数;其中,第一相邻预测单元位于预测单元相邻的左边,第二相邻预测单元位于预测单元相邻的左上边,第三相邻预测单元位于预测单元相邻的上边。
[0108]
可以理解的是,本发明实施例示意的结构并不构成对hevc帧内预测模式快速选择装置的具体限定。在本发明的另一些实施例中,hevc帧内预测模式快速选择装置可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。
[0109]
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
[0110]
本发明实施例还提供了一种hevc帧内预测模式快速选择装置,包括:至少一个存储器和至少一个处理器;所述至少一个存储器,用于存储机器可读程序;所述至少一个处理器,用于调用所述机器可读程序,执行本发明任一实施例中的hevc帧内预测模式快速选择方法。
[0111]
本发明实施例还提供了一种计算机可读介质,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行本发明任一实施例中的hevc帧内预测模式快速选择方法。具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或cpu或mpu)读出并执行存储在存储介质中的程序代码。
[0112]
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
[0113]
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如cd-rom、cd-r、cd-rw、dvd-rom、dvd-ram、dvd-rw、dvd+rw)、磁带、非易失性存储卡和rom。可选择地,可以由通信网络从服务器计算机上下载程序代码。
[0114]
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
[0115]
此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的cpu等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
[0116]
需要说明的是,上述各流程和各系统结构图中不是所有的步骤和模块都是必须的,可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的,可以根据需要进行调整。上述各实施例中描述的系统结构可以是物理结构,也可以是逻辑结构,即,有些模块可能由同一物理实体实现,或者,有些模块可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
[0117]
以上各实施例中,硬件单元可以通过机械方式或电气方式实现。例如,一个硬件单元可以包括永久性专用的电路或逻辑(如专门的处理器,fpga或asic)来完成相应操作。硬件单元还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器),可以由软件进
行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。
[0118]
上文通过附图和优选实施例对本发明进行了详细展示和说明,然而本发明不限于这些已揭示的实施例,基与上述多个实施例本领域技术人员可以知晓,可以组合上述不同实施例中的代码审核手段得到本发明更多的实施例,这些实施例也在本发明的保护范围之内。
技术特征:
1.一种hevc帧内预测模式快速选择方法,其特征在于,包括:获取预测单元的尺寸;当所述预测单元的尺寸小于或等于预设尺寸时,计算所述预测单元与相邻预测单元的结构相似性指数;当所述结构相似性指数大于预设阈值时,将大于预设阈值的所述结构相似性指数对应的预测模式加入到集合中;以及根据所述集合中的所述预测模式以及率失真代价值最小原则,确定最优预测模式。2.根据权利要求1所述的hevc帧内预测模式快速选择方法,其特征在于,在所述计算所述预测单元与相邻预测单元的结构相似性指数之后,所述hevc帧内预测模式快速选择还包括:当所述结构相似性指数小于或等于所述预设阈值时,计算所述预测单元在预设方向上的梯度幅度值;根据所述梯度幅度值,获取对应预设的预测模式集合;按照代价值由小到大排列所述预测模式集合中的所述预测模式;根据所述预测单元的尺寸,选择对应数量的所述预测模式作为候选模式;其中,所述根据所述集合中的所述预测模式以及率失真代价值最小原则,确定最优预测模式包括:根据所述候选模式以及率失真代价值最小原则,确定所述最优预测模式。3.根据权利要求1所述的hevc帧内预测模式快速选择方法,其特征在于,在所述根据所述集合中的所述预测模式以及率失真代价值最小原则,确定最优预测模式之前,所述hevc帧内预测模式快速选择还包括:当所述预测单元的尺寸大于所述预设尺寸时,计算所述预测单元在预设方向上的梯度幅度值;根据所述梯度幅度值,获取对应预设的预测模式集合;按照代价值由小到大排列所述预测模式集合中的所述预测模式;根据所述预测单元的尺寸,选择对应数量的所述预测模式作为候选模式;其中,所述根据所述集合中的所述预测模式以及率失真代价值最小原则,确定最优预测模式包括:根据所述候选模式以及率失真代价值最小原则,确定所述最优预测模式。4.根据权利要求2或3所述的hevc帧内预测模式快速选择方法,其特征在于,所述预设方向包括:垂直方向,水平方向,π/4方向,3π/4方向,垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向;其中,所述当所述预测单元的尺寸大于所述预设尺寸时,计算所述预测单元在预设方向上的梯度幅度值包括:当所述预测单元的尺寸大于所述预设尺寸时,计算所述预测单元在垂直方向,水平方向,π/4方向,3π/4方向,垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向上的8个梯度幅度值。5.根据权利要求2或3所述的hevc帧内预测模式快速选择方法,其特征在于,所述根据所述梯度幅度值,获取对应预设的预测模式集合包括:对比多个所述梯度幅度值与预设参数,获取小于所述预设参数的所述梯度幅度值对应
的所述预测模式集合;其中,所述预测模式包括33种角度预测模式,所述预测模式集合包括33种角度预测模式根据垂直方向,水平方向,π/4方向,3π/4方向,垂直向右π/8方向,垂直向左π/8方向,水平向上π/8方向,水平向下π/8方向划分的多个集合。6.根据权利要求5所述的hevc帧内预测模式快速选择方法,其特征在于,所述预设参数与所述梯度幅度值之和正相关,所述预设参数与所述梯度幅度值的数量负相关;其中,所述梯度幅度值之和包括所述预测单元在每个所述预设方向上的梯度值之和,所述梯度幅度值的数量包括所述预测单元在每个所述预设方向上的梯度值的数量之和。7.根据权利要求2或3所述的hevc帧内预测模式快速选择方法,其特征在于,所述根据所述候选模式以及率失真代价值最小原则,确定所述最优预测模式包括:分别计算多个所述候选模式的率失真代价值;从多个所述候选模式中选择所述率失真代价值最小的所述候选模式,作为所述最优预测模式。8.根据权利要求1所述的hevc帧内预测模式快速选择方法,其特征在于,所述预设尺寸包括4
×
4尺寸;其中,所述当所述预测单元的尺寸小于或等于预设尺寸时,计算所述预测单元与相邻预测单元的结构相似性指数包括:当所述预测单元的尺寸小于或等于4
×
4尺寸时,计算所述预测单元与第一相邻预测单元的所述结构相似性指数、第二相邻预测单元的所述结构相似性指数和第三相邻预测单元的所述结构相似性指数;其中,所述第一相邻预测单元位于所述预测单元相邻的左边,所述第二相邻预测单元位于所述预测单元相邻的左上边,所述第三相邻预测单元位于所述预测单元相邻的上边。9.一种hevc帧内预测模式快速选择装置,其特征在于,包括:获取模块,用于获取预测单元的尺寸;计算模块,用于当所述预测单元的尺寸小于或等于预设尺寸时,计算所述预测单元与相邻预测单元的结构相似性指数;添加模块,用于当所述结构相似性指数大于预设阈值时,将大于预设阈值的所述结构相似性指数对应的预测模式加入到集合中;以及确定模块,用于根据所述集合中的所述预测模式以及率失真代价值最小原则,确定最优预测模式。10.计算机可读介质,其特征在于,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行权利要求1至8任一所述的hevc帧内预测模式快速选择方法。
技术总结
本申请提供了一种HEVC帧内预测模式快速选择方法、装置及介质,其中,HEVC帧内预测模式快速选择方法包括:获取预测单元的尺寸;当所述预测单元的尺寸小于或等于预设尺寸时,计算所述预测单元的相邻预测单元的结构相似性指数;当所述结构相似性指数大于预设阈值时,将大于预设阈值的所述结构相似性指数对应的预测模式加入到集合中;以及根据所述集合中的所述预测模式以及率失真代价值最小原则,确定最优预测模式。本申请的方案可以减少编码时间。本申请的方案可以减少编码时间。本申请的方案可以减少编码时间。
技术研发人员:付雄 尚靖 任飞
受保护的技术使用者:四川虹美智能科技有限公司
技术研发日:2023.04.17
技术公布日:2023/9/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/