用于视频解码的方法、电子设备、存储介质和程序产品与流程

未命名 10-26 阅读:92 评论:0

用于视频解码的方法、电子设备、存储介质和程序产品
1.本技术是申请号为202080013526.7、申请日为2020年2月19日、题目为“视频编解码中针对长期参考图片的受约束运动矢量导出”的发明申请的分案申请。
技术领域
2.本技术总体涉及视频编解码和压缩。具体地,本公开涉及用于使用对针对长期参考图片的运动矢量导出的约束来执行视频编解码的系统和方法。


背景技术:

3.本部分提供了与本公开相关的背景技术信息。本部分内包含的信息不应必须被解释为现有技术。
4.可使用各种视频编解码技术中的任何视频编解码技术来压缩视频数据。可根据一个或更多个视频编解码标准来执行视频编解码。一些示例性的视频编解码标准包括通用视频编码(vvc)、联合探索测试模型(jem)编码、高效视频编码(h.265/hevc)、高级视频编码(h.264/avc)和运动图片专家组(mpeg)编码。
5.视频编解码通常使用利用了视频图像或序列中固有的冗余的预测方法(例如,帧间预测、帧内预测等)。视频编解码技术的一个目标在于将视频数据压缩为使用更低比特率的形式,同时避免或最小化视频质量的劣化。
6.视频编解码中利用的预测方法通常包括执行空间(帧内)预测和/或时间(帧间)预测来减少或去除视频数据中固有的冗余,并且通常与基于块的视频编解码相关联。
7.在基于块的视频编码中,逐块地处理输入视频信号。对于每个块(也称为编码单元(cu)),可执行空间预测和/或时间预测。
8.空间预测(也称为“帧内预测”)使用来自同一视频图片/条带中的已经编码的邻近块的样点(其被称为参考样点)的像素来预测当前块。空间预测减少了视频信号中固有的空间冗余。
9.时间预测(也称为“帧间预测”或“运动补偿预测”)使用来自已经编码的视频图片的重建像素来预测当前块。时间预测减少了视频信号中固有的时间冗余。通常由指示当前cu与其时间参考之间的运动的量和方向的一个或更多个运动矢量(mv)通知给定cu的时间预测信号。此外,当支持多个参考图片时,另外发送一个参考图片索引,其中该参考图片索引用于识别时间预测信号来自参考图片存储器中的哪个参考图片。
10.在空间和/或时间预测之后,编码器中的模式决策块例如基于率失真优化方法来选择最佳预测模式。然后从当前块中减去预测块;并且使用变换对预测残差进行去相关和量化。对量化的残差系数进行反量化和逆变换以形成重建残差,然后将重建残差加回到预测块以形成块的重建信号。
11.在空间和/或时间预测之后,进一步进行环路滤波,诸如可在将重建cu放入参考图片存储器中并用于对后面的视频块进行编解码之前,将去块滤波器、样点自适应偏移(sao)和自适应环路滤波器(alf)应用于重建cu。为了形成输出的视频比特流,将编码模式(帧间
或帧内)、预测模式信息、运动信息和量化残差系数都发送到熵编码单元以进一步进行压缩和打包以形成比特流。
12.在解码过程中,首先在熵解码单元对视频比特流进行熵解码。将编码模式和预测信息发送到空间预测单元(当帧内编码时)或时间预测单元(当帧间编码时)以形成预测块。将残差变换系数发送到反量化单元和逆变换单元以重建残差块。然后将预测块和残差块相加在一起。在将重建块存储在参考图片存储器中之前,进一步对重建块执行环路滤波。然后将参考图片存储器中的重建视频发送出去以驱动显示设备以及用于预测后面的视频块。
13.在诸如hevc和vvc的视频编解码标准中,参考图片集(rps)概念定义如何在解码图片缓冲器(dpb)中管理先前解码的图片以便用于参考,即样点数据预测和运动矢量预测。一般地,用于参考图片管理的rps概念是以每个条带(在当前vvc中也称为“并行块(tile)”)通知dpb的状态。
14.可将dpb中的图片标记为“用于短期参考”、“用于长期参考”或“不用于参考”。一旦图片被标记为“不用于参考”,它就不再可用于预测,并且当图片不再需要输出时,它可从dpb移除。
15.一般地,就显示顺序(即,图片顺序计数或称为poc)来说,与短期参考图片相比,长期参考图片通常更远离当前图片。长期参考图片与短期参考图片之间的这个区别可影响一些解码过程,诸如时间和空间mv预测或隐式加权预测中的运动矢量缩放。
16.在诸如hevc和vvc的视频编解码标准中,当导出空间和/或时间运动矢量候选时,基于形成对空间和/或时间运动矢量候选的导出的一部分的缩放过程中涉及的特定参考图片是长期参考图片还是非长期参考图片,对该缩放过程施加特定约束。
17.然而,根据诸如当前vvc标准化的视频编解码器规范,尚未对在此类视频编解码器规范中采用的较新的帧间模式视频编解码工具施加针对导出帧间模式编码块的运动矢量候选的类似约束。


技术实现要素:

18.本部分提供了本公开的总体概述,而不是对本公开的全部范围或本公开的所有特征的全面公开。
19.根据本公开的第一方面,在具有一个或更多个处理器和存储将由一个或更多个处理器执行的多个程序的存储器的计算设备处执行视频编解码方法。所述方法包括将视频流中的每个图片分割为多个块或编码单元(cu)。所述方法还包括对经帧间模式编码的那些块执行帧间模式运动矢量导出。所述方法还包括在对帧间模式编码块执行帧间模式运动矢量导出期间操作特定帧间模式编解码工具。所述方法还包括确定与在帧间模式编解码工具的操作中涉及的帧间模式编码块相关联的参考图片中的一个或更多个参考图片是否是长期参考图片,并且基于所述确定来约束针对所述帧间模式编码块的帧间模式编解码工具的操作。
20.根据本技术的第二方面,一种计算设备包括一个或更多个处理器、存储器和存储在存储器中的多个程序。程序在由一个或更多个处理器执行时使计算设备执行如上所述的操作。
21.根据本技术的第三方面,一种非暂态计算机可读存储介质存储用于由具有一个或
更多个处理器的计算设备执行的多个程序。程序在由一个或更多个处理器执行时使计算设备执行如上所述的操作。
附图说明
22.在下文中,将结合附图描述本公开的多组示例性、非限制性实施例。相关领域的普通技术人员可基于本文呈现的示例来实现对结构、方法或功能的变型,并且这些变型都包含在本公开的范围内。在不存在冲突的情况下,不同实施例的教导可以彼此组合,但不需要彼此组合。
23.图1是阐述可与许多视频编解码标准结合使用的示例性的基于块的混合视频编码器的框图。
24.图2是阐述可与许多视频编解码标准结合使用的示例性的视频解码器的框图。
25.图3是可与许多视频编解码标准结合使用的多类型树结构中的块分区的示例图。
26.图4是双向光流(bdof)过程的示例图。
27.图5是在解码器侧运动矢量修正(dmvr)中使用的双边匹配的示例图。
28.图6是在具有运动矢量差的合并模式(mmvd)中使用的搜索点的示例图。
29.图7a是在基于子块的时间运动矢量预测(sbtmvp)模式中使用的空间邻近块的示例图。
30.图7b是在sbtmvp模式中通过应用从空间邻近块识别的运动移位来导出子cu级运动信息的示例图。
具体实施方式
31.本公开中使用的术语旨在说明特定示例,而不是限制本公开。本公开以及所附权利要求中使用的单数形式“一”、“一个”和“该”也指代复数形式,除非上下文中明确包含其他含义。应当理解,如本文所使用的术语“和/或”指代一个或更多个相关联的所列项目的任何或所有可能的组合。
32.应当理解,尽管本文可使用术语“第一”、“第二”、“第三”等来描述各种信息,但是信息不应受这些术语的限制。这些术语仅用于将一类信息与另一类信息区分开。例如,在不脱离本公开内容的范围的情况下,第一信息可被称为第二信息;并且类似地,第二信息也可被称为第一信息。如本文所使用的,根据上下文,术语“如果”可被理解为意指“当......时”或“在......时”或“响应于......”。
33.贯穿本说明书对单数或复数形式的“一个实施例”、“实施例”、“另一实施例”等的引用意指结合实施例描述的一个或更多个特定特征、结构或特性被包括在本公开的至少一个实施例中。因此,贯穿本说明书在各处以单数或复数形式出现的短语“在一个实施例中”或“在实施例中”、“在另一实施例中”等不一定都指代相同的实施例。此外,一个或更多个实施例中的特定特征、结构或特性可以以任何合适的方式组合。
34.在概念上,许多视频编解码标准类似,包括先前在背景技术部分中提到的那些视频编解码标准。例如,几乎所有视频编解码标准使用基于块的处理,并且共享类似视频编解码框架以实现视频压缩。
35.图1示出了可与许多视频编解码标准结合使用的示例性的基于块的混合视频编码
器100的框图。在编码器100中,视频帧被分割为多个视频块以进行处理。对于每个给定视频块,基于帧间预测方法或帧内预测方法来形成预测。在帧间预测中,基于来自先前重建帧的像素,通过运动估计和运动补偿来形成一个或多个预测因子。在帧内预测中,基于当前帧中的重建像素来形成预测因子。通过模式决策,可选择最佳预测因子来预测当前块。
36.将表示当前视频块与其预测因子之间的差的预测残差发送到变换电路102。然后将变换系数从变换电路102发送到量化电路104以进行熵减少。然后将量化的系数馈送到熵编码电路106以生成压缩的视频比特流。如图1所示,来自帧间预测电路和/或帧内预测电路112的预测相关信息110(诸如视频块分割信息、运动矢量、参考图片索引和帧内预测模式)也通过熵编码电路106被馈送并保存到压缩的视频比特流114中。
37.在编码器100中,为了预测的目的,还需要解码器相关电路以便重建像素。首先,通过反量化116和逆变换电路118重建预测残差。该重建的预测残差与块预测因子120组合以生成当前视频块的未经滤波的重建像素。
38.为了提高编解码效率和视觉质量,通常使用环路滤波器。例如,去块滤波器在avc、hevc以及vvc的目前版本中可用。在hevc中,将被称为sao(样点自适应偏移)的附加环路滤波器定义为进一步提高编码效率。在vvc标准的当前版本中,正在积极地研究被称为alf(自适应环路滤波器)的另外的环路滤波器,并且它很有可能被包括在最终标准中。
39.这些环路滤波器操作是可选的。执行这些操作有助于提高编解码效率和视觉质量。它们也可根据由编码器100做出的决策被关闭,以节省计算复杂度。
40.应当注意,如果编码器100打开这些滤波器选项,则帧内预测通常基于未经滤波的重建像素,而帧间预测基于经过滤波的重建像素。
41.图2是阐述可与许多视频编解码标准结合使用的示例性的视频解码器200的框图。该解码器200类似于驻留在图1的编码器100中的重建相关部分。在解码器200(图2)中,首先通过熵解码202对输入的视频比特流201进行解码,以导出量化的系数等级和预测相关信息。然后通过反量化204和逆变换206对量化的系数等级进行处理,以获得重建的预测残差。在帧内/帧间模式选择器212中实现的块预测因子机制被配置为基于经解码的预测信息来执行帧内预测208或运动补偿210。通过使用求和器214对来自逆变换206的重建预测残差和由块预测因子机制生成的预测输出进行求和来获得一组未经滤波的重建像素。在打开环路滤波器的情况下,对这些重建像素执行滤波操作以导出最终重建视频。然后将参考图片存储器中的重建视频发送出去以驱动显示设备以及用于预测后面的视频块。
42.在诸如hevc的视频编解码标准中,可基于四叉树对块进行分割。在诸如目前vvc的较新视频编解码标准中,采用更多的分割方法,并且可基于四叉树、二叉树或三叉树将一个编码树单元(ctu)划分为多个cu以适应变化的局部特性。在目前vvc中的大部分编码模式中不存在对cu、预测单元(pu)和变换单元(tu)的区分,并且每个cu总是用作用于预测和变换两者的基本单元,而无需进一步的分割。然而,在诸如帧内子分割编码模式的一些特定编码模式中,每个cu可仍包含多个tu。在多类型树结构中,首先通过四叉树结构对一个ctu进行分割。然后,可通过二叉树和三叉树结构进一步对每个四叉树叶节点进行分割。
43.图3示出了目前vvc中采用的五种划分类型,即四元分割301、水平二元分割302、垂直二元分割303、水平三元分割304和垂直三元分割305。
44.在诸如hevc和目前vvc的视频编解码标准中,在参考图片集(rps)的概念下,在解
码图片缓冲器(dpb)中管理先前解码的图片以便用于参考。dpb中的图片可被标记为“用于短期参考”、“用于长期参考”或“不用于参考”。
45.当邻近块的参考图片不同于当前块的给定目标参考图片时,空间邻近块的缩放运动矢量可用作当前块的运动矢量预测因子。在针对空间运动候选的缩放过程中,基于当前图片与目标参考图片之间的图片顺序计数(poc)距离以及当前图片与邻近块的参考图片之间的poc距离来计算缩放因子。
46.在诸如hevc和目前vvc的视频编解码标准中,基于针对空间运动候选的缩放过程中涉及的特定参考图片是长期参考图片还是非长期参考图片,对针对空间运动候选的缩放过程施加特定约束。当两个参考图片之一是长期参考图片并且另一个不是长期参考图片时,邻近块的mv被认为无效。当两个参考图片都是长期参考图片时,空间邻近块的mv被直接用作当前块的mvp,并且禁止缩放处理,这是因为两个长期参考图片之间的poc距离通常较大,因此缩放的mv可能不可靠。
47.类似地,在针对时间运动候选的缩放过程中,基于当前图片与目标参考图片之间的poc距离以及同位图片与时间邻近块(也称为同位块)的参考图片之间的poc距离来计算缩放因子。
48.在诸如hevc和目前vvc的视频编解码标准中,还基于针对时间运动候选的缩放过程中涉及的特定参考图片是长期参考图片还是非长期参考图片,对针对时间运动候选的缩放过程施加特定约束。当两个参考图片之一是长期参考图片并且另一个不是长期参考图片时,邻近块的mv被认为无效。当两个参考图片都是长期参考图片时,时间邻近块的mv被直接用作当前块的mvp,并且禁止缩放处理,这是因为两个长期参考图片之间的poc距离通常较大,因此缩放的mv可能不可靠。
49.在诸如目前vvc的较新视频编解码标准中,已引入新的帧间模式编解码工具,并且新的帧间模式编解码工具的一些示例是:双向光流(bdof)、解码器侧运动矢量修正(dmvr)、具有mvd的合并模式(mmvd)、对称mvd(smvd)、具有加权平均的双向预测(bwa)、成对平均合并候选导出和基于子块的时间运动矢量预测(sbtmvp)。
50.视频编解码中的传统双向预测是从已经重建的参考图片获得的两个时间预测块的简单组合。然而,由于基于块的运动补偿的限制,可能存在可在两个预测块的样点之间观察到的其余的小运动,从而降低了运动补偿预测的效率。为了解决这个问题,在目前的vvc中应用bdof,以降低这种运动对一个块内的每个样点的影响。
51.图4是bdof过程的示例图。bdof是在使用双向预测时紧接着基于块的运动补偿预测执行的基于样点的运动修正。在子块周围的一个6
×
6窗口内应用bdof之后,通过最小化参考图片列表0(l0)预测样点和参考图片列表1(l1)预测样点之间的差来计算每个4
×
4子块的运动修正。基于如此导出的运动修正,通过基于光流模型沿运动轨迹对l0/l1预测样点进行插值来计算cu的最终双向预测样点。
52.dmvr是用于具有两个初始通知的mv的合并块的双向预测技术,其中所述mv是可通过使用双边匹配预测被进一步修正的mv。
53.图5是在dmvr中使用的双边匹配的示例图。双边匹配用于通过在两个不同参考图片中沿着当前cu的运动轨迹找到两个块之间的最接近匹配来导出当前cu的运动信息。在匹配过程中使用的代价函数是行子采样的绝对差之和(sad)。在完成匹配过程之后,修正后的
mv用于预测阶段中的运动补偿、去块滤波器中的边界强度计算、用于后续图片的时间运动矢量预测和用于后续cu的跨ctu空间运动矢量预测。在连续运动轨迹的假设下,指向两个参考块的运动矢量mv0和mv1应与当前图片与两个参考图片之间的时间距离(即,td0和td1)成比例。作为特殊情况,在当前图片在时间上介于两个参考图片之间并且从当前图片到两个参考图片的时间距离相同时,双边匹配变为基于镜像的双向mv。
54.除了现有的合并模式之外,目前的vvc还引入了mmvd。在现有的合并模式中,隐式导出的运动信息直接用于当前cu的预测样点生成。在mmvd模式中,在选择合并候选之后,通过通知的mvd信息进一步修正该合并候选。
55.在发送跳过标志和合并标志之后立即通知mmvd标志以指定mmvd模式是否用于cu。mmvd模式信息包括合并候选标志、用于指定运动幅度的距离索引和用于指示运动方向的方向索引。
56.在mmvd模式中,仅允许合并列表中的前两个候选之一被选择为起始mv,并且通知合并候选标志以指定使用这前两个候选中的哪一个。
57.图6是mmvd中使用的搜索点的示例图。将偏移添加到起始mv的水平分量或垂直分量以导出搜索点。距离索引指定运动幅度信息并且指示距起始点的预定义偏移,并且方向索引通过从方向索引到偏移符号的预定义映射来表示偏移相对于起始点的方向。
58.映射的偏移符号的含义可根据起始mv的信息而变化。当起始mv是单向预测mv或双向预测mv,其中,该双向预测mv所参考的参考图片指向当前图片的同一侧(即,多达两个参考图片的poc均大于当前图片poc,或均小于当前图片poc)时,映射的偏移符号指定添加到起始mv的mv偏移的符号。当起始mv是双向预测mv且其两个运动矢量指向当前图片的不同侧(即,一个参考图片的poc大于当前图片poc,并且另一参考图片的poc小于当前图片poc)时,映射的偏移符号指定添加到起始mv的l0运动矢量的mv偏移的符号和添加到起始mv的l1运动矢量的mv偏移的相反符号。
59.然后从通知的mmvd距离和符号导出mv偏移的两个分量,并且从mv偏移分量进一步导出最终mvd。
60.目前的vvc也引入了smvd模式。在smvd模式的情况下,包括l0和l1两者的参考图片索引以及l1的mvd的运动信息不通知而是被导出。在编码器中,smvd运动估计从初始mv评估开始。初始mv候选的集合包括从单向预测搜索获得的mv、从双向预测搜索获得的mv和来自amvp列表的mv。将具有最低率失真代价的初始mv候选选择为用于smvd运动搜索的初始mv。
61.目前的vvc也引入了bwa。在hevc中,通过对从两个参考图片获得的两个预测信号求平均和/或使用两个运动矢量来生成双向预测信号。在目前的vvc中,在bwa的情况下,双预测模式被扩展为允许两个预测信号的加权平均,而不止简单平均。
62.在目前的vvc中,在bwa中允许五个权重。对于每个双向预测的cu,以两种方式之一确定权重。对于非合并cu,在运动矢量差之后通知权重索引,而对于合并cu,基于合并候选索引从邻近块推断权重索引。加权平均双向预测仅应用于具有256或更多个亮度样点的cu(即,cu宽度乘以cu高度大于或等于256)。对于不使用后向预测的图片,使用所有五个权重。对于使用后向预测的图片,仅使用五个权重中的三个权重的预定义子集。
63.目前的vvc还引入了成对平均合并候选导出。在成对平均合并候选导出中,通过对现有合并候选列表中的预定义候选对求平均来生成成对平均候选。针对每个参考列表单独
地计算平均运动矢量。当两个运动矢量在一个列表中都可用时,即使当这两个运动矢量指向不同的参考图片时,也对它们求平均;当只有一个运动矢量可用时,直接使用这一个运动矢量;并且当无运动矢量可用时,列表保持无效。当在添加成对平均合并候选之后合并列表不满时,在末尾插入零mvp,直到达到最大合并候选数量。
64.用于目前vvc的当前参考软件代码库(称为vvc测试模型(vtm))也引入了sbtmvp模式。类似于hevc中的时间运动矢量预测(tmvp),sbtmvp使用同位图片中的运动场来改进用于当前图片中的cu的运动矢量预测和合并模式。由tmvp使用的同一同位图片用于sbtmvp。sbtmvp与tmvp的不同之处在于以下两个主要方面:第一,tmvp在cu级预测运动,而sbtmvp在子cu级预测运动,并且第二,tmvp从同位图片中的同位块(该同位块是相对于当前cu的右下方块或中心块)提取时间运动矢量,而sbtmvp在从同位图片提取时间运动信息之前应用运动移位,其中该运动移位是从来自当前cu的空间邻近块之一的运动矢量获得。
65.图7a和图7b示出sbtmvp模式的操作。sbtmvp在两个步骤中预测当前cu内的子cu的运动矢量。图7a示出第一步骤,其中按照a1、b1、b0和a0的顺序检查空间邻居。一旦识别到具有使用同位图片作为其参考图片的运动矢量的第一空间相邻块,就将该运动矢量选择为将被应用的运动移位。当没有从空间邻居识别到这样的运动时,则将运动移位设置为(0,0)。图7b示出第二步骤,其中应用在第一步骤中识别到的运动移位(即,将运动移位添加到当前块的坐标)以从同位图片获得子cu级运动信息(运动矢量和参考索引)。图7b中采用的示例图示出了将运动移位设置到块a1的运动的示例。然后,对于每个子cu,同位图片中的其相应块(覆盖中心样点的最小运动网格)的运动信息用于导出子cu的运动信息。在识别到同位子cu的运动信息之后,以与hevc的tmvp过程类似的方式将该运动信息转换为当前子cu的运动矢量和参考索引,其中应用时间运动缩放以将时间运动矢量的参考图片与当前cu的参考图片对准。
66.在vtm的第三版本(vtm3)中,包含sbtmvp候选和仿射合并候选两者的组合的基于子块的合并列表用于通知基于子块的合并模式。通过序列参数集(sps)标志来启用或停用sbtmvp模式。当启用sbtmvp模式时,添加sbtmvp预测因子作为基于子块的合并候选的列表的第一条目,并且之后是仿射合并候选。在sps中通知基于子块的合并列表的大小,并且基于子块的合并列表的最大允许大小在vtm3中固定为5。在sbtmvp中使用的子cu尺寸固定为8
×
8,并且如仿射合并模式那样,sbtmvp模式仅适用于宽度和高度两者均大于或等于8的cu。另外的sbtmvp合并候选的编码逻辑与其它合并候选的编码逻辑相同,即,对于p或b条带中的每个cu,执行另外的rd检查以决定是否使用sbtmvp候选。
67.目前的vvc引入了新的帧间模式编解码工具,然而,在hevc和目前的vvc中存在的针对用于导出空间运动候选和时间运动候选的缩放过程的长期参考图片相关约束在一些新工具中没有很好地定义。在本公开中,我们提出了针对新帧间模式编解码工具的与长期参考图片相关的若干约束。
68.根据本公开,在对帧间模式编码块的帧间模式编解码工具的操作期间,将进行关于与帧间模式编解码工具的操作中涉及的帧间模式编码块相关联的参考图片中的一个或更多个参考图片是否是长期参考图片的确定,然后基于该确定,将在对帧间模式编码块的帧间模式编解码工具的操作时施加约束。
69.根据本公开的实施例,帧间模式编解码工具包括成对平均合并候选的生成。
70.在一个示例中,当在生成成对平均合并候选时涉及的平均合并候选是从包括作为长期参考图片的一个参考图片和不是长期参考图片的另一参考图片的预定义候选对生成时,将该平均合并候选认为无效。
71.在同一示例中,在从包括都是长期参考图片的两个参考图片的预定义候选对生成平均合并候选期间,禁止缩放过程。
72.根据本公开的另一实施例,帧间模式编解码工具包括bdof,并且帧间模式编码块是双向预测块。
73.在一个示例中,当确定bdof的操作中涉及的双向预测块的一个参考图片是长期参考图片并且bdof的操作中涉及的双向预测块的另一参考图片不是长期参考图片时,禁止bdof的执行。
74.根据本公开的另一实施例,帧间模式编解码工具包括dmvr,并且帧间模式编码块是双向预测块。
75.在一个示例中,当确定dmvr的操作中涉及的双向预测块的一个参考图片是长期参考图片并且dmvr的操作中涉及的双向预测块的另一参考图片不是长期参考图片时,禁止dmvr的执行。
76.在另一示例中,当确定dmvr的操作中涉及的双向预测块的一个参考图片是长期参考图片并且dmvr的操作中涉及的双向预测块的另一参考图片不是长期参考图片时,将dmvr的执行范围限制为整数像素dmvr的执行范围。
77.根据本公开的另一实施例,帧间模式编解码工具包括mmvd候选的导出。
78.在一个示例中,当确定在mmvd候选的导出中涉及的运动矢量候选具有指向作为长期参考图片的参考图片的运动矢量时,禁止使用该运动矢量候选作为基础运动矢量(也称为起始运动矢量)。
79.在第二示例中,当在mmvd候选的导出中涉及的帧间模式编码块的一个参考图片是长期参考图片并且在mmvd候选的导出中涉及的帧间模式编码块的另一参考图片不是长期参考图片时,并且进一步当基础运动矢量是双向运动矢量时,则对于指向长期参考图片并且也包含在双向基础运动矢量中的一个运动矢量,禁止通过所通知的运动矢量差(mvd)来修改这一个运动矢量。
80.在同一第二示例中,所提出的mvd修改过程将替代地如紧接此段落的框中所示,其中文本的强调部分示出所提出的来自目前vvc中的现有mvd修改过程的修改。
81.[0082][0083]
在第三示例中,当在mmvd候选的导出中涉及的帧间模式编码块的至少一个参考图片是长期参考图片时,并且进一步当基础运动矢量是双向运动矢量时,则在最终mmvd候选的导出中禁止缩放过程。
[0084]
根据本公开的一个或更多个实施例,帧间模式编解码工具包括smvd候选的导出。
[0085]
在一个示例中,当确定运动矢量候选具有指向作为长期参考图片的参考图片的运动矢量时,禁止使用该运动矢量候选作为基础运动矢量。
[0086]
在一些示例中,当在smvd候选的导出中涉及的帧间模式编码块的至少一个参考图片是长期参考图片时,并且进一步当基础运动矢量是双向运动矢量时,则对于指向长期参考图片并且也包含在双向基础运动矢量中的一个运动矢量,禁止通过所通知的mvd修改这一个运动矢量。在其它示例中,当在smvd候选的导出中涉及的帧间模式编码块的一个参考图片是长期参考图片并且在smvd候选的导出中涉及的帧间模式编码块的另一参考图片不是长期参考图片时,并且进一步当基础运动矢量是双向运动矢量时,则对于指向长期参考图片并且也包含在双向基础运动矢量中的一个运动矢量,禁止通过所通知的mvd修改这一个运动矢量。
[0087]
根据本公开的另一实施例,帧间模式编解码工具包括具有加权平均的双向预测,并且帧间模式编码块是双向预测块。
[0088]
在一个示例中,当确定在具有加权平均的双向预测中涉及的双向预测块的至少一
个参考图片是长期参考图片时,禁止使用不均衡加权。
[0089]
根据本公开的另一实施例,帧间模式编解码工具包括运动矢量候选的导出,并且帧间模式编码块是sbtmvp编码块。
[0090]
在一个示例中,在针对sbtmvp编码块的运动矢量候选的导出中使用与针对传统tmvp编码块的运动矢量候选的导出相同的限制。
[0091]
在前一示例的一个改进中,对将在传统tmvp编码块和sbtmvp编码块两者上使用的运动矢量候选的导出的限制包括:一方面,如果在包括目标参考图片和邻近块的参考图片的两个参考图片内,一个参考图片是长期参考图片并且另一参考图片不是长期参考图片,则将时间邻近块的运动矢量视为无效,并且另一方面,当目标参考图片和邻近块的参考图片两者均是长期参考图片时,禁止对时间邻近块的运动矢量的缩放过程的操作,并且将时间邻近块的运动矢量直接用作当前块的运动矢量预测。
[0092]
根据本发明的另一实施例,帧间模式编解码工具包括在运动矢量候选的导出中使用仿射运动模型。
[0093]
在一个示例中,当确定在仿射运动模型的使用中涉及的参考图片是长期参考图片时,禁止在运动矢量候选的导出中使用仿射运动模型。
[0094]
在一个或更多个示例中,所描述的功能可以以硬件、软件、固件或其任何组合来实现。如果以软件实现,则功能可作为一个或更多个指令或代码被存储在计算机可读介质上,或通过计算机可读介质被传输并且由基于硬件的处理单元执行。计算机可读介质可包括计算机可读存储介质,其对应于诸如数据存储介质的有形介质,或包括促进将计算机程序从一处传送到另一处(例如,根据通信协议)的任何介质的通信介质。以此方式,计算机可读介质通常可对应于(1)非暂态的有形计算机可读存储介质、或(2)通信介质,诸如信号或载波。数据存储介质可以是可由一个或更多个计算机或一个或更多个处理器访问以检索用于实现本技术中描述的实施方式的指令、代码和/或数据结构的任何可用介质。计算机程序产品可包括计算机可读介质。
[0095]
此外,可使用包括一个或更多个电路的装置来实现上述方法,其中一个或更多个电路包括专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑设备(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子组件。装置可与其他硬件或软件组件组合地使用电路以执行上述方法。上面公开的每个模块、子模块、单元或子单元可至少部分地使用一个或更多个电路来实现。
[0096]
考虑到本文公开的本发明的说明书和实践,本发明的其他实施例对于本领域技术人员将是显而易见的。本技术旨在覆盖遵循本发明的一般原理的本发明的任何变化、用途或改编,并且包括在本领域已知或惯常实践内的与本公开的这种偏离。说明书和实施例旨在仅被认为是示例性的,本发明的真实范围和精神由所附权利要求指示。
[0097]
应当理解,本发明不限于上述和附图中所示的确切示例,并且可在不脱离其范围的情况下进行各种修改和改变。本发明的范围旨在仅受所附权利要求的限制。

技术特征:
1.一种用于视频解码的方法,包括:获取包括从视频帧分割成的多个块的编码信息的比特流;基于所述编码信息确定与在帧间模式编解码工具的操作中涉及的帧间模式编码块相关联的参考图片中的一个或更多个参考图片是否是长期参考图片;并且基于确定所述一个或更多个参考图片中的两个参考图片中的一个参考图片是长期参考图片且另一参考图片不是长期参考图片,约束针对所述帧间模式编码块的所述帧间模式编解码工具的操作,其中,所述帧间模式编解码工具包括基于子块的时间运动矢量预测sbtmvp;其中,在所述帧间模式编码块是sbtmvp编码块的情况下,所述约束针对所述帧间模式编码块的所述帧间模式编解码工具的操作,包括:在针对所述sbtmvp编码块的运动矢量候选的推导过程中,如果在包括目标参考图片和时间邻近块的参考图片的两个参考图片内,一个参考图片是长期参考图片并且另一参考图片不是长期参考图片,则将所述时间邻近块的运动矢量视为无效。2.根据权利要求1所述的方法,其中所述帧间模式编解码工具还包括双向光流bdof,并且在所述帧间模式编码块是双向预测块的情况下,所述约束针对所述帧间模式编码块的所述帧间模式编解码工具的操作,包括:当确定所述双向预测块的一个参考图片是长期参考图片并且所述双向预测块的另一参考图片不是长期参考图片时,禁止bdof的执行。3.根据权利要求1所述的方法,其中所述帧间模式编解码工具还包括解码器侧运动矢量修正dmvr,并且在所述帧间模式编码块是双向预测块的情况下,所述约束针对所述帧间模式编码块的所述帧间模式编解码工具的操作,包括:当确定所述双向预测块的一个参考图片是长期参考图片并且所述双向预测块的另一参考图片不是长期参考图片时,禁止dmvr的执行。4.根据权利要求1所述的方法,其中在针对所述sbtmvp编码块的运动矢量候选的推导过程中的所述约束同样应用于针对传统时间运动矢量预测tmvp编码块的运动矢量候选的推导过程。5.一种电子设备,包括:一个或更多个处理器;非暂态存储器,被耦接到所述一个或更多个处理器;以及多个程序,被存储在所述非暂态存储器中,其中所述多个程序在由所述一个或更多个处理器执行时使所述计算设备执行如权利要求1-4中任一项所述的用于视频解码的方法。6.一种非暂态计算机可读存储介质,其中所述非暂态计算机可读存储介质存储用于由具有一个或更多个处理器的计算设备执行的多个程序,其中所述多个程序在由所述一个或更多个处理器执行时使所述计算设备执行如权利要求1-4中任一项所述的用于视频解码的方法以处理接收到的视频比特流,并将处理后的视频比特流存储在所述非暂态计算机可读存储介质中。7.一种计算机程序产品,包括存储有指令的计算机可读介质,其中,当所述指令由处理器执行时,所述指令使所述处理器执行如权利要求1-4中任一项所述的用于视频解码的方法。

技术总结
提供了一种用于视频解码的方法、电子设备、存储介质和程序产品。所述方法包括:将视频帧分割为多个块;确定与在帧间预测模式下的解码过程中涉及的帧间模式编码块相关联的参考图片中的一个或更多个参考图片是否是长期参考图片;并且基于所述确定来约束在所述帧间预测模式下针对所述帧间模式编码块的解码过程中的操作。中的操作。中的操作。


技术研发人员:陈漪纹 修晓宇 王祥林 马宗全
受保护的技术使用者:北京达佳互联信息技术有限公司
技术研发日:2020.02.19
技术公布日:2023/10/20
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐