JP7637884B2 - Video encoding device, image encoding method, image encoding program, video decoding device, image decoding method, image decoding program, transmission method and recording method for transmitting bit stream generated by image encoding device - Google Patents
Video encoding device, image encoding method, image encoding program, video decoding device, image decoding method, image decoding program, transmission method and recording method for transmitting bit stream generated by image encoding device Download PDFInfo
- Publication number
- JP7637884B2 JP7637884B2 JP2019171785A JP2019171785A JP7637884B2 JP 7637884 B2 JP7637884 B2 JP 7637884B2 JP 2019171785 A JP2019171785 A JP 2019171785A JP 2019171785 A JP2019171785 A JP 2019171785A JP 7637884 B2 JP7637884 B2 JP 7637884B2
- Authority
- JP
- Japan
- Prior art keywords
- candidate
- motion vector
- prediction
- candidate list
- candidates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、画像をブロックに分割し、予測を行う画像符号化及び復号技術に関する。 The present invention relates to image encoding and decoding technology that divides an image into blocks and performs prediction.
画像の符号化及び復号では、処理の対象となる画像を所定数の画素の集合であるブロックに分割し、ブロック単位で処理をする。適切なブロックに分割し、画面内予測(イントラ予測)、画面間予測(インター予測)を適切に設定することにより、符号化効率が向上する。 When encoding and decoding an image, the image to be processed is divided into blocks, which are collections of a certain number of pixels, and processed on a block-by-block basis. Encoding efficiency is improved by dividing the image into appropriate blocks and setting intra-screen prediction (intra-prediction) and inter-screen prediction (inter-prediction) appropriately.
動画像の符号化・復号では、符号化・復号済みのピクチャから予測するインター予測により符号化効率を向上している。特許文献1には、インター予測の際に、アフィン変換を適用する技術が記載されている。動画像では、物体が拡大・縮小、回転といった変形を伴うことは珍しいことではなく、特許文献1の技術を適用することにより、効率的な符号化が可能となる。
In video encoding and decoding, encoding efficiency is improved by inter-prediction, which predicts from pictures that have already been encoded and decoded.
しかしながら、特許文献1の技術は画像の変換を伴うものであるため、処理負荷が多大という課題がある。本発明は上記の課題に鑑み、低負荷で効率的な符号化技術を提供する。
However, the technology in
上記課題を解決するために、本発明のある態様の画像復号装置は、履歴候補リストに含まれる候補をインター予測で用いたインター予測情報で更新する符号化情報格納部と、復号対象ブロックに隣接する複数のブロックのインター予測情報から空間候補を導出して第1候補リストに前記空間候補を追加する空間候補導出部と、前記履歴候補リストに含まれる1以上の候補を前記第1候補リストに追加して第2候補リストとする履歴候補導出部と、前記第2候補リストに含まれる候補から1つの選択候補を選択する候補選択部と、前記選択候補をインター予測情報としてインター予測を行うインター予測部と、を備え、前記履歴候補導出部は、インター予測モードに応じて前記第1候補リストに含まれる候補と重複する候補を追加するか否かを切り替える。 In order to solve the above problem, an image decoding device according to one aspect of the present invention includes an encoding information storage unit that updates candidates included in a history candidate list with inter prediction information used in inter prediction, a spatial candidate derivation unit that derives spatial candidates from inter prediction information of a plurality of blocks adjacent to a block to be decoded and adds the spatial candidates to a first candidate list, a history candidate derivation unit that adds one or more candidates included in the history candidate list to the first candidate list to create a second candidate list, a candidate selection unit that selects one selection candidate from the candidates included in the second candidate list, and an inter prediction unit that performs inter prediction using the selection candidate as inter prediction information, and the history candidate derivation unit switches whether or not to add a candidate that overlaps with a candidate included in the first candidate list depending on the inter prediction mode.
本発明によれば、高効率な画像符号化・復号処理を低負荷で実現することができる。 The present invention makes it possible to achieve highly efficient image encoding and decoding processing with low load.
本実施の形態において使用する技術、及び技術用語を定義する。 Definitions of the technologies and technical terms used in this embodiment.
<ツリーブロック>
実施の形態では、所定の大きさで符号化・復号処理対象画像を均等分割する。この単位をツリーブロックと定義する。図4に示す通り、本実施の形態では、ツリーブロックのサイズを128x128画素と設定するが、ツリーブロックのサイズはこれに限定されるものではなく、任意のサイズを設定してよい。処理対象(符号化処理においては符号化対象、復号処理においては復号対象に対応する。)のツリーブロックは、ラスタスキャン順、すなわち左から右、上から下の順序で切り替わる。各ツリーブロックの内部は、さらに再帰的な分割が可能である。ツリーブロック分割後の、符号化・復号の対象となるブロックを符号化ブロックと定義する。また、ツリーブロック、符号化ブロックを総称してブロックと定義する。適切なブロック分割を行うことにより効率的な符号化が可能となる。ツリーブロックのサイズは、符号化装置と復号装置で予め取り決めた固定値とすることもできるし、符号化装置が決定したツリーブロックのサイズを復号装置に伝送するような構成をとることもできる。
<Tree Block>
In the embodiment, the image to be encoded/decoded is divided equally into a predetermined size. This unit is defined as a tree block. As shown in FIG. 4, in the embodiment, the size of the tree block is set to 128x128 pixels, but the size of the tree block is not limited to this and may be set to any size. The tree blocks to be processed (corresponding to the encoding target in the encoding process and the decoding target in the decoding process) are switched in raster scan order, that is, from left to right and from top to bottom. The inside of each tree block can be further divided recursively. The block to be encoded/decoded after the tree block division is defined as an encoding block. In addition, the tree block and the encoding block are collectively defined as a block. Efficient encoding is possible by performing appropriate block division. The size of the tree block can be a fixed value previously determined by the encoding device and the decoding device, or a configuration can be adopted in which the size of the tree block determined by the encoding device is transmitted to the decoding device.
<予測モード>
処理対象符号化ブロック単位で、処理対象画像の処理済み(符号化処理においては符号化が完了した信号を復号した画像、画像信号等に用い、復号処理においては復号が完了した画像、予画像信号等に用いる。)の周囲の画像信号から予測を行うイントラ予測(MODE_INTRA)、及び処理済み画像の画像信号から予測を行うインター予測(MODE_INTER)を切り替える。このイントラ予測(MODE_INTRA)とインター予測(MODE_INTER)を識別するモードを予測モード(PredMode)と定義する。予測モード(PredMode)はイントラ予測(MODE_INTRA)、またはインター予測(MODE_INTER)を値として持ち、選択して符号化できる。
<Prediction mode>
For each coding block to be processed, the system switches between intra prediction (MODE_INTRA), which predicts from the surrounding image signals of the processed image to be processed (in coding processing, the signal for which coding has been completed is used for the decoded image, image signal, etc., and in decoding processing, it is used for the image for which decoding has been completed, preview image signal, etc.), and inter prediction (MODE_INTER), which predicts from the image signal of the processed image. A mode for distinguishing between this intra prediction (MODE_INTRA) and inter prediction (MODE_INTER) is defined as a prediction mode (PredMode). The prediction mode (PredMode) has values of intra prediction (MODE_INTRA) or inter prediction (MODE_INTER), and can be selected for coding.
<インター予測>
処理済み画像の画像信号から予測を行うインター予測では、複数の処理済み画像を参照ピクチャとして用いることができる。複数の参照ピクチャを管理するため、L0(参照リスト0)とL1(参照リストL1)の2種類のリストを定義し、それぞれ参照インデックスを用いて参照ピクチャを特定する。PスライスではL0予測(Pred_L0)が利用可能である。BスライスではL0予測(Pred_L0)、L1予測(Pred_L1)、双予測(Pred_BI)が利用可能である。L0予測(Pred_L0)はL0で管理されている参照ピクチャを参照するインター予測であり、L1予測(Pred_L1)はL1で管理されている参照ピクチャを参照するインター予測である。双予測(Pred_BI)はL0予測とL1予測が共に行われ、L0とL1のそれぞれで管理されている1つずつの参照ピクチャを参照するインター予測である。L0予測、L1予測、双予測を特定する情報を、参照モードと定義する。以降の処理において出力に添え字LXが付いている定数、変数に関しては、L0、L1ごとに処理が行われることを前提とする。
<Inter prediction>
In inter prediction, which performs prediction from an image signal of a processed image, multiple processed images can be used as reference pictures. In order to manage multiple reference pictures, two types of lists, L0 (reference list 0) and L1 (reference list L1), are defined, and reference pictures are identified using reference indices. L0 prediction (Pred_L0) is available for P slices. L0 prediction (Pred_L0), L1 prediction (Pred_L1), and bi-prediction (Pred_BI) are available for B slices. L0 prediction (Pred_L0) is inter prediction that refers to a reference picture managed in L0, and L1 prediction (Pred_L1) is inter prediction that refers to a reference picture managed in L1. Bi-prediction (Pred_BI) is inter prediction in which both L0 prediction and L1 prediction are performed, and one reference picture managed in each of L0 and L1 is referenced. Information that identifies L0 prediction, L1 prediction, and bi-prediction is defined as a reference mode. In the following processing, it is assumed that the constants and variables with the subscript LX in the output are processed for each of L0 and L1.
<予測動きベクトルモード>
予測動きベクトルモードは、予測動きベクトルを特定するためのインデックス、差分動きベクトル、参照モード、参照インデックスを伝送し、符号化対象ブロックのインター予測情報を決定するモードである。予測動きベクトルは、処理対象ブロックに近接する処理済みブロック、または処理済み画像に属するブロックで処理対象ブロックと同一位置またはその付近(近傍)に位置するブロックから導出した予測動きベクトル候補と、予測動きベクトルを特定するためのインデックスから導出する。
<Predictive motion vector mode>
The predicted motion vector mode is a mode in which an index for identifying a predicted motion vector, a differential motion vector, a reference mode, and a reference index are transmitted to determine inter prediction information for a block to be coded. The predicted motion vector is derived from a predicted motion vector candidate derived from a processed block adjacent to the block to be processed, or a block belonging to a processed image that is located at the same position as the block to be processed or in the vicinity (neighborhood), and an index for identifying the predicted motion vector.
<マージモード>
マージモードは、差分動きベクトル、参照インデックスを伝送せずに、処理対象ブロックに近接する処理済みブロック、または処理済み画像に属するブロックで処理対象ブロックと同一位置またはその付近(近傍)に位置するブロックのインター予測情報から、処理対象ブロックのインター予測情報を導出するモードである。
処理対象ブロックに近接する処理済みブロック、およびその処理済みブロックのインター予測情報を空間マージ候補と定義する。処理済み画像に属するブロックで処理対象ブロックと同一位置またはその付近(近傍)に位置するブロック、およびそのブロックのインター予測情報から導出されるインター予測情報を時間マージ候補と定義する。各マージ候補は、マージ候補リストに登録され、マージインデックスにより、処理対象ブロックの予測で使用するマージ候補を特定する。
<Merge mode>
The merge mode is a mode in which inter-prediction information for the block to be processed is derived from inter-prediction information for a processed block adjacent to the block to be processed, or a block belonging to a processed image that is located at the same position as the block to be processed or in its vicinity (vicinity), without transmitting a differential motion vector or a reference index.
The spatial merge candidates are defined as processed blocks adjacent to the current block and the inter prediction information of the processed blocks. The temporal merge candidates are defined as blocks belonging to the processed image that are located at the same position as the current block or in the vicinity (neighborhood) and the inter prediction information derived from the inter prediction information of the blocks. Each merge candidate is registered in a merge candidate list, and a merge index identifies the merge candidate to be used in predicting the current block.
<近接ブロック>
図11は、予測動きベクトルモード、マージモードで、インター予測情報を導出するために参照する参照ブロックを説明する図である。A0,A1,A2,B0,B1,B2,B3は、処理対象ブロックに近接する処理済みブロックである。T0は、符号化/復号処理済み画像に属するブロックで符号化/復号処理対象画像の符号化/復号処理対象ブロックと同一位置またはその付近(近傍)に位置するブロックである。
<Proximity block>
11 is a diagram for explaining reference blocks to be referenced for deriving inter prediction information in the predicted motion vector mode and merge mode. A0, A1, A2, B0, B1, B2, and B3 are processed blocks adjacent to the block to be processed. T0 is a block belonging to an image that has been coded/decoded and is located at the same position as the block to be coded/decoded in the image to be coded/decoded or in the vicinity (neighborhood).
A1,A2は、処理対象符号化ブロックの左側に位置し、処理対象符号化ブロックに隣接するブロックである。B1,B3は、処理対象符号化ブロックの上側に位置し、処理対象符号化ブロックに隣接するブロックである。A0,B0,B2はそれぞれ、処理対象符号化ブロックの左下、右上、左上に位置するブロックである。 A1 and A2 are blocks located to the left of the coding block to be processed and adjacent to the coding block to be processed. B1 and B3 are blocks located above the coding block to be processed and adjacent to the coding block to be processed. A0, B0, and B2 are blocks located at the bottom left, top right, and top left, respectively, of the coding block to be processed.
予測動きベクトルモード、マージモードにおいて近接ブロックをどのように扱うかの詳細は後述する。 Details on how adjacent blocks are handled in predicted motion vector mode and merge mode will be given later.
<アフィン変換動き補償>
アフィン変換動き補償は、所定単位のサブブロックに分割し、各サブブロックに対し、個別に動きベクトルを決定し、動き補償を行うものである。各サブブロックの動きベクトルは、処理対象ブロックに近接する処理済みブロック、または処理済み画像に属するブロックで処理対象ブロックと同一位置またはその付近(近傍)に位置するブロックのインター予測情報から導出する1つ以上の制御点に基づき導出する。本実施例では、サブブロックのサイズを4x4画素とするが、サブブロックのサイズはこれに限定されるものではないし、画素単位で動きベクトルを導出してもよい。
<Affine transformation motion compensation>
Affine transformation motion compensation is a method of dividing a block into subblocks of a predetermined unit, determining a motion vector for each subblock individually, and performing motion compensation. The motion vector of each subblock is derived based on one or more control points derived from inter-prediction information of a processed block adjacent to the block to be processed, or a block belonging to a processed image that is located at the same position as the block to be processed or in the vicinity (neighborhood). In this embodiment, the size of the subblock is 4x4 pixels, but the size of the subblock is not limited to this, and the motion vector may be derived in units of pixels.
図14に、制御点が2つの場合のアフィン変換動き補償の例を示す。この場合、2つの制御点が水平方向成分、垂直方向成分の2つのパラメータを有するため、制御点が2つの場合のアフィン変換を、4パラメータアフィン変換と呼称する。図14のCP1、CP2が制御点である。図15に、制御点が3つの場合のアフィン変換動き補償の例を示す。この場合、3つの制御点が水平方向成分、垂直方向成分の2つのパラメータを有するため、制御点が3つの場合のアフィン変換を、6パラメータアフィン変換と呼称する。図15のCP1、CP2、CP3が制御点である。 Figure 14 shows an example of affine transformation motion compensation when there are two control points. In this case, the two control points have two parameters, a horizontal component and a vertical component, so the affine transformation when there are two control points is called a four-parameter affine transformation. CP1 and CP2 in Figure 14 are the control points. Figure 15 shows an example of affine transformation motion compensation when there are three control points. In this case, the three control points have two parameters, a horizontal component and a vertical component, so the affine transformation when there are three control points is called a six-parameter affine transformation. CP1, CP2, and CP3 in Figure 15 are the control points.
アフィン変換動き補償は、予測動きベクトルモードおよびマージモードのいずれのモードにおいても利用可能である。予測動きベクトルモードでアフィン変換動き補償を適用するモードをサブブロック予測動きベクトルモードと定義し、マージモードでアフィン変換動き補償を適用するモードをサブブロックマージモードと定義する。 Affine transform motion compensation can be used in both predictive motion vector mode and merge mode. The mode in which affine transform motion compensation is applied in predictive motion vector mode is defined as sub-block predictive motion vector mode, and the mode in which affine transform motion compensation is applied in merge mode is defined as sub-block merge mode.
<インター予測のシンタックス>
図12、図13を用いて、インター予測に関するシンタックスを説明する。図12のmerge_flagは、処理対象符号化ブロックをマージモードとするか、予測動きベクトルモードとするかを示すフラグである。merge_affine_flagは、マージモードの処理対象符号化ブロックでサブブロックマージモードを適用するか否かを示すフラグである。inter_affine_flagは、予測動きベクトルモードの処理対象符号化ブロックでサブブロック予測動きベクトルモードを適用するか否かを示すフラグである。cu_affine_type_flagは、サブブロック予測動きベクトルモードにおいて、制御点の数を決定するためのフラグである。図13に各シンタックスエレメントの値と、それに対応する予測方法を示す。merge_flag=1,merge_affine_flag=0は、サブブロックマージでないマージモードである、通常マージモードに対応する。merge_flag=1,merge_affine_flag=1は、サブブロックマージモードに対応する。merge_flag=0,inter_affine_flag=0は、サブブロック予測動きベクトルモードでない予測動きベクトルマージである、通常予測動きベクトルモードに対応する。merge_flag=0,inter_affine_flag=1は、サブブロック予測動きベクトルモードに対応する。merge_flag=0,inter_affine_flag=1の場合は、さらにcu_affine_type_flagを伝送し、制御点の数を決定する。
<Inter prediction syntax>
The syntax related to inter prediction will be described with reference to FIG. 12 and FIG. 13. In FIG. 12, merge_flag is a flag indicating whether the processing target coding block is to be in merge mode or predicted motion vector mode. merge_affine_flag is a flag indicating whether or not the sub-block merge mode is applied to the processing target coding block in merge mode. inter_affine_flag is a flag indicating whether or not the sub-block predicted motion vector mode is applied to the processing target coding block in predicted motion vector mode. cu_affine_type_flag is a flag for determining the number of control points in the sub-block predicted motion vector mode. FIG. 13 shows the values of each syntax element and the corresponding prediction method. merge_flag=1, merge_affine_flag=0 correspond to the normal merge mode, which is a merge mode that is not a sub-block merge. merge_flag=1, merge_affine_flag=1 correspond to the sub-block merge mode. merge_flag=0, inter_affine_flag=0 correspond to the normal predicted motion vector mode, which is a predicted motion vector merge that is not a sub-block predicted motion vector mode. The case where merge_flag=0 and inter_affine_flag=1 corresponds to a sub-block predicted motion vector mode. When merge_flag=0 and inter_affine_flag=1, cu_affine_type_flag is further transmitted to determine the number of control points.
<POC>
POC(Picture Order Count)は符号化されるピクチャに関連付けられる変数とし、ピクチャの出力順序で1ずつ増加する値が設定される。POCの値によって、同じピクチャであるかを判別したり、出力順序でのピクチャ間の前後関係を判別したり、ピクチャ間の距離を導出したりすることができる。例えば、2つのピクチャのPOCが同じ値を持つ場合、同一のピクチャであると判断できる。2つのピクチャのPOCが違う値を持つ場合、POCの値が小さいピクチャのほうが、先に出力されるピクチャであると判断でき、2つのピクチャのPOCの差が時間軸方向でのピクチャ間距離を示す。
<POC>
POC (Picture Order Count) is a variable associated with a picture to be coded, and a value that increases by one in the output order of the picture is set. The value of POC can be used to determine whether the pictures are the same, to determine the order of pictures in the output order, and to derive the distance between pictures. For example, when two pictures have the same POC value, they can be determined to be the same picture. When two pictures have different POC values, it can be determined that the picture with the smaller POC value is the picture to be output first, and the difference between the POCs of the two pictures indicates the distance between the pictures in the time axis direction.
(第1の実施の形態)
本発明の第1の実施の形態に係る画像符号化装置100及び画像復号装置200について説明する。
First Embodiment
An image encoding device 100 and an image decoding device 200 according to a first embodiment of the present invention will be described.
図1は、第1の実施の形態に係る画像符号化装置100のブロック図である。実施の形態の動画像符号化装置は、画像符号化装置100、ブロック分割部101、インター予測部102、イントラ予測部103、復号画像メモリ104、予測方法決定部105、残差信号生成部106、直交変換・量子化部107、ビット列符号化部108、逆量子化・逆直交変換部109、復号画像信号重畳部110、および符号化情報格納メモリ111を備える。
Fig. 1 is a block diagram of an image coding device 100 according to a first embodiment. The video coding device according to the embodiment includes an image coding device 100, a
ブロック分割部101は、入力した画像を再帰的に分割して、符号化ブロックを生成する。ブロック分割部101は、分割対象となるブロックを水平方向と垂直方向にそれぞれ分割する4分割部と、分割対象となるブロックを水平方向または垂直方向のいずれかに分割する2-3分割部を含む。生成した処理対象符号化ブロックの画像信号を、インター予測部102、イントラ予測部103および残差信号生成部106に供給する。また、決定した再帰分割構造を示す情報をビット列符号化部108に供給する。ブロック分割部101の詳細な動作は後述する。
The
インター予測部102は、処理対象符号化ブロックのインター予測を行う。符号化情報格納メモリに格納されている予測モード、復号画像メモリ104に格納されている復号済みの画像信号から複数のインター予測情報の候補を導出し、複数の候補の中から適したインター予測モードを選択し、選択されたインター予測モード、及び選択されたインター予測モードに応じた予測画像信号を予測方法決定部105に供給する。インター予測部102の詳細な構成と動作は後述する。
The
イントラ予測部103は、処理対象符号化ブロックのイントラ予測を行う。復号画像メモリ104に格納されている復号済みの画像信号からイントラ予測により予測画像信号を生成し、複数のイントラ予測モードの中から適したイントラ予測モードを選択し、選択されたイントラ予測モード、及び選択されたイントラ予測モードに応じた予測画像信号を予測方法決定部105に供給する。図10にイントラ予測の例を示す。図10(a)は、イントラ予測の予測方向と予測モード番号の対応を示したものである。例えば、予測モード50は、垂直方向に画素をコピーすることによりイントラ予測画像を生成する。予測モード1は、DCモードであり、処理対象ブロックのすべての画素値を参照画素の平均値とするモードである。予測モード0はPlanarモードであり、垂直方向・水平方向の参照画素から2次元的なイントラ予測画像を作成するモードである。図10(b)は、予測モード40の場合のイントラ予測画像を生成する例である。処理対象ブロックの各画素に対し、予測モードの示す方向の参照画素の値をコピーする。予測モードの参照画素が整数位置でない場合には、周辺の整数位置の参照画素値から補間により参照画素値を決定する。
The
復号画像メモリ104は、復号画像信号重畳部110で生成した復号画像を格納する。復号画像メモリに格納されている復号画像は、インター予測部102、インター予測103に供給する。
The decoded
予測方法決定部105は、各予測に対して、符号化情報及び残差信号の符号量、予測画像信号と画像信号との間の歪量等を用いて評価することにより、最適な予測モード(インター予測またはイントラ予測)を決定する。インター予測のマージモードの場合は、マージインデックス、サブブロックマージモードか否かを示す情報(サブブロックマージフラグ)の符号化情報をビット列符号化部108に供給し、インター予測の予測動きベクトルモードの場合はインター予測モード、予測動きベクトルインデックス、L0、L1の参照インデックス、差分動きベクトル、サブブロックモードか否かを示す情報(サブブロック予測動きベクトルフラグ)等の符号化情報をビット列符号化部108に供給する。決定した符号化情報を符号化情報格納メモリ111に供給する。
The prediction
残差信号生成部106は、処理対象の画像信号から予測画像信号を減ずることにより残差信号を生成し、直交変換・量子化部107に供給する。
The residual
直交変換・量子化部107は、残差信号に対して量子化パラメータに応じて直交変換及び量子化を行い直交変換・量子化された残差信号を生成し、ビット列符号化部108と逆量子化・逆直交変換部109に供給する。
The orthogonal transform and
ビット列符号化部108は、シーケンス、ピクチャ、スライス、符号化ブロック単位の情報に加えて、符号化ブロック毎に予測方法決定部104によって決定された予測方法に応じた符号化情報を符号化する。具体的には、符号化ブロック毎の予測モードPredMode、分割モードPartMode、インター予測(PRED_INTER)の場合、マージモードかどうかを判別するフラグ、サブブロックマージフラグ、マージモードの場合はマージインデックス、マージモードでない場合はインター予測モード、予測動きベクトルインデックス、差分動きベクトルに関する情報、サブブロック予測動きベクトルフラグ等の符号化情報を後述する規定のシンタックス規則に従って符号化し、第1の符号化ビット列を生成する。また、ビット列符号化部108は、直交変換及び量子化された残差信号を規定のシンタックス規則に従ってエントロピー符号化して第2の符号化ビット列を生成する。第1の符号化ビット列と第2の符号化ビット列を規定のシンタックス規則に従って多重化し、ビットストリームを出力する。
The bit
逆量子化・逆直交変換部109は、直交変換・量子化部107から供給された直交変換・量子化された残差信号を逆量子化及び逆直交変換して残差信号を算出し、復号画像信号重畳部110に供給する。
The inverse quantization and inverse
復号画像信号重畳部110は、予測方法決定部105による決定に応じた予測画像信号と逆量子化・逆直交変換部109で逆量子化及び逆直交変換された残差信号を重畳して復号画像を生成し、復号画像メモリ104に格納する。なお、復号画像に対して符号化によるブロック歪等の歪を減少させるフィルタリング処理を施した後、復号画像メモリ104に格納してもよい。
The decoded image
符号化情報格納メモリ111は、予測方法決定部105で決定した、予測モード(インター予測またはイントラ予測)等の符号化情報を格納する。符号化情報格納メモリ111が格納する符号化情報は、インター予測の場合は、決定した動きベクトル、参照リスト、参照インデックスに加え、インター予測のマージモードの場合は、マージインデックス、サブブロックマージモードか否かを示す情報(サブブロックマージフラグ)の符号化情報、インター予測の予測動きベクトルモードの場合はインター予測モード、L0、L1の予測動きベクトルインデックス、L0、L1の参照インデックス、L0、L1の差分動きベクトル、サブブロックモードか否かを示す情報(サブブロック予測動きベクトルフラグ)、イントラ予測の場合は、決定したイントラ予測モード等である。符号化情報格納メモリ111で管理される履歴候補リストの構築については後述する。
The coding
図2は図1の動画像符号化装置に対応した本発明の実施の形態に係る動画像復号装置の構成を示すブロックである。実施の形態の動画像復号装置は、ビット列復号部201、ブロック分割部202、インター予測部203、イントラ予測部204、符号化情報格納メモリ205、逆量子化・逆直交変換部206、復号画像信号重畳部207、および復号画像メモリ208を備える。
Figure 2 is a block diagram showing the configuration of a video decoding device according to an embodiment of the present invention, which corresponds to the video encoding device of Figure 1. The video decoding device according to the embodiment includes a
図2の動画像復号装置の復号処理は、図1の動画像符号化装置の内部に設けられている復号処理に対応するものであるから、図2の符号化情報格納メモリ205、逆量子化・逆直交変換部206、復号画像信号重畳部207、および復号画像メモリ208の各構成は、図1の動画像符号化装置の逆量子化・逆直交変換部109、復号画像信号重畳部110、符号化情報格納メモリ111、および復号画像メモリ104の各構成とそれぞれ対応する機能を有する。
The decoding process of the video decoding device in FIG. 2 corresponds to the decoding process provided inside the video encoding device in FIG. 1, so each of the components of the encoding
ビット列復号部201に供給されるビットストリームは規定のシンタックスの規則に従って分離する。分離された第1の符号化ビット列を復号し、シーケンス、ピクチャ、スライス、符号化ブロック単位の情報、及び、符号化ブロック単位の符号化情報を得る。具体的には、符号化ブロック単位でインター予測(PRED_INTER)かイントラ予測(PRED_INTRA)かを判別する予測モードPredMode、分割モードPartMode、インター予測(PRED_INTER)の場合、マージモードかどうかを判別するフラグ、マージモードの場合はマージインデックス、サブブロックマージフラグ、予測動きベクトルモードである場合はインター予測モード、L0、L1の予測動きベクトルインデックス、L0、L1の参照インデックス、L0、L1の差分動きベクトル、サブブロック予測動きベクトルフラグ等に関する符号化情報を後述する規定のシンタックス規則に従って復号し、符号化情報をインター予測部203またはイントラ予測部204、および符号化情報格納メモリ205に供給する。分離した第2の符号化ビット列を復号して直交変換・量子化された残差信号を算出し、直交変換・量子化された残差信号を逆量子化・逆直交変換部208に供給する。
The bit stream supplied to the bit
インター予測部203は、復号対象の符号化ブロックの予測モードPredModeがインター予測(PRED_INTER)で予測動きベクトルモードである時に、符号化情報格納メモリ205に記憶されている既に復号された画像信号の符号化情報を用いて、複数の予測動きベクトルの候補を導出して後述する予測動きベクトル候補リストに登録し、予測動きベクトル候補リストに登録された複数の予測動きベクトルの候補の中から、第1符号化ビット列復号部202で復号され供給される予測動きベクトルインデックスに応じた予測動きベクトルを選択し、ビット列復号部201で復号された差分ベクトルと選択された予測動きベクトルから動きベクトルを算出し、他の符号化情報とともに符号化情報格納メモリ205に格納する。ここで供給・格納する符号化ブロックの符号化情報は、予測モードPredMode、分割モードPartMode、L0予測、及びL1予測を利用するかどうかを示すフラグpredFlagL0[xP][yP], predFlagL1[xP][yP]、L0、L1の参照インデックスrefIdxL0[xP][yP], refIdxL1[xP][yP]、L0、L1の動きベクトルmvL0[xP][yP], mvL1[xP][yP]等である。ここで、xP、yPはピクチャ内での符号化ブロックの左上の画素の位置を示すインデックスである。予測モードPredModeがインター予測(MODE_INTER)で、インター予測モードがL0予測(Pred_L0)の場合、L0予測を利用するかどうかを示すフラグpredFlagL0は1, L1予測を利用するかどうかを示すフラグpredFlagL1は0である。インター予測モードがL1予測(Pred_L1)の場合、L0予測を利用するかどうかを示すフラグpredFlagL0は0, L1予測を利用するかどうかを示すフラグpredFlagL1は1である。インター予測モードが双予測(Pred_BI)の場合、L0予測を利用するかどうかを示すフラグpredFlagL0、L1予測を利用するかどうかを示すフラグpredFlagL1は共に1である。さらに、復号対象の符号化ブロックの予測モードPredModeがインター予測(PRED_INTER)でマージモードの時に、マージ候補を導出する。符号化情報格納メモリ205に記憶されている既に復号された符号化ブロックの符号化情報を用いて、複数のマージの候補を導出して後述するマージ候補リストに登録し、マージ候補リストに登録された複数のマージ候補の中からビット列復号部201で復号され供給されるマージインデックスに対応したマージ候補を選択し、選択されたマージ候補のL0予測、及びL1予測を利用するかどうかを示すフラグpredFlagL0[xP][yP], predFlagL1[xP][yP]、L0、L1の参照インデックスrefIdxL0[xP][yP], refIdxL1[xP][yP]、L0、L1の動きベクトルmvL0[xP][yP], mvL1[xP][yP]等のインター予測情報を動き補償予測部206に供給するとともに、符号化情報格納メモリ205に格納する。ここで、xP、yPはピクチャ内での符号化ブロックの左上の画素の位置を示すインデックスである。インター予測部の詳細な構成と動作は後述する。
When the prediction mode PredMode of the coding block to be decoded is inter prediction (PRED_INTER) and a predicted motion vector mode, the
イントラ予測部204は、復号対象の符号化ブロックの予測モードPredModeがイントラ予測(PRED_INTRA)の時に、イントラ予測を行う。ビット列復号部201で復号された符号化情報にはイントラ予測モードが含まれており、イントラ予測モードに応じて、復号画像メモリ210に格納されている復号済みの画像信号からイントラ予測により予測画像信号を生成し、予測画像信号を復号画像信号重畳部209に供給する。イントラ予測部204は、画像符号化装置100のイントラ予測部103に対応するものであるから、イントラ予測部103と同様の処理を行う。
The
逆量子化・逆直交変換部208は、第1符号化ビット列復号部202で復号された直交変換・量子化された残差信号に対して逆直交変換及び逆量子化を行い、逆直交変換・逆量子化された残差信号を得る。
The inverse quantization and inverse
復号画像信号重畳部209は、動き補償予測部206でインター予測された予測画像信号、またはイントラ予測部204でイントラ予測された予測画像信号と、逆量子化・逆直交変換部208により逆直交変換・逆量子化された残差信号とを重畳することにより、復号画像信号を復号し、復号画像メモリ210に格納する。復号画像メモリ210に格納する際には、復号画像に対して符号化によるブロック歪等を減少させるフィルタリング処理を施した後、復号画像メモリ210に格納してもよい。
The decoded image signal superimposition unit 209 decodes the decoded image signal by superimposing the predicted image signal inter-predicted by the motion
次に、画像符号化装置100におけるブロック分割部101の動作について説明する。図3は、画像をツリーブロックに分割し、各ツリーブロックをさらに分割する動作を示すフローチャートである。まず、入力された画像を、所定サイズのツリーブロックに分割する(ステップS1001)。各ツリーブロックについては、所定の順序、すなわちラスタスキャン順に走査し(ステップS1002)、処理対象のツリーブロックの内部を分割する(ステップS1003)。
Next, the operation of the
図7は、ステップS1003の分割処理の詳細動作を示すフローチャートである。まず、処理対象のブロックを4分割するか否かを判断する(ステップS1101)。 Figure 7 is a flowchart showing the detailed operation of the division process in step S1003. First, it is determined whether or not to divide the block to be processed into four (step S1101).
処理対象ブロックを4分割すると判断した場合は、処理対象ブロックを4分割する(ステップS1102)。処理対象ブロックを分割した各ブロックについて、Zスキャン順、すなわち左上、右上、左下、右下の順に走査する(ステップS1103)。図5は、Zスキャン順の例であり、図6の601は、処理対象ブロックを4分割した例である。図6の601の番号0~3は処理の順番を示したものである。そしてステップS1101で分割した各ブロックについて、図7のフローチャートを再帰的に呼び出す。
If it is determined that the block to be processed should be divided into four, the block to be processed is divided into four (step S1102). Each block into which the block to be processed is divided is scanned in Z scan order, that is, in the order of upper left, upper right, lower left, and lower right (step S1103). Figure 5 is an example of Z scan order, and 601 in Figure 6 is an example of a block to be processed divided into four.
処理対象ブロックを4分割しないと判断した場合は、2-3分割を行う(ステップS1105)。 If it is determined that the block to be processed should not be divided into four, a 2-3 division is performed (step S1105).
図8は、ステップS1105の2-3分割処理の詳細動作を示すフローチャートである。まず、処理対象のブロックを2-3分割するか否か、すなわち2分割または3分割の何れかを行うか否かを判断する(ステップS1201)。 Figure 8 is a flowchart showing the detailed operation of the 2-3 division process in step S1105. First, it is determined whether the block to be processed is to be divided into 2-3, that is, whether to divide into 2 or 3 (step S1201).
処理対象ブロックを2-3分割すると判断しない場合、すなわち分割しないと判断した場合は、分割を終了し(S1211)、上位階層のブロックに戻る。 If it is not determined that the block to be processed should be divided into 2-3, i.e., if it is determined that no division should be made, the division is terminated (S1211) and the process returns to the block in the upper hierarchy.
処理対象のブロックを2-3分割すると判断した場合は、さらに処理対象ブロックを2分割するか否か(ステップS1202)を判断する。 If it is determined that the block to be processed should be divided into 2-3 parts, it is then determined whether or not to further divide the block to be processed into 2 parts (step S1202).
処理対象ブロックを2分割すると判断した場合は、処理対象ブロックを垂直方向に分割するか否かを判断し(ステップS1203)、その結果に基づき、処理対象ブロックを垂直方向に分割する(ステップS1204)か、処理対象ブロックを水平方向に分割する(ステップS1205)。ステップS1204の結果、処理対象ブロックは、図602に示す通り、垂直方向2分割に分割され、ステップS1205の結果、処理対象ブロックは、図604に示す通り、水平方向2分割に分割される。 If it is determined that the target block should be divided into two, it is determined whether or not to divide the target block vertically (step S1203), and based on the result of that determination, the target block is divided vertically (step S1204) or horizontally (step S1205). As a result of step S1204, the target block is divided into two vertically as shown in FIG. 602, and as a result of step S1205, the target block is divided into two horizontally as shown in FIG. 604.
ステップS1202において、処理対象のブロックを2分割すると判断しなかった場合、すなわち3分割すると判断した場合は、処理対象ブロックを垂直方向に分割するか否かを判断し(ステップS1206)、その結果に基づき、処理対象ブロックを垂直方向に分割する(ステップS1207)か、処理対象ブロックを水平方向に分割する(ステップS1208)。ステップS1207の結果、処理対象ブロックは、図603に示す通り、垂直方向3分割に分割され、ステップS1208の結果、処理対象ブロックは、図605に示す通り、水平方向3分割に分割される。 If it is not determined in step S1202 that the block to be processed should be divided into two, i.e., if it is determined that the block to be processed should be divided into three, it is determined whether or not to divide the block to be processed vertically (step S1206), and based on the result, the block to be processed is divided vertically (step S1207) or horizontally (step S1208). As a result of step S1207, the block to be processed is divided vertically into three as shown in FIG. 603, and as a result of step S1208, the block to be processed is divided horizontally into three as shown in FIG. 605.
ステップS1204からステップS1205のいずれかを実行後、処理対象ブロックを分割した各ブロックについて、左から右、上から下の順に走査する(ステップS1209)。図6の602から605の番号0~3は処理の順番を示したものである。分割した各ブロックについて、図8のフローチャートを再帰的に呼び出す。
After executing one of steps S1204 to S1205, each block into which the processing target block is divided is scanned in the order from left to right and top to bottom (step S1209).
ここで説明した再帰的なブロック分割は、分割する回数、または、処理対象のブロックのサイズ等により、分割要否を制限してもよい。分割要否を制限する情報は、符号化装置と復号化装置の間で予め取り決めを行うことで、情報の伝達を行わない構成で実現してもよいし、符号化装置が分割要否を制限する情報を決定し、符号化ビット列に記録することにより、復号化装置に伝達する構成で実現してもよい。 The recursive block division described here may limit the need for division depending on the number of divisions or the size of the block to be processed. The information limiting the need for division may be realized in a configuration in which no information is transmitted by making a prior agreement between the encoding device and the decoding device, or the encoding device may determine the information limiting the need for division and record it in the encoded bit string, thereby transmitting it to the decoding device.
次に、画像復号装置200におけるブロック分割部202の動作について説明する。ブロック分割部202は、画像符号化装置101のブロック分割部101と同様の処理手順でツリーブロックを分割するものである。ただし、画像符号化装置101のブロック分割部101では、画像認識による最適形状の推定や歪レート最適化等最適化手法を適用し、最適なブロック分割の形状を決定するのに対し、画像復号装置200におけるブロック分割部202は、符号化ビット列に記録されたブロック分割情報を復号することにより、ブロック分割形状を決定する点が異なる。
Next, the operation of the
第1の実施の形態のブロック分割に関するシンタックス(符号化ビット列の構文規則)を図9に示す。coding_quadtree()はブロックの4分割処理にかかるシンタックスを表し、multi_type_tree()はブロックの2分割または3分割処理にかかるシンタックスを表す。qt_splitはブロックを4分割するか否かを示すフラグであり、ブロックを4分割する場合は、qt_split=1、4分割しない場合は、qt_split=0とする。4分割する場合(qt_split=1)、4分割した各ブロックについて、再帰的に4分割処理をする(coding_quadtree(0), coding_quadtree(1), coding_quadtree(2), coding_quadtree(3))。4分割しない場合(qt_split=0)は、multi_type_tree()に従い、後続の分割を決定する。mtt_splitは、さらに分割をするか否かを示すフラグである。さらに分割をする場合(mtt_split=1)、垂直方向に分割するか水平方向に分割するかを示すフラグであるmtt_split_verticalと、2分割するか3分割するかを決定するフラグであるmtt_split_binaryを参照する。mtt_split_vertical=1は、垂直方向に分割することを示し、mtt_split_vertical=0は、水平方向に分割することを示す。mtt_split_binary=1は、2分割することを示し、mtt_split_binary=0は3分割することを示す。mtt_split=0となるまで、再帰的にmulti_type_treeを呼び出すことにより、階層的なブロック分割を行う。 The syntax for block division (syntax rules for coded bitstreams) in the first embodiment is shown in Figure 9. coding_quadtree() represents syntax for dividing a block into four, and multi_type_tree() represents syntax for dividing a block into two or three. qt_split is a flag indicating whether or not to divide a block into four. If the block is to be divided into four, qt_split=1 is used. If not, qt_split=0 is used. If the block is to be divided into four (qt_split=1), each block is divided into four and divided into four recursively (coding_quadtree(0), coding_quadtree(1), coding_quadtree(2), coding_quadtree(3)). If not, subsequent divisions are determined according to multi_type_tree(). mtt_split is a flag indicating whether or not to divide the block further. If further division is required (mtt_split=1), the mtt_split_vertical flag indicates whether to divide vertically or horizontally, and the mtt_split_binary flag determines whether to divide into two or three are referenced. mtt_split_vertical=1 indicates to divide vertically, and mtt_split_vertical=0 indicates to divide horizontally. mtt_split_binary=1 indicates to divide into two, and mtt_split_binary=0 indicates to divide into three. Hierarchical block division is performed by recursively calling multi_type_tree until mtt_split=0 is reached.
<インター予測>
実施の形態に係るインター予測方法は、図1の動画像符号化装置のインター予測部102および図2の動画像復号装置のインター予測部203において実施される。
<Inter prediction>
The inter prediction method according to the embodiment is implemented in the
実施の形態によるインター予測方法について、図面を用いて説明する。インター予測方法は符号化ブロック単位で符号化及び復号の処理の何れでも実施される。 The inter prediction method according to the embodiment will be described with reference to the drawings. The inter prediction method is performed in both the encoding and decoding processes on a coding block basis.
(符号化側のインター予測部102の説明)
図16は図1の動画像符号化装置のインター予測部102の詳細な構成を示す図である。通常予測動きベクトル導出部301は複数の通常予測動きベクトル候補を導出して予測動きベクトルを選択し、検出した動きベクトルとの差分ベクトルを算出する。検出されたインター予測モード、参照インデックス、動きベクトル、算出された差分ベクトルが通常予測動きベクトルモードのインター予測情報となる。このインター予測情報がインター予測モード判定部305に供給される。通常予測動きベクトル導出部301の詳細な構成と処理については後述する。
(Explanation of the
Fig. 16 is a diagram showing a detailed configuration of the
通常マージモード導出部302では複数の通常マージ候補を導出して通常マージ候補を選択し、通常マージモードのインター予測情報を得る。このインター予測情報がインター予測モード判定部306に供給される。通常マージモード導出部302の詳細な構成と処理については後述する。
The normal merge
サブブロック予測動きベクトル導出部303では複数のサブブロック予測動きベクトル候補を導出してサブブロック予測動きベクトルを選択し、検出した動きベクトルとの差分ベクトルを算出する。検出されたインター予測モード、参照インデックス、動きベクトル、算出された差分ベクトルが通常予測動きベクトルモードのインター予測情報となる。このインター予測情報がインター予測モード判定部306に供給される。サブブロック予測動きベクトル導出部303の詳細な構成と処理については後述する。
The sub-block predictive motion
サブブロックマージモード導出部304では複数のサブブロックマージ候補を導出してサブブロックマージ候補を選択し、サブブロックマージモードのインター予測情報を得る。このインター予測情報がインター予測モード判定部306に供給される。サブブロックマージモード導出部304の詳細な構成と処理については後述する。
The subblock merging
インター予測モード判定部305では通常予測動きベクトル導出部301、通常マージモード導出部302、サブブロック予測動きベクトル導出部303、サブブロックマージモード導出部304から供給されるインター予測情報に基づいて、インター予測モードを判定する。インター予測モード判定部の305から判定結果に応じたインター予測情報が動き補償予測部306に供給される。
The inter prediction
動き補償予測部306では判定されたインター予測情報に基づいて、復号画像メモリ104に格納されている参照画像信号に対してインター予測を行う。詳細な構成と処理については後述する。
Based on the determined inter prediction information, the motion
<復号側のインター予測部203の説明>
図22は図2の動画像復号装置のインター予測部203の詳細な構成を示す図である。
<Description of the
FIG. 22 is a diagram showing a detailed configuration of the
通常予測動きベクトル導出部401は複数の通常予測動きベクトル候補を導出して予測動きベクトルを選択し、検出した動きベクトルとの差分ベクトルを算出する。検出されたインター予測モード、参照インデックス、動きベクトル、差分ベクトルが通常予測動きベクトルモードのインター予測情報となる。このインター予測情報がスイッチ408を経由して動き補償予測部406に供給される。通常予測動きベクトル導出部401の詳細な構成と処理については後述する。
The normal prediction motion
通常マージモード導出部402では複数の通常マージ候補を導出して通常マージ候補を選択し、通常マージモードのインター予測情報を得る。このインター予測情報がスイッチ408を経由して動き補償予測部406に供給される。通常マージモード導出部402の詳細な構成と処理については後述する。
The normal merge
サブブロック予測動きベクトル導出部403では複数のサブブロック予測動きベクトル候補を導出してサブブロック予測動きベクトルを選択し、検出した動きベクトルとの差分ベクトルを算出する。検出されたインター予測モード、参照インデックス、動きベクトル、算出された差分ベクトルが通常予測動きベクトルモードのインター予測情報となる。このインター予測情報がスイッチ408を経由して動き補償予測部406に供給される。サブブロック予測動きベクトル導出部403の詳細な構成と処理については後述する。
The sub-block predictive motion
サブブロックマージモード導出部404では複数のサブブロックマージ候補を導出してサブブロックマージ候補を選択し、サブブロックマージモードのインター予測情報を得る。このインター予測情報がスイッチ408を経由して動き補償予測部406に供給される。サブブロックマージモード導出部404の詳細な構成と処理については後述する。
The subblock merge
動き補償予測部406では判定されたインター予測情報に基づいて、復号画像メモリ108に格納されている参照画像信号に対してインター予測を行う。詳細な構成と処理については符号化側と同様である。
The motion
<通常予測動きベクトルモード導出部(通常AMVP)>
図16の通常予測動きベクトルモード導出部301は、空間予測動きベクトル候補導出部321、時間予測動きベクトル候補導出部322、履歴予測動きベクトル候補導出部323、予測動きベクトル候補補充部325、通常動きベクトル検出部326、予測動きベクトル候補選択部327、動きベクトル減算部328を含む。
<Normal predicted motion vector mode derivation part (normal AMVP)>
The normal prediction motion vector
図23の通常予測動きベクトルモード導出部402は、空間予測動きベクトル候補導出部421、時間予測動きベクトル候補導出部422、履歴予測動きベクトル候補導出部423、予測動きベクトル候補補充部425、予測動きベクトル候補選択部426、動きベクトル加算部428を含む。
The normal prediction motion vector
符号化側の通常予測動きベクトルモード導出部301および復号側の通常予測動きベクトルモード導出部401の処理手順について、それぞれ図19、図25のフローチャートを用いて説明する。図19は符号化側の通常動きベクトルモード導出部301による通常予測動きベクトルモード導出処理手順を示すフローチャートであり、図25は復号側の通常動きベクトルモード導出部401による通常予測動きベクトルモード導出処理手順を示すフローチャートである。
The processing procedures of the normal prediction motion vector
<通常予測動きベクトルモード導出部(通常AMVP):符号化側の説明>
図19を参照して符号化側の通常予測動きベクトルモード導出処理手順を説明する。
<Normal predicted motion vector mode derivation unit (normal AMVP): Explanation on the encoding side>
The normal predictive motion vector mode derivation process on the encoding side will be described with reference to FIG.
まず、通常動きベクトル検出部326でインター予測モードおよび参照インデックス毎に通常動きベクトルを検出する(図19のステップS100)。
First, the normal motion
続いて、空間予測動きベクトル候補導出部321、時間予測動きベクトル候補導出部322、履歴予測動きベクトル候補導出部323、予測動きベクトル候補補充部325、予測動きベクトル候補選択部327、動きベクトル減算部328で、通常予測動きベクトルモードのインター予測で用いる動きベクトルの差分動きベクトルをL0、L1毎にそれぞれ算出する(図19のステップS101~S106)。具体的には符号化対象ブロックの予測モードPredModeがインター予測(MODE_INTER)で、インター予測モードがL0予測(Pred_L0)の場合、L0の予測動きベクトル候補リストmvpListL0を算出して、予測動きベクトルmvpL0を選択し、L0の動きベクトルmvL0の差分動きベクトルmvdL0を算出する。符号化対象ブロックのインター予測モードがL1予測(Pred_L1)の場合、L1の予測動きベクトル候補リストmvpListL1を算出して、予測動きベクトルmvpL1を選択し、L1の動きベクトルmvL1の差分動きベクトルmvdL1を算出する。符号化対象ブロックのインター予測モードが双予測(Pred_BI)の場合、L0予測とL1予測が共に行われ、L0の予測動きベクトル候補リストmvpListL0を算出して、L0の予測動きベクトルmvpL0を選択し、L0の動きベクトルmvL0の差分動きベクトルmvdL0を算出するとともに、L1の予測動きベクトル候補リストmvpListL1を算出して、L1の予測動きベクトルmvpL1を算出し、L1の動きベクトルmvL1の差分動きベクトルmvdL1をそれぞれ算出する。
Next, the spatial prediction motion vector
L0、L1それぞれについて、差分動きベクトル算出処理を行うが、L0、L1ともに共通の処理となる。したがって、以下の説明においてはL0、L1を共通のLXとして表す。L0の差分動きベクトルを算出する処理ではXが0であり、L1の差分動きベクトルを算出する処理ではXが1である。また、LXの差分動きベクトルを算出する処理中に、LXではなく、もう一方のリストの情報を参照する場合、もう一方のリストをLYとして表す。 Although the differential motion vector calculation process is performed for each of L0 and L1, it is a common process for both L0 and L1. Therefore, in the following explanation, L0 and L1 are represented as a common LX. In the process of calculating the differential motion vector of L0, X is 0, and in the process of calculating the differential motion vector of L1, X is 1. Furthermore, when referring to information from the other list instead of LX during the process of calculating the differential motion vector of LX, the other list is represented as LY.
LXの差分動きベクトルmvdLXを算出する場合(図19のステップS102のYES)、LXの予測動きベクトルの候補を算出してLXの予測動きベクトル候補リストmvpListLXを構築する(図19のステップS103)。通常予測動きベクトルモード導出部301の中の空間予測動きベクトル候補導出部321、時間予測動きベクトル候補導出部322、履歴予測動きベクトル候補導出部323、予測動きベクトル候補補充部325で複数の予測動きベクトルの候補を導出して予測動きベクトル候補リストmvpListLXを構築する。図19のステップS103の詳細な処理手順については図20のフローチャートを用いて後述する。
When calculating the differential motion vector mvdLX of LX (YES in step S102 in FIG. 19), a candidate predicted motion vector of LX is calculated to construct a predicted motion vector candidate list mvpListLX of LX (step S103 in FIG. 19). The spatial predicted motion vector
続いて、予測動きベクトル候補選択部327により、LXの予測動きベクトル候補リストmvpListLXからLXの予測動きベクトルmvpLXを選択する(図19のステップS104)。動きベクトルmvLXと予測動きベクトル候補リストmvpListLXの中に格納された各予測動きベクトルの候補mvpListLX[i]との差分であるそれぞれの差分動きベクトルを算出し、それら差分動きベクトルを符号化したときの符号量を予測動きベクトル候補リストmvpListLXの要素ごとに算出し、予測動きベクトル候補リストmvpListLXに登録された各要素の中で、予測動きベクトルの候補毎の符号量が最小となる予測動きベクトルの候補mvpListLX[i]を予測動きベクトルmvpLXとして選択する。予測動きベクトル候補リストmvpListLXの中で最小の発生符号量となる予測動きベクトルの候補が複数存在する場合には、予測動きベクトル候補リストmvpListLXの中のインデックスiが小さい番号で表される予測動きベクトルの候補mvpListLX[i]を最適予測動きベクトルmvpLXとして選択する。
Next, the predicted motion vector
続いて、動きベクトル減算部328で、LXの動きベクトルmvLXから選択されたLXの予測動きベクトルmvpLXを減算することによりLXの差分動きベクトルmvdLXを算出する(図19のステップS105)。
Then, the motion
(通常予測動きベクトルモード導出部(通常AMVP):復号側の説明)
次に、図25を参照して復号側の通常予測動きベクトルモード処理手順を説明する。復号側では、空間予測動きベクトル候補導出部421、時間予測動きベクトル候補導出部422、履歴予測動きベクトル候補導出部423、予測動きベクトル候補補充部425で、通常予測動きベクトルモードのインター予測で用いる動きベクトルをL0,L1毎にそれぞれ算出する(図25のステップS201~S206)。具体的には復号対象ブロックの予測モードPredModeがインター予測(MODE_INTER)で、復号対象ブロックのインター予測モードがL0予測(Pred_L0)の場合、L0の予測動きベクトル候補リストmvpListL0を算出して、予測動きベクトルmvpL0を選択し、L0の動きベクトルmvL0を算出する。復号対象ブロックのインター予測モードがL1予測(Pred_L1)の場合、L1の予測動きベクトル候補リストmvpListL1を算出して、予測動きベクトルmvpL1を選択し、L1の動きベクトルmvL1を算出する。復号対象ブロックのインター予測モードが双予測(Pred_BI)の場合、L0予測とL1予測が共に行われ、L0の予測動きベクトル候補リストmvpListL0を算出して、L0の予測動きベクトルmvpL0を選択し、L0の動きベクトルmvL0を算出するとともに、L1の予測動きベクトル候補リストmvpListL1を算出して、L1の予測動きベクトルmvpL1を算出し、L1の動きベクトルmvL1をそれぞれ算出する。
(Normal predicted motion vector mode derivation unit (normal AMVP): explanation on the decoding side)
Next, the normal predicted motion vector mode processing procedure on the decoding side will be described with reference to FIG. 25. On the decoding side, the spatial predicted motion vector
符号化側と同様に、復号側でもL0、L1それぞれについて、動きベクトル算出処理を行うが、L0、L1ともに共通の処理となる。したがって、以下の説明においてはL0、L1を共通のLXとして表す。L0の動きベクトルを算出する処理ではXが0であり、L1の動きベクトルを算出する処理ではXが1である。また、LXの動きベクトルを算出する処理中に、LXではなく、もう一方のリストの情報を参照する場合、もう一方のリストをLYとして表す。 As with the encoding side, the decoding side also performs motion vector calculation processing for each of L0 and L1, but the processing is common to both L0 and L1. Therefore, in the following explanation, L0 and L1 are represented as a common LX. In the processing for calculating the motion vector of L0, X is 0, and in the processing for calculating the motion vector of L1, X is 1. Also, when referring to information in the other list instead of LX during the processing for calculating the motion vector of LX, the other list is represented as LY.
LXの動きベクトルmvLXを算出する場合(図25のステップS202のYES)、LXの予測動きベクトルの候補を算出してLXの予測動きベクトル候補リストmvpListLXを構築する(図25のステップS203)。通常予測動きベクトルモード導出部401の中の空間予測動きベクトル候補導出部421、時間予測動きベクトル候補導出部422、履歴予測動きベクトル候補導出部423、予測動きベクトル候補補充部425で複数の予測動きベクトルの候補を算出し、予測動きベクトル候補リストmvpListLXを構築する。図25のステップS203の詳細な処理手順については図20のフローチャートを用いて後述する。
When calculating the motion vector mvLX of LX (YES in step S202 in FIG. 25), a candidate predicted motion vector of LX is calculated and a predicted motion vector candidate list mvpListLX of LX is constructed (step S203 in FIG. 25). The spatial predicted motion vector
続いて、予測動きベクトル候補選択部426で予測動きベクトル候補リストmvpListLXからビット列復号部201にて復号されて供給される予測動きベクトルのインデックスmvpIdxLXに対応する予測動きベクトルの候補mvpListLX[mvpIdxLX]を選択された予測動きベクトルmvpLXとして取り出す(図25のステップS204)。
Then, the motion vector predictor
続いて、動きベクトル加算部427でビット列復号部201にて復号されて供給されるLXの差分動きベクトルmvdLXとLXの予測動きベクトルmvpLXを加算することによりLXの動きベクトルmvLXを算出する(図25のステップS205)。
Then, the
<通常予測動きベクトルモード導出部(通常AMVP):動きベクトルの予測方法>
図20は本発明の実施の形態に係る動画像符号化装置の通常予測動きベクトルモード導出部301及び動画像復号装置の通常予測動きベクトルモード導出部401とで共通する機能を有する通常予測動きベクトルモード導出処理の処理手順を表すフローチャートである。
<Normal predicted motion vector mode derivation unit (normal AMVP): Motion vector prediction method>
Figure 20 is a flowchart showing the processing steps of a normal prediction motion vector mode derivation process having functions common to the normal prediction motion vector
通常予測動きベクトルモード導出部301及び通常予測動きベクトルモード導出部401では、予測動きベクトル候補リストmvpListLXN(NはAまたはB、以下同様)を備えている。予測動きベクトル候補リストmvpListLXNはリスト構造を成し、予測動きベクトル候補リスト内部の所在を示す予測動きベクトルインデックスと、インデックスに対応する予測動きベクトル候補を要素として格納する記憶領域が設けられている。予測動きベクトルインデックスの数字は0から開始され、予測動きベクトル候補リストmvpListLXNの記憶領域に、予測動きベクトル候補が格納される。以降の処理では、予測動きベクトル候補リストmvpListLXNに登録された予測動きベクトルインデックスiの予測動きベクトル候補となる符号化ブロックは、mvpListLXN [i]で表すこととし、予測動きベクトル候補リストmvpListLXNとは配列表記をすることで区別することとする。本実施の形態においては、予測動きベクトル候補リストmvpListLXNは最大で2個の予測動きベクトル候補(インター予測情報)を登録することができるものとする。さらに、予測動きベクトル候補リストmvpListLXNに登録されている予測動きベクトル候補数を示す変数numMvpCandに0を設定する。
The normal prediction motion vector
空間予測動きベクトル候補導出部321及び421は左側に隣接する符号化ブロックからの予測動きベクトルの候補を導出し、左側に隣接する符号化ブロックの予測動きベクトル候補が利用できるかどうかを示すフラグavailableFlagLXA、及び動きベクトルmvLXA、参照インデックスrefIdxA、リストListAを導出し、mvLXAを予測動きベクトル候補リストmvpListLXAに追加する(図20のステップS301)。なお、L0のときXは0、L1のときXは1とする(以下同様)。続いて、予測動きベクトル候補生成部121及び221は上側に隣接する符号化ブロックからの予測動きベクトルの候補を導出し、上側に隣接する符号化ブロックの予測動きベクトル候補が利用できるかどうかを示すフラグavailableFlagLXB、及び動きベクトルmvLXB、参照インデックスrefIdxB、リストListBを導出し、mvLXAとmvLXBが等しくなければ、mvLXBを予測動きベクトル候補リストmvpListLXBに追加する(図20のステップS302)。図20のステップS301とS302の処理は参照する隣接ブロックの位置と数が異なる点以外は共通であり、符号化ブロックの予測動きベクトル候補が利用できるかどうかを示すフラグavailableFlagLXN、及び動きベクトルmvLXN、参照インデックスrefIdxN、ListN(NはAまたはB、以下同様)を導出する。
The spatial prediction motion vector
続いて、時間予測動きベクトル候補導出部322及び422は異なる時間のピクチャの符号化ブロックからの予測動きベクトルの候補を導出し、異なる時間のピクチャの符号化ブロックの予測動きベクトル候補が利用できるかどうかを示すフラグavailableFlagLXCol、及び動きベクトルmvLXCol、参照インデックスrefIdxCol、リストListColを導出し、mvLXColを予測動きベクトル候補リストmvpListLXに追加する(図20のステップS303)。このステップS303の導出処理手順を後ほど詳細に説明する。
Then, the temporal motion vector predictor
ここで、シーケンス(SPS)、ピクチャ(PPS)またはスライスの単位で時間予測動きベクトル候補導出部322及び422の処理を省略することができるものとする。
Here, it is assumed that the processing of the temporal predictor motion vector
続いて、履歴予測動きベクトル候補導出部323及び423は履歴予測動きベクトル候補リストHmvpCandListに登録されている履歴予測動きベクトル候補を予測動きベクトル候補リストmvpListLXに追加する。(図20のステップS304)。このステップS304の登録処理手順については図41のフローチャートを用いて後ほど詳細に説明する。
Next, the history prediction motion vector
続いて予測動きベクトル候補補充部325及び425は予測動きベクトル候補リストmvpListLXを満たすまで(0,0)等、所定の値の動きベクトルを追加する(図20のS305)。
Then, the motion vector predictor
<通常マージモード導出部(通常マージ)>
図18の通常マージモード導出部302は、空間マージ候補導出部341、時間マージ候補導出部342、平均マージ候補導出部344、履歴マージ候補導出部345、マージ候補補充部346、マージ候補選択部347を含む。
<Normal merge mode derivation unit (normal merge)>
The normal merge
図24の通常マージモード導出部402は、空間マージ候補導出部441、時間マージ候補導出部442、平均マージ候補導出部444、履歴マージ候補導出部445、マージ候補補充部446、マージ候補選択部447を含む。
The normal merge
図21は本発明の実施の形態に係る動画像符号化装置の通常マージモード導出部302及び動画像復号装置の通常マージモード導出部402とで共通する機能を有するマージモード導出処理の手順を説明するフローチャートである。
Figure 21 is a flowchart explaining the steps of a merge mode derivation process having a function common to the normal merge
以下、諸過程を順を追って説明する。なお、以下の説明においては特に断りのない限りスライスタイプslice_typeがBスライスの場合について説明するが、Pスライスの場合にも適用できる。ただし、スライスタイプslice_typeがPスライスの場合、インター予測モードとしてL0予測(Pred_L0)だけがあり、L1予測(Pred_L1)、双予測(Pred_BI)がないので、L1に纏わる処理を省略することができる。 Below, the various steps are explained step by step. Note that in the following explanation, unless otherwise specified, the slice type slice_type is a B slice, but it can also be applied to the case of a P slice. However, when the slice type slice_type is a P slice, only L0 prediction (Pred_L0) is available as an inter prediction mode, and there is no L1 prediction (Pred_L1) or bi-prediction (Pred_BI), so the processing related to L1 can be omitted.
通常マージモード導出部302及び通常マージモード導出部402では、マージ候補リストmergeCandListを備えている。マージ候補リストmergeCandListはリスト構造を成し、マージ候補リスト内部の所在を示すマージインデックスと、インデックスに対応するマージ候補を要素として格納する記憶領域が設けられている。マージインデックスの数字は0から開始され、マージ候補リストmergeCandListの記憶領域に、マージ候補が格納される。以降の処理では、マージ候補リストmergeCandListに登録されたマージインデックスiのマージ候補となる符号化ブロックは、mergeCandList[i]で表すこととし、マージ候補リストmergeCandListとは配列表記をすることで区別することとする。本実施の形態においては、マージ候補リストmergeCandListは最大で6個のマージ候補(インター予測情報)を登録することができるものとする。さらに、マージ候補リストmergeCandListに登録されているマージ候補数を示す変数numMergeCandに0を設定する。
The normal merge
空間マージ候補導出部341及び空間マージ候補導出部441では、動画像符号化装置の符号化情報格納メモリ115または動画像復号装置の符号化情報格納メモリ210に格納されている符号化情報から、符号化/復号対象ブロックに隣接するそれぞれの符号化ブロックA,B,C,D,Eからの空間マージ候補A,B,C,D,Eを導出して、導出された空間マージ候補をマージ候補リストmergeCandListに登録する(図21のステップS401)。ここで、A,B,C,D,Eまたは時間マージ候補Colのいずれかを示すNを定義する。符号化ブロックNのインター予測情報が空間マージ候補Nとして利用できるかどうかを示すフラグavailableFlagN、空間マージ候補NのL0の参照インデックスrefIdxL0N及びL1の参照インデックスrefIdxL1N、L0予測が行われるかどうかを示すL0予測フラグpredFlagL0NおよびL1予測が行われるかどうかを示すL1予測フラグpredFlagL1N、L0の動きベクトルmvL0N、L1の動きベクトルmvL1Nを導出する。ただし、本実施の形態においては処理対象となる符号化ブロックを含む符号化ブロックと同じ符号化ブロックに含まれる符号化ブロックを参照せずに、マージ候補を導出するので、処理対象の符号化ブロックを含む符号化ブロックと同じ符号化ブロックに含まれる空間マージ候補は導出しない。
The spatial merge
続いて、時間マージ候補導出部342及び時間マージ候補導出部442では、異なる時間のピクチャからの時間マージ候補を導出して、導出された時間マージ候補をマージ候補リストmergeCandListに登録する(図21のステップS402)。時間マージ候補が利用できるかどうかを示すフラグavailableFlagCol、時間マージ候補のL0予測が行われるかどうかを示すL0予測フラグpredFlagL0ColおよびL1予測が行われるかどうかを示すL1予測フラグpredFlagL1Col、及びL0の動きベクトルmvL0Col、L1の動きベクトルmvL1Colを導出する。ステップS402の詳細な処理手順については図44~図47のフローチャートを用いて後ほど詳細に説明する。
Then, the temporal merge
ここで、シーケンス(SPS)、ピクチャ(PPS)またはスライスの単位で時間マージ候補導出部342及び時間マージ候補導出部442の処理を省略することができるものとする。
Here, it is assumed that the processing of the temporal merge
続いて、平均マージ候補導出部344及び平均マージ候補導出部444では、マージ候補リストmergeCandListから平均マージ候補を導出して、導出された平均マージ候補をマージ候補リストmergeCandListに登録する(図21のステップS403)。平均マージ候補は、マージ候補リストに2以上の候補が含まれている場合に導出される。
Next, the average merge
続いて、履歴マージ候補導出部345及び履歴マージ候補導出部445では、履歴予測動きベクトル候補リストHmvpCandListに登録されている履歴予測動きベクトル候補をマージ候補リストmergeCandListに追加する(図21のステップS404)。ステップS404の詳細な処理手順については図41のフローチャートを用いて後ほど詳細に説明する。
Next, the history merge
続いて、マージ候補補充部346及びマージ候補補充部446では、マージ候補リストmergeCandList内に登録されているマージ候補数numMergeCandが、最大マージ候補数maxNumMergeCandより小さい場合、マージ候補リストmergeCandList内に登録されているマージ候補数numMergeCandが最大マージ候補数maxNumMergeCandを上限として追加マージ候補を導出して、マージ候補リストmergeCandListに登録する(図21のステップS405)。最大マージ候補数maxNumMergeCandを上限として、Pスライスでは、異なる参照インデックスで動きベクトルが(0,0)の値を持つ予測モードがL0予測(Pred_L0)のゼロマージ候補を追加する。Bスライスでは、異なる参照インデックスで動きベクトルが(0,0)の値を持つ予測モードが双予測(Pred_BI)のゼロマージ候補を追加する。
Next, in the merge
続いて、マージ候補選択部347及びマージ候補補充部447では、マージ候補リストmergeCandList内に登録されているマージ候補からマージ候補を選択する。符号化側のマージ候補選択部347では、符号量とひずみ量を算出することによりマージ候補を選択し、選択されたマージ候補を示すマージ・インデックス、マージ候補のインター予測情報を動き補償予測部406に供給する。一方、復号側のマージ候補補充部447では、復号されたマージ・インデックスに基づいて、マージ候補を選択し、選択されたマージ候補を動き補償予測部406に供給する。
Next, the merge
<平均マージ候補>
平均マージ候補について説明する。平均マージ候補は、マージ候補リストに含まれる2つのマージ候補である第1マージ候補と第2マージ候補を利用して導出される。平均マージ候補は、第1マージ候補のL0予測の動きベクトルと第2マージ候補のL0予測の動きベクトルを平均したL0予測の平均動きベクトルと、第1マージ候補のL1予測の動きベクトルと第2マージ候補のL1予測の動きベクトルを平均したL1予測の平均動きベクトルを有するマージ候補である。平均マージ候補のL0予測の参照インデックスは第1マージ候補のL0予測の参照インデックスであり、平均マージ候補のL1予測の参照インデックスは第1マージ候補のL1予測の参照インデックスである。なお、平均動きベクトルの導出においては、動きベクトルの水平方向成分と垂直方向成分について、それぞれ独立して平均する。すなわち、平均マージ候補のL0予測の平均動きベクトルの水平方向成分は、第1マージ候補のL0予測の動きベクトルと第2マージ候補のL0予測の動きベクトルのそれぞれの水平方向成分を平均したものであり、平均マージ候補のL0予測の平均動きベクトルの垂直方向成分は、第1マージ候補のL0予測の動きベクトルと第2マージ候補のL0予測の動きベクトルそれぞれの垂直方向成分を平均したものである。平均マージ候補のL1予測の平均動きベクトルについても同様である。
平均マージ候補の導出を履歴マージ候補の導出の後にすることで、履歴マージ候補が平均マージ候補の対象となり、空間マージ候補や時間マージ候補の合計が1個以下でも履歴マージ候補を利用して平均マージ候補を導出することが可能になり、符号化効率が向上する。
<サブブロック予測動きベクトルモード導出>
サブブロック予測動きベクトルモード導出について説明する。
Average Merge Candidates
The average merge candidate will be described. The average merge candidate is derived using the first merge candidate and the second merge candidate, which are two merge candidates included in the merge candidate list. The average merge candidate is a merge candidate having an average motion vector of L0 prediction obtained by averaging the motion vector of L0 prediction of the first merge candidate and the motion vector of L0 prediction of the second merge candidate, and an average motion vector of L1 prediction obtained by averaging the motion vector of L1 prediction of the first merge candidate and the motion vector of L1 prediction of the second merge candidate. The reference index of the L0 prediction of the average merge candidate is the reference index of the L0 prediction of the first merge candidate, and the reference index of the L1 prediction of the average merge candidate is the reference index of the L1 prediction of the first merge candidate. In addition, in deriving the average motion vector, the horizontal component and the vertical component of the motion vector are independently averaged. That is, the horizontal component of the average motion vector of the L0 prediction of the average merge candidate is the average of the horizontal components of the motion vector of the L0 prediction of the first merge candidate and the motion vector of the L0 prediction of the second merge candidate, and the vertical component of the average motion vector of the L0 prediction of the average merge candidate is the average of the vertical components of the motion vector of the L0 prediction of the first merge candidate and the motion vector of the L0 prediction of the second merge candidate. The same is true for the average motion vector of the L1 prediction of the average merge candidate.
By deriving the average merge candidate after deriving the history merge candidate, the history merge candidate becomes the target of the average merge candidate, and it becomes possible to derive the average merge candidate using the history merge candidate even if the total number of spatial merge candidates and temporal merge candidates is one or less, thereby improving coding efficiency.
<Sub-block predictive motion vector mode derivation>
Sub-block predicted motion vector mode derivation will now be described.
図26は、本願の符号化装置におけるサブブロック予測動きベクトルモード導出部303のブロック図である。
Figure 26 is a block diagram of the sub-block prediction motion vector
まず、アフィン継承予測動きベクトル候補導出部361において、アフィン継承予測動きベクトル候補を導出する。アフィン継承予測動きベクトル候補導出の詳細については後述する。
First, the affine inheritance predicted motion vector
続いて、アフィン構築予測動きベクトル候補導出部362において、アフィン構築予測動きベクトル候補を導出する。アフィン構築予測動きベクトル候補導出の詳細については後述する。
Next, the affine construction predicted motion vector
続いて、アフィン同一予測動きベクトル候補導出部363において、アフィン同一予測動きベクトル候補を導出する。アフィン同一予測動きベクトル候補導出の詳細については後述する。
Next, the affine-identical predictor motion vector
サブブロック動きベクトル検出部366は、サブブロック予測動きベクトルモードに適するサブブロック動きベクトルを検出し、検出したベクトルをサブブロック予測動きベクトル候補選択部367、差分演算部368に供給する。
The sub-block motion
サブブロック予測動きベクトル候補選択部367は、アフィン継承予測動きベクトル候補導出部361、アフィン構築予測動きベクトル候補導出部362、アフィン同一予測動きベクトル候補導出部363において導出されたサブブロック予測動きベクトル候補の中から、サブブロック動きベクトル検出部366から供給された動きベクトルに基づいて、サブブロック予測動きベクトル候補を選択し、選択されたサブブロック予測動きベクトル候補に関する情報をインター予測モード判定部305、差分演算部368に供給する。
The sub-block predictive motion vector
差分演算部368は、サブブロック動きベクトル検出部366から供給された動きベクトルベクトルから、サブブロック予測動きベクトル候補選択部367で選択されたサブブロック予測動きベクトルを減算した差分予測動きベクトルを、インター予測モード判定部305に供給する。
The
図27は、本願の復号装置におけるサブブロック予測動きベクトルモード導出部403のブロック図である。
Figure 27 is a block diagram of the sub-block prediction motion vector
まず、アフィン継承予測動きベクトル候補導出部461において、アフィン継承予測動きベクトル候補を導出する。アフィン継承予測動きベクトル候補導出部461の処理は本願の符号化装置におけるアフィン継承予測動きベクトル候補導出部361の処理と同一である。
First, an affine inheritance predicted motion vector
続いて、アフィン構築予測動きベクトル候補導出部462において、アフィン構築予測動きベクトル候補を導出する。アフィン構築予測動きベクトル候補導出部462の処理は本願の符号化装置におけるアフィン構築予測動きベクトル候補導出部362の処理と同一である。
Next, an affine construction predicted motion vector
続いて、アフィン同一予測動きベクトル候補導出部463において、アフィン同一予測動きベクトル候補を導出する。アフィン同一予測動きベクトル候補導出部463の処理は本願の符号化装置におけるアフィン同一予測動きベクトル候補導出部363の処理と同一である。
Next, an affine-identical predictor motion vector
サブブロック予測動きベクトル候補選択部467は、アフィン継承予測動きベクトル候補導出部461、アフィン構築予測動きベクトル候補導出部462、アフィン同一予測動きベクトル候補導出部463において導出されたサブブロック予測動きベクトル候補の中から、符号化装置から伝送され復号される予測動きベクトルインデックスに基づいて、サブブロック予測動きベクトル候補を選択し、選択されたサブブロック予測動きベクトル候補に関する情報を動き補償予測部406、加算演算部467に供給する。
The sub-block predictive motion vector
加算演算部467は、サブブロック予測動きベクトル候補選択部466で選択されたサブブロック予測動きベクトルに、符号化装置から伝送され復号される差分動きベクトルを加算して生成した動きベクトルを動き補償予測部406に供給する。
The
<アフィン継承予測動きベクトル候補導出>
アフィン継承予測動きベクトル候補導出部361について説明する。アフィン継承予測動きベクトル候補導出部461についてもアフィン継承予測動きベクトル候補導出部361と同様である。
<Derivation of affine inheritance predicted motion vector candidates>
The following describes the affine inheritance predicted motion vector
アフィン継承予測動きベクトル候補は、アフィン制御点の動きベクトル情報を継承する。 Affine inheritance predicted motion vector candidates inherit the motion vector information of the affine control points.
図30は、アフィン継承予測動きベクトル候補導出を説明する図である。 Figure 30 is a diagram explaining the derivation of affine inheritance predicted motion vector candidates.
アフィン継承予測動きベクトル候補は、空間的に隣接する符号化済・復号済ブロックの有するアフィン制御点の動きベクトルを探索することで得られる。 Affine inheritance predicted motion vector candidates are obtained by searching for motion vectors of affine control points of spatially adjacent encoded and decoded blocks.
具体的には、符号化・復号対象ブロックの左側に隣接するブロック(A0,A1)と、符号化・復号対象ブロックの上側に隣接するブロック(B0,B1,B2)から、それぞれ最大1つのアフィンモードを探索し、アフィン継承予測動きベクトルとする。 Specifically, a maximum of one affine mode is searched for from each of the blocks (A0, A1) adjacent to the left side of the block to be encoded/decoded and the blocks (B0, B1, B2) adjacent to the top side of the block to be encoded/decoded, and these are used as the affine inheritance predicted motion vector.
図34は、アフィン継承予測動きベクトル候補導出のフローチャートである。 Figure 34 is a flowchart for deriving affine inheritance predicted motion vector candidates.
まず、符号化・復号対象ブロックの左側に隣接するブロック(A0,A1)を左グループとし(S3101)、A0を含むブロックがアフィン保障を用いたブロック(アフィンモード)であるか否かを判断する(S3102)。A0がアフィンモードである場合(S3102:YES)、A0が使用したアフィンモデルを取得し(S3103)、上側に隣接するブロックの処理に移る。A0がアフィンモードでない場合(S3102:NO)、アフィン継承予測動きベクトル候補導出の対象をA0->A1とし、A1を含むブロックからアフィンモードの取得を試みる。 First, the blocks (A0, A1) adjacent to the left side of the block to be coded/decoded are set as the left group (S3101), and it is determined whether the block including A0 is a block using affine guarantee (affine mode) (S3102). If A0 is in affine mode (S3102: YES), the affine model used by A0 is obtained (S3103), and processing moves to the adjacent block above. If A0 is not in affine mode (S3102: NO), the affine inheritance predicted motion vector candidate derivation target is set to A0->A1, and an attempt is made to obtain the affine mode from the block including A1.
続いて、符号化・復号対象ブロックの上側に隣接するブロック(B0,B1,B2)を上グループとし(S3104)、B0を含むブロックがアフィンモードであるか否かを判断する(S3105)。B0がアフィンモードである場合(S3105:YES)、B0が使用したアフィンモデルを取得し(S3106)、処理を終了する。B0がアフィンモードでない場合(S3105:NO)、アフィン継承予測動きベクトル候補導出の対象をB0->B1とし、B1を含むブロックからアフィンモードの取得を試みる。さらに、B1がアフィンモードでない場合(S3105:NO)、アフィン継承予測動きベクトル候補導出の対象をB1->B2とし、B2を含むブロックからアフィンモードの取得を試みる。 Next, the blocks (B0, B1, B2) adjacent to the upper side of the block to be coded/decoded are set as the upper group (S3104), and it is determined whether the block including B0 is in affine mode (S3105). If B0 is in affine mode (S3105: YES), the affine model used by B0 is obtained (S3106), and the process ends. If B0 is not in affine mode (S3105: NO), the target for deriving the affine inheritance predicted motion vector candidate is set to B0->B1, and an attempt is made to obtain the affine mode from the block including B1. Furthermore, if B1 is not in affine mode (S3105: NO), the target for deriving the affine inheritance predicted motion vector candidate is set to B1->B2, and an attempt is made to obtain the affine mode from the block including B2.
このように、左側ブロックと上側ブロックにグループを分けて、左側ブロックについては、左下から左上のブロックの順にアフィンモデルを探索し、左側ブロックについては、右上から左上のブロックの順にアフィンモデルを探索することで、可能な限り異なる2つのアフィンモデルを取得することができ、アフィン予測動きベクトルのいずれかが差分動きベクトルの小さくなるアフィン予測動きベクトル候補を導出することができる。 In this way, by dividing the blocks into left and top blocks, and searching for affine models for the left blocks from the bottom left to the top left blocks, and for the left blocks from the top right to the top left blocks, it is possible to obtain two affine models that are as different as possible, and to derive an affine prediction motion vector candidate in which one of the affine prediction motion vectors has a small differential motion vector.
<アフィン構築予測動きベクトル候補導出>
アフィン構築予測動きベクトル候補導出部362について説明する。アフィン構築予測動きベクトル候補導出部462についてもアフィン構築予測動きベクトル候補導出部362と同様である。
<Derivation of affine constructed predicted motion vector candidates>
The following describes the affine construction predicted motion vector
アフィン構築予測動きベクトル候補は、空間的に隣接するブロックの動き情報からアフィン制御点の動きベクトル情報を構築する。 Affine constructed predicted motion vector candidates construct motion vector information for affine control points from motion information of spatially adjacent blocks.
図31は、アフィン構築予測動きベクトル候補導出を説明する図である。 Figure 31 is a diagram explaining the derivation of affine construction predicted motion vector candidates.
アフィン構築予測動きベクトル候補は、空間的に隣接する符号化済・復号済ブロックの有する動きベクトルを組み合わせて新たなアフィンモデルを構築することで得られる。 Affine constructed predicted motion vector candidates are obtained by constructing a new affine model by combining the motion vectors of spatially adjacent encoded and decoded blocks.
具体的には、符号化・復号対象ブロックの左上側に隣接するブロック(B2,B3,A2)から左上アフィン制御点CP0の動きベクトルを導出し、符号化・復号対象ブロックの右上側に隣接するブロック(B1,B0)から右上アフィン制御点CP1の動きベクトルを導出し、符号化・復号対象ブロックの左下側に隣接するブロック(A1,A0)から左下アフィン制御点CP2の動きベクトルを導出する。 Specifically, the motion vector of the upper left affine control point CP0 is derived from the block (B2, B3, A2) adjacent to the upper left of the block to be coded/decoded, the motion vector of the upper right affine control point CP1 is derived from the block (B1, B0) adjacent to the upper right of the block to be coded/decoded, and the motion vector of the lower left affine control point CP2 is derived from the block (A1, A0) adjacent to the lower left of the block to be coded/decoded.
図35は、アフィン構築予測動きベクトル候補導出のフローチャートである。 Figure 35 is a flowchart for deriving affine construction predicted motion vector candidates.
まず、左上制御点CP0、右上制御点CP1、左下アフィン制御点CP2を導出する(S3201)。左上アフィン制御点CP0は、符号化・復号対象ブロックと同一の参照画像をもつ参照ブロックを、B2、B3、A2参照ブロックの優先順で探索することで算出される。右上アフィン制御点CP1は、符号化・復号対象ブロックと同一の参照画像をもつ参照ブロックを、B1、B0参照ブロックの優先順で探索することで算出される。左下アフィン制御点CP2は、符号化・復号対象ブロックと同一の参照画像をもつ参照ブロックを、A1、A0参照ブロックの優先順で探索することで算出される。 First, the upper left control point CP0, the upper right control point CP1, and the lower left affine control point CP2 are derived (S3201). The upper left affine control point CP0 is calculated by searching for reference blocks having the same reference image as the block to be coded/decoded, with the priority order of B2, B3, A2 reference blocks. The upper right affine control point CP1 is calculated by searching for reference blocks having the same reference image as the block to be coded/decoded, with the priority order of B1, B0 reference blocks. The lower left affine control point CP2 is calculated by searching for reference blocks having the same reference image as the block to be coded/decoded, with the priority order of A1, A0 reference blocks.
アフィン構築予測動きベクトルとして、アフィン制御点3本モードを選択する場合(S3202:YES)、3つのアフィン制御点(CP0,CP1,CP2)がすべて導出されたか否かを判断する(S3203)。3つのアフィン制御点(CP0,CP1,CP2)がすべて導出された場合(S3203:YES)、3つのアフィン制御点(CP0,CP1,CP2)を用いたアフィンモデルをアフィン構築予測動きベクトルとする(S3204)。アフィン制御点3本モードを選択せず、アフィン制御点2本モードを選択した場合(S3202:NO)、2つのアフィン制御点(CP0,CP1)がすべて導出されたか否かを判断する(S3205)。2つのアフィン制御点(CP0,CP1)がすべて導出された場合(S3205:YES)、2つのアフィン制御点(CP0,CP1)を用いたアフィンモデルをアフィン構築予測動きベクトルとする(S3206)。 When the three affine control points mode is selected as the affine construction predicted motion vector (S3202: YES), it is determined whether all three affine control points (CP0, CP1, CP2) have been derived (S3203). When all three affine control points (CP0, CP1, CP2) have been derived (S3203: YES), an affine model using the three affine control points (CP0, CP1, CP2) is set as the affine construction predicted motion vector (S3204). When the three affine control points mode is not selected and the two affine control points mode is selected (S3202: NO), it is determined whether all two affine control points (CP0, CP1) have been derived (S3205). If the two affine control points (CP0, CP1) have all been derived (S3205: YES), an affine model using the two affine control points (CP0, CP1) is set as the affine constructed predicted motion vector (S3206).
<アフィン同一予測動きベクトル候補導出>
アフィン同一予測動きベクトル候補導出部363について説明する。アフィン同一予測動きベクトル候補導出部463についてもアフィン同一予測動きベクトル候補導出部363と同様である。
<Derivation of Affine Same Predictor Motion Vector Candidates>
The affine co-predictor motion vector
アフィン同一予測動きベクトル候補は、各アフィン制御点で同一の動きベクトルを導出することで得られる。 Affine identical predictor motion vector candidates are obtained by deriving identical motion vectors at each affine control point.
具体的には、アフィン構築予測動きベクトル候補導出部362・462と同様に、各アフィン制御点情報を導出し、すべてのアフィン制御点をCP0~CP2のいずれかで同一に設定することで得られる。また、通常予測動きベクトルモードと同様に導出した時間動きベクトルをすべてのアフィン制御点に設定することでも得られる。
Specifically, similar to the affine construction predicted motion vector
<サブブロックマージモード導出>
サブブロックマージモード導出について説明する。
<Sub-block merge mode derivation>
Sub-block merge mode derivation will now be described.
図28は、本願の符号化装置におけるサブブロックマージモード導出部304のブロック図である。サブブロックマージモード導出部304は、サブブロックマージ候補リストsubblockMergeCandListを備えている。これは、通常マージモード導出部302におけるマージ候補リストmergeCandListと同様のものであり、サブブロック単位で異なる候補リストとなる点のみが異なる。
Figure 28 is a block diagram of the subblock merge
まず、サブブロック時間マージ候補導出部381において、サブブロック時間マージ候補を導出する。サブブロック時間マージ候補導出の詳細については後述する。
First, the sub-block time merging
続いて、アフィン継承マージ候補導出部382において、アフィン継承マージ候補を導出する。アフィン継承マージ候補導出の詳細については後述する。
Next, the affine inheritance merge
続いて、アフィン構築マージ候補導出部383において、アフィン構築マージ候補を導出する。アフィン構築マージ候補導出の詳細については後述する。
Next, the affine construction merge
続いて、アフィン固定マージ候補導出部384において、アフィン固定マージ候補を導出する。アフィン固定マージ候補導出の詳細については後述する。 Next, the affine-fixed merge candidate derivation unit 384 derives affine-fixed merge candidates. Details of affine-fixed merge candidate derivation will be described later.
サブブロックマージ候補選択部386は、サブブロック時間マージ候補導出部381、アフィン継承マージ候補導出部382、アフィン構築マージ候補導出部383、アフィン固定マージ候補導出部384において導出されたサブブロックマージ候補の中から、サブブロックマージ候補を選択し、選択されたサブブロックマージ候補に関する情報をインター予測モード判定部305に供給する。
The subblock merging
図29は、本願の復号装置におけるサブブロックマージモード導出部404のブロック図である。サブブロックマージモード導出部404は、サブブロックマージ候補リストsubblockMergeCandListを備えている。これは、サブブロックマージモード導出部304と同じものである。
Figure 29 is a block diagram of the subblock merge
まず、サブブロック時間マージ候補導出部481において、サブブロック時間マージ候補を導出する。サブブロック時間マージ候補導出部481の処理はサブブロック時間マージ候補導出部381の処理と同一である。
First, the sub-block time merge
続いて、アフィン継承マージ候補導出部482において、アフィン継承マージ候補を導出する。アフィン継承マージ候補導出部482の処理はアフィン継承マージ候補導出部382の処理と同一である。
Next, the affine inheritance merge
続いて、アフィン構築マージ候補導出部483において、アフィン構築マージ候補を導出する。アフィン構築マージ候補導出部483の処理はアフィン構築マージ候補導出部383の処理と同一である。
Next, the affine construct merge
続いて、アフィン固定マージ候補導出部485において、アフィン固定マージ候補を導出する。アフィン固定マージ候補導出部485の処理はアフィン固定マージ候補導出部485の処理と同一である。
Next, the affine-fixed merge
サブブロックマージ候補選択部486は、サブブロック時間マージ候補導出部481、アフィン継承マージ候補導出部482、アフィン構築マージ候補導出部483、アフィン固定マージ候補導出部484において導出されたサブブロックマージ候補の中から、符号化装置から伝送され復号されるインデックスに基づいて、サブブロックマージ候補を選択し、選択されたサブブロックマージ候補に関する情報を動き補償予測部406に供給する。
The subblock merging
<サブブロック時間マージ候補導出>
サブブロック時間マージ候補導出部381の動作については後述する。
<Sub-block Temporal Merging Candidate Derivation>
The operation of the sub-block temporal merging
<アフィン継承マージ候補導出>
アフィン継承マージ候補導出部382について説明する。アフィン継承マージ候補導出部482についてもアフィン継承マージ候補導出部382と同様である。
<Affine inheritance merge candidate derivation>
The following describes the affine inheritance merge
アフィン継承マージ候補は、空間的に隣接するブロックの有するアフィンモデルからアフィン制御点のアフィンモデルを継承する。 Affine inheritance merge candidate inherits the affine model of the affine control points from the affine model of the spatially adjacent block.
図32は、アフィン継承マージ候補導出を説明する図である。アフィンマージ継承マージモード候補の導出は、アフィン継承予測動きベクトルの導出と同様に、空間的に隣接する符号化済・復号済ブロックの有するアフィン制御点の動きベクトルを探索することで得られる。 Figure 32 is a diagram explaining the derivation of affine inheritance merge candidates. Similar to the derivation of affine inheritance prediction motion vectors, affine merge inheritance merge mode candidates are derived by searching for motion vectors of affine control points of spatially adjacent encoded and decoded blocks.
具体的には、符号化・復号対象ブロックの左側に隣接するブロック(A0,A1)と、符号化・復号対象ブロックの上側に隣接するブロック(B0,B1,B2)から、それぞれ最大1つのアフィンモードを探索し、アフィンマージモードに使用する。 Specifically, a maximum of one affine mode is searched for from each of the blocks (A0, A1) adjacent to the left side of the block to be encoded/decoded and the blocks (B0, B1, B2) adjacent to the top side of the block to be encoded/decoded, and used for the affine merge mode.
図36は、アフィン継承マージ候補導出のフローチャートである。 Figure 36 is a flowchart for deriving affine inheritance merge candidates.
まず、符号化・復号対象ブロックの左側に隣接するブロック(A0,A1)を左グループとし(S3301)、A0を含むブロックがアフィンモードであるか否かを判断する(S3302)。A0がアフィンモードである場合(S3102:YES)、A0が使用したアフィンモデルを取得し(S3303)、上側に隣接するブロックの処理に移る。A0がアフィンモードでない場合(S3302:NO)、アフィン継承マージ候補導出の対象をA0->A1とし、A1を含むブロックからアフィンモードの取得を試みる。 First, the blocks (A0, A1) adjacent to the left side of the block to be encoded/decoded are set as the left group (S3301), and it is determined whether the block including A0 is in affine mode (S3302). If A0 is in affine mode (S3102: YES), the affine model used by A0 is obtained (S3303), and processing moves to the adjacent block above. If A0 is not in affine mode (S3302: NO), the target for deriving affine inheritance merge candidates is set to A0->A1, and an attempt is made to obtain the affine mode from the block including A1.
続いて、符号化・復号対象ブロックの上側に隣接するブロック(B0,B1,B2)を上グループとし(S3304)、B0を含むブロックがアフィンモードであるか否かを判断する(S3305)。B0がアフィンモードである場合(S3305:YES)、B0が使用したアフィンモデルを取得し(S3306)、処理を終了する。B0がアフィンモードでない場合(S3305:NO)、アフィン継承マージ候補導出の対象をB0->B1とし、B1を含むブロックからアフィンモードの取得を試みる。さらに、B1がアフィンモードでない場合(S3305:NO)、アフィン継承マージ候補導出の対象をB1->B2とし、B2を含むブロックからアフィンモードの取得を試みる。 Next, the blocks (B0, B1, B2) adjacent to the upper side of the block to be encoded/decoded are set as the upper group (S3304), and it is determined whether the block including B0 is in affine mode (S3305). If B0 is in affine mode (S3305: YES), the affine model used by B0 is obtained (S3306), and the process ends. If B0 is not in affine mode (S3305: NO), the target for deriving affine inheritance merge candidates is set to B0->B1, and an attempt is made to obtain the affine mode from the block including B1. Furthermore, if B1 is not in affine mode (S3305: NO), the target for deriving affine inheritance merge candidates is set to B1->B2, and an attempt is made to obtain the affine mode from the block including B2.
<アフィン構築マージ候補導出>
アフィン構築マージ候補導出部383について説明する。アフィン構築マージ候補導出部483についてもアフィン構築マージ候補導出部383と同様である。
<Affine Construction Merge Candidate Derivation>
The affine construct merge
図33は、アフィン構築マージ候補導出を説明する図である。アフィン構築マージ候補は、空間的に隣接するブロックの有する動き情報及び時間符号化ブロックからアフィン制御点のアフィンモデルを構築する。 Figure 33 is a diagram explaining the derivation of affine construction merge candidates. Affine construction merge candidates construct an affine model of affine control points from motion information of spatially adjacent blocks and temporal coding blocks.
具体的には、符号化・復号対象ブロックの左上側に隣接するブロック(B2,B3,A2)から左上アフィン制御点CP0の動きベクトルを導出し、符号化・復号対象ブロックの右上側に隣接するブロック(B1,B0)から右上アフィン制御点CP1の動きベクトルを導出し、符号化・復号対象ブロックの左下側に隣接するブロック(A1,A0)から左下アフィン制御点CP2の動きベクトルを導出し、符号化・復号対象ブロックの右下側に隣接する時間符号化ブロック(T0)から右下アフィン制御点CP3の動きベクトルを導出する。 Specifically, the motion vector of the upper-left affine control point CP0 is derived from the block (B2, B3, A2) adjacent to the upper left of the block to be coded/decoded, the motion vector of the upper-right affine control point CP1 is derived from the block (B1, B0) adjacent to the upper right of the block to be coded/decoded, the motion vector of the lower-left affine control point CP2 is derived from the block (A1, A0) adjacent to the lower left of the block to be coded/decoded, and the motion vector of the lower-right affine control point CP3 is derived from the temporal coding block (T0) adjacent to the lower right of the block to be coded/decoded.
図37は、アフィン構築マージ候補導出のフローチャートである。 Figure 37 is a flowchart for deriving affine construction merge candidates.
まず、左上アフィン制御点CP0、右上アフィン制御点CP1、左下アフィン制御点CP2、右下アフィン制御点CP3を導出する(S3401)。左上制御点CP0は、動き情報を有するブロックを、B2、B3、A2ブロックの優先順で探索することで算出される。右上制御点CP1は、動き情報を有するブロックを、B1、B0ブロックの優先順で探索することで算出される。左下制御点CP2は、動き情報を有するブロックを、A1、A0ブロックの優先順で探索することで算出される。右下制御点CP3は、時間ブロックの動き情報を探索することで算出される。 First, the upper left affine control point CP0, the upper right affine control point CP1, the lower left affine control point CP2, and the lower right affine control point CP3 are derived (S3401). The upper left control point CP0 is calculated by searching for blocks having motion information in the order of priority: B2, B3, A2 blocks. The upper right control point CP1 is calculated by searching for blocks having motion information in the order of priority: B1, B0 blocks. The lower left control point CP2 is calculated by searching for blocks having motion information in the order of priority: A1, A0 blocks. The lower right control point CP3 is calculated by searching for motion information of time blocks.
続いて、導出されたCP0、CP1、CP2により3本アフィン制御点によるアフィンモデルを構築可能であるか否かを判断し(S3402)、構築可能である場合(S3402:YES)、CP0、CP1、CP2による3本アフィン制御点アフィンモデルをアフィンマージ候補とする(S3403)。 Next, it is determined whether an affine model can be constructed using the derived three affine control points CP0, CP1, and CP2 (S3402), and if so (S3402: YES), the three affine control point affine model using CP0, CP1, and CP2 is set as an affine merge candidate (S3403).
続いて、導出されたCP0、CP1、CP3により3本アフィン制御点によるアフィンモデルを構築可能であるか否かを判断し(S3404)、構築可能である場合(S3404:YES)、CP0、CP1、CP3による3本アフィン制御点アフィンモデルをアフィンマージ候補とする(S3405)。 Next, it is determined whether an affine model can be constructed using the derived three affine control points CP0, CP1, and CP3 (S3404), and if so (S3404: YES), the three affine control point affine model using CP0, CP1, and CP3 is set as an affine merge candidate (S3405).
続いて、導出されたCP0、CP2、CP3により3本アフィン制御点によるアフィンモデルを構築可能であるか否かを判断し(S3406)、構築可能である場合(S3406:YES)、CP0、CP2、CP3による3本アフィン制御点アフィンモデルをアフィンマージ候補とする(S3407)。 Next, it is determined whether an affine model can be constructed using the derived three affine control points CP0, CP2, and CP3 (S3406), and if so (S3406: YES), the three affine control point affine model using CP0, CP2, and CP3 is set as an affine merge candidate (S3407).
続いて、導出されたCP1、CP2、CP3により3本アフィン制御点によるアフィンモデルを構築可能であるか否かを判断し(S3408)、構築可能である場合(S3408:YES)、CP1、CP2、CP3による3本アフィン制御点アフィンモデルをアフィンマージ候補とする(S3409)。 Next, it is determined whether an affine model can be constructed using the three affine control points CP1, CP2, and CP3 derived (S3408), and if so (S3408: YES), the three affine control point affine model using CP1, CP2, and CP3 is set as an affine merge candidate (S3409).
続いて、導出されたCP0、CP1により2本アフィン制御点によるアフィンモデルを構築可能であるか否かを判断し(S3410)、構築可能である場合(S3410:YES)、CP0、CP1による2本アフィン制御点アフィンモデルをアフィンマージ候補とする(S3411)。 Next, it is determined whether an affine model can be constructed using two affine control points from the derived CP0 and CP1 (S3410), and if so (S3410: YES), the two affine control point affine model using CP0 and CP1 is set as an affine merge candidate (S3411).
続いて、導出されたCP0、CP2により2本アフィン制御点によるアフィンモデルを構築可能であるか否かを判断し(S3412)、構築可能である場合(S3412:YES)、CP0、CP2による2本アフィン制御点アフィンモデルをアフィンマージ候補とする(S3413)。 Next, it is determined whether an affine model can be constructed using two affine control points from the derived CP0 and CP2 (S3412), and if so (S3412: YES), the two affine control point affine model using CP0 and CP2 is set as an affine merge candidate (S3413).
ここで、アフィンモデルを構築あるか否かは、下記の条件で判断する。 Here, whether or not an affine model is constructed is determined based on the following conditions:
1.すべてのアフィン制御点の参照画像が同一である。(アフィン変換可能)
2.少なくとも1つのアフィン制御点で異なる動きベクトルをもつ。(平行移動で表現できない)
また、CP0,CP1,CP2による3本アフィン制御点アフィンモデル、CP0,CP1による2本アフィン制御点アフィンモデル以外のアフィンモデルは、3本制御アフィンモデルについては、CP0,CP1,CP2による3本アフィン制御点アフィンモデルに、2本制御アフィンモデルについては、CP0,CP1による2本アフィン制御点アフィンモデルに変換する。
1. The reference images for all affine control points are the same. (Affine transformation is possible)
2. At least one affine control point has a different motion vector (cannot be expressed by translation).
In addition, for affine models other than the three-line affine control point affine model using CP0, CP1, and CP2 and the two-line affine control point affine model using CP0 and CP1, the three-line control affine model is converted to a three-line affine control point affine model using CP0, CP1, and CP2, and the two-line control affine model is converted to a two-line affine control point affine model using CP0 and CP1.
<アフィン固定マージ候補導出>
アフィン固定マージ候補導出部385について説明する。アフィン固定マージ候補導出部485についてもアフィン固定マージ候補導出部385と同様である。
<Affine fixed merge candidate derivation>
The affine-anchored merging
アフィン固定マージ候補は、固定された動き情報でアフィン制御点の動き情報を固定する。 Affine fixed merge candidates fix the motion information of affine control points with fixed motion information.
具体的には、各アフィン制御点の動きベクトルを(0,0)に固定する。 Specifically, the motion vector of each affine control point is fixed to (0,0).
<時間予測動きベクトル>
時間予測動きベクトルの説明に先行して、ピクチャの時間的な前後関係について説明する。図49(a)は、符号化対象の符号化ブロックと、符号化対象ピクチャとは時間的に異なる符号化済みのピクチャの関係を示す。符号化対象ピクチャにおいて、符号化に参照する特定の符号化済みのピクチャをColPicと定義する。ColPicはシンタックスにより特定される。
<Temporal Predictive Motion Vector>
Prior to the description of the temporal prediction motion vector, the temporal relationship of pictures will be described. Figure 49 (a) shows the relationship between a coding block to be coded and a coded picture that is temporally different from the coding target picture. In the coding target picture, a specific coded picture to be referenced for coding is defined as ColPic. ColPic is specified by syntax.
また、図49(b)は、ColPicにおいて、符号化対象の符号化ブロックと同一位置、およびその近傍に存在する、符号化済みの符号化ブロックを示す。これらの符号化ブロックT0およびT1は、符号化対象ピクチャと時間的に異なるピクチャにおける、ほぼ同一位置の符号化ブロックである。 Figure 49(b) also shows coded blocks in ColPic that are in the same position as the coding block to be coded and in its vicinity. These coding blocks T0 and T1 are coding blocks in almost the same position in a picture that is temporally different from the coding block to be coded.
上記したピクチャの時間的な前後関係の説明は、符号化時のものであるが、復号時も同様となる。つまり、復号時は、上記の説明における符号化を復号と置き換えて、同様に説明される。 The above explanation of the temporal relationship of pictures is for encoding, but it is the same for decoding. In other words, the above explanation for decoding can be applied in the same way, with the word "encoding" substituted for "decoding."
図17の通常予測動きベクトルモード導出部301における時間予測動きベクトル候補導出部322の動作について、図50を参照して説明する。
The operation of the temporal prediction motion vector
まず、ColPicを導出する(ステップS4201)。ColPicの導出について、図51を参照して説明する。 First, ColPic is derived (step S4201). The derivation of ColPic is explained with reference to FIG. 51.
スライスタイプslice_typeがBスライスで、フラグcollocated_from_l0_flagが0の場合(ステップS4211のYES、ステップS4212のYES)、RefPicList1[0]、すなわち参照リストL1の参照インデックスが0のピクチャが異なる時間のピクチャcolPicとなる(ステップS4213)。そうでない場合、すなわちスライスタイプslice_typeがBスライスで前述のフラグcollocated_from_l0_flagが1の場合(ステップS4211のYES、ステップS4212のNO)、またはスライスタイプslice_typeがPスライスの場合(ステップS4211のNO、ステップS4214のYES)、RefPicList0[0]、すなわち参照リストL0の参照インデックスが0のピクチャが異なる時間のピクチャcolPicとなる(ステップS4215)。slice_typeがPスライスでない場合(ステップS4214:NO)、処理を終了する。 If the slice type slice_type is a B slice and the flag collocated_from_l0_flag is 0 (YES in step S4211, YES in step S4212), RefPicList1[0], i.e., the picture with a reference index of 0 in reference list L1, becomes a picture colPic of a different time (step S4213). Otherwise, i.e., if the slice type slice_type is a B slice and the above-mentioned flag collocated_from_l0_flag is 1 (YES in step S4211, NO in step S4212), or if the slice type slice_type is a P slice (NO in step S4211, YES in step S4214), RefPicList0[0], i.e., the picture with a reference index of 0 in reference list L0, becomes a picture colPic of a different time (step S4215). If slice_type is not a P slice (NO in step S4214), the process ends.
再び、図50を参照する。ColPicを導出したら、符号化ブロックcolCbを導出し、符号化情報を取得する(ステップS4202)。この処理について、図52を参照して説明する。 Refer to FIG. 50 again. After deriving ColPic, derive the coding block colCb and obtain the coding information (step S4202). This process will be described with reference to FIG. 52.
まず、異なる時間のピクチャcolPic内で処理対象の符号化ブロックと同一位置の右下(外側)に位置する符号化ブロックを異なる時間の符号化ブロックcolCbとする(ステップS4221)。この符号化ブロックは図49の符号化ブロックT0に相当する。 First, the coding block located at the lower right (outside) of the same position as the coding block to be processed in the picture colPic of a different time is set as the coding block colCb of a different time (step S4221). This coding block corresponds to coding block T0 in FIG. 49.
次に、異なる時間の符号化ブロックcolCbの符号化情報を取得する(ステップS4222)。異なる時間の符号化ブロックcolCbのPredModeが利用できないか、異なる時間の符号化ブロックcolCbの予測モードPredModeがイントラ予測(MODE_INTRA)である場合(ステップS4223:NO、ステップS4224:YES)、異なる時間のピクチャcolPic内で処理対象の符号化ブロックと同一位置の中央右下に位置する符号化ブロックを異なる時間の符号化ブロックcolCbとする(ステップS4225)。この符号化ブロックは図49の符号化ブロックT1に相当する。 Next, the coding information of the coding block colCb of the different time is obtained (step S4222). If the PredMode of the coding block colCb of the different time is unavailable or the prediction mode PredMode of the coding block colCb of the different time is intra prediction (MODE_INTRA) (step S4223: NO, step S4224: YES), the coding block located in the lower right corner of the same position as the coding block to be processed in the picture colPic of the different time is set as the coding block colCb of the different time (step S4225). This coding block corresponds to the coding block T1 in Figure 49.
再び、図50を参照する。次に、参照リストごとに、インター予測情報を導出する(S4203,S4204)。ここでは、符号化ブロックcolCbについて、参照リストごとの動きベクトルmvLXColと符号化情報が有効か否かを示すフラグavailableFlagLXColを導出する。LXは参照リストを示し、参照リスト0の導出ではLXはL0となり、参照リスト1の導出ではLXはL1となる。インター予測情報の導出について、図53を参照して説明する。
Refer to FIG. 50 again. Next, inter prediction information is derived for each reference list (S4203, S4204). Here, for the coding block colCb, a motion vector mvLXCol for each reference list and a flag availableFlagLXCol indicating whether the coding information is valid or not are derived. LX indicates a reference list, and when deriving
異なる時間の符号化ブロックcolCbが利用できない場合(S4231S4231:NO)、または予測モードPredModeがイントラ予測(MODE_INTRA)の場合(S4232:NO)、フラグavailableFlagLXColとフラグpredFlagLXColを共に0とし(ステップS4233)、動きベクトルmvLXColを(0,0)として(S4234)、処理を終了する。 If the coding block colCb of a different time is not available (S4231S4231: NO), or if the prediction mode PredMode is intra prediction (MODE_INTRA) (S4232: NO), the flag availableFlagLXCol and the flag predFlagLXCol are both set to 0 (step S4233), the motion vector mvLXCol is set to (0, 0) (S4234), and the processing ends.
符号化ブロックcolCbが利用でき(S4231:Yes)、予測モードPredModeがイントラ予測(MODE_INTRA)でない場合(S4232:YES)、以下の手順でmvCol、refIdxColおよびavailableFlagColを算出する。 If the coding block colCb is available (S4231: Yes) and the prediction mode PredMode is not intra prediction (MODE_INTRA) (S4232: YES), mvCol, refIdxCol, and availableFlagCol are calculated using the following procedure.
符号化ブロックcolCbのL0予測が利用されているかどうかを示すフラグPredFlagL0[xPCol][yPCol]が0の場合(S4235のYES)、符号化ブロックcolCbの予測モードはPred_L1であるので、動きベクトルmvColが符号化ブロックcolCbのL1の動きベクトルであるMvL1[xPCol][yPCol]と同じ値に設定され(S4236)、参照インデックスrefIdxColがL1の参照インデックスRefIdxL1[xPCol][yPCol]と同じ値に設定され(S4237)、リストListColがL1に設定される(S4238)。ここで、xPCol、yPColは異なる時間のピクチャcolPic内での符号化ブロックcolCbの左上の画素の位置を示すインデックスである。 When the flag PredFlagL0[xPCol][yPCol] indicating whether L0 prediction is used for the coding block colCb is 0 (YES in S4235), the prediction mode of the coding block colCb is Pred_L1, so the motion vector mvCol is set to the same value as the L1 motion vector MvL1[xPCol][yPCol] of the coding block colCb (S4236), the reference index refIdxCol is set to the same value as the L1 reference index RefIdxL1[xPCol][yPCol] (S4237), and the list ListCol is set to L1 (S4238). Here, xPCol and yPCol are indexes indicating the position of the top left pixel of the coding block colCb in a picture colPic of a different time.
一方、符号化ブロックcolCbのL0予測フラグPredFlagL0[xPCol][yPCol]が0でない場合(S4235のNO)、符号化ブロックcolCbのL1予測フラグPredFlagL1[xPCol][yPCol]が0かどうかを判定する。符号化ブロックcolCbのL1予測フラグPredFlagL1[xPCol][yPCol]が0の場合(S4239のYES)、動きベクトルmvColが符号化ブロックcolCbのL0の動きベクトルであるMvL0[xPCol][yPCol]と同じ値に設定され(S4240)、参照インデックスrefIdxColがL0の参照インデックスRefIdxL0[xPCol][yPCol] と同じ値に設定され(S4241)、リストListColがL0に設定される(S4242)。 On the other hand, if the L0 prediction flag PredFlagL0[xPCol][yPCol] of the coding block colCb is not 0 (NO in S4235), it is determined whether the L1 prediction flag PredFlagL1[xPCol][yPCol] of the coding block colCb is 0. If the L1 prediction flag PredFlagL1[xPCol][yPCol] of the coding block colCb is 0 (YES in S4239), the motion vector mvCol is set to the same value as the L0 motion vector MvL0[xPCol][yPCol] of the coding block colCb (S4240), the reference index refIdxCol is set to the same value as the L0 reference index RefIdxL0[xPCol][yPCol] (S4241), and the list ListCol is set to L0 (S4242).
符号化ブロックcolCbのL0予測フラグPredFlagL0[xPCol][yPCol]と符号化ブロックcolCbのL1予測フラグPredFlagL1[xPCol][yPCol]が共に0でない場合(S4235のNO,S4239のNO)、符号化ブロックcolCbのインター予測モードは双予測(Pred_BI)であるので、L0、L1の2つの動きベクトルから、一方を選択する(S4243)。 If the L0 prediction flag PredFlagL0[xPCol][yPCol] of the coding block colCb and the L1 prediction flag PredFlagL1[xPCol][yPCol] of the coding block colCb are both not 0 (NO in S4235, NO in S4239), the inter prediction mode of the coding block colCb is bi-predictive (Pred_BI), so one of the two motion vectors L0 and L1 is selected (S4243).
図54は、符号化ブロックcolCbのインター予測モードが双予測(Pred_BI)のときの符号化ブロックのインター予測情報の導出処理手順を示すフローチャートである。 Figure 54 is a flowchart showing the process steps for deriving inter prediction information for a coding block when the inter prediction mode of the coding block colCb is bi-prediction (Pred_BI).
まず、すべての参照リストに登録されているすべてのピクチャのPOCが現在の符号化対象ピクチャのPOCより小さいかどうかを判定し(S4251)、符号化ブロックcolCbのすべての参照リストであるL0及びL1に登録されているすべてのピクチャのPOCが現在の符号化対象ピクチャのPOCより小さい場合で(S4251のYES)、LXがL0、即ち符号化対象の符号化ブロックのL0の動きベクトルの予測ベクトル候補を導出している場合(S4252のYES)、符号化ブロックcolCbのL0の方のインター予測情報を選択し、LXがL1、即ち符号化対象の符号化ブロックのL1の動きベクトルの予測ベクトル候補を導出している場合(S4252のNO)、符号化ブロックcolCbのL1の方のインター予測情報を選択する。一方、符号化ブロックcolCbのすべての参照リストL0及びL1に登録されているピクチャのPOCの少なくとも1つが現在の符号化対象ピクチャのPOCより大きい場合で(S4251のNO)、フラグcollocated_from_l0_flagが0場合(S4253のYES)、符号化ブロックcolCbのL0の方のインター予測情報を選択し、フラグcollocated_from_l0_flagが1の場合(S4253のNO)、符号化ブロックcolCbのL1の方のインター予測情報を選択する。 First, it is determined whether the POC of all pictures registered in all reference lists is smaller than the POC of the current picture to be coded (S4251). If the POC of all pictures registered in all reference lists, L0 and L1, of the coding block colCb is smaller than the POC of the current picture to be coded (YES in S4251), and LX has derived a prediction vector candidate for the motion vector of L0, i.e., L0 of the coding block to be coded (YES in S4252), the inter prediction information of L0 of the coding block colCb is selected. If LX has derived a prediction vector candidate for the motion vector of L1, i.e., L1 of the coding block to be coded (NO in S4252), the inter prediction information of L1 of the coding block colCb is selected. On the other hand, if at least one of the POCs of the pictures registered in all reference lists L0 and L1 of the coding block colCb is larger than the POC of the current picture to be coded (NO in S4251), and if the flag collocated_from_l0_flag is 0 (YES in S4253), the inter prediction information of L0 of the coding block colCb is selected, and if the flag collocated_from_l0_flag is 1 (NO in S4253), the inter prediction information of L1 of the coding block colCb is selected.
符号化ブロックcolCbのL0の方のインター予測情報を選択する場合(S4252のYES、S4253のYES)、動きベクトルmvColがMvL0[xPCol][yPCol]と同じ値に設定され(S4254)、参照インデックスrefIdxColがRefIdxL0[xPCol][yPCol]と同じ値に設定され(S4255)、リストListColがL0に設定される(S4256)。 When selecting inter prediction information for L0 of coding block colCb (YES in S4252, YES in S4253), the motion vector mvCol is set to the same value as MvL0[xPCol][yPCol] (S4254), the reference index refIdxCol is set to the same value as RefIdxL0[xPCol][yPCol] (S4255), and the list ListCol is set to L0 (S4256).
符号化ブロックcolCbのL1の方のインター予測情報を選択する場合(S4252のNO、S4253のNO)、動きベクトルmvColがMvL1[xPCol][yPCol]と同じ値に設定され(S4257)、参照インデックスrefIdxColがRefIdxL1[xPCol][yPCol]と同じ値に設定され(S4258)、リストListColがL1に設定される(S4259)。 When selecting inter prediction information for L1 of the coding block colCb (NO in S4252, NO in S4253), the motion vector mvCol is set to the same value as MvL1[xPCol][yPCol] (S4257), the reference index refIdxCol is set to the same value as RefIdxL1[xPCol][yPCol] (S4258), and the list ListCol is set to L1 (S4259).
図53に戻り、符号化ブロックcolCbからインター予測情報が取得できたら、フラグavailableFlagLXColとフラグpredFlagLXColを共に1とする(S4244)。 Returning to FIG. 53, once inter prediction information has been obtained from the coding block colCb, the flag availableFlagLXCol and the flag predFlagLXCol are both set to 1 (S4244).
続いて、動きベクトルmvColをスケーリングして、動きベクトルmvLXColとする(S4245S4245)。この動きベクトルmvLXColのスケーリング演算処理手順を図55を用いて説明する。 Next, the motion vector mvCol is scaled to obtain the motion vector mvLXCol (S4245S4245). The procedure for the scaling calculation process of this motion vector mvLXCol will be explained using FIG. 55.
異なる時間のピクチャcolPicのPOCから、符号化ブロックcolCbのリストListColで参照する参照インデックスrefIdxColに対応する参照ピクチャのPOCを減算してピクチャ間距離tdを算出する(S4261)。なお、異なる時間のピクチャcolPicよりも符号化ブロックcolCbのリストListColで参照する参照ピクチャのPOCの方が表示順序で前の場合、ピクチャ間距離tdは正の値となり、異なる時間のピクチャcolPicよりも符号化ブロックcolCbのリストListColで参照する参照ピクチャのPOCの方が表示順序で後の場合、ピクチャ間距離tdは負の値となる。
td = 異なる時間のピクチャcolPicのPOC - 符号化ブロックcolCbのリストListColで参照する参照ピクチャのPOC
現在の符号化対象ピクチャのPOCから現在の符号化対象ピクチャのリストLXが参照する参照ピクチャのPOCを減算してピクチャ間距離tbを算出する(S4262)。なお、現在の符号化対象ピクチャよりも現在の符号化対象ピクチャのリストLXで参照する参照ピクチャの方が表示順序で前の場合、ピクチャ間距離tbは正の値となり、現在の符号化対象ピクチャのリストLXで参照する参照ピクチャの方が表示順序で後の場合、ピクチャ間距離tbは負の値となる。
tb = 現在の符号化 / 復号対象ピクチャのPOC - 時間マージ候補のLXの参照インデックスに対応する参照ピクチャのPOC
続いて、ピクチャ間距離tdとtbを比較し(S4263)、ピクチャ間距離tdとtbが等しい場合(S4263のYES)、次式により動きベクトルmvLXColを算出して(S4264)、本スケーリング演算処理を終了する。
mvLXCol = mvCol
一方、ピクチャ間距離tdとtbが等しくない場合(S4263のNO)、次式により変数txを算出する(S4265)。
tx = ( 16384 + Abs( td ) >> 1 ) / td
続いて、次式によりスケーリング係数distScaleFactorを算出する(S4266)。
distScaleFactor = Clip3( -4096, 4095, ( tb * tx + 32 ) >> 6 )
ここで、Clip3(x,y,z)は値zについて、最小値をx、最大値をyに制限する関数である。続いて、次式により動きベクトルmvLXColを算出して(S4267)、本スケーリング演算処理を終了する。
mvLXCol = Clip3( -32768, 32767, Sign( distScaleFactor * mvLXCol )
* ( (Abs( distScaleFactor * mvLXCol ) + 127 ) >> 8 ) )
ここで、Sign(x)は値xの符号を返す関数であり、Abs(x)は値xの絶対値を返す関数である。
The inter-picture distance td is calculated by subtracting the POC of the reference picture corresponding to the reference index refIdxCol referenced in the list ListCol of the coding block colCb from the POC of the picture colPic of the different time (S4261). Note that if the POC of the reference picture referenced in the list ListCol of the coding block colCb is earlier in the display order than the picture colPic of the different time, the inter-picture distance td is a positive value, and if the POC of the reference picture referenced in the list ListCol of the coding block colCb is later in the display order than the picture colPic of the different time, the inter-picture distance td is a negative value.
td = POC of a picture colPic at a different time - POC of a reference picture referenced in the list ListCol of coding blocks colCb
The POC of the reference picture referred to by the list LX of the current picture to be coded is subtracted from the POC of the current picture to be coded to calculate the inter-picture distance tb (S4262). Note that if the reference picture referred to by the list LX of the current picture to be coded is earlier in display order than the current picture to be coded, the inter-picture distance tb is a positive value, and if the reference picture referred to by the list LX of the current picture to be coded is later in display order, the inter-picture distance tb is a negative value.
tb = POC of the current picture to be coded/decoded - POC of the reference picture corresponding to the reference index of the LX of the temporal merge candidate
Next, the inter-picture distances td and tb are compared (S4263), and if the inter-picture distances td and tb are equal (YES at S4263), a motion vector mvLXCol is calculated by the following equation (S4264), and this scaling calculation process is terminated.
mvLXCol = mvCol
On the other hand, if the inter-picture distances td and tb are not equal (NO at S4263), the variable tx is calculated by the following formula (S4265).
tx = ( 16384 + Abs( td ) >> 1 ) / td
Next, the scaling coefficient distScaleFactor is calculated using the following equation (S4266).
distScaleFactor = Clip3( -4096, 4095, ( tb * tx + 32 ) >> 6 )
Here, Clip3(x, y, z) is a function that limits the value z to a minimum value of x and a maximum value of y. Next, a motion vector mvLXCol is calculated by the following equation (S4267), and this scaling calculation process ends.
mvLXCol = Clip3( -32768, 32767, Sign( distScaleFactor * mvLXCol )
* ((Abs( distScaleFactor * mvLXCol ) + 127 ) >> 8 ) )
Here, Sign(x) is a function that returns the sign of the value x, and Abs(x) is a function that returns the absolute value of the value x.
再び、図50を参照する。そして、L0の動きベクトルmvL0Colとを前述の通常予測動きベクトルモード導出部301における予測動きベクトル候補リストmvpListLXNに候補として追加する(S4205)。ただし、この追加は、参照リスト0の符号化ブロックcolCbが有効か否かを示すフラグavailableFlagL0Col=1の場合のみである。また、L1の動きベクトルmvL1Colを前述の通常予測動きベクトルモード導出部301における予測動きベクトル候補リストmvpListLXNに候補として追加する(S4205)。ただし、この追加は、参照リスト1の符号化ブロックcolCbが有効か否かを示すフラグavailableFlagL1Col=1の場合のみである。以上により、時間予測動きベクトル候補導出部322の処理を終了する。
Refer to FIG. 50 again. Then, the motion vector mvL0Col of L0 is added as a candidate to the predicted motion vector candidate list mvpListLXN in the normal predicted motion vector
上記した通常予測動きベクトルモード導出部301の説明は、符号化時のものであるが、復号時も同様となる。つまり、図23の通常予測動きベクトルモード導出部401における時間予測動きベクトル候補導出部422の動作は、上記の説明における符号化を復号と置き換えて、同様に説明される。
The above description of the normal prediction motion vector
<時間マージ>
図18の通常マージモード導出部302における時間マージ候補導出部342の動作について、図56を参照して説明する。
<Time Merge>
The operation of the temporal merge
まず、ColPicを導出する(ステップS4301)。次に、符号化ブロックcolCbを導出し、符号化情報を取得する(ステップS4302)。さらに、参照リストごとに、インター予測情報を導出する(S4303,S4304)。以上の処理は、時間予測動きベクトル候補導出部322におけるS4201からS4204と同じであるため、説明を省略する。
First, ColPic is derived (step S4301). Next, the coding block colCb is derived and coding information is obtained (step S4302). Furthermore, inter prediction information is derived for each reference list (S4303, S4304). The above processing is the same as S4201 to S4204 in the temporal motion vector predictor
次に、符号化ブロックcolCbが有効か否かを示すフラグavailableFlagColを算出する(S4305)。フラグavailableFlagL0Col、またはフラグavailableFlagL1Colが1の場合に、availableFlagColは1となる。それ以外ではavailableFlagColは0となる。 Next, the flag availableFlagCol indicating whether the coding block colCb is valid or not is calculated (S4305). If the flag availableFlagL0Col or the flag availableFlagL1Col is 1, then availableFlagCol is 1. In any other case, availableFlagCol is 0.
そして、L0の動きベクトルmvL0Col、およびL1の動きベクトルmvL1Colを、前述の通常マージモード導出部302におけるマージ候補リストmergeCandListに候補として追加する(S4306)。ただし、この追加は、符号化ブロックcolCbが有効か否かを示すフラグavailableFlagCol=1の場合のみである。以上により、時間マージ候補導出部342の処理を終了する。
Then, the L0 motion vector mvL0Col and the L1 motion vector mvL1Col are added as candidates to the merge candidate list mergeCandList in the normal merge
上記した時間マージ候補導出部342の説明は、符号化時のものであるが、復号時も同様となる。つまり、図24の通常マージモード導出部402における時間マージ候補導出部442の動作は、上記の説明における符号化を復号と置き換えて、同様に説明される。
The above description of the temporal merge
<履歴予測動きベクトル候補リストの更新>
次に、符号化側の符号化情報格納メモリ111及び復号側の符号化情報格納メモリ205に備える履歴予測動きベクトル候補リストHmvpCandListの更新方法について詳細に説明する。図38は履歴予測動きベクトル候補導出処理手順を説明するフローチャートである。
<Updating the Historical Motion Vector Predictor Candidate List>
Next, a detailed description will be given of a method for updating the historical motion vector predictor candidate list HmvpCandList provided in the encoding
本実施の形態では、履歴予測動きベクトル候補リストHmvpCandListの更新は、符号化情報格納メモリ111及び符号化情報格納メモリ205で実施されるものとする。インター予測部102及びインター予測部203の中に履歴候補リスト更新部を設置して履歴予測動きベクトル候補リストHmvpCandListの更新を実施させてもよい。
In this embodiment, the update of the history prediction motion vector candidate list HmvpCandList is performed in the coding
スライスの先頭で履歴予測動きベクトル候補リストHmvpCandListの初期設定を行い、符号化側では予測方法決定部106で通常予測ベクトルモードまたは通常マージモードが選択された場合に履歴予測動きベクトル候補リストHmvpCandListの更新し、復号側では、ビット列復号部201で復号されたインター予測モードが通常予測ベクトルモードまたは通常マージモードの場合に履歴予測動きベクトル候補リストHmvpCandListの更新する。通常予測ベクトルモードまたは通常マージモードでインター予測を行う際に用いるインター予測情報を登録すべきインター予測情報候補hMvpCandとし、符号化側の符号化情報格納メモリ111及び復号側の符号化情報格納メモリ205に備える履歴予測動きベクトル候補リストHmvpCandListに登録されているインター予測情報の中に、登録すべきインター予測情報候補hMvpCandと同じ値のインター予測が存在する場合は履歴予測動きベクトル候補リストHmvpCandListからその要素(インター予測情報)を削除し、登録すべきインター予測情報候補hMvpCandと同じ値のをインター予測が存在しない場合は履歴予測動きベクトル候補リストHmvpCandListの先頭の要素(インター予測情報)を削除し、履歴予測動きベクトル候補リストHmvpCandListの最後に、登録すべきインター予測情報候補hMvpCandを追加する。
The historical prediction motion vector candidate list HmvpCandList is initially set at the beginning of the slice, and on the encoding side, the historical prediction motion vector candidate list HmvpCandList is updated when the normal prediction vector mode or normal merge mode is selected by the prediction
本発明の符号化側の符号化情報格納メモリ111及び復号側の符号化情報格納メモリ205に備える履歴予測動きベクトル候補リストHmvpCandListの要素の数は6とする。
In the present invention, the number of elements in the historical predicted motion vector candidate list HmvpCandList provided in the encoding
まず、スライス単位での履歴予測動きベクトル候補リストHmvpCandListの初期化を行う。スライスの先頭で履歴予測動きベクトル候補リストHmvpCandListのすべての要素に履歴予測動きベクトル候補を追加し、履歴予測動きベクトル候補リストHmvpCandListに登録されている履歴予測動きベクトル候補の数NumHmvpCandの値は6に設定する(図38のステップS2101)。 First, the historical prediction motion vector candidate list HmvpCandList is initialized on a slice-by-slice basis. Historical prediction motion vector candidates are added to all elements of the historical prediction motion vector candidate list HmvpCandList at the beginning of the slice, and the value of the number of historical prediction motion vector candidates NumHmvpCand registered in the historical prediction motion vector candidate list HmvpCandList is set to 6 (step S2101 in FIG. 38).
ここでは、履歴予測動きベクトル候補リストHmvpCandListの初期化をスライス単位(スライスの最初の符号化ブロック)で実施するとしたが、ピクチャ単位、タイル単位やツリーブロック行単位で実施することもできる。 Here, the initialization of the historical predicted motion vector candidate list HmvpCandList is performed on a slice-by-slice basis (the first coding block of the slice), but it can also be performed on a picture-by-picture, tile-by-tile, or tree block row-by-tree block basis.
図62は履歴予測動きベクトル候補リストHmvpCandListの初期化によって追加される履歴予測動きベクトル候補の一例を示す表である。スライスタイプがBスライスで、参照ピクチャの枚数が4の場合の例を示す。履歴予測動きベクトルインデックスが(履歴予測動きベクトル候補の数NumHmvpCand-1)から0まで、スライスタイプに応じて動きベクトルの値が(0, 0)のインター予測情報を履歴予測動きベクトル候補として、履歴予測動きベクトル候補リストHmvpCandListに追加して、履歴予測動きベクトル候補リストを履歴候補で充填する。このとき、履歴予測動きベクトルインデックスを(履歴予測動きベクトル候補の数NumHmvpCand-1)から開始し、参照インデックスrefIdxLX(Xは0または1)には0から(参照ピクチャの数numRefIdx-1)まで1ずつインクリメントした値を設定する。その後は、履歴予測動きベクトル候補同士の重複を許可して、refIdxLXには0の値を設定する。履歴予測動きベクトル候補の数NumHmvpCandにすべての値を設定し、履歴予測動きベクトル候補の数NumHmvpCandの値を固定値にすることで、無効な履歴予測動きベクトル候補を無くす。このように、予測動きベクトル候補リストやマージ候補リストに追加される確率の高い履歴予測動きベクトルインデックスが大きい値の候補から、一般的に選択率の高い参照インデックスの小さい値を割り当てることで、符号化効率を向上させることができる。 Figure 62 is a table showing an example of a history prediction motion vector candidate added by initializing the history prediction motion vector candidate list HmvpCandList. An example is shown in which the slice type is a B slice and the number of reference pictures is 4. Inter prediction information with a history prediction motion vector index ranging from (the number of history prediction motion vector candidates NumHmvpCand-1) to 0 and a motion vector value of (0, 0) according to the slice type is added to the history prediction motion vector candidate list HmvpCandList as a history prediction motion vector candidate, and the history prediction motion vector candidate list is filled with history candidates. At this time, the history prediction motion vector index starts from (the number of history prediction motion vector candidates NumHmvpCand-1), and the reference index refIdxLX (X is 0 or 1) is set to a value incremented by 1 from 0 to (the number of reference pictures numRefIdx-1). After that, overlapping of history prediction motion vector candidates is permitted, and refIdxLX is set to a value of 0. By setting all values to the number of historical motion vector predictor candidates NumHmvpCand and setting the value of the number of historical motion vector predictor candidates NumHmvpCand to a fixed value, invalid historical motion vector predictor candidates are eliminated. In this way, by assigning small reference index values, which generally have a high selection rate, to candidates with large historical motion vector predictor index values that are likely to be added to the motion vector predictor candidate list or merge candidate list, it is possible to improve coding efficiency.
また、スライス単位で履歴予測動きベクトル候補リストを履歴予測動きベクトル候補で充填しておくことで、履歴予測動きベクトル候補の数を固定値として扱うことができるため、例えば履歴予測動きベクトル候補導出処理や履歴マージ候補導出処理を簡易化することができる。 In addition, by filling the history prediction motion vector candidate list with history prediction motion vector candidates on a slice-by-slice basis, the number of history prediction motion vector candidates can be treated as a fixed value, which can simplify, for example, the history prediction motion vector candidate derivation process and the history merge candidate derivation process.
ここでは、動きベクトルの値を一般的に選択確率の高い(0, 0)としたが、所定の値であればよい。例えば、(4,4)、(0,32)、(-128,0)などの値にして差分動きベクトルの符号化効率を改善しても良いし、所定値を複数設定して差分動きベクトルの符号化効率を改善しても良い。 Here, the value of the motion vector is set to (0, 0), which is generally selected with a high probability, but any predetermined value may be used. For example, values such as (4, 4), (0, 32), and (-128, 0) may be used to improve the coding efficiency of the differential motion vector, or multiple predetermined values may be set to improve the coding efficiency of the differential motion vector.
また、履歴予測動きベクトルインデックスを(履歴予測動きベクトル候補の数NumHmvpCand-1)から開始し、参照インデックスrefIdxLX(Xは0または1)には0から(参照ピクチャの数numRefIdx-1)まで1ずつインクリメントした値を設定するとしたが、履歴予測動きベクトルインデックスを0から開始してもよい。 In addition, although the historical prediction motion vector index is set to (the number of historical prediction motion vector candidates NumHmvpCand-1) and the reference index refIdxLX (X is 0 or 1) is set to a value incremented by 1 from 0 to (the number of reference pictures numRefIdx-1), the historical prediction motion vector index may also start from 0.
図63は履歴予測動きベクトル候補リストHmvpCandListの初期化によって追加される履歴予測動きベクトル候補の別の一例を示す表である。スライスタイプがBスライスで、参照ピクチャの枚数が2の場合の例を示す。この例では履歴予測動きベクトル候補リストHmvpCandListの各要素に履歴予測動きベクトル候補同士の重複がないように、参照インデックスまたは動きベクトルの値のいずれかが異なるインター予測情報を履歴予測動きベクトル候補として追加して、履歴予測動きベクトル候補リストを充填する。このとき、履歴予測動きベクトルインデックスを(履歴予測動きベクトル候補の数NumHmvpCand-1)から開始し、参照インデックスrefIdxLX(Xは0または1)には0から(参照ピクチャの数numRefIdx-1)まで1ずつインクリメントした値を設定する。その後は、refIdxLXには0で異なる値の動きベクトルを履歴予測動きベクトル候補として追加する。履歴予測動きベクトル候補の数NumHmvpCandにすべての値を設定し、履歴予測動きベクトル候補の数NumHmvpCandの値を固定値にすることで、無効な履歴予測動きベクトル候補を無くす。 Figure 63 is a table showing another example of a history prediction motion vector candidate added by initializing the history prediction motion vector candidate list HmvpCandList. An example is shown in which the slice type is a B slice and the number of reference pictures is two. In this example, inter-prediction information with different reference indexes or motion vector values is added as a history prediction motion vector candidate to fill the history prediction motion vector candidate list so that there is no overlap between the history prediction motion vector candidates in each element of the history prediction motion vector candidate list HmvpCandList. At this time, the history prediction motion vector index starts from (the number of history prediction motion vector candidates NumHmvpCand-1), and the reference index refIdxLX (X is 0 or 1) is set to a value incremented by one from 0 to (the number of reference pictures numRefIdx-1). After that, a motion vector with a different value, 0, is added as a history prediction motion vector candidate to refIdxLX. By setting all values to the number of historical prediction motion vector candidates NumHmvpCand and setting the value of the number of historical prediction motion vector candidates NumHmvpCand to a fixed value, invalid historical prediction motion vector candidates are eliminated.
このように、スライス単位で履歴予測動きベクトル候補リストを重複しない履歴予測動きベクトル候補で充填しておくことで、さらに、符号化ブロック単位で実施する後述の通常マージモード導出部302における履歴マージ候補導出部345より後のマージ候補補充部346の処理を省略することができ、処理量を削減することができる。
In this way, by filling the history prediction motion vector candidate list with non-overlapping history prediction motion vector candidates on a slice-by-slice basis, it is possible to omit the processing of the merge
ここでは、動きベクトルの値を(0, 0)や(1,0)など小さい値としたが、履歴予測動きベクトル候補同士の重複が生じなければ、動きベクトルの値を大きくしてもよい。 Here, the motion vector values are small values such as (0,0) or (1,0), but the motion vector values may be large as long as there is no overlap between historical predicted motion vector candidates.
また、履歴予測動きベクトルインデックスを(履歴予測動きベクトル候補の数NumHmvpCand-1)から開始し、参照インデックスrefIdxLX(Xは0または1)には0から(参照ピクチャの数numRefIdx-1)まで1ずつインクリメントした値を設定するとしたが、履歴予測動きベクトルインデックスを0から開始してもよい。 In addition, although the historical prediction motion vector index is set to (the number of historical prediction motion vector candidates NumHmvpCand-1) and the reference index refIdxLX (X is 0 or 1) is set to a value incremented by 1 from 0 to (the number of reference pictures numRefIdx-1), the historical prediction motion vector index may also start from 0.
図64は履歴予測動きベクトル候補リストHmvpCandListの初期化によって追加される履歴予測動きベクトル候補の別の一例を示す表である。 Figure 64 is a table showing another example of historical predicted motion vector candidates added by initializing the historical predicted motion vector candidate list HmvpCandList.
スライスタイプがBスライスの場合の例を示す。この例では履歴予測動きベクトル候補リストHmvpCandListの各要素に履歴予測動きベクトル候補同士の重複がないように、参照インデックスが0で、動きベクトルの値が異なるインター予測情報を履歴予測動きベクトル候補として追加して、履歴予測動きベクトル候補リストを充填する。このとき、履歴予測動きベクトルインデックスを(履歴予測動きベクトル候補の数NumHmvpCand-1)から開始し、参照インデックスrefIdxLX(Xは0または1)は0を設定する。履歴予測動きベクトル候補の数NumHmvpCandにすべての値を設定し、履歴予測動きベクトル候補の数NumHmvpCandの値を固定値にすることで、無効な履歴予測動きベクトル候補を無くす。 An example is shown for the case where the slice type is a B slice. In this example, inter-prediction information with a reference index of 0 and different motion vector values is added as a history prediction motion vector candidate to fill the history prediction motion vector candidate list so that there is no overlap between history prediction motion vector candidates in each element of the history prediction motion vector candidate list HmvpCandList. At this time, the history prediction motion vector index starts from (the number of history prediction motion vector candidates NumHmvpCand-1), and the reference index refIdxLX (X is 0 or 1) is set to 0. All values are set in the number of history prediction motion vector candidates NumHmvpCand, and the value of the number of history prediction motion vector candidates NumHmvpCand is set to a fixed value, thereby eliminating invalid history prediction motion vector candidates.
このように、参照インデックスを0とすることで、さらに、参照ピクチャの数を考慮することなく初期化することができるため処理を簡易化することができる。 In this way, by setting the reference index to 0, the process can be further simplified since initialization can be performed without taking into account the number of reference pictures.
ここでは、動きベクトルの値を2の倍数としたが、参照インデックスが0で履歴予測動きベクトル候補同士の重複が生じなければ、その他の値でもよい。 Here, the motion vector value is a multiple of 2, but other values are acceptable as long as the reference index is 0 and there is no overlap between historical motion vector predictor candidates.
また、履歴予測動きベクトルインデックスを(履歴予測動きベクトル候補の数NumHmvpCand-1)から開始し、参照インデックスrefIdxLX(Xは0または1)には0から(参照ピクチャの数numRefIdx-1)まで1ずつインクリメントした値を設定するとしたが、履歴予測動きベクトルインデックスを0から開始してもよい。 In addition, although the historical prediction motion vector index is set to (the number of historical prediction motion vector candidates NumHmvpCand-1) and the reference index refIdxLX (X is 0 or 1) is set to a value incremented by 1 from 0 to (the number of reference pictures numRefIdx-1), the historical prediction motion vector index may also start from 0.
続いて、スライス内の符号化ブロック毎に以下の履歴予測動きベクトル候補リストHmvpCandListの更新処理を繰り返し行なう(図38のステップS2102~S2111)。 Then, the following update process of the historical predicted motion vector candidate list HmvpCandList is repeated for each coding block in the slice (steps S2102 to S2111 in FIG. 38).
まず、符号化ブロック単位での初期設定を行う。同一候補が存在するか否かを示すフラグidenticalCandExistにFALSE(偽)の値を設定し、削除対象インデックスremoveIdxに0を設定する(図38のステップS2103)。 First, initial settings are made on a coding block basis. The flag identicalCandExist, which indicates whether an identical candidate exists, is set to FALSE, and the deletion target index removeIdx is set to 0 (step S2103 in FIG. 38).
履歴予測動きベクトル候補リストHmvpCandListに登録対象のインター予測情報候補hMvpCandが存在するか否かを判定する(図38のステップS2104)。符号化側の予測方法決定部105で通常予測動きベクトルモードまたは通常マージモードと判定された場合、または復号側のビット列復号部で通常予測動きベクトルモードまたは通常マージモードとして復号された場合、そのインター予測モードをhMvpCandとする。符号化側の予測方法決定部105でイントラ予測モード、サブブロック予測動きベクトルモードまたはサブブロックマージモードと判定された場合、または復号側のビット列復号部でイントラ予測モード、サブブロック予測動きベクトルモードまたはサブブロックマージモードとして復号された場合、履歴予測動きベクトル候補リストHmvpCandListの更新処理を行わず、登録対象のインター予測情報候補hMvpCandは存在しない。登録対象のインター予測情報候補hMvpCandが存在しない場合はステップS2105~S2110をスキップする(図38のステップS2104のNO)。登録対象のインター予測情報候補hMvpCandが存在する場合はステップS2105以下の処理を行う(図38のステップS2104のYES)。
It is determined whether the inter prediction information candidate hMvpCand to be registered exists in the history prediction motion vector candidate list HmvpCandList (step S2104 in FIG. 38). If the prediction
続いて、履歴予測動きベクトル候補リストHmvpCandListの各要素の中に登録対象のインター予測情報候補hMvpCandと同一の要素が存在するか否かを判定する(図38のステップS2105)。図39はこの同一要素確認処理手順のフローチャートである。履歴予測動きベクトル候補の数NumHmvpCandの値が0の場合(図39のステップS2121のNO)、履歴予測動きベクトル候補リストHmvpCandListは空で、同一候補は存在しないので図39ステップS2122~S2125をスキップし、本同一要素確認処理手順を終了する。履歴予測動きベクトル候補の数NumHmvpCandの値が0より大きい場合(図39のステップS2121のYES)、履歴予測動きベクトルインデックスhMvpIdxが0からNumHmvpCand-1まで、ステップS2122~S2125の処理を繰り返す(図39のステップS2121~S2125)。まず、履歴予測動きベクトル候補リストの0から数えてhMvpIdx番目の要素HmvpCandList[MvpIdx]がインター予測情報候補hMvpCandと同一かどうかを比較する(図39のステップS2123)。同一の場合(図39のステップS2123のYES)、同一候補が存在するか否かを示すフラグidenticalCandExistにTRUE(真)の値を設定し、削除対象インデックスremoveIdxにhMVpIndexの値を設定し、本同一要素確認処理を終了する。同一でない場合(図39のステップS2123のNO)、hMvpIdxを1インクリメントし(図39のステップS2121、S2125)、ステップS2123以降の処理を行う。 Next, it is determined whether or not there is an element identical to the inter-prediction information candidate hMvpCand to be registered among the elements of the history prediction motion vector candidate list HmvpCandList (step S2105 in FIG. 38). FIG. 39 is a flowchart of this identical element confirmation process procedure. If the value of the number of history prediction motion vector candidates NumHmvpCand is 0 (NO in step S2121 in FIG. 39), the history prediction motion vector candidate list HmvpCandList is empty and there is no identical candidate, so steps S2122 to S2125 in FIG. 39 are skipped and this identical element confirmation process procedure ends. If the value of the number of history prediction motion vector candidates NumHmvpCand is greater than 0 (YES in step S2121 in FIG. 39), the processes of steps S2122 to S2125 are repeated for the history prediction motion vector index hMvpIdx from 0 to NumHmvpCand-1 (steps S2121 to S2125 in FIG. 39). First, the hMvpIdx-th element HmvpCandList[MvpIdx] counting from 0 in the history predicted motion vector candidate list is compared with the inter prediction information candidate hMvpCand to see if it is the same (step S2123 in FIG. 39). If they are the same (YES in step S2123 in FIG. 39), a flag identicalCandExist indicating whether an identical candidate exists is set to TRUE, the deletion target index removeIdx is set to the value of hMVpIndex, and this identical element confirmation process ends. If they are not the same (NO in step S2123 in FIG. 39), hMvpIdx is incremented by 1 (steps S2121 and S2125 in FIG. 39), and the processes from step S2123 onwards are performed.
ここで、履歴予測動きベクトル候補リストを履歴予測動きベクトル候補で充填しておくことで、図39のステップS2121は省略することができる。 Here, by filling the history prediction motion vector candidate list with history prediction motion vector candidates, step S2121 in FIG. 39 can be omitted.
再び図38のフローチャートに戻り、履歴予測動きベクトル候補リストHmvpCandListの要素のシフト及び追加処理を行う(図38のステップS2106)。図40は図38のステップS2106の履歴予測動きベクトル候補リストHmvpCandListの要素シフト/追加処理手順のフローチャートである。まず、履歴予測動きベクトル候補リストHmvpCandListに格納されている要素を除いてから新たな要素を追加するか、要素を除かずに新たな要素追加するかを判定する。具体的には同一候補が存在するか否かを示すフラグidenticalCandExistにTRUE(真)またはNumHmvpCandが6かどうかを比較する(図40のステップS2141)。同一候補が存在するか否かを示すフラグidenticalCandExistにTRUE(真)またはNumHmvpCandが6のいずれかの条件を満たす場合(図40のステップS2141のYES)、履歴予測動きベクトル候補リストHmvpCandListに格納されている要素を除いてから新たな要素を追加する。インデックスiの初期値をremoveIdx + 1の値に設定する。この初期値からNumHmvpCandまで、ステップS2143の要素シフト処理を繰り返す。(図40のステップS2142~S2144)。HMVPCandList[ i - 1 ]にHMVPCandList[ i ]の要素をコピーすることで要素を前方にシフトし(図40のステップS2143)、iを1インクリメントする(図40のステップS2142、S2145)。続いて、履歴予測動きベクトル候補リストの最後に相当する0から数えて(NumHmvpCand-1)番目HMVPCandList[NumHmvpCand-1]にインター予測情報候補hMvpCandを追加し(図40のステップS2145)、本履歴予測動きベクトル候補リストHMVPCandListの要素シフト・追加処理を終了する。一方、同一候補が存在するか否かを示すフラグidenticalCandExistにTRUE(真)およびNumHmvpCandが6のいずれの条件も満たさない場合(図40のステップS2141のNO)、履歴予測動きベクトル候補リストHmvpCandListに格納されている要素を除かずに新たな要素を追加する。履歴予測動きベクトル候補リストの最後に相当する0から数えて(NumHmvpCand-1)番目 HMVPCandList[NumHmvpCand]にインター予測情報候補hMvpCandを追加し、NumHmvpCandを1インクリメントして(図40のステップS2145)、本履歴予測動きベクトル候補リストHMVPCandListの要素シフト・追加処理を終了する。
Returning to the flowchart of FIG. 38 again, the process of shifting and adding elements of the historical prediction motion vector candidate list HmvpCandList is performed (step S2106 of FIG. 38). FIG. 40 is a flowchart of the process procedure of shifting/adding elements of the historical prediction motion vector candidate list HmvpCandList in step S2106 of FIG. 38. First, it is determined whether to remove elements stored in the historical prediction motion vector candidate list HmvpCandList and then add a new element, or to add a new element without removing elements. Specifically, it is compared whether the flag identicalCandExist indicating whether or not an identical candidate exists is TRUE (true) or NumHmvpCand is 6 (step S2141 of FIG. 40). If either of the conditions of the flag identicalCandExist indicating whether or not an identical candidate exists is TRUE (true) or NumHmvpCand is 6 is satisfied (YES in step S2141 of FIG. 40), the elements stored in the historical prediction motion vector candidate list HmvpCandList are removed and then a new element is added. The initial value of index i is set to the value of
ここでは、履歴予測動きベクトル候補リストは予測動きベクトルモードとマージモードの両方に適用するものとするが、いずれか一方だけに適用してもよい。 Here, the historical motion vector predictor candidate list is assumed to apply to both the motion vector predictor mode and the merge mode, but it may also be applied to only one of them.
以上のように、履歴予測動きベクトル候補リストの更新においては、履歴予測動きベクトル候補リストに格納されている同一の要素を除いてから新たな要素を追加しているため、履歴予測動きベクトル候補リストに重複する要素は存在せず、履歴予測動きベクトル候補リストは全て異なる要素により構成される。 As described above, when updating the historical motion vector prediction candidate list, identical elements stored in the historical motion vector prediction candidate list are removed before new elements are added, so there are no duplicate elements in the historical motion vector prediction candidate list, and the historical motion vector prediction candidate list is composed of all different elements.
<履歴予測動きベクトル候補導出処理>
次に、符号化側の通常予測動きベクトルモード導出部301の履歴予測動きベクトル候補導出部323、復号側の通常予測動きベクトルモード導出部401の履歴予測動きベクトル候補導出部423で共通の処理である図20のステップS304の処理手順である履歴予測動きベクトル候補リストHMVPCandListからの履歴予測動きベクトル候補の導出方法について詳細に説明する。図41は履歴予測動きベクトル候補導出処理手順を説明するフローチャートである。
<Historical Prediction Motion Vector Candidate Derivation Process>
Next, a detailed description will be given of a method for deriving a historical prediction motion vector candidate from the historical prediction motion vector candidate list HMVPCandList, which is a processing procedure of step S304 in Fig. 20 and is common to the historical prediction motion vector
現在の予測動きベクトル候補の数numCurrMvpCandが予測動きベクトル候補リストの最大要素数(ここでは2)以上または履歴予測動きベクトル候補の数がNumHmvpCandの値が0の場合(図41のステップS2201のNO)、図41のステップS2202からS2208の処理を省略し、履歴予測動きベクトル候補導出処理手順を終了する。numCurrMvpCandが予測動きベクトル候補リストの最大要素数である2より小さい場合(図41のステップS2201のYES)、図41のステップS2202からS2208の処理を行う。 If the number of current motion vector predictor candidates numCurrMvpCand is equal to or greater than the maximum number of elements in the motion vector predictor candidate list (here, 2) or the number of historical motion vector predictor candidates is equal to 0 (NO in step S2201 in FIG. 41), steps S2202 to S2208 in FIG. 41 are omitted, and the historical motion vector predictor candidate derivation process procedure is terminated. If numCurrMvpCand is smaller than 2, which is the maximum number of elements in the motion vector predictor candidate list (YES in step S2201 in FIG. 41), steps S2202 to S2208 in FIG. 41 are performed.
続いて、インデックスiが1から、4とNumHmvpCandのいずれか小さい値まで、図41のステップS2203からS2207の処理を繰り返す(図41のステップS2202~S2208)。numCurrMvpCandが予測動きベクトル候補リストの最大要素数である2以上の場合(図41のステップS2203のNO)、図41のステップS2204からS2208の処理を省略し、本履歴予測動きベクトル候補導出処理手順を終了する。numCurrMvpCandが予測動きベクトル候補リストの最大要素数である2より小さい場合(図41のステップS2203のYES)、図41のステップS2204以降の処理を行う。 Next, the process of steps S2203 to S2207 in FIG. 41 is repeated for index i from 1 to the smaller of 4 and NumHmvpCand (steps S2202 to S2208 in FIG. 41). If numCurrMvpCand is equal to or greater than 2, which is the maximum number of elements in the motion vector predictor candidate list (NO in step S2203 in FIG. 41), the process of steps S2204 to S2208 in FIG. 41 is omitted, and this history motion vector predictor candidate derivation process procedure is terminated. If numCurrMvpCand is smaller than 2, which is the maximum number of elements in the motion vector predictor candidate list (YES in step S2203 in FIG. 41), the process of step S2204 and subsequent steps in FIG. 41 is performed.
続いて、ステップS2205からS2206までの処理を変数Yが0と1(L0とL1)についてそれぞれ行う(図41のステップS2204~S2207)。numCurrMvpCandが予測動きベクトル候補リストの最大要素数である2以上の場合(図41のステップS2205のNO)、図41のステップS2206からS2208の処理を省略し、本履歴予測動きベクトル候補導出処理手順を終了する。numCurrMvpCandが予測動きベクトル候補リストの最大要素数である2より小さい場合(図41のステップS2205のYES)、図41のステップS2206以降の処理を行う。 Next, the processes from step S2205 to S2206 are performed for variables Y of 0 and 1 (L0 and L1), respectively (steps S2204 to S2207 in FIG. 41). If numCurrMvpCand is equal to or greater than 2, which is the maximum number of elements in the motion vector predictor candidate list (NO in step S2205 in FIG. 41), steps S2206 to S2208 in FIG. 41 are omitted, and this history motion vector predictor candidate derivation process procedure ends. If numCurrMvpCand is less than 2, which is the maximum number of elements in the motion vector predictor candidate list (YES in step S2205 in FIG. 41), the processes from step S2206 onwards in FIG. 41 are performed.
続いて、LY予測の予測動きベクトル候補リストの0から数えてnumCurrMvpCand番目の要素mvpListLY[numCurrMvpCand ]に履歴予測動きベクトル候補HmvpCandList[NumHmvpCand - i]のLYの動きベクトルを追加し、numCurrMvpCandを1インクリメントする(図41のステップS2206)。 Next, the LY motion vector of the historical predicted motion vector candidate HmvpCandList[NumHmvpCand - i] is added to the numCurrMvpCand-th element mvpListLY[numCurrMvpCand], counting from 0, of the predicted motion vector candidate list for LY prediction, and numCurrMvpCand is incremented by 1 (step S2206 in Figure 41).
以上の図41のステップS2205からS2206の処理をL0とL1で双方ともに行う(図41のステップS2204~S2207)。 The above processing of steps S2205 to S2206 in FIG. 41 is performed on both L0 and L1 (steps S2204 to S2207 in FIG. 41).
インデックスiを1インクリメントし(図41のステップS2202、S2208)、インデックスiが4とNumHmvpCandのいずれか小さい値以下の場合、再びステップS2203以降の処理を行う(図41のステップS2202~S2208)。 Index i is incremented by 1 (steps S2202 and S2208 in FIG. 41), and if index i is equal to or less than the smaller of 4 and NumHmvpCand, processing from step S2203 onwards is performed again (steps S2202 to S2208 in FIG. 41).
本実施の形態においては、上述の通り、履歴予測動きベクトル候補導出処理においては、履歴予測動きベクトル候補リストの要素の動きベクトルと予測動きベクトル候補リストの要素の動きベクトルとの比較を行うことなく、履歴予測動きベクトル候補リストの要素の動きベクトルを予測動きベクトル候補リストへ追加する。 In this embodiment, as described above, in the historical prediction motion vector candidate derivation process, the motion vector of an element in the historical prediction motion vector candidate list is added to the predicted motion vector candidate list without comparing the motion vector of the element in the historical prediction motion vector candidate list with the motion vector of an element in the predicted motion vector candidate list.
このような構成を取ることにより、履歴予測動きベクトル候補の数が2以上であれば、履歴予測動きベクトル候補リスト候補導出処理が完了した後、予測動きベクトル候補リストが最大要素数に達することを保証することができる。また、動きベクトルが同一であるか否かを検査するための処理量と回路規模を削減することができる。 By adopting such a configuration, if the number of historical prediction motion vector candidates is two or more, it is possible to ensure that the predicted motion vector candidate list reaches the maximum number of elements after the historical prediction motion vector candidate list candidate derivation process is completed. In addition, it is possible to reduce the amount of processing and the circuit size required to check whether the motion vectors are identical.
通常予測動きベクトルモードは、予測動きベクトル候補リストに含まれる予測動きベクトル候補と差分ベクトルにより、処理対象ブロックの動き情報を決定するモードであり、差分ベクトルにより適切な動きベクトルを決定できる余地があるため、やむを得ず予測動きベクトル候補リストの要素が重複するような場合であっても、選択肢の減少による符号化効率の低下を最小限にとどめることができる。 Normal motion vector prediction mode is a mode in which motion information for the block to be processed is determined by the motion vector prediction candidates and difference vectors included in the motion vector prediction candidate list. Since there is room for determining an appropriate motion vector using the difference vector, even in cases where elements in the motion vector prediction candidate list overlap, it is possible to minimize the decrease in coding efficiency due to a reduction in options.
また、通常予測動きベクトルモードは、予測動きベクトル候補リストをL0予測とL1予測で別々に処理する。そのため、L0予測の予測動きベクトル候補リストでは要素が重複するような場合でも、L1予測の予測動きベクトル候補リストでは要素が重複しない場合もある。 In addition, in the normal predicted motion vector mode, the predicted motion vector candidate list is processed separately for L0 prediction and L1 prediction. Therefore, even if elements overlap in the predicted motion vector candidate list for L0 prediction, the elements may not overlap in the predicted motion vector candidate list for L1 prediction.
また、通常予測動きベクトルモードは、予測動きベクトル候補と参照インデックスを別々に処理する。そのため、予測動きベクトル候補リストでは要素が重複するような場合でも、参照インデックスには影響を与えない。 Also, the normal motion vector predictor mode processes motion vector predictor candidates and reference indices separately. Therefore, even if elements in the motion vector predictor candidate list are duplicated, this does not affect the reference index.
また、予測動きベクトル候補リストには最大でも2個の要素しか含まれないため、予測動きベクトル候補リストの要素が重複するような場合であっても、減少する選択肢の数は1のみである。 In addition, since the motion vector predictor candidate list contains at most two elements, even if elements in the motion vector predictor candidate list overlap, the number of options is reduced by only one.
また、履歴予測動きベクトル候補リストには同一の要素は含まれないため、履歴予測動きベクトル候補リストの要素と予測動きベクトル候補リストの要素との比較が実質的に意味を持つのは、空間予測動きベクトル候補導出部421と時間予測動きベクトル候補導出部422で予測動きベクトル候補リストの要素が1つだけしか生成されなかった場合に限定されるため頻度が極めて少ない。 また、一般的に通常予測動きベクトルモードが選択されるのは、隣接するブロックとの動きが類似しない場合であり、履歴予測動きベクトル候補リストの要素は予測動きベクトル候補リストに既に追加されている要素と重複する可能性は低い。
In addition, since the historical prediction motion vector candidate list does not contain identical elements, a comparison between elements of the historical prediction motion vector candidate list and elements of the predictor motion vector candidate list is practically meaningful only when only one element of the predictor motion vector candidate list is generated by the spatial prediction motion vector
以上のような理由から、予測動きベクトル候補リストの要素が重複する場合でも、選択肢の減少による符号化効率の低下を抑制しながら、履歴予測動きベクトル候補の動きベクトルと予測動きベクトル候補の動きベクトルの比較処理を削減することができる。 For the reasons described above, even if elements in the motion vector predictor candidate list overlap, it is possible to reduce the comparison process between the motion vectors of the historical motion vector predictor candidates and the motion vectors of the motion vector predictor candidates while suppressing a decrease in coding efficiency due to a reduction in options.
また、履歴予測動きベクトル候補リストを重複しない履歴予測動きベクトル候補で充填しておき、履歴予測動きベクトル候補リストの要素と予測動きベクトル候補リストの要素との比較を行うことなく、履歴予測動きベクトル候補リストの要素を予測動きベクトル候補リストへ追加することで、通常予測動きベクトルモード導出部301における履歴予測動きベクトル候補導出部323より後の予測動きベクトル補充部325の処理を省略することができる。
In addition, by filling the history prediction motion vector candidate list with non-overlapping history prediction motion vector candidates and adding elements of the history prediction motion vector candidate list to the prediction motion vector candidate list without comparing the elements of the history prediction motion vector candidate list with the elements of the prediction motion vector candidate list, it is possible to omit the processing of the prediction motion
<履歴マージ候補導出処理>
次に、符号化側の通常マージモード導出部302の履歴マージ候補導出部345、復号側の通常マージモード導出部401の履歴マージ候補導出部423で共通の処理である図20のステップS304の処理手順である履歴予測動きベクトル候補リストHmvpCandListからの履歴マージ候補の導出方法について詳細に説明する。図42は履歴マージ候補導出処理手順を説明するフローチャートである。
<History Merge Candidate Deriving Process>
Next, a detailed description will be given of a method for deriving a history merge candidate from the history merge candidate list HmvpCandList, which is a processing procedure of step S304 in Fig. 20 and is common to the history merge
まず、初期化処理を行う(図42のステップS2301)。isPruned[i]の0から(numCurrMergeCand -1)番目のそれぞれの要素にFALSEの値を設定し、変数numOrigMergeCandに現在のマージ候補リストに登録されている要素の数numCurrMergeCandを設定する。 First, an initialization process is performed (step S2301 in FIG. 42). The value FALSE is set for each of the elements from 0 to (numCurrMergeCand - 1) of isPruned[i], and the variable numOrigMergeCand is set to the number of elements currently registered in the merge candidate list, numCurrMergeCand.
続いて、履歴予測動きベクトル候補リストの要素の中でマージ候補リストに含まれていない要素をマージ候補リストに追加する。この時、履歴予測動きベクトル候補リストの後ろから降順に確認し、追加していく。インデックスhMvpIdxの初期値を1に設定し、この初期値からNumHmvpCand-1まで、図42のステップS2303からステップS2328までの追加処理を繰り返す(図42のステップS2302~S2329)。現在のマージ候補リストに登録されている要素の数numCurrMergeCandが(最大マージ候補数MaxNumMergeCand-1)以下でなければ、マージ候補リストのすべての要素にマージ候補が追加されたので、本履歴マージ候補導出処理を終了する(図42のステップS2303のNO)。現在のマージ候補リストに登録されている要素の数numCurrMergeCandが(最大マージ候補数MaxNumMergeCand-1)以下の場合、ステップS2304以降の処理を行う。sameMotionにFALSE(偽)の値を設定する(図42のステップS2304)。続いて、インデックスiの初期値を0に設定し、この初期値からnumOrigMergeCand-1まで図42のステップS2306、S2307の処理を行う(図42のS2305~S2308)。履歴動きベクトル予測候補リストの0から数えて(NumHmvpCand - hMvpIdx)番目の要素HmvpCandList[NumHmvpCand- hMvpIdx]がマージ候補リストの0から数えてi番目の要素mergeCandList[i]と同じ値かどうかを比較する(図42のステップS2306)。マージ候補の同じ値とはマージ候補が持つすべての構成要素(インター予測モード、参照インデックス、動きベクトル)の値が同じ場合にマージ候補が同じ値とする。同じ値の場合(図39のステップS2306のYES)、sameMotionおよびisPruned[i]共にTRUE(真)を設定する(図42のステップS2307)。同じ値でない場合(図39のステップS2306のNO)、ステップS2307の処理をスキップする。図42のステップS2305からステップS2308までの繰り返し処理が完了したらsameMotionがFALSE(偽)かどうかを比較し(図42のステップS2309)、sameMotionが FALSE(偽)の場合(図42のステップS2309のYES)、すなわち履歴予測動きベクトル候補リストの0から数えて(NumHmvpCand - hMvpIdx)番目の要素HmvpCandList[NumHmvpCand - hMvpIdx]はmergeCandListに存在しないので、マージ候補リストのnumCurrMergeCand番目のmergeCandList[numCurrMergeCand]に履歴予測動きベクトル候補リストの0から数えて(NumHmvpCand - hMvpIdx)番目の要素HmvpCandList[NumHmvpCand - hMvpIdx]を追加し、numCurrMergeCandを1インクリメントする(図42のステップS2310)。インデックスhMvpIdxを1インクリメントし(図42のステップS2302)、図42のステップS2302~S2311の繰り返し処理を行う。 Next, elements in the history prediction motion vector candidate list that are not included in the merge candidate list are added to the merge candidate list. At this time, the elements are checked and added in descending order from the end of the history prediction motion vector candidate list. The initial value of the index hMvpIdx is set to 1, and the addition process from step S2303 to step S2328 in FIG. 42 is repeated from this initial value to NumHmvpCand-1 (steps S2302 to S2329 in FIG. 42). If the number of elements registered in the current merge candidate list, numCurrMergeCand, is not equal to or less than (maximum number of merge candidates, MaxNumMergeCand-1), merge candidates have been added to all elements in the merge candidate list, so this history merge candidate derivation process is terminated (NO in step S2303 in FIG. 42). If the number of elements registered in the current merge candidate list, numCurrMergeCand, is equal to or less than (maximum number of merge candidates, MaxNumMergeCand-1), the process from step S2304 onwards is performed. A value of FALSE is set to sameMotion (step S2304 in FIG. 42). Next, the initial value of index i is set to 0, and the processes of steps S2306 and S2307 in FIG. 42 are performed from this initial value to numOrigMergeCand-1 (S2305 to S2308 in FIG. 42). A comparison is made to see whether the (NumHmvpCand-hMvpIdx)-th element HmvpCandList[NumHmvpCand-hMvpIdx] counting from 0 of the history motion vector prediction candidate list is the same as the i-th element mergeCandList[i] counting from 0 of the merge candidate list (step S2306 in FIG. 42). The same value of merge candidates is determined to be the case when the values of all components (inter prediction mode, reference index, motion vector) of the merge candidates are the same. If they are the same value (YES in step S2306 in FIG. 39), sameMotion and isPruned[i] are both set to TRUE (step S2307 in FIG. 42). If they are not the same value (NO in step S2306 in FIG. 39), the process in step S2307 is skipped. When the repeated process from step S2305 to step S2308 in Fig. 42 is completed, a comparison is made to see whether sameMotion is FALSE (step S2309 in Fig. 42 ). If sameMotion is FALSE (YES in step S2309 in Fig. 42 ), that is, the (NumHmvpCand - hMvpIdx)-th element HmvpCandList[NumHmvpCand - hMvpIdx] counting from 0 in the history motion vector predictor candidate list does not exist in mergeCandList, so the (NumHmvpCand - hMvpIdx)-th element HmvpCandList[NumHmvpCand - hMvpIdx] is added and numCurrMergeCand is incremented by 1 (step S2310 in FIG. 42). Index hMvpIdx is incremented by 1 (step S2302 in FIG. 42), and steps S2302 to S2311 in FIG. 42 are repeated.
履歴予測動きベクトル候補リストのすべての要素の確認が完了するか、マージ候補リストのすべての要素にマージ候補が追加されたら、本履歴マージ候補の導出処理を完了する。
本実施の形態においては、上述の通り、履歴マージ候補導出処理においては、履歴予測動きベクトル候補リストの要素と現在のマージ候補リストの要素との比較を行い、現在のマージ候補リストに存在しない履歴予測動きベクトル候補リストの要素のみをマージ候補リストに追加する。
通常マージモードは、通常予測動きベクトルモードと異なり、差分ベクトルを用いずに処理対象ブロックの動き情報を直接に決定するモードであるため、現在のマージ候補リストの要素と重複する履歴マージ候補リストの要素の追加を禁止することにより、符号化効率を向上させることができる。ここでは、履歴予測動きベクトル候補リストの要素と現在のマージ候補リストの全ての候補同士を比較したとしたが、少なくとも履歴予測動きベクトル候補リストの要素と現在のマージ候補リストの要素とを比較して符号化効率を向上させることができれば、これに限定されない。
例えば、比較する履歴予測動きベクトル候補リストの要素の数を1や2などに制限してもよい。また、比較する現在のマージ候補リストの要素の数を1や2に限定してもよい。
また、通常マージモードでは、マージ候補リストにはL0予測の動きベクトルとL1予測の動きベクトルの両方が含まれる。そのため、通常予測動きベクトルモードのように、L0予測の予測動きベクトルとL1予測の予測動きベクトルを別々に調整することができない。
また、通常マージモードは、マージ候補リストにはL0予測の参照インデックスとL1予測の参照インデックスの両方が含まれる。そのため、通常予測動きベクトルモードのように、L0予測の参照インデックスとL1予測の参照インデックスを別々に調整することができない。
また、マージ候補リストには予測動きベクトル候補リストよりも多い最大で6個の要素が含まれるため、マージ候補リスト内に重複する要素を追加した場合、マージ候補リスト内に重複する要素の数が増え、マージ候補リストを効率的に利用できない。
また、マージ候補リストに追加される履歴予測動きベクトル候補リストの要素は、履歴予測動きベクトル候補リストの要素の中で最も後に追加された要素である。そのため、マージ候補リストに追加される履歴予測動きベクトル候補リストの要素は、処理対象の符号化ブロックと空間的に最も近い動き情報となる。一般的に、通常マージモードが選択されるのは、隣接するブロックとの動きが類似している場合であり、履歴予測動きベクトル候補リストの要素はマージ候補リストに既に追加されている要素と重複する可能性が高くなる。
以上のような課題に対処するため、マージ候補リストの要素と重複する履歴予測動きベクトル候補リストの要素の追加を禁止して、有効な選択要素を増加させることにより、符号化効率を向上させることができる。
When all elements in the history motion vector predictor candidate list have been checked, or when merge candidates have been added to all elements in the merge candidate list, this history merge candidate derivation process is completed.
In this embodiment, as described above, in the history merge candidate derivation process, elements of the history prediction motion vector candidate list are compared with elements of the current merge candidate list, and only elements of the history prediction motion vector candidate list that are not present in the current merge candidate list are added to the merge candidate list.
Unlike the normal predicted motion vector mode, the normal merge mode is a mode that directly determines the motion information of the block to be processed without using a difference vector, so that the coding efficiency can be improved by prohibiting the addition of elements of the history merge candidate list that overlap with elements of the current merge candidate list. Here, the elements of the history predicted motion vector candidate list are compared with all candidates of the current merge candidate list, but this is not limited to this as long as the coding efficiency can be improved by comparing at least the elements of the history predicted motion vector candidate list with the elements of the current merge candidate list.
For example, the number of elements of the historical motion vector predictor candidate list to be compared may be limited to one, two, etc. Also, the number of elements of the current merge candidate list to be compared may be limited to one or two.
In the normal merge mode, the merge candidate list includes both the motion vector of L0 prediction and the motion vector of L1 prediction. Therefore, unlike the normal prediction motion vector mode, the prediction motion vector of L0 prediction and the prediction motion vector of L1 prediction cannot be adjusted separately.
In addition, in the normal merge mode, the merge candidate list includes both the reference indexes for L0 prediction and the reference indexes for L1 prediction. Therefore, unlike the normal prediction motion vector mode, the reference indexes for L0 prediction and the reference indexes for L1 prediction cannot be adjusted separately.
In addition, since the merge candidate list contains up to six elements, which is more than the predicted motion vector candidate list, if a duplicate element is added to the merge candidate list, the number of duplicate elements in the merge candidate list increases, and the merge candidate list cannot be used efficiently.
In addition, the element of the history prediction motion vector candidate list that is added to the merge candidate list is the element that is added most recently among the elements of the history prediction motion vector candidate list.Therefore, the element of the history prediction motion vector candidate list that is added to the merge candidate list is the motion information that is spatially closest to the coding block to be processed.Generally, normal merge mode is selected when the motion of adjacent blocks is similar, and the element of the history prediction motion vector candidate list is likely to overlap with the element that has already been added to the merge candidate list.
In order to address the above-mentioned issues, the addition of elements to the historical motion vector predictor candidate list that overlap with elements to the merge candidate list can be prohibited, thereby increasing the number of valid selection elements and improving the coding efficiency.
また、マージ候補リストに含めることのできる要素の最大数である6を予測動きベクトル候補リストに含めることのできる要素の最大数である2より大きくすることで、通常マージモードの選択確率を高めることで、予測動きベクトル候補リストの要素の重複による符号化効率の低下を抑制しながら、履歴予測動きベクトル候補の動きベクトルと予測動きベクトル候補の動きベクトルの比較処理を削減することができる。
また、空間マージ候補に加えて、時間マージ候補、履歴マージ候補、平均マージ候補、ゼロマージ候補などの多様なマージ候補を含めて、通常マージモードの選択確率を高めることで、予測動きベクトル候補リストの要素の重複による符号化効率の低下を抑制しながら、履歴予測動きベクトル候補の動きベクトルと予測動きベクトル候補の動きベクトルの比較処理を削減することができる。
In addition, by making the maximum number of elements that can be included in a merge candidate list, which is 6, greater than the maximum number of elements that can be included in a predicted motion vector candidate list, which is 2, the probability of selecting the normal merge mode is increased, thereby reducing the comparison process between the motion vectors of the historical predicted motion vector candidates and the motion vectors of the predicted motion vector candidates while suppressing a decrease in encoding efficiency due to overlapping elements in the predicted motion vector candidate list.
In addition, by including a variety of merge candidates such as temporal merge candidates, history merge candidates, average merge candidates, and zero merge candidates in addition to spatial merge candidates, it is possible to increase the probability of selecting the normal merge mode, while suppressing a decrease in encoding efficiency due to overlapping elements in the predictor motion vector candidate list, and reduce the comparison process between the motion vector of the history predictor motion vector candidate and the motion vector of the predictor motion vector candidate.
<サブブロック時間マージ候補導出>
図16のサブブロックマージモード導出部304におけるサブブロック時間マージ候補導出部381の動作について、図44を参照して説明する。
<Sub-block Temporal Merging Candidate Derivation>
The operation of the sub-block temporal merging
まず、符号化ブロックが8x8画素未満か否かを判定する(S4002)。 First, it is determined whether the coding block is less than 8x8 pixels (S4002).
符号化ブロックが8x8画素未満の場合(S4002:Yes)、サブブロック時間マージ候補の存在を示すフラグavailableFlagSbCol=0に設定して(S4003)、サブブロック時間マージ候補導出部の処理を終了する。ここで、シンタックスによりテンポラル動きベクトル予測が禁止されている場合、またはサブブロック時間マージが禁止されている場合には、符号化ブロックが8x8画素未満の場合(S4002:Yes)と同じ処理をする。 If the coding block is less than 8x8 pixels (S4002: Yes), the flag indicating the presence of a sub-block temporal merge candidate is set to availableFlagSbCol=0 (S4003), and the processing of the sub-block temporal merge candidate derivation unit is terminated. Here, if temporal motion vector prediction is prohibited by the syntax, or if sub-block temporal merging is prohibited, the same processing is performed as when the coding block is less than 8x8 pixels (S4002: Yes).
一方、符号化ブロックが8x8画素以上の場合(S4002:No)、符号化ピクチャにおける符号化ブロックの隣接動き情報を導出する(S4004)。 On the other hand, if the coding block is 8x8 pixels or larger (S4002: No), adjacent motion information of the coding block in the coded picture is derived (S4004).
符号化ブロックの隣接動き情報を導出する処理について、図45を参照して説明する。隣接動き情報を導出する処理は、前述の空間予測動きベクトル候補導出部321の処理と相似している。ただし、隣接ブロックの探索をする順番はA0,B0,B1,A1であり、B2は探索しない。まず、隣接ブロックn=A0として、符号化情報を取得する(S4052)。符号化情報とは、隣接ブロックを利用できるか否かを示すフラグavailableFlagN、参照リストごとの参照インデックスrefIdxLXN、および動きベクトルmvLXNを示す。
The process of deriving adjacent motion information of a coding block will be described with reference to FIG. 45. The process of deriving adjacent motion information is similar to the process of the spatial prediction motion vector
次に、隣接ブロックnが有効か無効かを判断する(S4054)。隣接ブロックを利用できるか否かを示すフラグavailableFlagN=1であれば有効、それ以外は無効とする。 Next, it is determined whether adjacent block n is valid or invalid (S4054). If the flag indicating whether the adjacent block is available or not is availableFlagN=1, it is valid; otherwise it is invalid.
隣接ブロックnが有効であれば(S4054:Yes)、参照インデックスrefIdxLXNを、隣接ブロックnの参照インデックスrefIdxLXnとする(S4056)。また、動きベクトルmvLXNを、隣接ブロックnの動きベクトルmvLXnとして(S4056)、ブロックの隣接動き情報を導出する処理を終了する。 If adjacent block n is valid (S4054: Yes), the reference index refIdxLXN is set to the reference index refIdxLXn of adjacent block n (S4056). In addition, the motion vector mvLXN is set to the motion vector mvLXn of adjacent block n (S4056), and the process of deriving adjacent motion information of blocks is terminated.
一方、隣接ブロックnが無効であれば(S4106:No)、隣接ブロックn=B0として、符号化情報を取得する(S4104)。以下、同様の処理をして、B1,A1の順番にループする。隣接動き情報を導出する処理は、隣接ブロックが有効となるまでループし、全ての隣接ブロックA0,B0,B1,A1が無効であれば、ブロックの隣接動き情報を導出する処理を終了する。 On the other hand, if adjacent block n is invalid (S4106: No), adjacent block n=B0 is set and coding information is obtained (S4104). Similar processing is then repeated, looping in the order of B1 and A1. The process of deriving adjacent motion information loops until the adjacent blocks become valid, and if all adjacent blocks A0, B0, B1, and A1 are invalid, the process of deriving adjacent motion information for blocks ends.
再び、図44を参照する。隣接動き情報を導出したら(S4004)、テンポラル動きベクトルを導出する(S4006)。 Referring again to FIG. 44. Once the adjacent motion information has been derived (S4004), a temporal motion vector is derived (S4006).
テンポラル動きベクトルを導出する処理について、図46を参照して説明する。まず、テンポラル動きベクトルtempMv=(0,0)として初期化する(S4062)。 The process of deriving a temporal motion vector will be described with reference to FIG. 46. First, the temporal motion vector tempMv is initialized to (0,0) (S4062).
次に、隣接動き情報が有効か無効かを判断する(S4064)。隣接ブロックを利用できるか否かを示すフラグavailableFlagN=1であれば有効、それ以外は無効とする。隣接動き情報が無効の場合(S4064:No)、テンポラル動きベクトルを導出する処理を終了する。 Next, it is determined whether the adjacent motion information is valid or invalid (S4064). If the flag indicating whether the adjacent block is available or not is available, availableFlagN=1, the information is valid; otherwise, the information is invalid. If the adjacent motion information is invalid (S4064: No), the process of deriving the temporal motion vector is terminated.
一方、隣接動き情報が有効の場合(S4064:Yes)、隣接ブロックNにおいてL1予測を利用しているか否かを示すフラグpredFlagL1Nが1か否かを判断する(S4066)。predFlagL1N=0の場合(S4066:No)、次の処理(S4078)に進む。predFlagL1N=1の場合(S4066:Yes)、すべての参照リストに登録されているすべてのピクチャのPOCが、現在の符号化対象ピクチャのPOC以下か否かを判断する(S4068)。この判断が真の場合(S4068:Yes)、次の処理(S4070)に進む。 On the other hand, if the adjacent motion information is valid (S4064: Yes), it is determined whether the flag predFlagL1N, which indicates whether L1 prediction is used in adjacent block N, is 1 (S4066). If predFlagL1N=0 (S4066: No), proceed to the next process (S4078). If predFlagL1N=1 (S4066: Yes), it is determined whether the POCs of all pictures registered in all reference lists are equal to or lower than the POC of the current picture to be coded (S4068). If this determination is true (S4068: Yes), proceed to the next process (S4070).
スライスタイプslice_typeがBスライスで、フラグcollocated_from_l0_flagが0の場合(S4070:Yes、かつS4072:Yes)、ColPicと参照ピクチャRefPicList1[refIdxL1N](参照リストL1の参照インデックスrefIdxL1Nのピクチャ)が同じか否かを判断する(S4074)。この判断が真の場合(S4074:Yes)、テンポラル動きベクトルtempMv=mvL1Nとする(S4076)。この判断が偽の場合(S4074:No)、次の処理(S4078)に進む。スライスタイプslice_typeがBスライスでなく、フラグcollocated_from_l0_flagが0でない場合(S4070:No、またはS4072:No)、次の処理(S4078)に進む。 If the slice type slice_type is a B slice and the flag collocated_from_l0_flag is 0 (S4070: Yes and S4072: Yes), it is determined whether ColPic is the same as the reference picture RefPicList1[refIdxL1N] (the picture with the reference index refIdxL1N in the reference list L1) (S4074). If this determination is true (S4074: Yes), the temporal motion vector tempMv=mvL1N is set (S4076). If this determination is false (S4074: No), proceed to the next process (S4078). If the slice type slice_type is not a B slice and the flag collocated_from_l0_flag is not 0 (S4070: No or S4072: No), proceed to the next process (S4078).
そして、隣接ブロックNにおいてL0予測を利用しているか否かを示すフラグpredFlagL0Nが1か否かを判断する(S4078)。predFlagL0N=1の場合(S4078:Yes)、ColPicと参照ピクチャRefPicList0[refIdxL0N](参照リストL0の参照インデックスrefIdxL0Nのピクチャ)が同じか否かを判断する(S4080)。この判断が真の場合(S4080:Yes)、テンポラル動きベクトルtempMv=mvL0Nとする(S4082)。この判断が偽の場合(S4080:No)、テンポラル動きベクトルを導出する処理を終了する。 Then, it is determined whether the flag predFlagL0N, which indicates whether L0 prediction is used in adjacent block N, is 1 (S4078). If predFlagL0N=1 (S4078: Yes), it is determined whether ColPic is the same as the reference picture RefPicList0[refIdxL0N] (the picture at reference index refIdxL0N in reference list L0) (S4080). If this determination is true (S4080: Yes), the temporal motion vector tempMv=mvL0N is set (S4082). If this determination is false (S4080: No), the process of deriving the temporal motion vector is terminated.
再び、図44を参照する。次に、ColPicを導出する(S4016)。この処理は、時間予測動きベクトル候補導出部322におけるS4201と同じであるから、説明を省略する。
Refer to FIG. 44 again. Next, ColPic is derived (S4016). This process is the same as S4201 in the temporal motion vector predictor
そして、異なる時間の符号化ブロックcolCbを設定する(S4017)。これは、異なる時間のピクチャColPic内で処理対象の符号化ブロックと同一位置の中央右下に位置する符号化ブロックを、colCbとして設定するものである。この符号化ブロックは図49の符号化ブロックT1に相当する。 Then, a coding block colCb of a different time is set (S4017). This involves setting the coding block located in the lower right corner of the same position as the coding block to be processed in the picture ColPic of the different time as colCb. This coding block corresponds to coding block T1 in Figure 49.
次に、符号化ブロックcolCbにテンポラル動きベクトルtempMvを加算した位置を、新たなcolCbとする(S4018)。符号化ブロックcolCbの左上の位置を(xColCb, yColCb)、テンポラル動きベクトルtempMvを1/16画素精度で(tempMv[0], tempMv[1])とすると、新たなcolCbの左上の位置は、以下のようになる。
xColCb = Clip3( xCtb, xCtb + CtbSizeY + 3, xcolCb + ( tempMv[0] >> 4 ) )
yColCb = Clip3( yCtb, yCtb + CtbSizeY - 1, ycolCb + ( tempMv[1] >> 4 ) )
ここで、ツリーブロックの左上の位置は(xCtb, yCtb)、ツリーブロックの大きさはCtbSizeYとする。上式に示すように、tempMv加算後の位置は、tempMv加算前に比べて大きくずれないように、ツリーブロックの大きさ程度の範囲に補正される。もしこの位置が画面外となった場合は、画面内に補正される。
Next, the position obtained by adding the temporal motion vector tempMv to the coding block colCb is set as new colCb (S4018). If the position of the upper left corner of the coding block colCb is (xColCb, yColCb) and the temporal motion vector tempMv is (tempMv[0], tempMv[1]) with 1/16 pixel accuracy, the position of the upper left corner of the new colCb is as follows:
xColCb = Clip3( xCtb, xCtb + CtbSizeY + 3, xcolCb + ( tempMv[0] >> 4 ) )
yColCb = Clip3( yCtb, yCtb + CtbSizeY - 1, ycolCb + ( tempMv[1] >> 4 ) )
Here, the position of the top left corner of the tree block is (xCtb, yCtb), and the size of the tree block is CtbSizeY. As shown in the above formula, the position after adding tempMv is corrected to within the range of the size of the tree block so that it does not deviate significantly from the position before adding tempMv. If this position is outside the screen, it is corrected to within the screen.
そして、この符号化ブロックcolCbの予測モードPredModeがインター予測(MODE_INTER)か否かを判定する(S4020)。colCbの予測モードがインター予測でない場合(S4020:No)、サブブロック時間マージ候補の存在を示すフラグavailableFlagSbCol=0に設定して(S4003)、サブブロック時間マージ候補導出部の処理を終了する。 Then, it is determined whether the prediction mode PredMode of this coding block colCb is inter prediction (MODE_INTER) (S4020). If the prediction mode of colCb is not inter prediction (S4020: No), a flag indicating the presence of a sub-block temporal merge candidate is set to availableFlagSbCol=0 (S4003), and the processing of the sub-block temporal merge candidate derivation unit is terminated.
一方、colCbの予測モードがインター予測の場合(S4020:Yes)、参照リストごとにインター予測情報を導出する(S4022,S4023)。ここでは、colCbについて、参照リストごとの中心動きベクトルctrMvLXと、LX予測を利用しているか否かを示すフラグctrPredFlagLXを導出する。LXは参照リストを示し、参照リスト0の導出ではLXはL0となり、参照リスト1の導出ではLXはL1となる。インター予測情報の導出について、図47を参照して説明する。
On the other hand, if the prediction mode of colCb is inter prediction (S4020: Yes), inter prediction information is derived for each reference list (S4022, S4023). Here, for colCb, a central motion vector ctrMvLX for each reference list and a flag ctrPredFlagLX indicating whether LX prediction is used or not are derived. LX indicates a reference list, and when deriving
異なる時間の符号化ブロックcolCbが利用できない場合(S4112:NO)、または予測モードPredModeがイントラ予測(MODE_INTRA)の場合(S4114:NO)、フラグavailableFlagLXColとフラグpredFlagLXColを共に0とし(ステップS4116)、動きベクトルmvColを(0,0)として(S4118)、インター予測情報の導出処理を終了する。 If the coding block colCb of a different time is not available (S4112: NO), or if the prediction mode PredMode is intra prediction (MODE_INTRA) (S4114: NO), the flags availableFlagLXCol and predFlagLXCol are both set to 0 (step S4116), the motion vector mvCol is set to (0, 0) (S4118), and the process of deriving inter prediction information is terminated.
符号化ブロックcolCbが利用でき(S4112:Yes)、予測モードPredModeがイントラ予測(MODE_INTRA)でない場合(S4114:YES)、以下の手順でmvCol、refIdxColおよびavailableFlagColを算出する。 If the coding block colCb is available (S4112: Yes) and the prediction mode PredMode is not intra prediction (MODE_INTRA) (S4114: YES), mvCol, refIdxCol, and availableFlagCol are calculated using the following procedure.
符号化ブロックcolCbのLX予測が利用されているかどうかを示すフラグPredFlagLX[xPCol][yPCol]が1の場合(S4120のYES)、動きベクトルmvColが符号化ブロックcolCbのLXの動きベクトルであるMvLX[xPCol][yPCol]と同じ値に設定され(S4122)、参照インデックスrefIdxColがLXの参照インデックスRefIdxLX[xPCol][yPCol]と同じ値に設定され(S4124)、リストlistColがLXに設定される(S4126)。ここで、xPCol、yPColは異なる時間のピクチャcolPic内での符号化ブロックcolCbの左上の画素の位置を示すインデックスである。 When the flag PredFlagLX[xPCol][yPCol] indicating whether LX prediction of the coding block colCb is used is 1 (YES in S4120), the motion vector mvCol is set to the same value as the LX motion vector MvLX[xPCol][yPCol] of the coding block colCb (S4122), the reference index refIdxCol is set to the same value as the LX reference index RefIdxLX[xPCol][yPCol] (S4124), and the list listCol is set to LX (S4126). Here, xPCol and yPCol are indexes indicating the position of the top left pixel of the coding block colCb in a picture colPic of a different time.
一方、符号化ブロックcolCbのLX予測が利用されているかどうかを示すフラグPredFlagLX[xPCol][yPCol]が0の場合(S4120のNO)、以下の処理をする。まず、すべての参照リストに登録されているすべてのピクチャのPOCが、現在の符号化対象ピクチャのPOC以下か否かを判断する(S4128)。かつ、colCbのLY予測が利用されているかどうかを示すフラグPredFlagLY[xPCol][yPCol]が1か否かを判断する(S4128)。ここで、LY予測とはLX予測とは異なる参照リストと定義する。つまり、LX=L0ではLY=L1、LX=L1ではLY=L0となる。 On the other hand, if the flag PredFlagLX[xPCol][yPCol] indicating whether LX prediction of the coding block colCb is used is 0 (NO in S4120), the following process is performed. First, it is determined whether the POC of all pictures registered in all reference lists is equal to or lower than the POC of the current picture to be coded (S4128). It is also determined whether the flag PredFlagLY[xPCol][yPCol] indicating whether LY prediction of colCb is used is 1 (S4128). Here, LY prediction is defined as a reference list different from LX prediction. In other words, when LX=L0, LY=L1, and when LX=L1, LY=L0.
この判断が真の場合(S4128:Yes)、動きベクトルmvColが符号化ブロックcolCbのLYの動きベクトルであるMvLY[xPCol][yPCol]と同じ値に設定され(S4130)、参照インデックスrefIdxColがLYの参照インデックスRefIdxLY[xPCol][yPCol]と同じ値に設定され(S4132)、リストlistColがLXに設定される(S4134)。 If this determination is true (S4128: Yes), the motion vector mvCol is set to the same value as MvLY[xPCol][yPCol], which is the motion vector of LY of the coding block colCb (S4130), the reference index refIdxCol is set to the same value as the reference index RefIdxLY[xPCol][yPCol] of LY (S4132), and the list listCol is set to LX (S4134).
一方、この判断が偽の場合(S4128:No)、フラグavailableFlagLXColとフラグpredFlagLXColを共に0とし(ステップS4116)、動きベクトルmvColを(0,0)として(S4118)、インター予測情報の導出処理を終了する。 On the other hand, if this determination is false (S4128: No), the flags availableFlagLXCol and predFlagLXCol are both set to 0 (step S4116), the motion vector mvCol is set to (0, 0) (S4118), and the process of deriving inter prediction information is terminated.
符号化ブロックcolCbからインター予測情報が取得できたら、フラグavailableFlagLXColとフラグpredFlagLXColを共に1とする(S4136)。 When inter prediction information is obtained from the coding block colCb, the flag availableFlagLXCol and the flag predFlagLXCol are both set to 1 (S4136).
続いて、動きベクトルmvColをスケーリングして、動きベクトルmvLXColとする(S4138)。この処理は、時間予測動きベクトル候補導出部322におけるS4245と同じであるから、説明を省略する。
Next, the motion vector mvCol is scaled to obtain the motion vector mvLXCol (S4138). This process is the same as S4245 in the temporal motion vector predictor
再び、図44を参照する。参照リストごとにインター予測情報を導出したら、算出された動きベクトルmvLXColを中心動きベクトルctrMvLX、算出されたフラグpredFlagLXColをフラグctrPredFlagLXとする(S4022,S4023)。 Refer to FIG. 44 again. Once the inter prediction information is derived for each reference list, the calculated motion vector mvLXCol is set as the central motion vector ctrMvLX, and the calculated flag predFlagLXCol is set as the flag ctrPredFlagLX (S4022, S4023).
そして、中心動きベクトルが有効か無効かを判断する(S4024)。ctrPredFlagL0=0かつctrPredFlagL1=0であれば無効、それ以外は無効と判断する。中心動きベクトルが無効の場合(S4024:No)、サブブロック時間マージ候補の存在を示すフラグavailableFlagSbCol=0に設定して(S4003)、サブブロック時間マージ候補導出部の処理を終了する。 Then, it is determined whether the central motion vector is valid or invalid (S4024). If ctrPredFlagL0=0 and ctrPredFlagL1=0, it is invalid; otherwise, it is invalid. If the central motion vector is invalid (S4024: No), the flag indicating the presence of a sub-block temporal merge candidate is set to availableFlagSbCol=0 (S4003), and the processing of the sub-block temporal merge candidate derivation unit is terminated.
一方、中心動きベクトルが有効の場合(S4024:Yes)、サブブロック時間マージ候補の存在を示すフラグavailableFlagSbCol=1に設定して(S4025)、サブブロック動き情報を導出する(S4026)。この処理について、図48を参照して説明する。 On the other hand, if the central motion vector is valid (S4024: Yes), the flag indicating the presence of a sub-block temporal merge candidate is set to availableFlagSbCol=1 (S4025), and sub-block motion information is derived (S4026). This process will be described with reference to FIG. 48.
まず、符号化ブロックcolCbの幅cbWidthと高さcBheightから、幅方向のサブブロック数numSbXおよび高さ方向のサブブロック数numSbYを算出する(S4152)。また、refIdxLXSbCol=0とする(S4152)。この処理以降は、予測サブブロックcolSbの単位で繰り返し処理をする。この繰り返しは、高さ方向のインデックスySbIdxを0からnumSbYまで、幅方向のインデックスxSbIdxを0からnumSbXまで変更しながら処理をする。 First, the number of sub-blocks in the width direction, numSbX, and the number of sub-blocks in the height direction, numSbY, are calculated from the width cbWidth and height cBheight of the coding block colCb (S4152). In addition, refIdxLXSbCol = 0 is set (S4152). After this process, the process is repeated in units of predicted sub-blocks colSb. This repetition is performed while changing the height direction index ySbIdx from 0 to numSbY and the width direction index xSbIdx from 0 to numSbX.
符号化ブロックcolCbの左上の位置を(xCb,yCb)とすると、予測サブブロックcolSbの左上の位置(xSb,ySb)は、以下のように算出される。
xSb = xCb + xSbIdx * sbWidth
ySb = yCb + ySbIdx * sbHeight
次に、予測サブブロックcolSbにテンポラル動きベクトルtempMvを加算した位置を、新たなcolSbとする(S4154)。予測サブブロックcolSbの左上の位置を(xColSb, yColSb)、テンポラル動きベクトルtempMvを1/16画素精度で(tempMv[0], tempMv[1])とすると、新たなcolSbの左上の位置は、以下のようになる。
xColSb = Clip3( xCtb, xCtb + CtbSizeY + 3, xSb + ( tempMv[0] >> 4 ) )
yColSb = Clip3( yCtb, yCtb + CtbSizeY - 1, ySb + ( tempMv[1] >> 4 ) )
ここで、ツリーブロックの左上の位置は(xCtb, yCtb)、ツリーブロックの大きさはCtbSizeYとする。上式に示すように、tempMv加算後の位置は、tempMv加算前に比べて大きくずれないように、ツリーブロックの大きさ程度の範囲に補正される。もしこの位置が画面外となった場合は、画面内に補正される。
If the top left position of the coding block colCb is (xCb, yCb), the top left position (xSb, ySb) of the prediction sub-block colSb is calculated as follows.
xSb = xCb + xSbIdx * sbWidth
ySb = yCb + ySbIdx * sbHeight
Next, the position obtained by adding the temporal motion vector tempMv to the prediction sub-block colSb is set as new colSb (S4154). If the position of the upper left corner of the prediction sub-block colSb is (xColSb, yColSb) and the temporal motion vector tempMv is (tempMv[0], tempMv[1]) with 1/16 pixel accuracy, the position of the upper left corner of the new colSb is as follows:
xColSb = Clip3( xCtb, xCtb + CtbSizeY + 3, xSb + ( tempMv[0] >> 4 ) )
yColSb = Clip3( yCtb, yCtb + CtbSizeY - 1, ySb + ( tempMv[1] >> 4 ) )
Here, the position of the top left corner of the tree block is (xCtb, yCtb), and the size of the tree block is CtbSizeY. As shown in the above formula, the position after adding tempMv is corrected to within the range of the size of the tree block so that it does not deviate significantly from the position before adding tempMv. If this position is outside the screen, it is corrected to within the screen.
そして、参照リストごとにインター予測情報を導出する(S4156,S4158)。ここでは、予測サブブロックcolSbについて、サブブロック単位で参照リストごとの動きベクトルmvLXSbColと、予測サブブロックが有効か否かを示すフラグavailableFlagLXSbColを導出する。LXは参照リストを示し、参照リスト0の導出ではLXはL0となり、参照リスト1の導出ではLXはL1となる。インター予測情報の導出は、図47のS4022,S4023と同じであるため、説明を省略する。
Then, inter prediction information is derived for each reference list (S4156, S4158). Here, for the prediction sub-block colSb, a motion vector mvLXSbCol for each reference list on a sub-block basis and a flag availableFlagLXSbCol indicating whether the prediction sub-block is valid or not are derived. LX indicates a reference list, and when deriving
インター予測情報を導出後(S4156,S4158)、予測サブブロックcolSbが有効か否かを判断する(S4160)。availableFlagL0SbCol=0かつavailableFlagL1SbCol=0の場合はcolSbが無効、それ以外は有効と判断する。colSbが無効の場合(S4160:No)、動きベクトルmvLXSbColを、中心動きベクトルctrMvLXとする(S4162)。さらに、LX予測を利用しているか否かを示すフラグpredFlagLXSbColを、中心動きベクトルにおけるフラグctrPredFlagLXとする(S4162)。以上により、サブブロック動き情報の導出を終了する。 After deriving the inter prediction information (S4156, S4158), it is determined whether or not the predicted sub-block colSb is valid (S4160). If availableFlagL0SbCol=0 and availableFlagL1SbCol=0, colSb is invalid; otherwise, it is determined to be valid. If colSb is invalid (S4160: No), the motion vector mvLXSbCol is set to the central motion vector ctrMvLX (S4162). Furthermore, the flag predFlagLXSbCol indicating whether or not LX prediction is being used is set to the flag ctrPredFlagLX in the central motion vector (S4162). This completes the derivation of sub-block motion information.
再び、図44を参照する。そして、L0の動きベクトルmvL0SbCol、およびL1の動きベクトルmvL1SbColを、前述のサブブロックマージモード導出部304におけるサブブロックマージ候補リストsubblockMergeCandListに候補として追加する(S4028)。ただし、この追加は、サブブロック時間マージ候補の存在を示すフラグavailableSbCol=1の場合のみである。以上により、時間マージ候補導出部342の処理を終了する。
Refer to FIG. 44 again. Then, the L0 motion vector mvL0SbCol and the L1 motion vector mvL1SbCol are added as candidates to the subblock merge candidate list subblockMergeCandList in the subblock merge
上記したサブブロック時間マージ候補導出部381の説明は、符号化時のものであるが、復号時も同様となる。つまり、図22のサブブロックマージモード導出部404におけるサブブロック時間マージ候補導出部481の動作は、上記の説明における符号化を復号と置き換えて、同様に説明される。
The above description of the subblock temporal merge
<動き補償予測処理>
動き補償予測部306は、符号化において現在予測処理の対象となっているブロックの位置およびサイズを取得する。また、動き補償予測部306は、インター予測情報をインター予測モード判定部305から取得する。取得したインター予測情報から参照インデックスおよび動きベクトルを導出し、復号画像メモリ内の参照インデックスで特定される参照ピクチャを、動きベクトルの分だけ予測ブロックの画像信号と同一位置より移動させた位置の画像信号を取得した後に予測信号を生成する。
<Motion Compensation Prediction Processing>
The motion
インター予測における参照モードがL0予測やL1予測のような、単一の参照ピクチャからの予測の場合には、1つの参照ピクチャから取得した予測信号を動き補償予測信号とし、参照モードがBI予測のような、予測モードが2つの参照ピクチャからの予測の場合には、2つの参照ピクチャから取得した予測信号を重みづけ平均したものを動き補償予測信号とし、動き補償予測信号を予測方法決定部に供給する。ここでは双予測の重みづけ平均の比率を1:1とするが、他の比率を用いて重みづけ平均を行っても良い。例えば、予測対象となっているピクチャと参照ピクチャとのピクチャ間隔が近いものほど重みづけの比率が大きくなるようにしてもよい。また、重みづけ比率の算出をピクチャ間隔の組み合わせと重みづけ比率との対応表を用いて行うようにしても良い。 When the reference mode in inter prediction is prediction from a single reference picture, such as L0 prediction or L1 prediction, the prediction signal obtained from one reference picture is used as a motion compensation prediction signal, and when the reference mode is prediction from two reference pictures, such as BI prediction, the weighted average of the prediction signals obtained from the two reference pictures is used as a motion compensation prediction signal, and the motion compensation prediction signal is supplied to the prediction method determination unit. Here, the weighted average ratio for bi-prediction is set to 1:1, but weighted averaging may be performed using other ratios. For example, the weighting ratio may be set to be larger as the picture interval between the picture to be predicted and the reference picture becomes closer. The weighting ratio may also be calculated using a correspondence table of combinations of picture intervals and weighting ratios.
動き補償予測部406は、符号化側の動き補償予測部306と同様の機能をもつ。動き補償予測部406は、インター予測情報を、通常予測動きベクトルモード導出部401、通常マージモード導出部402、サブブロック予測動きベクトルモード導出部403、サブブロックマージモード導出部404から、スイッチ408を介して取得する。
The motion
動き補償予測部406は、得られた動き補償予測信号を、復号画像信号重畳部207に供給する。
The motion
<予測方向について>
図57~61は、動き補償予測の予測方向について説明するための図である。単一の参照ピクチャからの予測を行う処理を単予測と定義し、単予測の場合はL0予測またはL1予測という、参照リストに登録された2つの参照ピクチャのいずれか一方を利用した予測を行う。
<About prediction direction>
57 to 61 are diagrams for explaining the prediction direction of motion compensation prediction. A process of performing prediction from a single reference picture is defined as uni-prediction, and in the case of uni-prediction, prediction is performed using either one of two reference pictures registered in a reference list, called L0 prediction or L1 prediction.
図57は単予測であってL0の参照ピクチャ(RefL0Pic)が符号化対象ピクチャ(CurPic)より前の時刻にある場合を示している。図58は単予測であってL0予測の参照ピクチャが符号化対象ピクチャより後の時刻にある場合を示している。同様に、図57および図58のL0予測の参照ピクチャをL1予測の参照ピクチャ(RefL1Pic)に置き換えて単予測を行うこともできる。 Figure 57 shows a case where uni-prediction is performed and the L0 reference picture (RefL0Pic) is at a time earlier than the picture to be coded (CurPic). Figure 58 shows a case where uni-prediction is performed and the reference picture for L0 prediction is at a time later than the picture to be coded. Similarly, uni-prediction can be performed by replacing the reference picture for L0 prediction in Figures 57 and 58 with the reference picture for L1 prediction (RefL1Pic).
2つの参照ピクチャからの予測を行う処理を双予測と定義し、双予測の場合はL0予測とL1予測の双方を利用してBI予測と表現する。図59は双予測であってL0予測の参照ピクチャが符号化対象ピクチャより前の時刻にあって、L1予測の参照ピクチャが符号化対象ピクチャより後の時刻にある場合を示している。図60は双予測であってL0予測の参照ピクチャとL1予測の参照ピクチャが符号化対象ピクチャより前の時刻にある場合を示している。図61は双予測であってL0予測の参照ピクチャとL1予測の参照ピクチャが符号化対象ピクチャより後の時刻にある場合を示している。このように、L0/L1の予測種別と時間の関係は、L0が過去方向、L1が未来方向とは限定されずに用いることが可能である。また双予測の場合に、同一の参照ピクチャを用いてL0予測及びL1予測のそれぞれを行ってもよい。なお、動き補償予測を単予測で行うか双予測で行うかの判断は、例えばL0予測を利用するか否か及びL1予測を利用するか否かを示す情報(例えば、フラグ)に基づき判断される。 A process of making predictions from two reference pictures is defined as bi-prediction, and in the case of bi-prediction, both L0 prediction and L1 prediction are used and expressed as BI prediction. Figure 59 shows a case where the reference picture for L0 prediction is before the picture to be coded, and the reference picture for L1 prediction is after the picture to be coded. Figure 60 shows a case where the reference picture for L0 prediction and the reference picture for L1 prediction are before the picture to be coded. Figure 61 shows a case where the reference picture for L0 prediction and the reference picture for L1 prediction are after the picture to be coded. In this way, the relationship between the prediction type and time of L0/L1 can be used without being limited to L0 being the past direction and L1 being the future direction. In addition, in the case of bi-prediction, the same reference picture may be used to make each of L0 prediction and L1 prediction. The decision as to whether to perform motion compensation prediction in a uni-predictive or bi-predictive manner is made based on information (e.g., a flag) indicating, for example, whether to use L0 prediction and whether to use L1 prediction.
<参照インデックスについて>
本発明の実施の形態では、動き補償予測の精度向上のために、動き補償予測において複数の参照ピクチャの中から最適な参照ピクチャを選択することを可能とする。そのため、動き補償予測で利用した参照ピクチャを参照インデックスとして利用するとともに、参照インデックスを符号化ベクトルとともに符号化ストリーム中に符号化する。
<About reference index>
In an embodiment of the present invention, in order to improve the accuracy of motion compensation prediction, it is possible to select an optimal reference picture from among multiple reference pictures in motion compensation prediction. To this end, the reference picture used in the motion compensation prediction is used as a reference index, and the reference index is coded into the coding stream together with a coding vector.
<通常予測動きベクトルモードに基づく動き補償処理>
動き補償部306は、図16の符号化側におけるインター予測部102でも示されるように、インター予測モード判定部305において、通常予測動きベクトルモード導出部301によるインター予測情報が選択された場合には、このインター予測情報をインター予測モード判定部305から取得し、現在処理対象となっているブロックの参照モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、予測方法決定部105に供給される。
<Motion compensation process based on normal predicted motion vector mode>
16 , when the inter prediction information by the normal prediction motion vector
同様に、動き補償部406は、図22の復号側におけるインター予測部203でも示されるように、復号の過程でスイッチ408が通常予測動きベクトルモード導出部401に接続された場合には、通常予測動きベクトルモード導出部401によるインター予測情報を取得し、現在処理対象となっているブロックの参照モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、復号画像信号重畳部207に供給される。
Similarly, as shown in the
<通常マージモードに基づく動き補償処理>
動き補償部306は、図16の符号化側におけるインター予測部102でも示されるように、インター予測モード判定部305において、通常マージモード導出部302によるインター予測情報が選択された場合には、このインター予測情報をインター予測モード判定部305から取得し、現在処理対象となっているブロックの参照モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、予測方法決定部105に供給される。
<Motion compensation process based on normal merge mode>
As also shown in the
同様に、動き補償部406は、図22の復号側におけるインター予測部203でも示されるように、復号の過程でスイッチ408が通常マージモード導出部402に接続された場合には、通常マージモード導出部402によるインター予測情報を取得し、現在処理対象となっているブロックの参照モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、復号画像信号重畳部207に供給される。
Similarly, as shown in the
<サブブロック予測動きベクトルモードに基づく動き補償処理>
動き補償部306は、図16の符号化側におけるインター予測部102でも示されるように、インター予測モード判定部305において、サブブロック予測動きベクトルモード導出部303によるインター予測情報が選択された場合には、このインター予測情報をインター予測モード判定部305から取得し、現在処理対象となっているブロックの参照モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、予測方法決定部105に供給される。
<Motion compensation process based on sub-block predicted motion vector mode>
16 , when inter prediction information is selected by the sub-block prediction motion vector
同様に、動き補償部406は、図22の復号側におけるインター予測部203でも示されるように、復号の過程でスイッチ408がサブブロック予測動きベクトルモード導出部403に接続された場合には、サブブロック予測動きベクトルモード導出部403によるインター予測情報を取得し、現在処理対象となっているブロックの参照モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、復号画像信号重畳部207に供給される。
Similarly, as shown in the
<サブブロックマージモードに基づく動き補償処理>
動き補償部306は、図16の符号化側におけるインター予測部102でも示されるように、インター予測モード判定部305において、サブブロックマージモード導出部304によるインター予測情報が選択された場合には、このインター予測情報をインター予測モード判定部305から取得し、現在処理対象となっているブロックの参照モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、予測方法決定部105に供給される。
<Motion compensation process based on sub-block merge mode>
16 , when inter prediction information by the sub-block merge
同様に、動き補償部406は、図22の復号側におけるインター予測部203でも示されるように、復号の過程でスイッチ408がサブブロックマージモード導出部404に接続された場合には、サブブロックマージモード導出部404によるインター予測情報を取得し、現在処理対象となっているブロックの参照モード、参照インデックス、動きベクトルを導出し、動き補償予測信号を生成する。生成された動き補償予測信号は、復号画像信号重畳部207に供給される。
Similarly, as shown in the
<アフィン変換予測に基づく動き補償処理>
通常予測動きベクトルモード、および通常マージモードでは、以下のフラグに基づいてアフィンモデルによる動き補償が利用できる。以下のフラグは、符号化処理においてインター予測モード判定部305により決定されるインター予測の条件に基づいて以下のフラグに反映され、符号化ストリーム中に符号化される。復号処理においては、符号化ストリーム中の以下のフラグに基づいてアフィンモデルによる動き補償を行うか否かを特定する。
<Motion compensation processing based on affine transformation prediction>
In the normal prediction motion vector mode and normal merge mode, motion compensation using an affine model can be used based on the following flags. The following flags are reflected in the following flags based on the inter prediction conditions determined by the inter prediction
sps_affine_enabled_flagは、インター予測において、アフィンモデルによる動き補償が利用できるかどうかを表す。sps_affine_enabled_flagが0であれば、シーケンス単位でアフィンモデルによる動き補償ではないように抑制される。また、inter_affine_flag とcu_affine_type_flag は、符号化ビデオシーケンスのCUシンタックスにおいて伝送されない。sps_affine_enabled_flagが1であれば、符号化ビデオシーケンスにおいてアフィンモデルによる動き補償を利用できる。 sps_affine_enabled_flag indicates whether motion compensation using the affine model can be used in inter prediction. If sps_affine_enabled_flag is 0, motion compensation using the affine model is suppressed on a sequence-by-sequence basis. In addition, inter_affine_flag and cu_affine_type_flag are not transmitted in the CU syntax of the encoded video sequence. If sps_affine_enabled_flag is 1, motion compensation using the affine model can be used in the encoded video sequence.
sps_affine_type_flagは、インター予測において、6パラメータアフィンモデルによる動き補償が利用できるかどうかを表す。 sps_affine_type_flag indicates whether motion compensation using the 6-parameter affine model is available for inter prediction.
sps_affine_type_flagが0であれば、6パラメータアフィンモデルによる動き補償ではないように抑制される。また、cu_affine_type_flagは、符号化ビデオシーケンスのCUシンタックスにおいて伝送されない。sps_affine_type_flagが1であれば、符号化ビデオシーケンスにおいて6パラメータアフィンモデルによる動き補償を利用できる。 If sps_affine_type_flag is 0, motion compensation using the 6-parameter affine model is suppressed. In addition, cu_affine_type_flag is not transmitted in the CU syntax of the encoded video sequence. If sps_affine_type_flag is 1, motion compensation using the 6-parameter affine model can be used in the encoded video sequence.
sps_affine_type_flagが存在しない場合には、0であるものとする。 If sps_affine_type_flag is not present, it is assumed to be 0.
PまたはBスライスを復号している場合、現在処理対象となっているCUにおいて、inter_affine_flagが1であれば、現在処理対象となっているCUの動き補償予測信号を生成するために、アフィンモデルによる動き補償が用いられる。 When decoding a P or B slice, if inter_affine_flag is 1 for the currently processed CU, motion compensation using the affine model is used to generate a motion compensation prediction signal for the currently processed CU.
inter_affine_flagが0であれば、現在処理対象となっているCUにアフィンモデルは用いられない。 If inter_affine_flag is 0, no affine model is used for the currently processed CU.
inter_affine_flagが存在しない場合には、0であるものとする。 If inter_affine_flag is not present, it is assumed to be 0.
PまたはBスライスを復号している場合、現在処理対象となっているCUにおいて、cu_affine_type_flagが1であれば、現在処理対象となっているCUの動き補償予測信号を生成するために、6パラメータアフィンモデルによる動き補償が用いられる。 When decoding a P or B slice, if cu_affine_type_flag is 1 for the currently processed CU, motion compensation using a 6-parameter affine model is used to generate a motion compensation prediction signal for the currently processed CU.
cu_affine_type_flagが0であれば、現在処理対象となっているCUの動き補償予測信号を生成するために、4パラメータアフィンモデルによる動き補償が用いられる。 If cu_affine_type_flag is 0, motion compensation using a four-parameter affine model is used to generate a motion compensation prediction signal for the currently processed CU.
アフィンモデルによる動き補償では、サブブロック単位で参照インデックスや動きベクトルが導出されることから、サブブロック単位で処理対象となっている参照インデックスや動きベクトルを用いて動き補償予測信号を生成する。 In affine model motion compensation, reference indexes and motion vectors are derived on a subblock basis, so a motion compensation prediction signal is generated using the reference indexes and motion vectors being processed on a subblock basis.
<変形例1>
本実施の形態の変形例1について説明する。本変形例は本実施の形態とはマージ差分動きベクトルモードが追加されていることが異なり、本実施の形態とは異なる点のみ説明する。図12のumve_flagが1であれば、マージ差分動きベクトルモードとなり、umve_flagが0であれば、通常マージモードとなる。
<
A first modified example of the present embodiment will be described. This modified example differs from the present embodiment in that a merge differential motion vector mode is added, and only the differences from the present embodiment will be described. If umve_flag in FIG. 12 is 1, the merge differential motion vector mode is selected, and if umve_flag is 0, the normal merge mode is selected.
続いて、マージ差分動きベクトルモードの動作について説明する。マージ候補の上位2つ(マージ候補リスト内のマージインデックスが0および1のマージ候補)のいずれか1つのマージ候補のL0予測の動きベクトルとL1予測の動きベクトルのそれぞれに対して、1つのマージ差分動きベクトルを加算することができるモードである。
Next, the operation of the merge differential motion vector mode will be described. This mode allows one merge differential motion vector to be added to each of the L0 prediction motion vector and the L1 prediction motion vector of one of the top two merge candidates (merge candidates with
なお、マージ差分動きベクトルモードの場合には、マージ差分動きベクトルはビット列符号化部108で符号化され、ビット列復号部201で復号される。
In the case of the merge differential motion vector mode, the merge differential motion vector is coded by the bit
以上のように、マージ候補リストはマージ差分動きベクトルモードにも利用されるため、マージ候補リストの要素と重複する履歴予測動きベクトル候補リストの要素の追加を禁止して、有効な選択要素を増加させることにより、符号化効率を向上させることができる。 As described above, since the merge candidate list is also used in the merge motion vector difference mode, the coding efficiency can be improved by prohibiting the addition of elements in the history predicted motion vector candidate list that overlap with elements in the merge candidate list and increasing the number of valid selection elements.
また、マージ差分動きベクトルモードを追加して通常予測動きベクトルモードの選択確率を下げることで、予測動きベクトル候補リストの要素の重複による符号化効率の低下を抑制しながら、履歴予測動きベクトル候補の動きベクトルと予測動きベクトル候補の動きベクトルの比較処理を削減できる。
<変形例2>
本実施の形態の変形例2について説明する。本変形例は本実施の形態とは図41で示される履歴予測動きベクトル候補導出部323及び423の動作が異なり、本実施の形態とは異なる点のみ説明する。図65は変形例2の履歴予測動きベクトル候補導出処理手順を説明するフローチャートである。図65は図41とはステップS2209が追加されていることが異なる。図65は図41のステップS2209以外は同じ動作である。
In addition, by adding the merge differential motion vector mode and reducing the probability of selecting the normal predicted motion vector mode, it is possible to reduce the comparison process between the motion vectors of the history predicted motion vector candidate and the motion vector of the predicted motion vector candidate while suppressing a decrease in encoding efficiency due to overlapping elements in the predicted motion vector candidate list.
<
numCurrMvpCandが予測動きベクトル候補リストの最大要素数である2より小さい場合(図65のステップS2205のYES)の処理について説明する。 The following describes the processing performed when numCurrMvpCand is smaller than 2, which is the maximum number of elements in the predicted motion vector candidate list (YES in step S2205 in Figure 65).
履歴予測動きベクトル候補HmvpCandList[NumHmvpCand - i]のLYの参照インデックスと処理対象の符号化ブロックのLYの参照インデックスが同一であるか否かを検査し(図65のステップS2209)、履歴予測動きベクトル候補HmvpCandList[NumHmvpCand - i]のLYの参照インデックスと処理対象の符号化ブロックのLYの参照インデックスが同一であれば(図65のステップS2209のYES)、S2206に進む。履歴予測動きベクトル候補HmvpCandList[NumHmvpCand - i]のLYの参照インデックスと処理対象の符号化ブロックのLYの参照インデックスが同一でなければ(図65のステップS2209のNO)、S2207に進む。 Check whether the LY reference index of the history prediction motion vector candidate HmvpCandList[NumHmvpCand-i] is the same as the LY reference index of the coding block to be processed (step S2209 in FIG. 65). If the LY reference index of the history prediction motion vector candidate HmvpCandList[NumHmvpCand-i] is the same as the LY reference index of the coding block to be processed (YES in step S2209 in FIG. 65), proceed to S2206. If the LY reference index of the history prediction motion vector candidate HmvpCandList[NumHmvpCand-i] is not the same as the LY reference index of the coding block to be processed (NO in step S2209 in FIG. 65), proceed to S2207.
以上のように、履歴予測動きベクトル候補のLYの参照インデックスと処理対象の符号化ブロックのLYの参照インデックスが同一である場合に、履歴予測動きベクトル候補の動きベクトルをLY予測の予測動きベクトル候補リストに追加することで、履歴予測動きベクトル候補の動きベクトルと予測動きベクトル候補の動きベクトルとの比較を行うことなく、精度の高い履歴予測動きベクトル候補を予測動きベクトル候補リストに追加できる。 As described above, when the LY reference index of the history prediction motion vector candidate is the same as the LY reference index of the coding block to be processed, the motion vector of the history prediction motion vector candidate is added to the prediction motion vector candidate list for LY prediction, so that a highly accurate history prediction motion vector candidate can be added to the prediction motion vector candidate list without comparing the motion vector of the history prediction motion vector candidate with the motion vector of the prediction motion vector candidate.
本実施の形態では、履歴予測動きベクトル候補導出処理においては、履歴予測動きベクトル候補リストの要素と予測動きベクトル候補リストの要素との比較を行うことなく、履歴予測動きベクトル候補リストの要素を予測動きベクトル候補リストへ追加する一方、履歴マージ候補導出処理においては、履歴マージ候補リストの要素とマージリストの要素との比較を行い、マージリストに存在しない履歴マージ候補リストのみをマージリストに追加する。上記構成を取ることにより以下の効果を得ることができる。 In this embodiment, in the history prediction motion vector candidate derivation process, elements of the history prediction motion vector candidate list are added to the prediction motion vector candidate list without comparing the elements of the history prediction motion vector candidate list with the elements of the prediction motion vector candidate list, while in the history merge candidate derivation process, elements of the history merge candidate list are compared with elements of the merge list, and only history merge candidate lists that do not exist in the merge list are added to the merge list. By adopting the above configuration, the following effects can be obtained.
1.履歴予測動きベクトル候補リスト候補導出処理において、追加の候補導出処理を行う必要がなく、処理量、回路規模を削減することができるとともに、やむを得ず予測動きベクトル候補リストの要素が重複するような場合であっても、選択肢の減少による符号化効率の低下を最小限にとどめることができる。 1. In the process of deriving candidates from the historical motion vector predictor candidate list, there is no need to perform additional candidate derivation processing, which reduces the amount of processing and the circuit size. In addition, even in cases where elements in the motion vector predictor candidate list are inevitably duplicated, it is possible to minimize the decrease in coding efficiency due to a reduction in options.
2.履歴マージ候補導出処理においては、マージリストの要素と重複する履歴マージ候補リストの要素の追加を禁止することにより、差分ベクトルを用いずに処理対象ブロックの動き情報を決定する通常マージモードにおいて、適切なマージ候補リストを構築することができ、符号化効率を向上させることができる。 2. In the history merge candidate derivation process, by prohibiting the addition of elements to the history merge candidate list that overlap with elements of the merge list, it is possible to construct an appropriate merge candidate list in the normal merge mode, which determines the motion information of the block to be processed without using a difference vector, and thus improve coding efficiency.
3.履歴予測動きベクトル候補リストを重複しない履歴予測動きベクトル候補で充填しておくこと、通常マージモード導出部302における履歴マージ候補導出部345より後のマージ候補補充部346の処理を省略することができ、処理量を削減することができる。
3. By filling the history prediction motion vector candidate list with non-overlapping history prediction motion vector candidates, the processing of the merge
4.履歴予測動きベクトル候補リストを重複しない履歴予測動きベクトル候補で充填しておき、且つ履歴予測動きベクトル候補リストの要素と予測動きベクトル候補リストの要素との比較を行うことなく、履歴予測動きベクトル候補リストの要素を予測動きベクトル候補リストへ追加することで、通常予測動きベクトルモード導出部301における履歴予測動きベクトル候補導出部323より後の予測動きベクトル補充部325の処理を省略することができる。
4. By filling the history prediction motion vector candidate list with non-overlapping history prediction motion vector candidates and adding elements of the history prediction motion vector candidate list to the prediction motion vector candidate list without comparing the elements of the history prediction motion vector candidate list with the elements of the prediction motion vector candidate list, it is possible to omit the processing of the prediction motion
以上に述べた全ての実施の形態は、複数を組み合わせても良い。 All of the above-mentioned embodiments may be combined in multiple ways.
以上に述べた全ての実施の形態において、画像符号化装置が出力する符号化ビットストリームは、実施の形態で用いられた符号化方法に応じて復号することができるように特定のデータフォーマットを有している。また、この画像符号化装置に対応する画像復号装置は、この特定のデータフォーマットの符号化ビットストリームを復号することができる。 In all of the embodiments described above, the coded bitstream output by the image coding device has a specific data format so that it can be decoded according to the coding method used in the embodiment. Furthermore, an image decoding device corresponding to this image coding device can decode the coded bitstream in this specific data format.
画像符号化装置と画像復号装置の間で符号化ビットストリームをやりとりするために、有線または無線のネットワークが用いられる場合、通信路の伝送形態に適したデータ形式に符号化ビットストリームを変換して伝送してもよい。その場合、画像符号化装置が出力する符号化ビットストリームを通信路の伝送形態に適したデータ形式の符号化データに変換してネットワークに送信する送信装置と、ネットワークから符号化データを受信して符号化ビットストリームに復元して画像復号装置に供給する受信装置とが設けられる。 When a wired or wireless network is used to exchange coded bitstreams between an image coding device and an image decoding device, the coded bitstream may be converted into a data format suitable for the transmission mode of the communication channel before being transmitted. In this case, a transmitting device is provided that converts the coded bitstream output by the image coding device into coded data in a data format suitable for the transmission mode of the communication channel and transmits the coded bitstream to the network, and a receiving device is provided that receives the coded data from the network, restores it to a coded bitstream, and supplies it to the image decoding device.
送信装置は、画像符号化装置が出力する符号化ビットストリームをバッファするメモリと、符号化ビットストリームをパケット化するパケット処理部と、ネットワークを介してパケット化された符号化データを送信する送信部とを含む。受信装置は、ネットワークを介してパケット化された符号化データを受信する受信部と、受信された符号化データをバッファするメモリと、符号化データをパケット処理して符号化ビットストリームを生成し、画像復号装置に提供するパケット処理部とを含む。 The transmitting device includes a memory that buffers the coded bitstream output by the image coding device, a packet processing unit that packetizes the coded bitstream, and a transmitting unit that transmits the packetized coded data via the network. The receiving device includes a receiving unit that receives the packetized coded data via the network, a memory that buffers the received coded data, and a packet processing unit that packetizes the coded data to generate a coded bitstream and provides it to the image decoding device.
また、画像復号装置で復号された画像を表示する表示部を構成に追加することで、表示装置としても良い。その場合、表示部は、復号画像信号重畳部205により生成され、復号画像メモリ206に格納された復号画像信号を読み出して画面に表示する。
In addition, a display unit that displays the image decoded by the image decoding device may be added to the configuration to form a display device. In this case, the display unit reads out the decoded image signal generated by the decoded image
また、撮像部を構成に追加し、撮像した画像を画像符号化装置に入力することで、撮像装置としても良い。その場合、撮像部は、撮像した画像信号をブロック分割部101に入力する。
Also, an imaging unit may be added to the configuration and the captured image may be input to the image encoding device to form an imaging device. In this case, the imaging unit inputs the captured image signal to the
図66に、本願の符号化復号装置のハードウェア構成の一例を示す。符号化復号装置は、本発明の実施の形態に係る画像符号化装置、および画像復号装置の構成を包含する。係る符号化復号装置9000は、CPU9001、コーデックIC9002、I/Oインターフェース9003、メモリ9004、光学ディスクドライブ9005、ネットワークインターフェース9006、ビデオインターフェース9009を有し、各部はバス9010により接続される。
Figure 66 shows an example of the hardware configuration of the encoding/decoding device of the present application. The encoding/decoding device includes the configuration of the image encoding device and image decoding device according to the embodiment of the present invention. The encoding/
画像符号化部9007と画像復号部9008は、典型的にはコーデックIC9002として実装される。本発明の実施の形態に係る画像符号化装置の画像符号化処理は、画像符号化部9007により実行され、本発明の実施の形態に係る画像復号装置における画像復号処理は、画像符号化部9007により実行される。I/Oインターフェース9003は、例えばUSBインターフェースにより実現され、外部のキーボード9104、マウス9105等と接続する。CPU9001は、I/Oインターフェース9003を介して入力したユーザー操作に基づき、ユーザーの所望する動作を実行するように符号化復号装置9000を制御する。キーボード9104、マウス9105等によるユーザーの操作としては、符号化、復号のどちらの機能を実行するかの選択、符号化品質の設定、符号化ストリームの入出力先、画像の入出力先等がある。
The
ユーザーがディスク記録媒体9100に記録された画像を再生する操作を所望する場合、光学ディスクドライブ9005は、挿入されたディスク記録媒体9100から符号化ビットストリームを読出し、読み出した符号化ストリームを、バス9010を介してコーデックIC9002の画像復号部9008に送る。画像復号部9008は入力した符号化ビットストリームに対して本発明の実施の形態に係る画像復号装置における画像復号処理を実行し、復号画像を、ビデオインターフェース9009を介して外部のモニタ9103へ送る。また、符号化復号装置9000は、ネットワークインターフェース9006を有し、ネットワーク9101を介して、外部の配信サーバ9106や、携帯端末9107と接続可能である。ユーザーがディスク記録媒体9100に記録された画像に変えて、配信サーバ9106や携帯端末9107に記録された画像を再生することを所望する場合は、ネットワークインターフェース9006は、入力されたディスク記録媒体9100から符号化ビットストリームを読出すことに変えて、ネットワーク9101より符号化ストリームを取得する。また、ユーザーがメモリ9004に記録された画像を再生することを所望する場合は、メモリ9004に記録された符号化ストリームに対して、本発明の実施の形態に係る画像復号装置における画像復号処理を実行する。
When a user wishes to play back an image recorded on the
ユーザーが外部のカメラ9102で撮像した画像を符号化しメモリ9004に記録する操作を所望する場合、ビデオインターフェース9009は、カメラ9102から画像を入力し、バス9010を介し、コーデックIC9002の画像符号化部9007に送る。画像符号化部9007は、ビデオインターフェース9009を介して入力した画像に対して本発明の実施の形態に係る画像符号化装置における画像符号化処理を実行し、符号化ビットストリームを作成する。そして符号化ビットストリームを、バス9010を介し、メモリ9004へ送る。ユーザーがメモリ9004に変えて、ディスク記録媒体9100に符号化ストリームを記録することを所望する場合は、光学ディスクドライブ9005は、挿入されたディスク記録媒体9100に対し符号化ストリームの書き出しを行う。
When the user wishes to encode an image captured by an
画像符号化装置を有し画像復号装置を有さないハードウェア構成や、画像復号装置を有し画像符号化装置を有さないハードウェア構成を実現することも可能である。そのようなハードウェア構成は、例えばコーデックIC9002が、画像符号化部9007、または画像復号部9008にそれぞれ置き換わることにより実現される。
It is also possible to realize a hardware configuration that has an image encoding device but not an image decoding device, or a hardware configuration that has an image decoding device but not an image encoding device. Such a hardware configuration is realized, for example, by replacing the
以上の符号化及び復号に関する処理は、ハードウェアを用いた伝送、蓄積、受信装置として実現しても良いのは勿論のこと、ROM(リード・オンリー・メモリ)やフラッシュメモリ等に記憶されているファームウェアや、コンピュータ等のソフトウェアによって実現しても良い。そのファームウェアプログラム、ソフトウェアプログラムをコンピュータ等で読み取り可能な記録媒体に記録して提供しても良いし、有線あるいは無線のネットワークを通してサーバから提供しても良いし、地上波あるいは衛星ディジタル放送のデータ放送として提供しても良い。 The above encoding and decoding processes may of course be realized as transmission, storage, and receiving devices using hardware, but may also be realized by firmware stored in ROM (read-only memory) or flash memory, or by software on a computer, etc. The firmware and software programs may be provided by recording them on a recording medium that can be read by a computer, etc., or may be provided from a server via a wired or wireless network, or may be provided as data broadcasting on terrestrial or satellite digital broadcasting.
以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。 The present invention has been described above based on the embodiments. The embodiments are merely examples, and it will be understood by those skilled in the art that various modifications are possible in the combination of each component and each processing process, and that such modifications are also within the scope of the present invention.
100 画像符号化装置、 101 ブロック分割部、 102 インター予測部、 103 イントラ予測部、104 復号画像メモリ、 105 予測方法決定部、 106 残差信号生成部、 107 直交変換・量子化部、 108 ビット列符号化部、 109 逆量子化・逆直交変換部、 110 復号画像信号重畳部、 111 符号化情報格納メモリ、 200 画像復号装置、 201 ビット列復号部、 202 ブロック分割部、 203 インター予測部 204 イントラ予測部、 205 符号化情報格納メモリ205 逆量子化・逆直交変換部、 207 復号画像信号重畳部、 208 復号画像メモリ。
100 Image encoding device, 101 Block division unit, 102 Inter prediction unit, 103 Intra prediction unit, 104 Decoded image memory, 105 Prediction method determination unit, 106 Residual signal generation unit, 107 Orthogonal transformation and quantization unit, 108 Bit string encoding unit, 109 Inverse quantization and inverse orthogonal transformation unit, 110 Decoded image signal superposition unit, 111 Encoded information storage memory, 200 Image decoding device, 201 Bit string decoding unit, 202 Block division unit, 203
Claims (8)
履歴候補リストに含まれる履歴候補を候補として前記第1候補リストに追加して第2候補リストとする履歴候補導出部と、
前記第2候補リストに含まれる候補から選択候補を選択する候補選択部と、
前記選択候補を利用してインター予測を行うインター予測部と、
を備え、
前記履歴候補導出部は、前記符号化対象ブロックの予測モードが第1の予測モードである場合、前記履歴候補に含まれる動きベクトルおよび参照インデックスと前記第1候補リストに含まれる候補に含まれる動きベクトルおよび参照インデックスが同一であるか否かに基づき前記履歴候補を前記第1候補リストに追加するか否かを決定し、前記予測モードが第2の予測モードである場合、前記履歴候補の動きベクトルと前記第1候補リストに含まれる候補の動きベクトルが同一であるか否かに関わらず、前記履歴候補を前記第1候補リストに追加し、
前記予測モードが第1の予測モードである場合の前記第2候補リストに含まれる候補の最大数は前記予測モードが第2のモードである場合の前記第2候補リストに含まれる候補の最大数よりも大きいことを特徴とする
動画像符号化装置。 a spatial candidate derivation unit that derives spatial candidates from inter prediction information of a plurality of blocks adjacent to a current block to be coded, and registers the spatial candidates in a first candidate list;
a history candidate derivation unit that adds history candidates included in the history candidate list as candidates to the first candidate list to generate a second candidate list;
a candidate selection unit that selects a selection candidate from the candidates included in the second candidate list;
an inter prediction unit that performs inter prediction using the selection candidates;
Equipped with
when a prediction mode of the encoding target block is a first prediction mode, the history candidate derivation unit determines whether to add the history candidate to the first candidate list based on whether a motion vector and a reference index included in the history candidate are identical to a motion vector and a reference index included in a candidate included in the first candidate list, and when the prediction mode is a second prediction mode, adds the history candidate to the first candidate list regardless of whether a motion vector of the history candidate is identical to a motion vector of a candidate included in the first candidate list;
A video encoding device, characterized in that a maximum number of candidates included in the second candidate list when the prediction mode is a first prediction mode is greater than a maximum number of candidates included in the second candidate list when the prediction mode is a second mode.
履歴候補リストに含まれる履歴候補を候補として前記第1候補リストに追加して第2候補リストとする履歴候補導出工程と、
前記第2候補リストに含まれる候補から選択候補を選択する候補選択工程と、
前記選択候補を利用してインター予測を行うインター予測工程と、
を有し、
前記履歴候補導出工程は、前記符号化対象ブロックの予測モードが第1の予測モードである場合、前記履歴候補に含まれる動きベクトルおよび参照インデックスと前記第1候補リストに含まれる候補に含まれる動きベクトルおよび参照インデックスが同一であるか否かに基づき前記履歴候補を前記第1候補リストに追加するか否かを決定し、前記予測モードが第2の予測モードである場合、前記履歴候補の動きベクトルと前記第1候補リストに含まれる候補の動きベクトルが同一であるか否かに関わらず、前記履歴候補を前記第1候補リストに追加し、
前記予測モードが第1の予測モードである場合の前記第2候補リストに含まれる候補の最大数は前記予測モードが第2のモードである場合の前記第2候補リストに含まれる候補の最大数よりも大きいことを特徴とする
画像符号化方法。 a spatial candidate derivation step of deriving spatial candidates from inter prediction information of a plurality of blocks adjacent to the encoding target block, and registering the spatial candidates in a first candidate list as candidates;
a history candidate derivation step of adding history candidates included in the history candidate list as candidates to the first candidate list to generate a second candidate list;
a candidate selection step of selecting a selection candidate from the candidates included in the second candidate list;
an inter prediction step of performing inter prediction using the selection candidates;
having
the history candidate derivation step, when a prediction mode of the encoding target block is a first prediction mode, determines whether or not to add the history candidate to the first candidate list based on whether a motion vector and a reference index included in the history candidate are identical to a motion vector and a reference index included in a candidate included in the first candidate list; and, when the prediction mode is a second prediction mode, adds the history candidate to the first candidate list regardless of whether a motion vector of the history candidate is identical to a motion vector of a candidate included in the first candidate list;
An image encoding method, characterized in that a maximum number of candidates included in the second candidate list when the prediction mode is a first prediction mode is greater than a maximum number of candidates included in the second candidate list when the prediction mode is a second mode.
符号化対象ブロックに隣接する複数のブロックのインター予測情報から空間候補を導出して、候補として第1候補リストに登録する空間候補導出ステップと、
履歴候補リストに含まれる履歴候補を候補として前記第1候補リストに追加して第2候補リストとする履歴候補導出ステップと、
前記第2候補リストに含まれる候補から選択候補を選択する候補選択ステップと、
前記選択候補を利用してインター予測を行うインター予測ステップと、
を実行させ、
前記履歴候補導出ステップは、前記符号化対象ブロックの予測モードが第1の予測モードである場合、前記履歴候補に含まれる動きベクトルおよび参照インデックスと前記第1候補リストに含まれる候補に含まれる動きベクトルおよび参照インデックスが同一であるか否かに基づき前記履歴候補を前記第1候補リストに追加するか否かを決定し、前記予測モードが第2の予測モードである場合、前記履歴候補の動きベクトルと前記第1候補リストに含まれる候補の動きベクトルが同一であるか否かに関わらず、前記履歴候補を前記第1候補リストに追加し、
前記予測モードが第1の予測モードである場合の前記第2候補リストに含まれる候補の最大数は前記予測モードが第2のモードである場合の前記第2候補リストに含まれる候補の最大数よりも大きいことを特徴とする
画像符号化プログラム。 On the computer,
a spatial candidate derivation step of deriving spatial candidates from inter prediction information of a plurality of blocks adjacent to the encoding target block, and registering the spatial candidates in a first candidate list as candidates;
a history candidate derivation step of adding history candidates included in the history candidate list as candidates to the first candidate list to generate a second candidate list;
a candidate selection step of selecting a selection candidate from the candidates included in the second candidate list;
an inter prediction step of performing inter prediction using the selected candidates;
Run the command,
the history candidate derivation step, when a prediction mode of the encoding target block is a first prediction mode, determines whether or not to add the history candidate to the first candidate list based on whether a motion vector and a reference index included in the history candidate are identical to a motion vector and a reference index included in a candidate included in the first candidate list; and, when the prediction mode is a second prediction mode, adds the history candidate to the first candidate list regardless of whether a motion vector of the history candidate is identical to a motion vector of a candidate included in the first candidate list;
An image encoding program, characterized in that a maximum number of candidates included in the second candidate list when the prediction mode is a first prediction mode is greater than a maximum number of candidates included in the second candidate list when the prediction mode is a second mode.
履歴候補リストに含まれる履歴候補を候補として前記第1候補リストに追加して第2候補リストとする履歴候補導出部と、
前記第2候補リストに含まれる候補から選択候補を選択する候補選択部と、
前記選択候補を利用してインター予測を行うインター予測部と、
を備え、
前記履歴候補導出部は、前記復号対象ブロックの予測モードが第1の予測モードである場合、前記履歴候補に含まれる動きベクトルおよび参照インデックスと前記第1候補リストに含まれる候補に含まれる動きベクトルおよび参照インデックスが同一であるか否かに基づき前記履歴候補を前記第1候補リストに追加するか否かを決定し、前記予測モードが第2の予測モードである場合、前記履歴候補の動きベクトルと前記第1候補リストに含まれる候補の動きベクトルが同一であるか否かに関わらず、前記履歴候補を前記第1候補リストに追加し、
前記予測モードが第1の予測モードである場合の前記第2候補リストに含まれる候補の最大数は前記予測モードが第2のモードである場合の前記第2候補リストに含まれる候補の最大数よりも大きいことを特徴とする
動画像復号装置。 a spatial candidate derivation unit that derives spatial candidates from inter prediction information of a plurality of blocks adjacent to a decoding target block, and registers the spatial candidates in a first candidate list as candidates;
a history candidate derivation unit that adds history candidates included in the history candidate list as candidates to the first candidate list to generate a second candidate list;
a candidate selection unit that selects a selection candidate from the candidates included in the second candidate list;
an inter prediction unit that performs inter prediction using the selection candidates;
Equipped with
the history candidate derivation unit, when a prediction mode of the decoding target block is a first prediction mode, determines whether or not to add the history candidate to the first candidate list based on whether a motion vector and a reference index included in the history candidate are identical to a motion vector and a reference index included in a candidate included in the first candidate list; and, when the prediction mode is a second prediction mode, adds the history candidate to the first candidate list regardless of whether a motion vector of the history candidate is identical to a motion vector of a candidate included in the first candidate list;
A video decoding device, characterized in that a maximum number of candidates included in the second candidate list when the prediction mode is a first prediction mode is greater than a maximum number of candidates included in the second candidate list when the prediction mode is a second mode.
履歴候補リストに含まれる履歴候補を候補として前記第1候補リストに追加して第2候補リストとする履歴候補導出工程と、
前記第2候補リストに含まれる候補から選択候補を選択する候補選択工程と、
前記選択候補を利用してインター予測を行うインター予測工程と、
を有し、
前記履歴候補導出工程は、前記復号対象ブロックの予測モードが第1の予測モードである場合、前記履歴候補に含まれる動きベクトルおよび参照インデックスと前記第1候補リストに含まれる候補に含まれる動きベクトルおよび参照インデックスが同一であるか否かに基づき前記履歴候補を前記第1候補リストに追加するか否かを決定し、前記予測モードが第2の予測モードである場合、前記履歴候補の動きベクトルと前記第1候補リストに含まれる候補の動きベクトルが同一であるか否かに関わらず、前記履歴候補を前記第1候補リストに追加し、
前記予測モードが第1の予測モードである場合の前記第2候補リストに含まれる候補の最大数は前記予測モードが第2のモードである場合の前記第2候補リストに含まれる候補の最大数よりも大きいことを特徴とする
画像復号方法。 a spatial candidate derivation step of deriving spatial candidates from inter prediction information of a plurality of blocks adjacent to the block to be decoded, and registering the spatial candidates in a first candidate list as candidates;
a history candidate derivation step of adding history candidates included in the history candidate list as candidates to the first candidate list to generate a second candidate list;
a candidate selection step of selecting a selection candidate from the candidates included in the second candidate list;
an inter prediction step of performing inter prediction using the selection candidates;
having
the history candidate derivation step, when a prediction mode of the decoding target block is a first prediction mode, determines whether or not to add the history candidate to the first candidate list based on whether a motion vector and a reference index included in the history candidate are identical to a motion vector and a reference index included in a candidate included in the first candidate list; and, when the prediction mode is a second prediction mode, adds the history candidate to the first candidate list regardless of whether a motion vector of the history candidate is identical to a motion vector of a candidate included in the first candidate list;
An image decoding method, characterized in that a maximum number of candidates included in the second candidate list when the prediction mode is a first prediction mode is greater than a maximum number of candidates included in the second candidate list when the prediction mode is a second mode.
復号対象ブロックに隣接する複数のブロックのインター予測情報から空間候補を導出して、候補として第1候補リストに登録する空間候補導出ステップと、
履歴候補リストに含まれる履歴候補を候補として前記第1候補リストに追加して第2候補リストとする履歴候補導出ステップと、
前記第2候補リストに含まれる候補から選択候補を選択する候補選択ステップと、
前記選択候補を利用してインター予測を行うインター予測ステップと、
を実行させ、
前記履歴候補導出ステップは、前記復号対象ブロックの予測モードが第1の予測モードである場合、前記履歴候補に含まれる動きベクトルおよび参照インデックスと前記第1候補リストに含まれる候補に含まれる動きベクトルおよび参照インデックスが同一であるか否かに基づき前記履歴候補を前記第1候補リストに追加するか否かを決定し、前記予測モードが第2の予測モードである場合、前記履歴候補の動きベクトルと前記第1候補リストに含まれる候補の動きベクトルが同一であるか否かに関わらず、前記履歴候補を前記第1候補リストに追加し、
前記予測モードが第1の予測モードである場合の前記第2候補リストに含まれる候補の最大数は前記予測モードが第2のモードである場合の前記第2候補リストに含まれる候補の最大数よりも大きいことを特徴とする
画像復号プログラム。 On the computer,
a spatial candidate derivation step of deriving spatial candidates from inter prediction information of a plurality of blocks adjacent to the decoding target block, and registering the spatial candidates in a first candidate list as candidates;
a history candidate derivation step of adding history candidates included in the history candidate list as candidates to the first candidate list to generate a second candidate list;
a candidate selection step of selecting a selection candidate from the candidates included in the second candidate list;
an inter prediction step of performing inter prediction using the selected candidates;
Run the command,
the history candidate derivation step, when a prediction mode of the decoding target block is a first prediction mode, determines whether or not to add the history candidate to the first candidate list based on whether a motion vector and a reference index included in the history candidate are identical to a motion vector and a reference index included in a candidate included in the first candidate list; and, when the prediction mode is a second prediction mode, adds the history candidate to the first candidate list regardless of whether a motion vector of the history candidate is identical to a motion vector of a candidate included in the first candidate list;
An image decoding program, characterized in that a maximum number of candidates included in the second candidate list when the prediction mode is a first prediction mode is greater than a maximum number of candidates included in the second candidate list when the prediction mode is a second mode.
符号化対象ブロックに隣接する複数のブロックのインター予測情報から空間候補を導出して、候補として第1候補リストに登録する空間候補導出工程と、
履歴候補リストに含まれる履歴候補を候補として前記第1候補リストに追加して第2候補リストとする履歴候補導出工程と、
前記第2候補リストに含まれる候補から選択候補を選択する候補選択工程と、
前記選択候補を利用してインター予測を行うインター予測工程と、
符号化情報を符号化しビットストリームを生成するビットストリーム生成工程と、
前記ビットストリームを伝送するビットストリーム伝送工程と、
を有し、
前記履歴候補導出工程は、前記符号化対象ブロックの予測モードが第1の予測モードである場合、前記履歴候補に含まれる動きベクトルおよび参照インデックスと前記第1候補リストに含まれる候補に含まれる動きベクトルおよび参照インデックスが同一であるか否かに基づき前記履歴候補を前記第1候補リストに追加するか否かを決定し、前記予測モードが第2の予測モードである場合、前記履歴候補の動きベクトルと前記第1候補リストに含まれる候補の動きベクトルが同一であるか否かに関わらず、前記履歴候補を前記第1候補リストに追加し、
前記予測モードが第1の予測モードである場合の前記第2候補リストに含まれる候補の最大数は前記予測モードが第2のモードである場合の前記第2候補リストに含まれる候補の最大数よりも大きいことを特徴とする
伝送方法。 A transmission method for transmitting a bitstream generated by an image encoding device , comprising the steps of:
a spatial candidate derivation step of deriving spatial candidates from inter prediction information of a plurality of blocks adjacent to the encoding target block, and registering the spatial candidates in a first candidate list as candidates;
a history candidate derivation step of adding history candidates included in the history candidate list as candidates to the first candidate list to generate a second candidate list;
a candidate selection step of selecting a selection candidate from the candidates included in the second candidate list;
an inter prediction step of performing inter prediction using the selection candidates;
a bitstream generating step of encoding the encoding information to generate a bitstream;
a bitstream transmitting step of transmitting the bitstream;
having
the history candidate derivation step, when a prediction mode of the encoding target block is a first prediction mode, determines whether or not to add the history candidate to the first candidate list based on whether a motion vector and a reference index included in the history candidate are identical to a motion vector and a reference index included in a candidate included in the first candidate list; and, when the prediction mode is a second prediction mode, adds the history candidate to the first candidate list regardless of whether a motion vector of the history candidate is identical to a motion vector of a candidate included in the first candidate list;
a maximum number of candidates included in the second candidate list when the prediction mode is a first prediction mode is greater than a maximum number of candidates included in the second candidate list when the prediction mode is a second mode.
Transmission method.
符号化対象ブロックに隣接する複数のブロックのインター予測情報から空間候補を導出して、候補として第1候補リストに登録する空間候補導出工程と、a spatial candidate derivation step of deriving spatial candidates from inter prediction information of a plurality of blocks adjacent to the encoding target block, and registering the spatial candidates in a first candidate list as candidates;
履歴候補リストに含まれる履歴候補を候補として前記第1候補リストに追加して第2候補リストとする履歴候補導出工程と、a history candidate derivation step of adding history candidates included in the history candidate list as candidates to the first candidate list to generate a second candidate list;
前記第2候補リストに含まれる候補から選択候補を選択する候補選択工程と、a candidate selection step of selecting a selection candidate from the candidates included in the second candidate list;
前記選択候補を利用してインター予測を行うインター予測工程と、an inter prediction step of performing inter prediction using the selection candidates;
符号化情報を符号化しビットストリームを生成するビットストリーム生成工程と、a bitstream generating step of encoding the encoding information to generate a bitstream;
前記ビットストリームを前記記録媒体に記録するビットストリーム記録工程と、a bitstream recording step of recording the bitstream on the recording medium;
を有し、having
前記履歴候補導出工程は、前記符号化対象ブロックの予測モードが第1の予測モードである場合、前記履歴候補に含まれる動きベクトルおよび参照インデックスと前記第1候補リストに含まれる候補に含まれる動きベクトルおよび参照インデックスが同一であるか否かに基づき前記履歴候補を前記第1候補リストに追加するか否かを決定し、前記予測モードが第2の予測モードである場合、前記履歴候補の動きベクトルと前記第1候補リストに含まれる候補の動きベクトルが同一であるか否かに関わらず、前記履歴候補を前記第1候補リストに追加し、the history candidate derivation step, when a prediction mode of the encoding target block is a first prediction mode, determines whether or not to add the history candidate to the first candidate list based on whether a motion vector and a reference index included in the history candidate are identical to a motion vector and a reference index included in a candidate included in the first candidate list; and, when the prediction mode is a second prediction mode, adds the history candidate to the first candidate list regardless of whether a motion vector of the history candidate is identical to a motion vector of a candidate included in the first candidate list;
前記予測モードが第1の予測モードである場合の前記第2候補リストに含まれる候補の最大数は前記予測モードが第2のモードである場合の前記第2候補リストに含まれる候補の最大数よりも大きいことを特徴とするa maximum number of candidates included in the second candidate list when the prediction mode is a first prediction mode is greater than a maximum number of candidates included in the second candidate list when the prediction mode is a second mode.
記録方法。Recording method.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018247403 | 2018-12-28 | ||
| JP2018247403 | 2018-12-28 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2020109934A JP2020109934A (en) | 2020-07-16 |
| JP2020109934A5 JP2020109934A5 (en) | 2022-09-29 |
| JP7637884B2 true JP7637884B2 (en) | 2025-03-03 |
Family
ID=71570190
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019171785A Active JP7637884B2 (en) | 2018-12-28 | 2019-09-20 | Video encoding device, image encoding method, image encoding program, video decoding device, image decoding method, image decoding program, transmission method and recording method for transmitting bit stream generated by image encoding device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7637884B2 (en) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2020003275A1 (en) | 2018-06-29 | 2020-01-02 | Beijing Bytedance Network Technology Co., Ltd. | Partial/full pruning when adding a hmvp candidate to merge/amvp |
| WO2020071793A1 (en) | 2018-10-02 | 2020-04-09 | 엘지전자 주식회사 | Method and apparatus for constructing prediction candidate on basis of hmvp |
-
2019
- 2019-09-20 JP JP2019171785A patent/JP7637884B2/en active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2020003275A1 (en) | 2018-06-29 | 2020-01-02 | Beijing Bytedance Network Technology Co., Ltd. | Partial/full pruning when adding a hmvp candidate to merge/amvp |
| JP2021530184A (en) | 2018-06-29 | 2021-11-04 | 北京字節跳動網絡技術有限公司Beijing Bytedance Network Technology Co., Ltd. | Partial / all pruning when adding HMVP candidates to merge / AMVP |
| WO2020071793A1 (en) | 2018-10-02 | 2020-04-09 | 엘지전자 주식회사 | Method and apparatus for constructing prediction candidate on basis of hmvp |
| JP2022502964A (en) | 2018-10-02 | 2022-01-11 | エルジー エレクトロニクス インコーポレイティドLg Electronics Inc. | Methods and Devices for Configuring Prediction Candidates Based on HMVP |
Non-Patent Citations (3)
| Title |
|---|
| Weiwei Xu et al.,CE4-related: Constraint of Pruning in History-based Motion Vector Prediction [online],JVET-L0448-v2(JVET-L0448_CE4-related_history prunning constraint.docx), [2023年10月23日検索],インターネット <URL: https://jvet-experts.org/doc_end_user/documents/12_Macao/wg11/JVET-L0448-v2 .zip>,2018年10月01日 |
| Yongjo Ahn et al.,CE10-related: Diagonal motion partitions on top of MTT block structure [online],JVET-K0270(JVET-K0270_r2.docx), [2023年10月23日検索],インターネット <URL: https://jvet-experts.org/doc_end_user/documents/11_Ljubljana/wg11/JVET-K0270-v3.zip>,2018年07月15日 |
| 大久保 榮、他,「H.265/HEVC教科書」,初版,株式会社インプレスジャパン,2013年10月21日,pp.136-140 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2020109934A (en) | 2020-07-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7405127B2 (en) | Image decoding device, image decoding method, and image decoding program | |
| JP7601168B2 (en) | Video encoding device, video encoding method, video encoding program, video decoding device, video decoding method, and video decoding program | |
| JP7519611B2 (en) | Image decoding device, image decoding method, and image decoding program | |
| JP7637884B2 (en) | Video encoding device, image encoding method, image encoding program, video decoding device, image decoding method, image decoding program, transmission method and recording method for transmitting bit stream generated by image encoding device | |
| JP2020109936A (en) | Image coding device, image coding method, and image coding program | |
| JP7637885B2 (en) | Image encoding device, image encoding method, and image encoding program | |
| JP7137744B2 (en) | Image decoding device, image decoding method and image decoding program | |
| JP2020108081A (en) | Image encoding device, image encoding method, and image encoding program | |
| JP7418687B2 (en) | Video encoding device, video encoding method, and video encoding program | |
| JP7215243B2 (en) | image coding device | |
| JP7451873B2 (en) | Image encoding device, image encoding method, and image encoding program | |
| JP7418686B2 (en) | Video encoding device, video encoding method, and video encoding program | |
| JP2020108079A (en) | Image encoding device, image encoding method, and image encoding program | |
| JP2020108084A (en) | Dynamic picture image encoder, dynamic picture image encoding method and dynamic picture image encoding program | |
| JP2020108085A (en) | Image encoding device, image encoding method, and image encoding program | |
| JP2020108080A (en) | Image decoding device, image decoding method, and image decoding program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20220309 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220920 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220920 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231026 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231107 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240105 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241113 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250107 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250203 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7637884 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |