+

WO2018128466A1 - Device and method for encoding or decoding image - Google Patents

Device and method for encoding or decoding image Download PDF

Info

Publication number
WO2018128466A1
WO2018128466A1 PCT/KR2018/000264 KR2018000264W WO2018128466A1 WO 2018128466 A1 WO2018128466 A1 WO 2018128466A1 KR 2018000264 W KR2018000264 W KR 2018000264W WO 2018128466 A1 WO2018128466 A1 WO 2018128466A1
Authority
WO
WIPO (PCT)
Prior art keywords
block
qtbt
partition
image data
divided
Prior art date
Application number
PCT/KR2018/000264
Other languages
French (fr)
Korean (ko)
Inventor
임정연
신재섭
손세훈
이선영
Original Assignee
에스케이텔레콤 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020180001062A external-priority patent/KR20180082330A/en
Application filed by 에스케이텔레콤 주식회사 filed Critical 에스케이텔레콤 주식회사
Priority to CN201880005760.8A priority Critical patent/CN110169065B/en
Publication of WO2018128466A1 publication Critical patent/WO2018128466A1/en
Priority to US16/505,080 priority patent/US11102517B2/en
Priority to US17/380,419 priority patent/US11595700B2/en
Priority to US17/380,371 priority patent/US11533515B2/en
Priority to US18/099,387 priority patent/US11917212B2/en
Priority to US18/099,393 priority patent/US11902594B2/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Definitions

  • the present invention relates to image encoding or decoding for efficiently encoding an image. More specifically, the present invention relates to a block partitioning scheme capable of taking into account the characteristics of various images more actively, and a technique of signaling the partitioning information with the partitioning information.
  • FIG. 1 is a conceptual diagram of an exemplary quadtree block structure for a CTU.
  • a coding tree unit CTU
  • CU coding unit
  • FIG. 1 a CU having the best coding efficiency is selected while repeatedly dividing a CTU having a maximum size of 64x64 in a quadtree manner to at least 4x4.
  • Each CU is further divided into a PU (Prediction Unit).
  • PU Prediction Unit
  • the CU is divided into a TU (Transformation Unit) for the residual block.
  • 1 illustrates a rectangular PU divided by a dotted line.
  • quadtree plus binary tree (QTBT) structure has been newly discussed, and attempts have been made to reflect various local characteristics of image data while removing existing CU, PU, and TU concepts.
  • An object of the present invention is to provide a QTBT partitioning structure that allows various shapes of blocks that can more efficiently reflect local characteristics of various images, and a method for efficiently signaling the partitioning structure.
  • a method comprising: receiving a bitstream including a block of encoded image data and segmentation information related to the block of the image data; And determining a QuadTree plus BinaryTree (QTBT) partitioning structure for the block of the image data by using the partitioning information.
  • the QTBT partition structure is a structure in which a binary tree is rooted from a leaf node of a quadtree, and the binary tree is defined by partition types for splitting a parent node into two child nodes. Types include triangular partition type and rectangular partition type.
  • the method further includes decoding the block of the encoded image data for each leaf node of the QTBT. In the binary tree, child nodes of a parent node divided into a triangular partition type are no longer split, whereas child nodes of a parent node partitioned into a rectangular partition type are allowed to be split into two child nodes again.
  • an apparatus for decoding image data including a memory and one or more processors configured to perform the aforementioned method. That is, the one or more processors may include receiving a bitstream including a block of encoded image data and segmentation information related to the block of image data; Determining a QuadTree plus BinaryTree (QTBT) partition structure for the block of the image data by using the split information; And decoding the block of the encoded image data for each leaf node of the QTBT.
  • QTBT QuadTree plus BinaryTree
  • a method including: receiving a bitstream including a block of encoded image data and segmentation information related to the block of the image data; And determining the QTBT segmentation structure for the block of the image data by using the segmentation information. And decoding the block of the encoded image data for each leaf node of the QTBT.
  • the QTBT splitting structure is a structure in which a binary tree is rooted from a leaf node of a quadtree, and leaf nodes of the quadtree are allowed to be divided into two child nodes, and the two child nodes. Are ⁇ shaped blocks and ⁇ shaped blocks.
  • CTU coding tree unit
  • 1 is a conceptual diagram of an exemplary quadtree block structure for a CTU.
  • FIG. 2 is a diagram illustrating a form (a) divided into squares and a divided form (b) divided into a combination of squares and triangles.
  • 3A and 3B illustrate triangular block division shapes.
  • 4 is a view showing a block division form of irregularities.
  • FIG. 5 is a block diagram of an example video encoding apparatus in which the techniques of this disclosure may be used.
  • FIG. 6 shows an example of a plurality of intra prediction modes.
  • FIG. 7 is an exemplary diagram of neighboring blocks of a current block.
  • FIG. 8 is a block diagram of an example video decoding apparatus in which the techniques of this disclosure may be used.
  • FIG. 9 is a conceptual diagram of partition partitions allowed in BT partitioning according to an embodiment of the present invention.
  • FIG. 10 is a tree representation of an example of a bit allocation method for four BT divisions illustrated in FIG. 9.
  • FIG. 11A is a conceptual diagram of an exemplary QTBT splitting structure according to an embodiment of the present invention
  • FIG. 11B is a tree structure illustrating the QTBT splitting structure of FIG. 11A.
  • FIG. 12 is a tree representation of an example of a bit allocation method for the uneven partition illustrated in FIG. 4.
  • FIG. 13 is a diagram representing an example of a bit allocation method for BT division in which rectangular divisions are allowed.
  • FIG. 14A is a conceptual diagram of an exemplary CU partition and a PU partition according to an embodiment of the present invention
  • FIG. 14B illustrates the CU partition of FIG. 14A in a tree structure.
  • 15 is a flowchart illustrating an exemplary operation of encoding an image by the image encoding device.
  • 16 is a flowchart illustrating an exemplary operation of decoding an image by the image decoding device.
  • 17 is a flowchart illustrating another exemplary operation of decoding an image by the image decoding device.
  • FIG. 2 is a diagram illustrating a form (a) divided into squares and a divided form (b) divided into a combination of squares and triangles.
  • a given characteristic that is, the position, size, and shape of an object
  • a form divided into a combination of squares and triangles may more efficiently reflect a given characteristic of an image than (a) of FIG. May be advantageous to the process).
  • 3A and 3B illustrate triangular block division shapes.
  • 3A illustrates a form in which a square block is divided into two triangles of equal size
  • FIG. 3B illustrates a form in which a rectangular block is divided into two triangles of equal size.
  • the proposed triangular block may be useful when there are diagonal edges in the rectangle, as in the example of FIG. In other words, it is possible to set a triangular region having a similar texture as one block, thereby increasing coding efficiency.
  • 4 is a view showing a block division form of irregularities. 4 shows four shapes in which a square block is divided into irregular shapes. The shapes illustrated in FIG. 4 are distinguished according to the relative position of the block shaped block with respect to the block shaped block. If the image is divided into such a combination of uneven blocks and squares, the given characteristic of the image may be more efficiently reflected.
  • the present disclosure generally relates to a block partitioning scheme that can more actively consider characteristics of an image, and a technique of signaling the partitioning information.
  • the techniques of this disclosure allow for a more flexible approach to use block partitions of various shapes in addition to square or rectangle in video encoding, thereby providing additional opportunities for improving encoding and / or image quality.
  • FIG. 5 is a block diagram of an example video encoding apparatus in which the techniques of this disclosure may be used.
  • the image encoding apparatus includes a block splitter 510, a predictor 520, a subtractor 530, a transformer 540, a quantizer 545, an encoder 550, an inverse quantizer 560, and an inverse transform unit ( 565, an adder 570, a filter unit 580, and a memory 590.
  • each component may be implemented as a hardware chip, or may be implemented in software and implemented so that the microprocessor executes a function of software corresponding to each component.
  • the block dividing unit 510 After dividing each picture constituting an image into a plurality of coding tree units (CTUs), the block dividing unit 510 recursively divides the CTUs using a tree structure.
  • a leaf node in the tree structure becomes a CU (coding unit) which is a basic unit of coding.
  • the tree structure is a quadtree (QT) in which a parent node (or parent node) is divided into four child nodes (or child nodes) of the same size, or such a QT structure and a parent node are divided into two child nodes.
  • QTBT QuadTree plus BinaryTree
  • the CTU may be first divided into a QT structure.
  • Quadtree splitting may be repeated until the size of the splitting block reaches the minimum block size (MinQTSize) of the leaf nodes allowed in QT. If the leaf node of the quadtree is not larger than the maximum block size (MaxBTSize) of the root node allowed in BT, it may be further partitioned into the BT structure.
  • MaxBTSize maximum block size of the root node allowed in BT
  • BT there may be a plurality of partition types. For example, in some examples, a rectangular division type may be used that divides a block of nodes into two rectangles of the same size.
  • a triangular split type that splits into two triangles of the same size may be used in addition to the BT split.
  • a concave-convex type of dividing a given block into a j-shaped block and a j-shaped block may be used.
  • the rectangular division type there may be a horizontal division form and a vertical division form according to the division direction.
  • the triangular division type there may be a down-right division form and an up-right division form according to the division direction.
  • the uneven division type may have four division forms according to the division direction (that is, according to the relative positions of the U-shaped block and the U-shaped block).
  • the partition information generated by the block divider 510 by dividing the CTU by the QTBT structure is encoded by the encoder 550 and transmitted to the image decoding apparatus.
  • a block corresponding to a CU that is, a leaf node of QTBT
  • a 'current block' a block corresponding to a CU (that is, a leaf node of QTBT) to be encoded or decoded
  • the prediction unit 520 generates a prediction block by predicting the current block.
  • the predictor 520 includes an intra predictor 522 and an inter predictor 524.
  • the intra predictor 522 predicts pixels in the current block by using pixels (reference pixels) positioned around the current block in the current picture including the current block. There are a plurality of intra prediction modes according to the prediction direction, and the peripheral pixels to be used and the equations are defined differently according to each prediction mode. In particular, the intra predictor 522 may determine an intra prediction mode to use to encode the current block. In some examples, intra prediction unit 522 may encode the current block using several intra prediction modes and select an appropriate intra prediction mode to use from the tested modes. For example, intra predictor 522 calculates rate distortion values using rate-distortion analysis for several tested intra prediction modes, and has the best rate distortion characteristics among the tested modes. Intra prediction mode may be selected.
  • FIG. 6 shows an example of a plurality of intra prediction modes.
  • the plurality of intra prediction modes may include two non-directional modes (planar mode and DC mode) and 65 directional modes.
  • the intra predictor 522 selects one intra prediction mode from among the plurality of intra prediction modes, and predicts the current block by using a neighboring pixel (reference pixel) and an operation formula determined according to the selected intra prediction mode.
  • Information on the selected intra prediction mode is encoded by the encoder 550 and transmitted to the image decoding apparatus.
  • the intra predictor 522 may efficiently encode intra prediction mode information indicating which mode of the plurality of intra prediction modes is used as the intra prediction mode of the current block. Some of the most probable modes as the intra prediction mode of may be determined as the most probable mode (MPM). In addition, mode information indicating whether the intra prediction mode of the current block is selected from the MPM is generated and transmitted to the encoder 550. In general, when the intra prediction mode of the current block is selected from the MPMs, the first intra identification information for indicating which mode of the MPMs is selected as the intra prediction mode of the current block is transmitted to the encoder.
  • the intra prediction unit 522 instead of explicitly signaling which mode among the MPMs and / or non-MPMs is selected as the intra prediction mode for predicting the current block. Can group the MPMs and / or non-MPMs and signal the index of the group to which the intra mode for predicting the current block belongs.
  • the present invention is not limited thereto, and the number of MPMs included in the MPM list may be selected within a range of 3 to 10.
  • the MPM list is constructed using the intra prediction mode of neighboring blocks of the current block.
  • the neighboring block may be, for example, all or some of the left block L, the upper block A, the lower left block BL, the upper right block AR, and the upper left block AL of the current block. It may include.
  • the intra prediction mode of these neighboring blocks is included in the MPM list.
  • the intra prediction mode of the valid blocks in the order of the left block (L), the top block (A), the bottom left block (BL), the top right block (AR), and the top left block (AL) is included in the MPM list.
  • the candidate is configured by adding a planar mode and a DC mode to the intra prediction modes of the blocks.
  • valid modes in the order of the left block (L), the top block (A), the planar mode, the DC mode, the bottom left block (BL), the top right block (AR), and the top left block (AL) may be added to the MPM list.
  • valid modes in the order of the left block (L), the top block (A), the planar mode, the bottom left block (BL), the top right block (AR), the top left block (AL), and the DC mode may be added to the MPM list. have.
  • the MPM list includes only different intra prediction modes. That is, when a duplicated mode is present, only one of them is included in the MPM list.
  • the MPM may be derived by adding -1 or +1 to the directional modes in the list.
  • the number of insufficient modes is added to the MPM list in the order of vertical mode, horizontal mode, diagonal mode, and the like. You may.
  • the inter prediction unit 524 searches for the block most similar to the current block in the coded and decoded reference picture before the current picture, and generates a prediction block for the current block using the searched block. A motion vector corresponding to a displacement between the current block in the current picture and the prediction block in the reference picture is generated.
  • the motion information including the information about the reference picture and the motion vector used to predict the current block is encoded by the encoder 550 and transmitted to the image decoding apparatus.
  • the subtractor 530 generates a residual block by subtracting the prediction block generated by the intra predictor 522 or the inter predictor 524 from the current block.
  • the converter 540 converts the residual signal in the residual block having pixel values of the spatial domain into a transform coefficient of the frequency domain.
  • the transformer 540 may convert the residual signals in the residual block using the size of the current block as a conversion unit, or divide the residual block into a plurality of smaller subblocks and convert the residual signals in a subblock-sized transform unit. You can also convert. There may be various ways of dividing the residual block into smaller subblocks. For example, it may be divided into sub-blocks of a predetermined same size, or a quadtree (QT) scheme may be used in which the residual block is a root node.
  • QT quadtree
  • the quantization unit 545 quantizes the transform coefficients output from the transform unit 540, and outputs the quantized transform coefficients to the encoder 550.
  • the encoder 550 generates a bitstream by encoding the quantized transform coefficients by using an encoding method such as CABAC.
  • the encoder 550 encodes information such as CTU size, MinQTSize, MaxBTSize, MaxBTDepth, MinBTSize, QT split flag (QT_split_flag), BT split flag (QT_split_flag) related to block division, so that the image decoding apparatus may
  • the block can be divided in the same way as
  • the encoder 550 encodes information about a prediction type indicating whether a current block is encoded by intra prediction or inter prediction, and encodes intra prediction information or inter prediction information according to the prediction type.
  • the inverse quantizer 560 inversely quantizes the quantized transform coefficients output from the quantizer 545 to generate transform coefficients.
  • the inverse transformer 565 restores the residual block by converting the transform coefficients output from the inverse quantizer 560 from the frequency domain to the spatial domain.
  • the adder 570 reconstructs the current block by adding the reconstructed residual block and the predicted block generated by the predictor 520.
  • the pixels in the reconstructed current block are used as reference pixels when intra prediction of the next order of blocks.
  • the filter unit 580 deblocks and filters the boundary between the reconstructed blocks in order to remove blocking artifacts that occur due to encoding / decoding of blocks. When all the blocks in a picture are reconstructed, the reconstructed picture is used as a reference picture for inter prediction of a block in a picture to be encoded later.
  • FIG. 8 is a block diagram of an example video decoding apparatus in which the techniques of this disclosure may be used.
  • the image decoding apparatus includes a decoder 810, an inverse quantizer 820, an inverse transformer 830, a predictor 840, an adder 850, a filter 860, and a memory 870.
  • the image decoding apparatus may be implemented by each component as a hardware chip, or may be implemented by software and a microprocessor to execute a function of software corresponding to each component.
  • the decoder 810 decodes the bitstream received from the image encoding apparatus, extracts information related to block division, determines a current block to be decoded, and includes prediction information and residual signal information necessary for reconstructing the current block. Extract
  • the decoder 810 extracts information about the CTU size from a high level syntax such as a Sequence Parameter Set (SPS) or a Picture Parameter Set (PPS) to determine the size of the CTU, and determines the size of the picture.
  • a high level syntax such as a Sequence Parameter Set (SPS) or a Picture Parameter Set (PPS) to determine the size of the CTU, and determines the size of the picture.
  • SPS Sequence Parameter Set
  • PPS Picture Parameter Set
  • Split into CTUs The CTU is determined as the highest layer of the tree structure, that is, the root node, and the CTU is partitioned using a tree structure (eg, a QTBT structure) by extracting partition information about the CTU.
  • a tree structure eg, a QTBT structure
  • the decoder 810 determines the current block (current block) to be decoded by splitting the tree structure, the decoder 810 extracts information about a prediction type indicating whether the current block is intra predicted or inter predicted.
  • the decoder 810 extracts a syntax element for intra prediction information (intra prediction mode) of the current block. First, the decoder 810 extracts mode information (ie, MPM flag) indicating whether or not the intra prediction mode of the current block is selected from the MPMs. Also, in general, when the intra mode encoding information indicates that the intra prediction mode of the current block is selected from the MPMs, the first intra identification information for indicating which mode of the MPMs is selected as the intra prediction mode of the current block is extracted. And if the intra mode encoding information indicates that the intra prediction mode of the current block is not selected among the MPMs, a second intra for indicating which mode other than the MPM is selected as the intra prediction mode of the current block.
  • mode information ie, MPM flag
  • the intra prediction unit 522 may indicate an intra identification information indicating which mode among MPMs and / or non-MPMs is selected as an intra prediction mode for predicting a current block.
  • group MPMs and / or non-MPMs and extract intra identification information eg, group index, etc. indicating whether an intra mode for predicting the current block belongs.
  • the decoder 810 extracts information about quantized transform coefficients of the current block as information on the residual signal.
  • the inverse quantization unit 820 inversely quantizes the quantized transform coefficients
  • the inverse transform unit 830 inversely transforms the inverse quantized transform coefficients from the frequency domain to the spatial domain to generate a residual block for the current block.
  • the predictor 840 includes an intra predictor 842 and an inter predictor 844.
  • the intra predictor 842 is activated when the intra prediction is the prediction type of the current block
  • the inter predictor 844 is activated when the intra prediction is the prediction type of the current block.
  • the intra predictor 842 determines the intra prediction mode of the current block among the plurality of intra prediction modes from the syntax element for the intra prediction mode extracted from the decoder 810, and references pixels around the current block according to the intra prediction mode. Predict the current block using
  • the intra predictor 842 constructs an MPM list including a predetermined number of MPMs from neighboring blocks of the current block.
  • the method of constructing the MPM list is the same as that of the intra predictor 522 of FIG. 2.
  • the intra prediction unit 842 may indicate the first intra identification information among the MPMs in the MPM list. Select the MPM indicated by the intra prediction mode of the current block. On the other hand, if the mode information indicates that the intra prediction mode of the current block is not selected from the MPM, the intra prediction mode of the current block is determined among the remaining intra prediction modes except the MPMs in the MPM list using the second intra identification information. do.
  • the intra prediction unit 522 of the image encoding apparatus may determine the final intra mode (that is, the intra mode for predicting the current block) by evaluating the intra modes belonging to the corresponding group. For example, in some examples, the intra predictor 842 may generate a reconstructed block for a plurality of intra modes belonging to a group, and evaluate the reconstructed blocks to determine a final intra mode.
  • the inter predictor 844 determines motion information of the current block using a syntax element for the intra prediction mode extracted from the decoder 810, and predicts the current block using the determined motion information.
  • the adder 850 reconstructs the current block by adding the residual block output from the inverse transformer and the prediction block output from the inter predictor or the intra predictor.
  • the pixels in the reconstructed current block are utilized as reference pixels in intra prediction of the block to be subsequently decoded.
  • the filter unit 860 deblocks and filters the boundary between the reconstructed blocks in order to remove blocking artifacts caused by block-by-block decoding, and stores them in the memory 870. When all the blocks in a picture are reconstructed, the reconstructed picture is used as a reference picture for inter prediction of a block in a picture to be decoded later.
  • Techniques of the present disclosure generally relate to a technique for signaling partition information representing a QTBT block partition structure that allows not only rectangular but also triangular or uneven blocks, and a technique for determining block partitioning from partition information.
  • One aspect of the techniques of the present disclosure may be performed by the encoder 550 of the image encoding apparatus illustrated in FIG. 5 and / or the decoder 810 of the image decoding apparatus illustrated in FIG. 8.
  • one or more other units of the image encoding apparatus and / or the image decoding apparatus may additionally or alternatively be responsible for performing the techniques of this disclosure.
  • QTBT block partitioning can be used to partition a CTU into CUs. That is, the root node of the QTBT may be a CTU, and the leaf node of the QTBT may be a CU.
  • the CTU that is the root node may be first divided into a QT structure.
  • the image encoding apparatus uses a QT split flag (QT_split_flag) to signal whether the root node of the QTBT is split into a QT structure.
  • QT_split_flag 0 indicates that the root node is not QT split
  • QT_split_flag 1 indicates that the root node is split into four blocks of the same size.
  • the QT division of each node may be repeated recursively.
  • BT partitioning may be performed on blocks that are not QT partitioned (ie, leaf nodes of QT).
  • the BT partition proposed in the present disclosure may have a plurality of partition types. For example, in some examples, a rectangular division type may be used that divides a block of nodes into two rectangles of the same size. In some other examples, a triangular split type that splits into two triangles of the same size may be used in addition to the BT split. In another example, a concave-convex type of dividing a given block into a j-shaped block and a j-shaped block may be used.
  • FIG. 9 is a conceptual diagram of partition partitions allowed in BT partitioning according to an embodiment of the present invention.
  • BT division and triangular division are used for BT division.
  • Rectangular division is to divide a given block (square or rectangular) into two rectangles of the same size
  • triangular division is to divide a given block (square or rectangular) into two triangles of the same size.
  • (A) and (b) in FIG. 9 are examples of two kinds of rectangular division
  • (c) and (d) are examples of two kinds of triangular division.
  • the rectangular division is divided into a horizontal form and a vertical form according to the division direction
  • the triangular division is divided into a down-right form and an up-right form according to the division direction. Therefore, in the present embodiment, BT divisions are divided into four types according to shape and direction.
  • FIG. 9 illustrates a square block divided into two rectangles or two triangles
  • a rectangular block divided into two rectangles or two triangles is also possible.
  • the rectangular block can be further divided into two rectangles or two triangles.
  • Triangle blocks are no longer split.
  • FIG. 10 is a tree representation of an example of a bit allocation method for four BT divisions illustrated in FIG. 9.
  • one bit is allocated to indicate whether a BT division is selected, and in the case where the BT division is selected, a type of BT division (i.e., triangle division or rectangular division is selected).
  • One bit and one bit for indicating a division direction are additionally allocated, thus representing a BT partition shape for a given block with a total of three bits.
  • the first bin of the BT split flag indicates whether the block is BT split
  • the second bin indicates the type of BT split (ie, rectangular or triangular split)
  • the third bin indicates the division direction of the BT division (ie, the direction of the rectangular division or the direction of the triangular division).
  • FIG. 11A is a conceptual diagram of an exemplary QTBT splitting structure according to an embodiment of the present invention
  • FIG. 11B is a tree structure illustrating the QTBT splitting structure of FIG. 11A.
  • black circles indicate leaf nodes of the QTBT splitting structure
  • white circles indicate nodes that are QT splitting or BT splitting.
  • the bits indicated in each node mean the QT partition flag and the BT partition flag based on Tables 1 and 2.
  • the underlined bits are QT split flags and the remaining bits are BT split flags.
  • the bit nodes “0” are not assigned to child nodes of nodes to which “ 110 ” and “ 111 ” are assigned italics.
  • the triangular block corresponds to a leaf node that is no longer split, so once a given node is triangulated, there is no need to signal that it is no longer BT split for its child nodes.
  • the child node may have a shape in which the triangle block, which is the parent node, is bisected into triangles again.
  • the partition flag may be displayed as "0" if the partition flag is not divided and "1" if the partition flag is partitioned.
  • partitions of the concave-convex shape illustrated in FIG. 4 are used for BT partitioning. Uneven partitions are divided into four types according to their division direction (that is, according to the relative position of the block in the shape of the block in the shape of the block).
  • FIG. 12 is a tree representation of an example of a bit allocation method for the uneven partition illustrated in FIG. 4.
  • one bit is allocated to indicate whether a BT division is selected, and two bits are additionally allocated to indicate which uneven division is selected when the BT division is selected.
  • the bits allocated to the respective partition patterns are summarized in Table 3 below.
  • the first bin of the BT split flag indicates whether the block is BT split, and the second bin and the third bin indicate which uneven split is applied.
  • the divided blocks are no longer BT divided. Therefore, it is not necessary to signal the BT split flag for child nodes of the BT split node.
  • the technique proposed in this embodiment uses the rectangular division illustrated in FIGS. 9A and 9B for BT division in the QTBT division structure of the CTU for determining a coding unit (CU), and uses a PU (Prediction Unit).
  • the triangular PU may be described as a partition mode for prediction of a corresponding CU.
  • FIG. 13 is a diagram representing an example of a bit allocation method for BT division in which rectangular divisions are allowed.
  • one bit is allocated to indicate whether the BT division is selected, and in the case where the BT division is selected, one bit for additionally indicating the direction of the BT division (ie, the direction of the rectangular division) is additionally allocated. do. Therefore, it is possible to express the BT partition shape for a given block with 2 bits in total.
  • a summary of the bits allocated to each BT partitions is shown in Table 4. As shown in Table 4, the first bin of the BT split flag indicates whether the block is BT split, and the second bin indicates the split direction of the BT split (ie, the direction of the rectangular split).
  • FIG. 14A is a conceptual diagram of an exemplary CU partition and a PU partition according to an embodiment of the present invention
  • FIG. 14B illustrates the CU partition of FIG. 14A in a tree structure.
  • solid lines represent CU divisions of the QTBT division structure
  • dotted lines represent PU divisions.
  • black circles indicate leaf nodes of the QTBT splitting structure
  • white circles indicate nodes that are QT splitting or BT splitting.
  • the bits indicated in each node mean the QT partition flag based on Table 1 and the BT partition flags based on Table 4.
  • the image encoding apparatus should signal PU partition information (or mode type) for the corresponding CU.
  • Mode type signaling is performed for all CUs corresponding to the leaf nodes of FIG. 14B.
  • Information on the mode type for one CU may be displayed as shown in Table 5.
  • 15 is a flowchart illustrating an exemplary operation of encoding an image by the image encoding device.
  • the image encoding apparatus determines a QTBT splitting structure for encoding a block of image data (S1510).
  • the QTBT block partitioning structure is a structure in which a binary tree is rooted from a leaf node of a quadtree.
  • the binary tree is defined by a plurality of partition types that split a parent node into two child nodes.
  • the division types may include a triangular division type and a rectangular division type.
  • nodes that are split into triangular split types are no longer split.
  • nodes that are split into rectangular partition types are again allowed to split into two child nodes.
  • the leaf nodes of the quadtree are allowed to be split into two child nodes, where the two child nodes may be j-shaped blocks and j-shaped blocks. In this case, the child nodes may no longer be divided.
  • the image encoding apparatus generates an encoded bitstream including the block of the image data and the segmentation information representing the determined QTBT segmentation structure based on the determined QTBT segmentation structure (S1520).
  • 16 is a flowchart illustrating an exemplary operation of decoding an image by the image decoding device.
  • the image decoding apparatus receives a bitstream including a block of encoded image data and segmentation information related to the block of the image data (S1610).
  • the image decoding apparatus determines the QTBT segmentation structure for the block of the image data by using the segmentation information (S1620).
  • the QTBT splitting structure is a structure in which a binary tree is rooted from a leaf node of a quadtree.
  • the binary tree is defined by a plurality of partition types that split a parent node into two child nodes.
  • the division types may include a triangular division type and a rectangular division type.
  • nodes that are split into triangular split types are no longer split.
  • nodes that are split into rectangular partition types are again allowed to split into two child nodes.
  • the leaf nodes of the quadtree are allowed to be split into two child nodes, where the two child nodes may be j-shaped blocks and j-shaped blocks. In this case, the child nodes may no longer be divided.
  • the image decoding apparatus decodes the block of the encoded image data for each leaf node of the QTBT (S1630).
  • 17 is a flowchart illustrating another exemplary operation of decoding an image by the image decoding device.
  • the image decoding apparatus receives a bitstream including a coding tree unit (CTU) of encoded image data and segmentation information related to the CTU of the image data (S1710).
  • CTU coding tree unit
  • the image decoding apparatus determines the QTBT segmentation structure for the CTU by using the segmentation information (S1720).
  • the QTBT splitting structure is a structure in which a binary tree is rooted from a leaf node of a quadtree. In the binary tree, a given block is divided into two rectangles of the same size. Nodes split into a rectangular partition type are allowed to split into two child nodes again. Thus, leaf nodes (ie CUs) of QTBT may be square or rectangular in shape.
  • the image decoding apparatus determines the prediction partition mode for each leaf node of the QTBT by using the split information (S1730).
  • the prediction partition mode allows the leaf nodes of the QTBT to be divided and predicted into two triangles of the same size.
  • the PU may be square, rectangular or triangular in shape.
  • the image decoding apparatus decodes the block of the encoded image data according to the prediction partition mode for each leaf node of the QTBT (S1740).

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

The present invention suggests a QTBT division structure, which allows blocks having various shapes and can reflect local characteristics of various images more efficiently, and a method for efficiently signaling the division structure. In order to reflect given characteristics of an image, the present invention includes a triangular block division shape, a rectangular block division shape, and a block division shape having concave-convex parts.

Description

영상 부호화 또는 복호화하기 위한 장치 및 방법Apparatus and method for image encoding or decoding
본 발명은 영상을 효율적으로 부호화하기 위한 영상 부호화 또는 복호화에 관한 것이다. 보다 상세하게는, 다양한 영상의 특성들을 보다 적극적으로 고려할 수 있는 블록 분할 방식과, 그 분할 정보를 분할 정보를 시그널링하는 기법에 관한 것이다.The present invention relates to image encoding or decoding for efficiently encoding an image. More specifically, the present invention relates to a block partitioning scheme capable of taking into account the characteristics of various images more actively, and a technique of signaling the partitioning information with the partitioning information.
이 부분에 기술된 내용은 단순히 본 실시예에 대한 배경 정보를 제공할 뿐 종래 기술을 구성하는 것은 아니다. The contents described in this section merely provide background information on the present embodiment and do not constitute a prior art.
도 1은 CTU에 대한 예시적인 쿼드트리 블록 구조의 개념도이다. HEVC(High Efficiency Video Coding) 표준에 따르면, CTU(Coding Tree Unit)은, 영상 내 다양한 로컬 특성을 반영하기 위해 코딩 트리로 쿼드트리(quadtree) 구조를 이용하여, CU(Coding Unit)로 나뉜다. 도 1에 예시된 것처럼, 최대 크기가 64x64인 CTU를 최소 4x4까지 쿼드트리 방식으로 반복적으로 사등분 하면서 코딩 효율이 가장 좋은 CU가 선택된다. 각각의 CU는 다시 PU(Prediction Unit)으로 나뉘며, PU가 결정이 되고 예측 과정이 진행된 후, CU는 잔차 블록(residual block)에 대해 TU(Transformation Unit)으로 나뉜다. 도 1에는 점선에 의해 나뉘어진 직사각형 모양의 PU가 예시되어 있다.1 is a conceptual diagram of an exemplary quadtree block structure for a CTU. According to the HEVC (High Efficiency Video Coding) standard, a coding tree unit (CTU) is divided into a coding unit (CU) using a quadtree structure as a coding tree to reflect various local characteristics in an image. As illustrated in FIG. 1, a CU having the best coding efficiency is selected while repeatedly dividing a CTU having a maximum size of 64x64 in a quadtree manner to at least 4x4. Each CU is further divided into a PU (Prediction Unit). After the PU is determined and the prediction process is performed, the CU is divided into a TU (Transformation Unit) for the residual block. 1 illustrates a rectangular PU divided by a dotted line.
최근에 QTBT(Quadtree plus Binary tree) 구조가 새롭게 논의되고 있으며, 기존의 CU, PU, 및 TU 개념을 제거하면서도 영상 데이터의 다양한 로컬 특성을 반영하기 위한 시도들이 이루어지고 있다. Recently, a quadtree plus binary tree (QTBT) structure has been newly discussed, and attempts have been made to reflect various local characteristics of image data while removing existing CU, PU, and TU concepts.
본 발명은 다양한 영상의 로컬 특성을 보다 효율적으로 반영할 수 있는 다양한 모양의 블록을 허용하는 QTBT 분할 구조와 그 분할 구조를 효율적으로 시그널링하는 방법을 제공하는 데 그 목적이 있다.An object of the present invention is to provide a QTBT partitioning structure that allows various shapes of blocks that can more efficiently reflect local characteristics of various images, and a method for efficiently signaling the partitioning structure.
본 발명의 일 측면에 따르면, 부호화된 영상 데이터의 블록 및 상기 영상 데이터의 블록에 관련된 분할 정보를 포함하는 비트스트림을 수신하는 단계; 및 상기 분할 정보를 이용하여, 상기 영상 데이터의 블록에 대한 QTBT(QuadTree plus BinaryTree) 분할 구조를 결정하는 단계를 포함하는 영상 데이터를 복호화하는 방법을 제공하다. 여기서 상기 QTBT 분할 구조는 쿼드트리의 리프 노드(leaf node)로부터 바이너리트리가 루트된(rooted) 구조이며, 상기 바이너리트리는 부모 노드를 2개의 자식 노드로 분할하는 분할 타입들에 의해 정의되며, 상기 분할 타입들은 삼각형 분할 타입과 직사각형 분할 타입을 포함한다. 상기 방법은 상기 QTBT의 각 리프 노드별로 상기 부호화된 영상 데이터의 블록을 복호화하는 단계를 더 포함한다. 상기 바이너리트리에서, 삼각형 분할 타입으로 분할되는 부모 노드의 자식 노드들은 더 이상 분할되지 않는데 반해, 직사각형 분할 타입으로 분할되는 부모 노드의 자식 노드들은 재차 2개의 자식 노드로 분할되는 것이 허용된다. According to an aspect of the present invention, there is provided a method comprising: receiving a bitstream including a block of encoded image data and segmentation information related to the block of the image data; And determining a QuadTree plus BinaryTree (QTBT) partitioning structure for the block of the image data by using the partitioning information. Herein, the QTBT partition structure is a structure in which a binary tree is rooted from a leaf node of a quadtree, and the binary tree is defined by partition types for splitting a parent node into two child nodes. Types include triangular partition type and rectangular partition type. The method further includes decoding the block of the encoded image data for each leaf node of the QTBT. In the binary tree, child nodes of a parent node divided into a triangular partition type are no longer split, whereas child nodes of a parent node partitioned into a rectangular partition type are allowed to be split into two child nodes again.
본 발명의 다른 측면에 따르면, 메모리 및 전술한 방법을 수행하도록 구성된 하나 이상의 프로세서들을 포함하는 영상 데이터를 복호화하는 장치를 제공한다. 즉, 하나 이상의 프로세서들은 부호화된 영상 데이터의 블록 및 상기 영상 데이터의 블록에 관련된 분할 정보를 포함하는 비트스트림을 수신하는 단계; 상기 분할 정보를 이용하여, 상기 영상 데이터의 블록에 대한 QTBT(QuadTree plus BinaryTree) 분할 구조를 결정하는 단계; 및 상기 QTBT의 각 리프 노드별로 상기 부호화된 영상 데이터의 블록을 복호화하는 단계를 수행하도록 구성된다.According to another aspect of the present invention, there is provided an apparatus for decoding image data including a memory and one or more processors configured to perform the aforementioned method. That is, the one or more processors may include receiving a bitstream including a block of encoded image data and segmentation information related to the block of image data; Determining a QuadTree plus BinaryTree (QTBT) partition structure for the block of the image data by using the split information; And decoding the block of the encoded image data for each leaf node of the QTBT.
본 발명의 또 다른 측면에 따르면, 부호화된 영상 데이터의 블록 및 상기 영상 데이터의 블록에 관련된 분할 정보를 포함하는 비트스트림을 수신하는 단계; 및 상기 분할 정보를 이용하여, 상기 영상 데이터의 블록에 대한 QTBT 분할 구조를 결정하는 단계; 및 상기 QTBT의 각 리프 노드별로 상기 부호화된 영상 데이터의 블록을 복호화하는 단계를 포함하는 영상 복호화 방법을 제공한다. 여기서 상기 QTBT 분할 구조는 쿼드트리의 리프 노드(leaf node)로부터 바이너리트리가 루트된(rooted) 구조이며, 상기 쿼드트리의 리프 노드는 2개의 자식 노드로 분할되는 것이 허용되며, 상기 2개의 자식 노드는 凹 모양의 블록과 凸 모양의 블록이다. According to still another aspect of the present invention, there is provided a method including: receiving a bitstream including a block of encoded image data and segmentation information related to the block of the image data; And determining the QTBT segmentation structure for the block of the image data by using the segmentation information. And decoding the block of the encoded image data for each leaf node of the QTBT. Here, the QTBT splitting structure is a structure in which a binary tree is rooted from a leaf node of a quadtree, and leaf nodes of the quadtree are allowed to be divided into two child nodes, and the two child nodes. Are 凹 shaped blocks and 凸 shaped blocks.
본 발명의 또 다른 측면에 따르면, 부호화된 영상 데이터의 CTU(coding tree unit) 및 상기 영상 데이터의 CTU에 관련된 분할 정보를 포함하는 비트스트림을 수신하는 단계; 상기 분할 정보를 이용하여, 상기 CTU에 대한 QTBT 분할 구조를 결정하는 단계; 상기 분할 정보를 이용하여, 상기 QTBT의 각 리프 노드마다 예측 파티션 모드를 결정하는 단계; 및 상기 QTBT의 각 리프 노드에 대한 예측 파티션 모드에 따라 상기 부호화된 영상 데이터의 블록을 복호화하는 단계를 포함하는 영상 복호화 방법을 제공한다. 상기 QTBT의 바이너리트리에서, 주어진 블록은 동일한 크기의 2개의 직사각형으로 분할될 수 있다. 상기 예측 파티션 모드는 상기 QTBT의 리프 노드가 동일한 크기의 2개의 삼각형으로 분할되어 예측되는 것을 허용한다.According to another aspect of the invention, receiving a bitstream including a coding tree unit (CTU) of the encoded image data and segmentation information related to the CTU of the image data; Determining a QTBT splitting structure for the CTU using the splitting information; Determining a prediction partition mode for each leaf node of the QTBT using the partitioning information; And decoding the block of the encoded image data according to a prediction partition mode for each leaf node of the QTBT. In the binary tree of the QTBT, a given block can be divided into two rectangles of the same size. The prediction partition mode allows the leaf nodes of the QTBT to be divided and predicted into two triangles of the same size.
도 1은 CTU에 대한 예시적인 쿼드트리 블록 구조의 개념도이다. 1 is a conceptual diagram of an exemplary quadtree block structure for a CTU.
도 2는 정사각형들로 분할된 형태(a)와 정사각형들 및 삼각형들의 조합으로 분할된 분할 형태(b)를 예시한 도면이다. 2 is a diagram illustrating a form (a) divided into squares and a divided form (b) divided into a combination of squares and triangles.
도 3a 및 도 3b는 삼각형 모양의 블록 분할 형태들을 예시한 도면이다. 3A and 3B illustrate triangular block division shapes.
도 4는 요철 모양의 블록 분할 형태를 보인 도면이다. 4 is a view showing a block division form of irregularities.
도 5는 본 개시의 기술들이 사용될 수 있는 예시적인 영상 부호화 장치의 블록도이다.5 is a block diagram of an example video encoding apparatus in which the techniques of this disclosure may be used.
도 6은 복수의 인트라 예측 모드에 대한 예시를 나타낸다. 6 shows an example of a plurality of intra prediction modes.
도 7는 현재 블록의 주변블록에 대한 예시도이다.7 is an exemplary diagram of neighboring blocks of a current block.
도 8는 본 개시의 기술들이 사용될 수 있는 예시적인 영상 복호화 장치의 블록도이다.8 is a block diagram of an example video decoding apparatus in which the techniques of this disclosure may be used.
도 9는 본 발명의 일 실시예에 따른, BT 분할에서 허용되는 분할 파티션들의 개념도이다.9 is a conceptual diagram of partition partitions allowed in BT partitioning according to an embodiment of the present invention.
도 10은 도 9에 예시된 4가지 BT 분할에 대한 비트 할당 방법의 일 예를 트리로 표현한 도면이다.FIG. 10 is a tree representation of an example of a bit allocation method for four BT divisions illustrated in FIG. 9.
도 11a는 본 발명의 일 실시예에 따른, 예시적인 QTBT 분할 구조의 개념도이고, 도 11b는 도 11a의 QTBT 분할 구조를 트리 구조로 나타낸 도면이다. FIG. 11A is a conceptual diagram of an exemplary QTBT splitting structure according to an embodiment of the present invention, and FIG. 11B is a tree structure illustrating the QTBT splitting structure of FIG. 11A.
도 12는 도 4에 예시된 요철 모양의 파티션에 대한 비트 할당 방법의 일 예를 트리로 표현한 도면이다. FIG. 12 is a tree representation of an example of a bit allocation method for the uneven partition illustrated in FIG. 4.
도 13은 직사각형 분할들이 허용되는 BT 분할에 대한 비트 할당 방법의 일 예를 트리로 표현한 도면이다. FIG. 13 is a diagram representing an example of a bit allocation method for BT division in which rectangular divisions are allowed.
도 14a는 본 발명의 일 실시예에 따른 예시적인 CU 파티션과 PU 파티션의 개념도이며, 도 14b는 도 14a의 CU 파티션을 트리 구조로 나타낸 것이다.14A is a conceptual diagram of an exemplary CU partition and a PU partition according to an embodiment of the present invention, and FIG. 14B illustrates the CU partition of FIG. 14A in a tree structure.
도 15은 영상 부호화 장치가 영상을 부호화하는 예시적인 동작을 도시한 흐름도이다. 15 is a flowchart illustrating an exemplary operation of encoding an image by the image encoding device.
도 16은 영상 복호화 장치가 영상을 복호화하는 예시적인 동작을 도시한 흐름도이다. 16 is a flowchart illustrating an exemplary operation of decoding an image by the image decoding device.
도 17은 영상 복호화 장치가 영상을 복호화하는 다른 예시적인 동작을 도시한 흐름도이다.17 is a flowchart illustrating another exemplary operation of decoding an image by the image decoding device.
이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성 요소들에 식별 부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.Hereinafter, some embodiments of the present invention will be described in detail through exemplary drawings. In adding an identification code to the components of each drawing, it should be noted that the same components as possible, even if shown on different drawings have the same reference numerals. In addition, in describing the present invention, when it is determined that the detailed description of the related well-known configuration or function may obscure the gist of the present invention, the detailed description thereof will be omitted.
도 2는 정사각형들로 분할된 형태(a)와 정사각형들 및 삼각형들의 조합으로 분할된 분할 형태(b)를 예시한 도면이다. 도 2의 (a)와 같이, 기존의 쿼드트리 분할 방식의 경우에도 다양한 크기의 정사각형들로 분할함으로써 영상의 주어진 특성(즉, 객체의 위치, 크기, 및 형태)을 어느 정도 반영할 수 있다. 그러나, 도 2의 (b)에 예시된 것처럼, 정사각형들과 삼각형들의 조합으로 분할된 형태가, 도 2의 (a)에 비해, 영상의 주어진 특성을 보다 효율적으로 반영할 수 있음(결과적으로 부호화 과정에 유리할 수 있음)에 주목한다. 2 is a diagram illustrating a form (a) divided into squares and a divided form (b) divided into a combination of squares and triangles. As shown in (a) of FIG. 2, even in the conventional quadtree partitioning scheme, by dividing into squares of various sizes, a given characteristic (that is, the position, size, and shape of an object) of the image may be reflected to some extent. However, as illustrated in (b) of FIG. 2, a form divided into a combination of squares and triangles may more efficiently reflect a given characteristic of an image than (a) of FIG. May be advantageous to the process).
도 3a 및 도 3b는 삼각형 모양의 블록 분할 형태들을 예시한 도면이다. 도 3a에는 정사각형 블록이 균등한 크기의 2개의 삼각형들로 분할되는 형태가 예시되어 있으며, 도 3b에는 직사각형 블록이 균등한 크기의 2개의 삼각형들로 분할되는 형태가 예시되어 있다. 제안하는 삼각형 모양 블록은, 도 2의 (b)의 예시와 같이, 사각형 내에 대각선 에지(edge)가 존재할 때 유용할 것이다. 즉, 유사한 텍스쳐(texture)를 가진 삼각형 영역을 하나의 블록으로 설정할 수 있게 되어 부호화 효율성이 높아질 것이다.3A and 3B illustrate triangular block division shapes. 3A illustrates a form in which a square block is divided into two triangles of equal size, and FIG. 3B illustrates a form in which a rectangular block is divided into two triangles of equal size. The proposed triangular block may be useful when there are diagonal edges in the rectangle, as in the example of FIG. In other words, it is possible to set a triangular region having a similar texture as one block, thereby increasing coding efficiency.
도 4는 요철 모양의 블록 분할 형태를 보인 도면이다. 도 4에는 정사각형의 블록을 요철 모양으로 분할한 네 가지 형태가 도시되어 있다. 도 4에 예시된 형태들은 凹 모양의 블록에 대한 凸 모양의 블록의 상대적인 위치에 따라 구분된다. 이러한 요철 모양의 블록들과 사각형들의 조합으로 영상을 분할한다면, 영상의 주어진 특성을 보다 효율적으로 반영할 수 있을 것이다. 4 is a view showing a block division form of irregularities. 4 shows four shapes in which a square block is divided into irregular shapes. The shapes illustrated in FIG. 4 are distinguished according to the relative position of the block shaped block with respect to the block shaped block. If the image is divided into such a combination of uneven blocks and squares, the given characteristic of the image may be more efficiently reflected.
본 개시는, 일반적으로, 영상의 특성들을 보다 적극적으로 고려할 수 있는 블록 분할 방식과, 그 분할 정보를 시그널링하는 기법에 관한 것이다. 본 개시의 기술들은 영상 코딩에서 정사각형이나 직사각형 외에 다양한 모양의 블록 파티션을 사용할 수 있는 더 유연한 접근법을 허용하며, 그로 인해, 코딩 압축 및/또는 영상 품질을 향상시키기 위한 추가적인 기회들을 제공한다.The present disclosure generally relates to a block partitioning scheme that can more actively consider characteristics of an image, and a technique of signaling the partitioning information. The techniques of this disclosure allow for a more flexible approach to use block partitions of various shapes in addition to square or rectangle in video encoding, thereby providing additional opportunities for improving encoding and / or image quality.
도 5는 본 개시의 기술들이 사용될 수 있는 예시적인 영상 부호화 장치의 블록도이다.5 is a block diagram of an example video encoding apparatus in which the techniques of this disclosure may be used.
영상 부호화 장치는 블록 분할부(510), 예측부(520), 감산기(530), 변환부(540), 양자화부(545), 부호화부(550), 역양자화부(560), 역변환부(565), 가산기(570), 필터부(580) 및 메모리(590)를 포함한다. 영상 부호화 장치는 각 구성요소는 하드웨어 칩으로 구현될 수 있으며, 또는 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.The image encoding apparatus includes a block splitter 510, a predictor 520, a subtractor 530, a transformer 540, a quantizer 545, an encoder 550, an inverse quantizer 560, and an inverse transform unit ( 565, an adder 570, a filter unit 580, and a memory 590. In the image encoding apparatus, each component may be implemented as a hardware chip, or may be implemented in software and implemented so that the microprocessor executes a function of software corresponding to each component.
블록 분할부(510)는 영상을 구성하는 각 픽처(picture)를 복수의 CTU(Coding Tree Unit)으로 분할한 이후에, CTU를 트리 구조(tree structure)를 이용하여 반복적으로(recursively) 분할한다. 트리 구조에서의 리프 노드(leaf node)가 부호화의 기본 단위인 CU (coding unit)가 된다. 트리 구조로는 상위 노드(혹은 부모 노드)가 동일한 크기의 네 개의 하위 노드(혹은 자식 노드)로 분할되는 쿼드트리(QuadTree, QT), 또는 이러한 QT 구조 및 상위 노드가 두 개의 하위 노드로 분할되는 바이너리트리(BinaryTree, BT) 구조를 혼용한 QTBT (QuadTree plus BinaryTree) 구조가 사용될 수 있다. 즉, CTU를 다수의 CU로 분할하기 위해 QTBT를 사용할 수 있다.After dividing each picture constituting an image into a plurality of coding tree units (CTUs), the block dividing unit 510 recursively divides the CTUs using a tree structure. A leaf node in the tree structure becomes a CU (coding unit) which is a basic unit of coding. The tree structure is a quadtree (QT) in which a parent node (or parent node) is divided into four child nodes (or child nodes) of the same size, or such a QT structure and a parent node are divided into two child nodes. A QTBT (QuadTree plus BinaryTree) structure that uses a binary tree structure may be used. That is, QTBT may be used to divide a CTU into a plurality of CUs.
QTBT (QuadTree plus BinaryTree) 구조에서, CTU는 먼저 QT 구조로 분할될 수 있다. 쿼드트리 분할은 분할 블록(splitting block)의 크기가 QT에서 허용되는 리프 노드의 최소 블록 크기(MinQTSize)에 도달 할 때까지 반복 될 수 있다. 쿼드트리의 리프 노드가 BT에서 허용되는 루트 노드의 최대 블록 크기(MaxBTSize)보다 크지 크지 않은 경우, BT 구조로 더 파티셔닝될 수 있다. BT에서는 복수의 분할 타입이 존재할 수 있다. 예컨대, 일부 예시에서, 해당 노드의 블록을 동일 크기의 두 개 직사각형으로 분할하는 직사각형 분할 타입이 사용될 수 있다. 다른 일부 예시에서, 동일 크기의 두 개 삼각형으로 분할하는 삼각형 분할 타입이 BT 분할에 추가로 사용될 수 있다. 또 다른 예시에서, 주어진 블록을 凹 모양의 블록과 凸 모양의 블록으로 분할하는 요철 분할 타입이 사용될 수 있다. 직사각형 분할 타입에는 분할 방향에 따라 수평(horizontal) 분할 형태와 수직(vertical) 분할 형태가 존재할 수 있다. 삼각형 분할 타입에는 분할 방향에 따라 우하향(down-right) 분할 형태와 우상향(up-right) 분할 형태가 존재할 수 있다. 요철 분할 타입은 도 4에 예시된 바와 같이, 분할 방향에 따라 (즉, 凹 모양의 블록과 凸 모양의 블록의 상대적인 위치에 따라) 4개의 분할 형태가 존재할 수 있다.In a QTBT (QuadTree plus BinaryTree) structure, the CTU may be first divided into a QT structure. Quadtree splitting may be repeated until the size of the splitting block reaches the minimum block size (MinQTSize) of the leaf nodes allowed in QT. If the leaf node of the quadtree is not larger than the maximum block size (MaxBTSize) of the root node allowed in BT, it may be further partitioned into the BT structure. In BT, there may be a plurality of partition types. For example, in some examples, a rectangular division type may be used that divides a block of nodes into two rectangles of the same size. In some other examples, a triangular split type that splits into two triangles of the same size may be used in addition to the BT split. In another example, a concave-convex type of dividing a given block into a j-shaped block and a j-shaped block may be used. In the rectangular division type, there may be a horizontal division form and a vertical division form according to the division direction. In the triangular division type, there may be a down-right division form and an up-right division form according to the division direction. As shown in FIG. 4, the uneven division type may have four division forms according to the division direction (that is, according to the relative positions of the U-shaped block and the U-shaped block).
블록 분할부(510)가 QTBT 구조에 의해 CTU를 분할하여 생성하는 분할 정보는 부호화부(550)에 의해 부호화되어 영상 복호화 장치로 전달된다. The partition information generated by the block divider 510 by dividing the CTU by the QTBT structure is encoded by the encoder 550 and transmitted to the image decoding apparatus.
이하에서는, 부호화 또는 복호화하고자 하는 CU(즉, QTBT의 리프 노드)에 해당하는 블록을 '현재 블록'이라 칭한다.Hereinafter, a block corresponding to a CU (that is, a leaf node of QTBT) to be encoded or decoded is called a 'current block'.
예측부(520)는 현재 블록을 예측하여 예측블록을 생성한다. 예측부(520)는 인트라 예측부(522)와 인터 예측부(524)를 포함한다. The prediction unit 520 generates a prediction block by predicting the current block. The predictor 520 includes an intra predictor 522 and an inter predictor 524.
인트라 예측부(522)는 현재 블록이 포함된 현재 픽처 내에서 현재 블록의 주변에 위치한 픽셀(참조 픽셀)들을 이용하여 현재 블록 내의 픽셀들을 예측한다. 예측 방향에 따라 복수의 인트라 예측모드가 존재하며, 각 예측모드에 따라 사용할 주변 픽셀과 연산식이 다르게 정의된다. 특히, 인트라 예측부(522)는 현재 블록을 부호화하는데 사용할 인트라 예측 모드를 결정할 수 있다. 일부 예들에서, 인트라 예측부(522)는 여러 인트라 예측 모드들을 사용하여 현재 블록을 인코딩하고, 테스트된 모드들로부터 사용할 적절한 인트라 예측 모드를 선택할 수도 있다. 예를 들어, 인트라 예측부(522)는 여러 테스트된 인트라 예측 모드들에 대한 레이트 왜곡(rate-distortion) 분석을 사용하여 레이트 왜곡 값들을 계산하고, 테스트된 모드들 중 최선의 레이트 왜곡 특징들을 갖는 인트라 예측 모드를 선택할 수도 있다. The intra predictor 522 predicts pixels in the current block by using pixels (reference pixels) positioned around the current block in the current picture including the current block. There are a plurality of intra prediction modes according to the prediction direction, and the peripheral pixels to be used and the equations are defined differently according to each prediction mode. In particular, the intra predictor 522 may determine an intra prediction mode to use to encode the current block. In some examples, intra prediction unit 522 may encode the current block using several intra prediction modes and select an appropriate intra prediction mode to use from the tested modes. For example, intra predictor 522 calculates rate distortion values using rate-distortion analysis for several tested intra prediction modes, and has the best rate distortion characteristics among the tested modes. Intra prediction mode may be selected.
도 6은 복수의 인트라 예측 모드에 대한 예시를 나타낸다. 6 shows an example of a plurality of intra prediction modes.
도 6에서 보는 바와 같이, 복수의 인트라 예측 모드는 2개의 비방향성 모드(planar 모드 및 DC 모드)와 65개의 방향성 모드를 포함할 수 있다.As shown in FIG. 6, the plurality of intra prediction modes may include two non-directional modes (planar mode and DC mode) and 65 directional modes.
인트라 예측부(522)는 복수의 인트라 예측 모드 중에서 하나의 인트라 예측 모드를 선택하고, 선택된 인트라 예측 모드에 따라 결정되는 주변 픽셀(참조 픽셀)과 연산식을 사용하여 현재 블록을 예측한다. 선택된 인트라 예측 모드에 대한 정보는 부호화부(550)에 의해 부호화되어 영상 복호화 장치로 전달된다.The intra predictor 522 selects one intra prediction mode from among the plurality of intra prediction modes, and predicts the current block by using a neighboring pixel (reference pixel) and an operation formula determined according to the selected intra prediction mode. Information on the selected intra prediction mode is encoded by the encoder 550 and transmitted to the image decoding apparatus.
한편, 인트라 예측부(522)는, 복수의 인트라 예측 모드 중 어느 모드가 현재 블록의 인트라 예측 모드로 사용되었는지를 지시하는 인트라 예측 모드 정보를 효율적으로 부호화하기 위해, 복수의 인트라 예측 모드 중 현재 블록의 인트라 예측 모드로서 가능성이 높은 일부의 모드를 MPM(most probable mode)으로 결정할 수 있다. 그리고, 현재 블록의 인트라 예측 모드가 MPM 중에서 선택되는지 여부를 지시하는 모드 정보를 생성하여 부호화부(550)로 전달한다. 일반적으로, 현재 블록의 인트라 예측 모드가 MPM 중에서 선택되는 경우, MPM 중 어느 모드가 현재 블록의 인트라 예측 모드로 선택되었는지를 지시하기 위한 제1 인트라 식별정보를 부호화부로 전달한다. 반면 현재 블록의 인트라 예측 모드가 MPM 중에서 선택되지 않은 경우, MPM이 아닌 나머지 모드들 중 어느 모드가 현재 블록의 인트라 예측 모드로 선택되었는지를 지시하기 위한 제2 인트라 식별정보를 부호화부로 전달한다. 대안적으로, 본 발명의 일 측면에 따른 인트라 예측부(522)는 MPM들 및/또는 non-MPM들 중에서 어느 모드가 현재 블록을 예측하기 위한 인트라 예측 모드로 선택되었는지를 명시적으로 시그널링하는 대신에, MPM들 및/또는 non-MPM들을 그룹화하고, 현재 블록을 예측하기 위한 인트라 모드가 속하는 그룹의 인덱스를 시그널링할 수 있다.Meanwhile, the intra predictor 522 may efficiently encode intra prediction mode information indicating which mode of the plurality of intra prediction modes is used as the intra prediction mode of the current block. Some of the most probable modes as the intra prediction mode of may be determined as the most probable mode (MPM). In addition, mode information indicating whether the intra prediction mode of the current block is selected from the MPM is generated and transmitted to the encoder 550. In general, when the intra prediction mode of the current block is selected from the MPMs, the first intra identification information for indicating which mode of the MPMs is selected as the intra prediction mode of the current block is transmitted to the encoder. On the other hand, if the intra prediction mode of the current block is not selected from the MPM, the second intra identification information for indicating which mode other than the MPM is selected as the intra prediction mode of the current block is transmitted to the encoder. Alternatively, the intra prediction unit 522 according to an aspect of the present invention instead of explicitly signaling which mode among the MPMs and / or non-MPMs is selected as the intra prediction mode for predicting the current block. Can group the MPMs and / or non-MPMs and signal the index of the group to which the intra mode for predicting the current block belongs.
이하에서는, MPM 리스트를 구성하는 방법을 설명한다. 여기서는, 6개의 MPM으로 MPM 리스트를 구성하는 것을 예로 설명하나, 본 발명이 이에 한정되는 것은 아니며 MPM 리스트에 포함되는 MPM의 개수는 3개 내지 10개의 범위 내에서 선택될 수 있다.Hereinafter, a method of constructing the MPM list will be described. Herein, an example of configuring an MPM list with six MPMs is described as an example. However, the present invention is not limited thereto, and the number of MPMs included in the MPM list may be selected within a range of 3 to 10.
먼저, 현재 블록의 주변블록들의 인트라 예측 모드를 이용하여 MPM 리스트를 구성한다. 주변블록은, 예컨대 도 7에 도시된 바와 같이, 현재 블록의 좌측블록(L), 상단블록(A), 좌하단블록(BL), 우상단블록(AR), 좌상단블록(AL) 중에서 전부 또는 일부를 포함할 수 있다. First, the MPM list is constructed using the intra prediction mode of neighboring blocks of the current block. The neighboring block may be, for example, all or some of the left block L, the upper block A, the lower left block BL, the upper right block AR, and the upper left block AL of the current block. It may include.
이 주변블록들의 인트라 예측 모드가 MPM 리스트에 포함된다. 여기서, 좌측블록(L), 상단블록(A), 좌하단블록(BL), 우상단블록(AR), 좌상단블록(AL)의 순서로 유효한 블록의 인트라 예측모드가 MPM 리스트에 포함되고, 이 주변블록들의 인트라 예측 모드들에 planar 모드 및 DC 모드를 추가하여 후보를 구성한다. 또는, 좌측블록(L), 상단블록(A), planar 모드, DC 모드, 좌하단블록(BL), 우상단블록(AR), 좌상단블록(AL)의 순으로 유효한 모드가 MPM 리스트에 추가될 수도 있다. 또는, 좌측블록(L), 상단블록(A), planar 모드, 좌하단블록(BL), 우상단블록(AR), 좌상단블록(AL), DC 모드의 순으로 유효한 모드가 MPM 리스트에 추가될 수도 있다.The intra prediction mode of these neighboring blocks is included in the MPM list. In this case, the intra prediction mode of the valid blocks in the order of the left block (L), the top block (A), the bottom left block (BL), the top right block (AR), and the top left block (AL) is included in the MPM list, The candidate is configured by adding a planar mode and a DC mode to the intra prediction modes of the blocks. Alternatively, valid modes in the order of the left block (L), the top block (A), the planar mode, the DC mode, the bottom left block (BL), the top right block (AR), and the top left block (AL) may be added to the MPM list. have. Alternatively, valid modes in the order of the left block (L), the top block (A), the planar mode, the bottom left block (BL), the top right block (AR), the top left block (AL), and the DC mode may be added to the MPM list. have.
MPM 리스트에는 서로 다른 인트라 예측 모드만이 포함된다. 즉, 중복된 모드(duplicated mode)가 존재하는 경우 그 중 하나의 모드만이 MPM 리스트에 포함된다.The MPM list includes only different intra prediction modes. That is, when a duplicated mode is present, only one of them is included in the MPM list.
만약, 리스트 내의 MPM의 개수가 기결정된 개수(예컨대, 6)보다 작은 경우에는, 리스트 내의 방향성 모드들에 -1 또는 +1을 가산하여 MPM을 유도할 수도 있다. 또한, 리스트 내의 MPM의 개수가 기결정된 개수보다 작은 경우에는, 수직 모드(vertical mode), 수직 모드(horizontal mode), 대각선 모드(diagonal mode) 등의 순서로 부족한 개수 만큼의 모드를 MPM 리스트에 추가할 수도 있다.If the number of MPMs in the list is smaller than the predetermined number (eg, 6), the MPM may be derived by adding -1 or +1 to the directional modes in the list. In addition, when the number of MPMs in the list is smaller than the predetermined number, the number of insufficient modes is added to the MPM list in the order of vertical mode, horizontal mode, diagonal mode, and the like. You may.
인터 예측부(524)는 현재 픽처보다 먼저 부호화 및 복호화된 참조 픽처 내에서 현재 블록과 가장 유사한 블록을 탐색하고, 그 탐색된 블록을 이용하여 현재 블록에 대한 예측블록을 생성한다. 그리고, 현재 픽처 내의 현재 블록과 참조 픽처 내의 예측블록 간의 변위(displacement)에 해당하는 움직임벡터(motion vector)를 생성한다. 현재 블록을 예측하기 위해 사용된 참조 픽처에 대한 정보 및 움직임벡터에 대한 정보를 포함하는 움직임 정보는 부호화부(550)에 의해 부호화되어 영상 복호화 장치로 전달된다.The inter prediction unit 524 searches for the block most similar to the current block in the coded and decoded reference picture before the current picture, and generates a prediction block for the current block using the searched block. A motion vector corresponding to a displacement between the current block in the current picture and the prediction block in the reference picture is generated. The motion information including the information about the reference picture and the motion vector used to predict the current block is encoded by the encoder 550 and transmitted to the image decoding apparatus.
감산기(530)는 현재 블록으로부터 인트라 예측부(522) 또는 인터 예측부(524)에 의해 생성된 예측블록을 감산하여 잔차 블록을 생성한다.The subtractor 530 generates a residual block by subtracting the prediction block generated by the intra predictor 522 or the inter predictor 524 from the current block.
변환부(540)는 공간 영역의 픽셀 값들을 가지는 잔차 블록 내의 잔차 신호를 주파수 도메인의 변환 계수로 변환한다. 변환부(540)는 잔차 블록 내의 잔차 신호들을 현재 블록의 크기를 변환 단위로 사용하여 변환할 수 있으며, 또는 잔차 블록을 더 작은 복수의 서브블록을 분할하고 서브블록 크기의 변환 단위로 잔차 신호들을 변환할 수도 있다. 잔차 블록을 더 작은 서브블록으로 분할하는 방법은 다양하게 존재할 수 있다. 예컨대, 기정의된 동일한 크기의 서브블록으로 분할할 수도 있으며, 또는 잔차 블록을 루트 노드로 하는 QT(quadtree) 방식의 분할을 사용할 수도 있다. The converter 540 converts the residual signal in the residual block having pixel values of the spatial domain into a transform coefficient of the frequency domain. The transformer 540 may convert the residual signals in the residual block using the size of the current block as a conversion unit, or divide the residual block into a plurality of smaller subblocks and convert the residual signals in a subblock-sized transform unit. You can also convert. There may be various ways of dividing the residual block into smaller subblocks. For example, it may be divided into sub-blocks of a predetermined same size, or a quadtree (QT) scheme may be used in which the residual block is a root node.
양자화부(545)는 변환부(540)로부터 출력되는 변환 계수들을 양자화하고, 양자화된 변환 계수들을 부호화부(550)로 출력한다.The quantization unit 545 quantizes the transform coefficients output from the transform unit 540, and outputs the quantized transform coefficients to the encoder 550.
부호화부(550)는 양자화된 변환 계수들을 CABAC 등의 부호화 방식을 사용하여 부호화하여 비트스트림을 생성한다. 또한, 부호화부(550)는 블록 분할과 관련된 CTU size, MinQTSize, MaxBTSize, MaxBTDepth, MinBTSize, QT 분할 플래그(QT_split_flag), BT 분할 플래그(QT_split_flag) 등의 정보를 부호화하여, 영상 복호화 장치가 영상 부호화 장치와 동일하게 블록을 분할할 수 있도록 한다.The encoder 550 generates a bitstream by encoding the quantized transform coefficients by using an encoding method such as CABAC. In addition, the encoder 550 encodes information such as CTU size, MinQTSize, MaxBTSize, MaxBTDepth, MinBTSize, QT split flag (QT_split_flag), BT split flag (QT_split_flag) related to block division, so that the image decoding apparatus may The block can be divided in the same way as
부호화부(550)는 현재 블록이 인트라 예측에 의해 부호화되었는지 아니면 인터 예측에 의해 부호화되었는지 여부를 지시하는 예측 타입에 대한 정보를 부호화하고, 예측 타입에 따라 인트라 예측정보 또는 인터 예측정보를 부호화한다. The encoder 550 encodes information about a prediction type indicating whether a current block is encoded by intra prediction or inter prediction, and encodes intra prediction information or inter prediction information according to the prediction type.
역양자화부(560)는 양자화부(545)로부터 출력되는 양자화된 변환 계수들을 역양자화하여 변환 계수들을 생성한다. 역변환부(565)는 역양자화부(560)로부터 출력되는 변환 계수들을 주파수 도메인으로부터 공간 도메인으로 변환하여 잔차블록을 복원한다.The inverse quantizer 560 inversely quantizes the quantized transform coefficients output from the quantizer 545 to generate transform coefficients. The inverse transformer 565 restores the residual block by converting the transform coefficients output from the inverse quantizer 560 from the frequency domain to the spatial domain.
가산부(570)는 복원된 잔차블록과 예측부(520)에 의해 생성된 예측블록을 가산하여 현재 블록을 복원한다. 복원된 현재 블록 내의 픽셀들은 다음 순서의 블록을 인트라 예측할 때 참조 픽셀로서 사용된다.The adder 570 reconstructs the current block by adding the reconstructed residual block and the predicted block generated by the predictor 520. The pixels in the reconstructed current block are used as reference pixels when intra prediction of the next order of blocks.
필터부(580)는 블록 단위의 부호화/복호화로 인해 발생하는 블록킹 현상(blocking artifact)을 제거하기 위해 복원된 블록 간의 경계를 디블록킹 필터링하고 메모리(590)에 저장한다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.The filter unit 580 deblocks and filters the boundary between the reconstructed blocks in order to remove blocking artifacts that occur due to encoding / decoding of blocks. When all the blocks in a picture are reconstructed, the reconstructed picture is used as a reference picture for inter prediction of a block in a picture to be encoded later.
이하에서는 영상 복호화 장치에 대해 설명한다.Hereinafter, an image decoding apparatus will be described.
도 8은 본 개시의 기술들이 사용될 수 있는 예시적인 영상 복호화 장치의 블록도이다.8 is a block diagram of an example video decoding apparatus in which the techniques of this disclosure may be used.
영상 복호화 장치는 복호화부(810), 역양자화부(820), 역변환부(830), 예측부(840), 가산기(850), 필터부(860) 및 메모리(870)를 포함한다. 도 2의 영상 부호화 장치와 마찬가지로, 영상 복호화 장치는 각 구성요소가 하드웨어 칩으로 구현될 수 있으며, 또는 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.The image decoding apparatus includes a decoder 810, an inverse quantizer 820, an inverse transformer 830, a predictor 840, an adder 850, a filter 860, and a memory 870. Like the image encoding apparatus of FIG. 2, the image decoding apparatus may be implemented by each component as a hardware chip, or may be implemented by software and a microprocessor to execute a function of software corresponding to each component.
복호화부(810)는 영상 부호화 장치로부터 수신한 비트스트림을 복호화하여 블록 분할과 관련된 정보를 추출하여 복호화하고자 하는 현재 블록을 결정하고, 현재 블록을 복원하기 위해 필요한 예측 정보와 잔차신호에 대한 정보 등을 추출한다.The decoder 810 decodes the bitstream received from the image encoding apparatus, extracts information related to block division, determines a current block to be decoded, and includes prediction information and residual signal information necessary for reconstructing the current block. Extract
복호화부(810)는 SPS (Sequence Parameter Set) 또는 PPS (Picture Parameter Set)과 같은 하이 레벨 신택스(high level syntax)로부터 CTU size에 대한 정보를 추출하여 CTU의 크기를 결정하고, 픽처를 결정된 크기의 CTU로 분할한다. 그리고 CTU를 트리 구조의 최상위 레이어, 즉, 루트 노드로 결정하고, CTU에 대한 분할 정보를 추출함으로써 CTU를 트리 구조(예컨대, QTBT 구조)를 이용하여 분할한다. The decoder 810 extracts information about the CTU size from a high level syntax such as a Sequence Parameter Set (SPS) or a Picture Parameter Set (PPS) to determine the size of the CTU, and determines the size of the picture. Split into CTUs. The CTU is determined as the highest layer of the tree structure, that is, the root node, and the CTU is partitioned using a tree structure (eg, a QTBT structure) by extracting partition information about the CTU.
복호화부(810)는 트리 구조의 분할을 통해 복호화하고자 하는 현재 블록(현재 블록)을 결정하게 되면, 현재 블록이 인트라 예측되었는지 아니면 인터 예측되었는지를 지시하는 예측 타입에 대한 정보를 추출한다. When the decoder 810 determines the current block (current block) to be decoded by splitting the tree structure, the decoder 810 extracts information about a prediction type indicating whether the current block is intra predicted or inter predicted.
예측 타입 정보가 인트라 예측을 지시하는 경우, 복호화부(810)는 현재 블록의 인트라 예측정보(인트라 예측 모드)에 대한 신택스 요소를 추출한다. 먼저, 복호화부(810)는 현재 블록의 인트라 예측 모드가 MPM 중에서 선택되는지 여부를 지시하는 모드 정보(즉, MPM 플래그)를 추출한다. 또한, 일반적으로, 인트라 모드 부호화 정보가 현재 블록의 인트라 예측 모드가 MPM 중에서 선택됨을 지시하는 경우, MPM 중 어느 모드가 현재 블록의 인트라 예측 모드로 선택되었는지를 지시하기 위한 제1 인트라 식별정보를 추출하고, 인트라 모드 부호화 정보가 현재 블록의 인트라 예측 모드가 MPM 중에서 선택되지 않음을 지시하는 경우, MPM이 아닌 나머지 모드들 중 어느 모드가 현재 블록의 인트라 예측 모드로 선택되었는지를 지시하기 위한 제2 인트라 식별정보를 추출한다. 대안적으로, 본 발명의 일 측면에 따른 인트라 예측부(522)는, MPM들 및/또는 non-MPM들 중에서 어느 모드가 현재 블록을 예측하기 위한 인트라 예측 모드로 선택되었는지를 지시하는 인트라 식별정보를 추출하는 대신에, MPM들 및/또는 non-MPM들을 그룹화하고, 현재 블록을 예측하기 위한 인트라 모드가 속하는지를 지시하는 인트라 식별정보(예컨대, 그룹의 인덱스 등)를 추출한다. When the prediction type information indicates intra prediction, the decoder 810 extracts a syntax element for intra prediction information (intra prediction mode) of the current block. First, the decoder 810 extracts mode information (ie, MPM flag) indicating whether or not the intra prediction mode of the current block is selected from the MPMs. Also, in general, when the intra mode encoding information indicates that the intra prediction mode of the current block is selected from the MPMs, the first intra identification information for indicating which mode of the MPMs is selected as the intra prediction mode of the current block is extracted. And if the intra mode encoding information indicates that the intra prediction mode of the current block is not selected among the MPMs, a second intra for indicating which mode other than the MPM is selected as the intra prediction mode of the current block. Extract identification information. Alternatively, the intra prediction unit 522 according to an aspect of the present invention may indicate an intra identification information indicating which mode among MPMs and / or non-MPMs is selected as an intra prediction mode for predicting a current block. Instead of extracting, group MPMs and / or non-MPMs and extract intra identification information (eg, group index, etc.) indicating whether an intra mode for predicting the current block belongs.
한편, 복호화부(810)는 잔차신호에 대한 정보로서 현재 블록의 양자화된 변환계수들에 대한 정보를 추출한다.Meanwhile, the decoder 810 extracts information about quantized transform coefficients of the current block as information on the residual signal.
역양자화부(820)는 양자화된 변환계수들을 역양자화하고 역변환부(830)는 역양자화된 변환계수들을 주파수 도메인으로부터 공간 도메인으로 역변환하여 잔차신호들을 복원함으로써 현재 블록에 대한 잔차블록을 생성한다.The inverse quantization unit 820 inversely quantizes the quantized transform coefficients, and the inverse transform unit 830 inversely transforms the inverse quantized transform coefficients from the frequency domain to the spatial domain to generate a residual block for the current block.
예측부(840)는 인트라 예측부(842) 및 인터 예측부(844)를 포함한다. 인트라 예측부(842)는 현재 블록의 예측 타입인 인트라 예측일 때 활성화되고, 인터 예측부(844)는 현재 블록의 예측 타입인 인트라 예측일 때 활성화된다.The predictor 840 includes an intra predictor 842 and an inter predictor 844. The intra predictor 842 is activated when the intra prediction is the prediction type of the current block, and the inter predictor 844 is activated when the intra prediction is the prediction type of the current block.
인트라 예측부(842)는 복호화부(810)로부터 추출된 인트라 예측 모드에 대한 신택스 요소로부터 복수의 인트라 예측 모드 중 현재 블록의 인트라 예측 모드를 결정하고, 인트라 예측 모드에 따라 현재 블록 주변의 참조 픽셀들을 이용하여 현재 블록을 예측한다. The intra predictor 842 determines the intra prediction mode of the current block among the plurality of intra prediction modes from the syntax element for the intra prediction mode extracted from the decoder 810, and references pixels around the current block according to the intra prediction mode. Predict the current block using
현재 블록의 인트라 예측 모드를 결정하기 위해, 인트라 예측부(842)는 현재 블록의 주변블록으로부터 기 결정된 개수의 MPM들을 포함하는 MPM 리스트를 구성한다. MPM 리스트를 구성하는 방법은 도 2의 인트라 예측부(522)와 동일하다. In order to determine the intra prediction mode of the current block, the intra predictor 842 constructs an MPM list including a predetermined number of MPMs from neighboring blocks of the current block. The method of constructing the MPM list is the same as that of the intra predictor 522 of FIG. 2.
일반적으로, 인트라 예측의 모드 정보(즉, MPM 플래그)가 현재 블록의 인트라 예측 모드가 MPM 중에서 선택됨을 지시하는 경우에는, 인트라 예측부(842)는 MPM 리스트 내의 MPM들 중 제1 인트라 식별정보에 의해 지시되는 MPM을 현재 블록의 인트라 예측 모드로 선택한다. 반면, 모드 정보가 현재 블록의 인트라 예측 모드가 MPM으로부터 선택되지 않음을 지시하는 경우, 제2 인트라 식별정보를 이용하여 MPM 리스트 내의 MPM들을 제외한 나머지 인트라 예측 모드들 중에서 현재 블록의 인트라 예측 모드를 결정한다. In general, when the mode information of the intra prediction (ie, the MPM flag) indicates that the intra prediction mode of the current block is selected from the MPMs, the intra prediction unit 842 may indicate the first intra identification information among the MPMs in the MPM list. Select the MPM indicated by the intra prediction mode of the current block. On the other hand, if the mode information indicates that the intra prediction mode of the current block is not selected from the MPM, the intra prediction mode of the current block is determined among the remaining intra prediction modes except the MPMs in the MPM list using the second intra identification information. do.
대안적으로, 본 발명의 일 측면에 따른 영상 부호화 장치의 인트라 예측부(522)는, 전술한 바와 같이, MPM들 및/또는 non-MPM들 중에서 어느 모드가 현재 블록을 예측하기 위한 인트라 예측 모드로 선택되었는지를 명시적으로 시그널링하는 대신에, MPM들 및/또는 non-MPM들을 그룹화하고, 현재 블록을 예측하기 위한 인트라 모드가 속하는 그룹의 인덱스를 시그널링한다. 이 경우, 영상 복호화 장치의 인트라 예측부(842)는 해당 그룹에 속한 인트라 모드들을 평가하여 최종 인트라 모드(즉, 현재 블록을 예측하기 위한 인트라 모드)를 결정할 수 있다. 예컨대, 일부 예들에서, 인트라 예측부(842)는 한 그룹에 속한 다수 개의 인트라 모드에 대해, 복원 블록(reconstructed block)을 생성하고, 복원 블록들을 평가하여 최종 인트라 모드를 결정할 수 있다. Alternatively, the intra prediction unit 522 of the image encoding apparatus according to an aspect of the present invention, as described above, an intra prediction mode for which mode among the MPMs and / or non-MPMs predicts the current block. Instead of explicitly signaling whether or not is selected, group the MPMs and / or non-MPMs and signal the index of the group to which the intra mode to predict the current block belongs. In this case, the intra prediction unit 842 of the image decoding apparatus may determine the final intra mode (that is, the intra mode for predicting the current block) by evaluating the intra modes belonging to the corresponding group. For example, in some examples, the intra predictor 842 may generate a reconstructed block for a plurality of intra modes belonging to a group, and evaluate the reconstructed blocks to determine a final intra mode.
인터 예측부(844)는 복호화부(810)로부터 추출된 인트라 예측 모드에 대한 신택스 요소를 이용하여 현재 블록의 움직임정보를 결정하고, 결정된 움직임정보를 이용하여 현재 블록을 예측한다.The inter predictor 844 determines motion information of the current block using a syntax element for the intra prediction mode extracted from the decoder 810, and predicts the current block using the determined motion information.
가산기(850)는 역변환부로부터 출력되는 잔차블록과 인터 예측부 또는 인트라 예측부로부터 출력되는 예측블록을 가산하여 현재 블록을 복원한다. 복원된 현재 블록 내의 픽셀들은 이후에 복호화할 블록을 인트라 예측할 때의 참조픽셀로서 활용된다.The adder 850 reconstructs the current block by adding the residual block output from the inverse transformer and the prediction block output from the inter predictor or the intra predictor. The pixels in the reconstructed current block are utilized as reference pixels in intra prediction of the block to be subsequently decoded.
필터부(860)는 블록 단위의 복호화로 인해 발생하는 블록킹 현상(blocking artifact)를 제거하기 위해 복원된 블록 간의 경계를 디블록킹 필터링하고 메모리(870)에 저장한다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 복호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.The filter unit 860 deblocks and filters the boundary between the reconstructed blocks in order to remove blocking artifacts caused by block-by-block decoding, and stores them in the memory 870. When all the blocks in a picture are reconstructed, the reconstructed picture is used as a reference picture for inter prediction of a block in a picture to be decoded later.
본 개시의 기법들은 일반적으로 직사각형뿐만 아니라 삼각형이나 요철 모양의 블록을 허용하는 QTBT 블록 분할 구조를 표현하는 분할 정보를 시그널링하는 기법과 분할 정보로부터 블록 파티셔닝을 결정하는 기법에 관한 것이다. 본 개시의 기법들의 일 측면은 도 5에 예시된 영상 부호화 장치의 부호화부(550) 및/또는 도 8에 예시된 영상 복호화 장치의 복호화부(810)에 의해 수행될 수도 있다. 다른 예들에서, 영상 부호화 장치 및/또는 영상 복호화 장치의 하나 이상의 다른 유닛들이 추가적이거나 대안적으로 본 개시의 기법들을 수행하는 것을 담당할 수도 있다. QTBT 블록 파티셔닝은 CTU를 CU들로 파티셔닝하는데 사용될 수 있다. 즉, QTBT의 루트 노드(root node)는 CTU 일 수 있으며, QTBT의 리프 노드는 CU일 수 있다. Techniques of the present disclosure generally relate to a technique for signaling partition information representing a QTBT block partition structure that allows not only rectangular but also triangular or uneven blocks, and a technique for determining block partitioning from partition information. One aspect of the techniques of the present disclosure may be performed by the encoder 550 of the image encoding apparatus illustrated in FIG. 5 and / or the decoder 810 of the image decoding apparatus illustrated in FIG. 8. In other examples, one or more other units of the image encoding apparatus and / or the image decoding apparatus may additionally or alternatively be responsible for performing the techniques of this disclosure. QTBT block partitioning can be used to partition a CTU into CUs. That is, the root node of the QTBT may be a CTU, and the leaf node of the QTBT may be a CU.
QTBT 구조에서, 루트 노드인 CTU는 먼저 QT 구조로 분할될 수 있다. 영상 부호화 장치는 QTBT의 루트 노드가 QT 구조로 분할되는지 여부를 시그널링하기 위해 QT 분할 플래그(QT_split_flag)를 사용한다. 표 1과 같이, QT_split_flag = 0은 루트 노드가 QT 분할되지 않음을 나타내며, QT_split_flag = 1은 루트 노드가 동일 크기의 네 개의 블록으로 분할됨을 나타낸다.In the QTBT structure, the CTU that is the root node may be first divided into a QT structure. The image encoding apparatus uses a QT split flag (QT_split_flag) to signal whether the root node of the QTBT is split into a QT structure. As shown in Table 1, QT_split_flag = 0 indicates that the root node is not QT split, and QT_split_flag = 1 indicates that the root node is split into four blocks of the same size.
QT split flagQT split flag ValueValue
No splitNo split 00
splitsplit 1One
각 노드들의 QT 분할은 재귀적으로 반복될 수 있다. QT 분할되지 않는 블록들(즉, QT의 리프 노드들)은 BT 분할이 수행될 수 있다. 본 개시에서 제안하는 BT 분할은 복수의 분할 타입을 가질 수 있다. 예컨대, 일부 예시에서, 해당 노드의 블록을 동일 크기의 두 개 직사각형으로 분할하는 직사각형 분할 타입이 사용될 수 있다. 다른 일부 예시에서, 동일 크기의 두 개 삼각형으로 분할하는 삼각형 분할 타입이 BT 분할에 추가로 사용될 수 있다. 또 다른 예시에서, 주어진 블록을 凹 모양의 블록과 凸 모양의 블록으로 분할하는 요철 분할 타입이 사용될 수 있다.The QT division of each node may be repeated recursively. BT partitioning may be performed on blocks that are not QT partitioned (ie, leaf nodes of QT). The BT partition proposed in the present disclosure may have a plurality of partition types. For example, in some examples, a rectangular division type may be used that divides a block of nodes into two rectangles of the same size. In some other examples, a triangular split type that splits into two triangles of the same size may be used in addition to the BT split. In another example, a concave-convex type of dividing a given block into a j-shaped block and a j-shaped block may be used.
이하에서는, BT 분할에서 허용되는 분할 타입들과 이를 시그널링하는 방법에 관한 몇몇 실시예들을 설명한다. Hereinafter, some embodiments regarding partition types allowed in BT partitioning and a method of signaling the same will be described.
제1 실시예 (BT 분할 - 직사각형 분할 및 삼각형 분할의 조합)First Embodiment (BT Division—Combination of Rectangular Division and Triangle Division)
도 9는 본 발명의 일 실시예에 따른, BT 분할에서 허용되는 분할 파티션들의 개념도이다.9 is a conceptual diagram of partition partitions allowed in BT partitioning according to an embodiment of the present invention.
본 실시예에서 BT 분할에는 직사각형 분할과 삼각형 분할이 사용된다. 직사각형 분할은 (정사각형 또는 직사각형의) 주어진 블록을 동일한 크기의 2개의 직사각형으로 분할하는 것이며, 삼각형 분할은 (정사각형 또는 직사각형의) 주어진 블록을 동일한 크기의 2개의 삼각형으로 분할하는 것이다. 도 9에서 (a) 및 (b)는 두 종류의 직사각형 분할의 예시이고, (c) 및 (d)는 두 종류의 삼각형 분할의 예시이다. 직사각형 분할은 분할 방향에 따라 수평(horizontal) 형태와 수직(vertical) 형태로 구분되고, 삼각형 분할은 분할 방향에 따라 우하향(down-right) 형태와 우상향(up-right) 형태로 구분된다. 따라서, 본 실시예에서 BT 분할들은 형태 및 방향에 의해 4가지로 구분된다.In the present embodiment, BT division and triangular division are used for BT division. Rectangular division is to divide a given block (square or rectangular) into two rectangles of the same size, and triangular division is to divide a given block (square or rectangular) into two triangles of the same size. (A) and (b) in FIG. 9 are examples of two kinds of rectangular division, and (c) and (d) are examples of two kinds of triangular division. The rectangular division is divided into a horizontal form and a vertical form according to the division direction, and the triangular division is divided into a down-right form and an up-right form according to the division direction. Therefore, in the present embodiment, BT divisions are divided into four types according to shape and direction.
비록 도 9에는 정사각형 블록이 2개의 직사각형 혹은 2개의 삼각형으로 분할된 형태가 예시되어 있으나, 직사각형 블록이 2개의 직사각형 혹은 2개의 삼각형으로 분할된 형태도 가능함에 유의한다. 따라서 직사각형 블록은 다시 2개의 직사각형 혹은 2개의 삼각형으로 분할될 수 있다. 반면, 삼각형 블록은 더 이상 분할되지 않는다.Although FIG. 9 illustrates a square block divided into two rectangles or two triangles, a rectangular block divided into two rectangles or two triangles is also possible. Thus, the rectangular block can be further divided into two rectangles or two triangles. Triangle blocks, on the other hand, are no longer split.
도 10은 도 9에 예시된 4가지 BT 분할에 대한 비트 할당 방법의 일 예를 트리로 표현한 도면이다.FIG. 10 is a tree representation of an example of a bit allocation method for four BT divisions illustrated in FIG. 9.
도 10을 참조하면, BT 분할이 선택되는지를 나타내기 위해 1비트가 할당되며, BT 분할이 선택된 경우에, BT 분할의 형태(즉, 삼각형 분할이 선택되는지 혹은 직사각형 분할이 선택되는지를 나타내기 위한 1 비트와 분할 방향을 나타내기 위한 1비트가 추가로 할당된다. 따라서, 총 3비트로 주어진 블록에 대한 BT 분할 모양을 표현할 수 있다. Referring to FIG. 10, one bit is allocated to indicate whether a BT division is selected, and in the case where the BT division is selected, a type of BT division (i.e., triangle division or rectangular division is selected). One bit and one bit for indicating a division direction are additionally allocated, thus representing a BT partition shape for a given block with a total of three bits.
각 BT 분할들에 할당된 비트들을 정리하면, 표 2와 같다. 표 2에 보인 바와 같이, BT split flag의 첫 번째 빈(bin)은 블록이 BT 분할되는지 여부를 가리키고, 두 번째 빈은 BT 분할의 형태(즉, 직사각형 분할인지 삼각형 분할인지 여부를 가리키며, 세 번째 빈은 BT 분할의 분할 방향(즉, 직사각형 분할의 방향 혹은 삼각형 분할의 방향)을 가리킨다. A summary of the bits allocated to each BT partitions is shown in Table 2. As shown in Table 2, the first bin of the BT split flag indicates whether the block is BT split, the second bin indicates the type of BT split (ie, rectangular or triangular split), and the third bin. The bin indicates the division direction of the BT division (ie, the direction of the rectangular division or the direction of the triangular division).
BT split flagBT split flag ValueValue
No splitNo split 00
Split rectangle (horizontal)Split rectangle (horizontal) 100100
Split rectangle (vertical)Split rectangle (vertical) 101101
Split triangle (down-right)Split triangle (down-right) 110110
Split triangle (up-right)Split triangle (up-right) 111111
도 11a는 본 발명의 일 실시예에 따른, 예시적인 QTBT 분할 구조의 개념도이고, 도 11b는 도 11a의 QTBT 분할 구조를 트리 구조로 나타낸 도면이다. 도 11b에서 흑색 원은 QTBT 분할 구조의 리프 노드(leaf node)를 가리키며, 흰색 원은 QT 분할 혹은 BT 분할되는 노드를 가리킨다. 또한, 각 노드에 표기된 비트들은 표 1 및 표 2에 기초한 QT 분할 플래그 및 BT 분할 플래그들을 의미한다. 각 노드에 할당된 비트들 중에서, 밑줄 친 비트들은 QT 분할 플래그이며, 나머지 비트들은 BT 분할 플래그들이다. 도 11b에서, 이탤릭로 표시된 "110" 및 "111"이 할당된 노드들의 자식 노드들에는 비트 "0"이 할당되어 있지 않음에 유의하라. 전술한 바와 같이, 삼각형 블록은 더 이상 분할되지 않는 리프 노드에 해당하므로, 주어진 노드가 삼각형 분할되면, 그 자식 노드에 대해서는 더 이상 BT 분할되지 않는다는 것을 시그널링할 필요가 없다. FIG. 11A is a conceptual diagram of an exemplary QTBT splitting structure according to an embodiment of the present invention, and FIG. 11B is a tree structure illustrating the QTBT splitting structure of FIG. 11A. In FIG. 11B, black circles indicate leaf nodes of the QTBT splitting structure, and white circles indicate nodes that are QT splitting or BT splitting. In addition, the bits indicated in each node mean the QT partition flag and the BT partition flag based on Tables 1 and 2. Of the bits assigned to each node, the underlined bits are QT split flags and the remaining bits are BT split flags. Note that in FIG. 11B, the bit nodes “0” are not assigned to child nodes of nodes to which “ 110 ” and “ 111 ” are assigned italics. As mentioned above, the triangular block corresponds to a leaf node that is no longer split, so once a given node is triangulated, there is no need to signal that it is no longer BT split for its child nodes.
대안적으로, 삼각형 블록으로 분할된 경우 자식 노드를 가질 수 있다. 이때, 자식 노드는 부모 노드인 삼각형 블록을 다시 삼각형으로 이등분한 모양일 수 있다. 2개의 부모 노드인 삼각형 블록은 각각 독립적으로 삼각형 분할을 결정하게 된다. 해당 분할 플래그는 분할이 되지 않으면 "0"으로, 분할 되었으면 "1"으로 표시할 수 있다.Alternatively, it may have child nodes when divided into triangular blocks. In this case, the child node may have a shape in which the triangle block, which is the parent node, is bisected into triangles again. The triangle blocks, which are the two parent nodes, each independently determine the triangle split. The partition flag may be displayed as "0" if the partition flag is not divided and "1" if the partition flag is partitioned.
제2 실시예 (BT 분할 - 요철 분할의 조합)Second embodiment (combination of BT division-uneven division)
본 실시예에서 BT 분할에는 도 4에 예시된 요철 모양의 파티션들이 이용된다. 요철 모양의 파티션들은 그 분할 방향에 따라(즉, 凹 모양의 블록에 대한 凸 모양의 블록의 상대적인 위치에 따라) 네 가지로 구분된다. In the present embodiment, partitions of the concave-convex shape illustrated in FIG. 4 are used for BT partitioning. Uneven partitions are divided into four types according to their division direction (that is, according to the relative position of the block in the shape of the block in the shape of the block).
도 12는 도 4에 예시된 요철 모양의 파티션에 대한 비트 할당 방법의 일 예를 트리로 표현한 도면이다. 도 12을 참조하면, BT 분할이 선택되는지를 나타내기 위해 1비트가 할당되며, BT 분할이 선택된 경우에 어떠한 요철 분할이 선택되는지를 나타내기 위해 2 비트가 추가로 할당된다. 이와 같이 각 분할 패턴들에 할당된 비트들을 정리하면, 표 3과 같다. 표 3에 보인 바와 같이, BT split flag의 첫 번째 빈(bin)은 블록이 BT 분할되는지 여부를 나타내고, 두 번째 빈(bin)과 세 번째 빈(bin)은 어느 요철 분할이 적용되었는지를 나타낸다. FIG. 12 is a tree representation of an example of a bit allocation method for the uneven partition illustrated in FIG. 4. Referring to FIG. 12, one bit is allocated to indicate whether a BT division is selected, and two bits are additionally allocated to indicate which uneven division is selected when the BT division is selected. In this way, the bits allocated to the respective partition patterns are summarized in Table 3 below. As shown in Table 3, the first bin of the BT split flag indicates whether the block is BT split, and the second bin and the third bin indicate which uneven split is applied.
BT split flagBT split flag ValueValue
No splitNo split 00
Split rectangle (horizontal)Split rectangle (horizontal) 100100
Split down-typeSplit down-type 101101
Split left-typeSplit left-type 110110
Split right-typeSplit right-type 111111
본 실시예에서는, 일단 정사각형 (혹은 직사각형) 블록이 요철 모양으로 분할되면, 분할된 블록들은 더 이상 BT 분할되지 않는다. 따라서, BT 분할된 노드의 자식노드들에 대해서는 BT split flag를 시그널링할 필요가 없다.In this embodiment, once the square (or rectangular) block is divided into an uneven shape, the divided blocks are no longer BT divided. Therefore, it is not necessary to signal the BT split flag for child nodes of the BT split node.
제3실시예 (PU에 삼각형 분할을 허용)Third Embodiment (Triangle Division Allowed in PU)
본 실시예에서 제안하는 기법은, CU(Coding Unit)를 결정하기 위한 CTU의 QTBT 분할 구조에서 BT분할에 도 9의 (a) 및 (b)에 예시된 직사각형 분할을 이용하고, PU(Prediction Unit)를 결정하기 위한 CU의 분할에 도 9의 (c) 및 (d)에 예시된 삼각형 분할을 이용하는 것이다. 즉, 제1실시예가 삼각형 모양의 CU를 허용했다면, 본 실시예는 삼각형 모양의 PU를 허용한다. 여기서, 삼각형 모양의 PU는 해당 CU에 대한 예측을 위한 파티션 모드(partition mode)로 설명 될 수 있다.The technique proposed in this embodiment uses the rectangular division illustrated in FIGS. 9A and 9B for BT division in the QTBT division structure of the CTU for determining a coding unit (CU), and uses a PU (Prediction Unit). The triangular division illustrated in (c) and (d) of FIG. That is, if the first embodiment allows a triangular CU, this embodiment allows a triangular PU. Here, the triangular PU may be described as a partition mode for prediction of a corresponding CU.
도 13은 직사각형 분할들이 허용되는 BT 분할에 대한 비트 할당 방법의 일 예를 트리로 표현한 도면이다. 도 13을 참조하면, BT 분할이 선택되었는지를 나타내기 위해 1비트가 할당되며, BT 분할이 선택된 경우에, BT 분할의 방향(즉, 직사각형 분할의 방향)을 나타내기 위한 1비트가 추가로 할당된다. 따라서, 총 2비트로 주어진 블록에 대한 BT 분할 모양을 표현할 수 있다. 각 BT 분할들에 할당된 비트들을 정리하면, 표 4과 같다. 표 4에 보인 바와 같이, BT split flag의 첫 번째 빈(bin)은 블록이 BT 분할되는지 여부를 가리키고, 두 번째 빈은 BT 분할의 분할 방향(즉, 직사각형 분할의 방향)을 가리킨다.FIG. 13 is a diagram representing an example of a bit allocation method for BT division in which rectangular divisions are allowed. Referring to FIG. 13, one bit is allocated to indicate whether the BT division is selected, and in the case where the BT division is selected, one bit for additionally indicating the direction of the BT division (ie, the direction of the rectangular division) is additionally allocated. do. Therefore, it is possible to express the BT partition shape for a given block with 2 bits in total. A summary of the bits allocated to each BT partitions is shown in Table 4. As shown in Table 4, the first bin of the BT split flag indicates whether the block is BT split, and the second bin indicates the split direction of the BT split (ie, the direction of the rectangular split).
BT split flagBT split flag ValueValue
No splitNo split 00
Split horizontalSplit horizontal 1010
Split verticalSplit vertical 1111
도 14a는 본 발명의 일 실시예에 따른 예시적인 CU 파티션과 PU 파티션의 개념도이며, 도 14b는 도 14a의 CU 파티션을 트리 구조로 나타낸 것이다. 도 14a에서 실선은 QTBT 분할 구조의 CU 분할들을 나타내며, 점선은 PU 분할들을 나타낸다. 도 14b에서 흑색 원은 QTBT 분할 구조의 리프 노드(leaf node)를 가리키며, 흰색 원은 QT 분할 혹은 BT 분할되는 노드를 가리킨다. 또한, 각 노드에 표기된 비트들은 표 1에 기초한 QT 분할 플래그 및 표 4에 기초한 BT 분할 플래그들을 의미한다.14A is a conceptual diagram of an exemplary CU partition and a PU partition according to an embodiment of the present invention, and FIG. 14B illustrates the CU partition of FIG. 14A in a tree structure. In FIG. 14A, solid lines represent CU divisions of the QTBT division structure, and dotted lines represent PU divisions. In FIG. 14B, black circles indicate leaf nodes of the QTBT splitting structure, and white circles indicate nodes that are QT splitting or BT splitting. In addition, the bits indicated in each node mean the QT partition flag based on Table 1 and the BT partition flags based on Table 4.
영상 부호화 장치는 CU 파티션이 정해지면, 해당 CU에 대한 PU 파티션 정보(혹은 Mode type) 시그널링해야 한다. Mode type의 시그널링은 도 14b의 리프 노드에 해당하는 모든 CU들에 대해 수행된다. 하나의 CU에 대한 Mode type에 대한 정보는 표 5와 같이 표시될 수 있다. When the CU partition is determined, the image encoding apparatus should signal PU partition information (or mode type) for the corresponding CU. Mode type signaling is performed for all CUs corresponding to the leaf nodes of FIG. 14B. Information on the mode type for one CU may be displayed as shown in Table 5.
BT split flagBT split flag ValueValue
Quadrangle (사각형)Quadrangle 00
Triangle (down-right)Triangle (down-right) 1010
Triangle (up-right)Triangle (up-right) 1111
도 15는 영상 부호화 장치가 영상을 부호화하는 예시적인 동작을 도시한 흐름도이다. 15 is a flowchart illustrating an exemplary operation of encoding an image by the image encoding device.
도 15의 예에서, 영상 부호화 장치는 영상 데이터의 블록을 부호화하기 위한 QTBT 분할 구조를 결정한다(S1510). 여기서 상기 QTBT 블록 파티셔닝 구조는 쿼드트리의 리프 노드(leaf node)로부터 바이너리트리가 루트되는(rooted) 구조이다. 일부 예시에서, 바이너리트리는 부모 노드를 2개의 자식 노드로 분할하는 복수의 분할 타입들에 의해 정의된다. 상기 분할 타입들은 삼각형 분할 타입과 직사각형 분할 타입을 포함할 수 있다. 바이너리트리에서, 삼각형 분할 타입으로 분할되는 노드들은 더 이상 분할되지 않는다. 바이너리트리에서, 직사각형 분할 타입으로 분할되는 노드들은 재차 2개의 자식 노드로 분할되는 것이 허용된다. 다른 일부 예시에서, 쿼드트리의 리프 노드는 2개의 자식 노드로 분할되는 것이 허용되며, 2개의 자식 노드는 凹 모양의 블록과 凸 모양의 블록일 수 있다. 이 경우 자식 노드들은 더 이상 분할되지 않을 수 있다. In the example of FIG. 15, the image encoding apparatus determines a QTBT splitting structure for encoding a block of image data (S1510). The QTBT block partitioning structure is a structure in which a binary tree is rooted from a leaf node of a quadtree. In some examples, the binary tree is defined by a plurality of partition types that split a parent node into two child nodes. The division types may include a triangular division type and a rectangular division type. In a binary tree, nodes that are split into triangular split types are no longer split. In the binary tree, nodes that are split into rectangular partition types are again allowed to split into two child nodes. In some other examples, the leaf nodes of the quadtree are allowed to be split into two child nodes, where the two child nodes may be j-shaped blocks and j-shaped blocks. In this case, the child nodes may no longer be divided.
영상 부호화 장치는 상기 결정된 QTBT 분할 구조에 기초하여, 상기 영상 데이터의 블록과 상기 결정된 QTBT 분할 구조를 표현하는 분할 정보를 포함하는 부호화된 비트스트림을 생성한다(S1520).The image encoding apparatus generates an encoded bitstream including the block of the image data and the segmentation information representing the determined QTBT segmentation structure based on the determined QTBT segmentation structure (S1520).
도 16은 영상 복호화 장치가 영상을 복호화하는 예시적인 동작을 도시한 흐름도이다. 16 is a flowchart illustrating an exemplary operation of decoding an image by the image decoding device.
도 16의 예에서, 영상 복호화 장치는 부호화된 영상 데이터의 블록 및 상기 영상 데이터의 블록에 관련된 분할 정보를 포함하는 비트스트림을 수신한다(S1610). In the example of FIG. 16, the image decoding apparatus receives a bitstream including a block of encoded image data and segmentation information related to the block of the image data (S1610).
영상 복호화 장치는 상기 분할 정보를 이용하여, 상기 영상 데이터의 블록에 대한 QTBT 분할 구조를 결정한다(S1620). 여기서 상기 QTBT 분할 구조는 쿼드트리의 리프 노드로부터 바이너리트리가 루트된 구조이다. 일부 예시에서, 바이너리트리는 부모 노드를 2개의 자식 노드로 분할하는 복수의 분할 타입들에 의해 정의된다. 상기 분할 타입들은 삼각형 분할 타입과 직사각형 분할 타입을 포함할 수 있다. 바이너리트리에서, 삼각형 분할 타입으로 분할되는 노드들은 더 이상 분할되지 않는다. 바이너리트리에서, 직사각형 분할 타입으로 분할되는 노드들은 재차 2개의 자식 노드로 분할되는 것이 허용된다. 다른 일부 예시에서, 쿼드트리의 리프 노드는 2개의 자식 노드로 분할되는 것이 허용되며, 2개의 자식 노드는 凹 모양의 블록과 凸 모양의 블록일 수 있다. 이 경우 자식 노드들은 더 이상 분할되지 않을 수 있다.The image decoding apparatus determines the QTBT segmentation structure for the block of the image data by using the segmentation information (S1620). The QTBT splitting structure is a structure in which a binary tree is rooted from a leaf node of a quadtree. In some examples, the binary tree is defined by a plurality of partition types that split a parent node into two child nodes. The division types may include a triangular division type and a rectangular division type. In a binary tree, nodes that are split into triangular split types are no longer split. In the binary tree, nodes that are split into rectangular partition types are again allowed to split into two child nodes. In some other examples, the leaf nodes of the quadtree are allowed to be split into two child nodes, where the two child nodes may be j-shaped blocks and j-shaped blocks. In this case, the child nodes may no longer be divided.
영상 복호화 장치는 상기 QTBT의 각 리프 노드별로 상기 부호화된 영상 데이터의 블록을 복호화한다(S1630). The image decoding apparatus decodes the block of the encoded image data for each leaf node of the QTBT (S1630).
도 17은 영상 복호화 장치가 영상을 복호화하는 다른 예시적인 동작을 도시한 흐름도이다. 17 is a flowchart illustrating another exemplary operation of decoding an image by the image decoding device.
도 17의 예에서, 영상 복호화 장치는 부호화된 영상 데이터의 CTU(coding tree unit) 및 상기 영상 데이터의 CTU에 관련된 분할 정보를 포함하는 비트스트림을 수신한다(S1710).In the example of FIG. 17, the image decoding apparatus receives a bitstream including a coding tree unit (CTU) of encoded image data and segmentation information related to the CTU of the image data (S1710).
영상 복호화 장치는 상기 분할 정보를 이용하여, 상기 CTU에 대한 QTBT 분할 구조를 결정한다(S1720). 여기서 상기 QTBT 분할 구조는 쿼드트리의 리프 노드로부터 바이너리트리가 루트된 구조이다. 바이너리트리에서, 주어진 블록은 동일한 크기의 2개의 직사각형으로 분할된다. 직사각형 분할 타입으로 분할되는 노드들은 재차 2개의 자식 노드로 분할되는 것이 허용된다. 따라서, QTBT의 리프 노드들(즉, CU들)은 정사각형 또는 직사각형 모양일 수 있다.The image decoding apparatus determines the QTBT segmentation structure for the CTU by using the segmentation information (S1720). The QTBT splitting structure is a structure in which a binary tree is rooted from a leaf node of a quadtree. In the binary tree, a given block is divided into two rectangles of the same size. Nodes split into a rectangular partition type are allowed to split into two child nodes again. Thus, leaf nodes (ie CUs) of QTBT may be square or rectangular in shape.
영상 복호화 장치는 상기 분할 정보를 이용하여, 상기 QTBT의 각 리프 노드마다 예측 파티션 모드를 결정한다(S1730). 상기 예측 파티션 모드는 상기 QTBT의 리프 노드가 동일한 크기의 2개의 삼각형으로 분할되어 예측되는 것을 허용한다. 따라서, PU는 정사각형, 직사각형 또는 삼각형 모양일 수 있다.The image decoding apparatus determines the prediction partition mode for each leaf node of the QTBT by using the split information (S1730). The prediction partition mode allows the leaf nodes of the QTBT to be divided and predicted into two triangles of the same size. Thus, the PU may be square, rectangular or triangular in shape.
영상 복호화 장치는 상기 QTBT의 각 리프 노드에 대한 예측 파티션 모드에 따라 상기 부호화된 영상 데이터의 블록을 복호화한다(S1740).The image decoding apparatus decodes the block of the encoded image data according to the prediction partition mode for each leaf node of the QTBT (S1740).
이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The above description is merely illustrative of the technical idea of the present embodiment, and those skilled in the art to which the present embodiment belongs may make various modifications and changes without departing from the essential characteristics of the present embodiment. Therefore, the present embodiments are not intended to limit the technical idea of the present embodiment but to describe the present invention, and the scope of the technical idea of the present embodiment is not limited by these embodiments. The scope of protection of the present embodiment should be interpreted by the following claims, and all technical ideas within the scope equivalent thereto should be construed as being included in the scope of the present embodiment.
CROSS-REFERENCE TO RELATED APPLICATIONCROSS-REFERENCE TO RELATED APPLICATION
본 특허출원은, 본 명세서에 그 전체가 참고로서 포함되는, 2017년 01월 09일 한국에 출원한 특허출원번호 제10-2017-0003156호, 및 2018년 01월 04일 한국에 출원한 특허출원번호 제10-2018-0001062호에 대해 우선권을 주장한다.This patent application is incorporated by reference in Korean Patent Application No. 10-2017-0003156, filed on Jan. 09, 2017, and Jan. 04, 2018, which is hereby incorporated by reference in its entirety. Priority is claimed on number 10-2018-0001062.

Claims (10)

  1. 영상 데이터를 복호화하는 방법에 있어서,In the method for decoding video data,
    부호화된 영상 데이터의 블록 및 상기 영상 데이터의 블록에 관련된 분할 정보를 포함하는 비트스트림을 수신하는 단계;Receiving a bitstream including a block of encoded image data and segmentation information related to the block of image data;
    상기 분할 정보를 이용하여, 상기 영상 데이터의 블록에 대한 QTBT(QuadTree plus BinaryTree) 분할 구조를 결정하는 단계, 여기서 상기 QTBT 분할 구조는 쿼드트리의 리프 노드(leaf node)로부터 바이너리트리가 루트된(rooted) 구조이며, 상기 바이너리트리는 부모 노드를 2개의 자식 노드로 분할하는 분할 타입들에 의해 정의되며, 상기 분할 타입들은 삼각형 분할 타입과 직사각형 분할 타입을 포함함; 및Determining a QuadTree plus BinaryTree (QTBT) partition structure for the block of the image data using the partition information, wherein the QTBT partition structure is a binary tree rooted from a leaf node of a quadtree. The binary tree is defined by partition types for dividing a parent node into two child nodes, the partition types including a triangle partition type and a rectangular partition type; And
    상기 QTBT의 각 리프 노드별로 상기 부호화된 영상 데이터의 블록을 복호화하는 단계Decoding the block of the encoded image data for each leaf node of the QTBT
    를 포함하는, 영상 복호화 방법.Image decoding method comprising a.
  2. 제1항에 있어서,The method of claim 1,
    상기 바이너리트리에서, 삼각형 분할 타입으로 분할되는 노드의 자식 노드들은 더 이상 분할되지 않는 것을 특징으로 하는, 영상 복호화 방법In the binary tree, child nodes of nodes divided into triangular partition types are no longer partitioned.
  3. 제1항에 있어서,The method of claim 1,
    상기 바이너리트리에서, 직사각형 분할 타입으로 분할되는 노드의 자식 노드들은 재차 2개의 자식 노드로 분할되는 것이 허용되는 것을 특징으로 하는, 영상 복호화 방법.The child decoding method of the binary tree, characterized in that the child nodes of the node divided into the rectangular partition type is allowed to be divided into two child nodes again.
  4. 제1항에 있어서, The method of claim 1,
    상기 삼각형 분할 타입은, The triangular division type,
    분할 방향에 따라 우하향(down-right) 분할 형태와 우상향(up-right) 분할 형태로 구분되는 것을 특징으로 하는, 영상 복호화 방법.And a down-right segmentation form and an up-right segmentation form according to the segmentation direction.
  5. 제1항에 있어서, The method of claim 1,
    상기 사각형 분할 타입은, The rectangular division type is
    분할 방향에 따라 수평(horizontal) 분할 형태와 수직(vertical) 분할 형태로 구분되는 것을 특징으로 하는, 영상 복호화 방법.The image decoding method according to the division direction, characterized in that divided into a horizontal (vertical) form and a vertical (vertical) divided form.
  6. 영상 데이터를 복호화하는 장치로서, An apparatus for decoding video data,
    메모리; 및Memory; And
    하나 이상의 프로세서들을 포함하며, Includes one or more processors,
    상기 하나 이상의 프로세서들은,The one or more processors,
    부호화된 영상 데이터의 블록 및 상기 영상 데이터의 블록에 관련된 분할 정보를 포함하는 비트스트림을 수신하는 단계;Receiving a bitstream including a block of encoded image data and segmentation information related to the block of image data;
    상기 분할 정보를 이용하여, 상기 영상 데이터의 블록에 대한 QTBT(QuadTree plus BinaryTree) 분할 구조를 결정하는 단계, 여기서 상기 QTBT 분할 구조는 쿼드트리의 리프 노드(leaf node)로부터 바이너리트리가 루트된(rooted) 구조이며, 상기 바이너리트리는 부모 노드를 2개의 자식 노드로 분할하는 분할 타입들에 의해 정의되며, 상기 분할 타입들은 삼각형 분할 타입과 직사각형 분할 타입을 포함함; 및Determining a QuadTree plus BinaryTree (QTBT) partition structure for the block of the image data using the partition information, wherein the QTBT partition structure is a binary tree rooted from a leaf node of a quadtree. The binary tree is defined by partition types for dividing a parent node into two child nodes, the partition types including a triangle partition type and a rectangular partition type; And
    상기 QTBT의 각 리프 노드별로 상기 부호화된 영상 데이터의 블록을 복호화하는 단계를 수행하도록 구성된, 영상 복호화 장치.And decoding the block of the encoded image data for each leaf node of the QTBT.
  7. 제6항에 있어서,The method of claim 6,
    상기 바이너리트리에서, 삼각형 분할 타입으로 분할되는 노드의 자식 노드들은 더 이상 분할되지 않는 것을 특징으로 하는, 영상 복호화 방법In the binary tree, child nodes of nodes divided into triangular partition types are no longer partitioned.
  8. 제6항에 있어서,The method of claim 6,
    상기 바이너리트리에서, 직사각형 분할 타입으로 분할되는 노드의 자식 노드들은 재차 2개의 자식 노드로 분할되는 것이 허용되는 것을 특징으로 하는, 영상 복호화 방법.The child decoding method of the binary tree, characterized in that the child nodes of the node divided into the rectangular partition type is allowed to be divided into two child nodes again.
  9. 영상 데이터를 복호화 방법에 있어서,In the video data decoding method,
    부호화된 영상 데이터의 블록 및 상기 영상 데이터의 블록에 관련된 분할 정보를 포함하는 비트스트림을 수신하는 단계;Receiving a bitstream including a block of encoded image data and segmentation information related to the block of image data;
    상기 분할 정보를 이용하여, 상기 영상 데이터의 블록에 대한 QTBT 분할 구조를 결정하는 단계, 여기서 상기 QTBT 분할 구조는 쿼드트리의 리프 노드(leaf node)로부터 바이너리트리가 루트된(rooted) 구조이며, 상기 쿼드트리의 리프 노드는 2개의 자식 노드로 분할되는 것이 허용되며, 상기 2개의 자식 노드는 凹 모양의 블록과 凸 모양의 블록임; 및Determining a QTBT splitting structure for the block of the image data using the splitting information, wherein the QTBT splitting structure is a structure in which a binary tree is rooted from a leaf node of a quadtree. Leaf nodes of the quadtree are allowed to be divided into two child nodes, wherein the two child nodes are 凹 -shaped blocks and 凸 -shaped blocks; And
    상기 QTBT의 각 리프 노드별로 상기 부호화된 영상 데이터의 블록을 복호화하는 단계Decoding the block of the encoded image data for each leaf node of the QTBT
    를 포함하는, 영상 데이터의 복호화 방법.The image data decoding method comprising a.
  10. 영상 데이터를 복호화 방법에 있어서,In the video data decoding method,
    부호화된 영상 데이터의 CTU(coding tree unit) 및 상기 영상 데이터의 CTU에 관련된 분할 정보를 포함하는 비트스트림을 수신하는 단계;Receiving a bitstream including a coding tree unit (CTU) of encoded image data and segmentation information related to the CTU of the image data;
    상기 분할 정보를 이용하여, 상기 CTU에 대한 QTBT 분할 구조를 결정하는 단계, 여기서 상기 QTBT 분할 구조는 쿼드트리의 리프 노드(leaf node)로부터 바이너리트리가 루트된(rooted) 구조임; Determining a QTBT splitting structure for the CTU using the splitting information, wherein the QTBT splitting structure is a structure in which a binary tree is rooted from a leaf node of a quadtree;
    상기 분할 정보를 이용하여, 상기 QTBT의 각 리프 노드마다 예측 파티션 모드를 결정하는 단계, 상기 예측 파티션 모드는 상기 QTBT의 리프 노드가 동일한 크기의 2개의 삼각형으로 분할되어 예측되는 것을 허용함; 및 Using the partitioning information, determining a prediction partition mode for each leaf node of the QTBT, wherein the prediction partition mode allows the leaf nodes of the QTBT to be split and predicted into two triangles of the same size; And
    상기 QTBT의 각 리프 노드에 대한 예측 파티션 모드에 따라 상기 부호화된 영상 데이터의 블록을 복호화하는 단계Decoding a block of the encoded image data according to a prediction partition mode for each leaf node of the QTBT
    를 포함하는, 영상 복호화 방법.Image decoding method comprising a.
PCT/KR2018/000264 2017-01-09 2018-01-05 Device and method for encoding or decoding image WO2018128466A1 (en)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201880005760.8A CN110169065B (en) 2017-01-09 2018-01-05 Apparatus and method for encoding or decoding image
US16/505,080 US11102517B2 (en) 2017-01-09 2019-07-08 Apparatus and method for video encoding and decoding of coding tree unit
US17/380,419 US11595700B2 (en) 2017-01-09 2021-07-20 Apparatus and method for video encoding or decoding
US17/380,371 US11533515B2 (en) 2017-01-09 2021-07-20 Apparatus and method for video encoding or decoding
US18/099,387 US11917212B2 (en) 2017-01-09 2023-01-20 Apparatus and method for video encoding or decoding
US18/099,393 US11902594B2 (en) 2017-01-09 2023-01-20 Apparatus and method for video encoding or decoding

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2017-0003156 2017-01-09
KR20170003156 2017-01-09
KR10-2018-0001062 2018-01-04
KR1020180001062A KR20180082330A (en) 2017-01-09 2018-01-04 Apparatus and Method for Video Encoding or Decoding

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US16/505,080 Continuation US11102517B2 (en) 2017-01-09 2019-07-08 Apparatus and method for video encoding and decoding of coding tree unit

Publications (1)

Publication Number Publication Date
WO2018128466A1 true WO2018128466A1 (en) 2018-07-12

Family

ID=62789414

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2018/000264 WO2018128466A1 (en) 2017-01-09 2018-01-05 Device and method for encoding or decoding image

Country Status (1)

Country Link
WO (1) WO2018128466A1 (en)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109862369A (en) * 2018-12-28 2019-06-07 杭州海康威视数字技术股份有限公司 A coding and decoding method and device thereof
WO2020083403A1 (en) * 2018-10-27 2020-04-30 华为技术有限公司 Image prediction method and device
WO2020088691A1 (en) * 2018-11-02 2020-05-07 Beijing Bytedance Network Technology Co., Ltd. Harmonization between geometry partition prediction mode and other tools
WO2020125752A1 (en) * 2018-12-21 2020-06-25 Mediatek Inc. Method and apparatus of simplified triangle merge mode candidate list derivation
GB2580326A (en) * 2018-12-28 2020-07-22 British Broadcasting Corp Video encoding and video decoding
WO2021003126A1 (en) * 2019-07-02 2021-01-07 Beijing Dajia Internet Information Technology Co., Ltd. Methods and apparatuses for video coding using triangle partition
CN112753218A (en) * 2018-12-12 2021-05-04 腾讯美国有限责任公司 Method and apparatus for video encoding
CN114145015A (en) * 2019-06-19 2022-03-04 Lg 电子株式会社 Image encoding/decoding method and apparatus for limiting size of chroma block and method for transmitting bitstream
JP2022517559A (en) * 2018-12-30 2022-03-09 ベイジン ダージャー インターネット インフォメーション テクノロジー カンパニー リミテッド Video coding and decoding methods and equipment for triangle prediction
US11589038B2 (en) 2018-12-14 2023-02-21 British Broadcasting Corporation Methods for video encoding and video decoding
US12309398B2 (en) 2020-02-07 2025-05-20 British Broadcasting Corporation Chroma intra prediction in video coding and decoding

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140113854A (en) * 2013-03-15 2014-09-25 삼성전자주식회사 Method and apparatus for encoding and decoding video
KR101595899B1 (en) * 2008-04-15 2016-02-19 오렌지 Coding and decoding of an image or of a sequence of images sliced into partitions of pixels of linear form
WO2016091161A1 (en) * 2014-12-10 2016-06-16 Mediatek Singapore Pte. Ltd. Method of video coding using binary tree block partitioning
KR101681303B1 (en) * 2010-07-29 2016-12-01 에스케이 텔레콤주식회사 Method and Apparatus for Encoding/Decoding of Video Data Using Partitioned-Block Prediction
KR20160138130A (en) * 2014-03-19 2016-12-02 삼성전자주식회사 Video encoding and decoding method and apparatus involving boundary filtering

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101595899B1 (en) * 2008-04-15 2016-02-19 오렌지 Coding and decoding of an image or of a sequence of images sliced into partitions of pixels of linear form
KR101681303B1 (en) * 2010-07-29 2016-12-01 에스케이 텔레콤주식회사 Method and Apparatus for Encoding/Decoding of Video Data Using Partitioned-Block Prediction
KR20140113854A (en) * 2013-03-15 2014-09-25 삼성전자주식회사 Method and apparatus for encoding and decoding video
KR20160138130A (en) * 2014-03-19 2016-12-02 삼성전자주식회사 Video encoding and decoding method and apparatus involving boundary filtering
WO2016091161A1 (en) * 2014-12-10 2016-06-16 Mediatek Singapore Pte. Ltd. Method of video coding using binary tree block partitioning

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020083403A1 (en) * 2018-10-27 2020-04-30 华为技术有限公司 Image prediction method and device
US12231628B2 (en) 2018-10-27 2025-02-18 Huawei Technologies Co., Ltd. Picture prediction method and apparatus
US11711511B2 (en) 2018-10-27 2023-07-25 Huawei Technologies Co., Ltd. Picture prediction method and apparatus
US11700371B2 (en) 2018-11-02 2023-07-11 Beijing Bytedance Network Technology Co., Ltd Table maintenance for HMVP candidate storage
US12170768B2 (en) 2018-11-02 2024-12-17 Beijing Bytedance Network Technology Co., Ltd. Table maintenance for HMVP candidate storage
CN111147855A (en) * 2018-11-02 2020-05-12 北京字节跳动网络技术有限公司 Coordination between Geometric Segmentation Prediction Models and Other Tools
WO2020088691A1 (en) * 2018-11-02 2020-05-07 Beijing Bytedance Network Technology Co., Ltd. Harmonization between geometry partition prediction mode and other tools
US11122266B2 (en) 2018-11-02 2021-09-14 Beijing Bytedance Network Technology Co., Ltd. Table maintenance for HMVP candidate storage
CN112753218A (en) * 2018-12-12 2021-05-04 腾讯美国有限责任公司 Method and apparatus for video encoding
US11589038B2 (en) 2018-12-14 2023-02-21 British Broadcasting Corporation Methods for video encoding and video decoding
WO2020125752A1 (en) * 2018-12-21 2020-06-25 Mediatek Inc. Method and apparatus of simplified triangle merge mode candidate list derivation
US11856194B2 (en) 2018-12-21 2023-12-26 Hfi Innovation Inc. Method and apparatus of simplified triangle merge mode candidate list derivation
CN109862368B (en) * 2018-12-28 2020-02-11 杭州海康威视数字技术股份有限公司 Coding and decoding method and equipment thereof
US11778201B2 (en) 2018-12-28 2023-10-03 British Broadcasting Corporation Video encoding and video decoding
CN109862368A (en) * 2018-12-28 2019-06-07 杭州海康威视数字技术股份有限公司 A coding and decoding method and device thereof
CN109862369B (en) * 2018-12-28 2020-05-12 杭州海康威视数字技术股份有限公司 A coding and decoding method and device thereof
WO2020135033A1 (en) * 2018-12-28 2020-07-02 杭州海康威视数字技术股份有限公司 Video encoding and decoding
GB2580326A (en) * 2018-12-28 2020-07-22 British Broadcasting Corp Video encoding and video decoding
CN109862369A (en) * 2018-12-28 2019-06-07 杭州海康威视数字技术股份有限公司 A coding and decoding method and device thereof
WO2020135035A1 (en) * 2018-12-28 2020-07-02 杭州海康威视数字技术股份有限公司 Video encoding and decoding
JP7171928B2 (en) 2018-12-30 2022-11-15 ベイジン ダージャー インターネット インフォメーション テクノロジー カンパニー リミテッド Video encoding/decoding method and apparatus for triangle prediction
JP2022517559A (en) * 2018-12-30 2022-03-09 ベイジン ダージャー インターネット インフォメーション テクノロジー カンパニー リミテッド Video coding and decoding methods and equipment for triangle prediction
US11917147B2 (en) 2019-06-19 2024-02-27 Lg Electronics Inc. Image encoding/decoding method and apparatus for limiting size of chroma block, and method for transmitting bitstream
CN114145015A (en) * 2019-06-19 2022-03-04 Lg 电子株式会社 Image encoding/decoding method and apparatus for limiting size of chroma block and method for transmitting bitstream
WO2021003126A1 (en) * 2019-07-02 2021-01-07 Beijing Dajia Internet Information Technology Co., Ltd. Methods and apparatuses for video coding using triangle partition
US12309398B2 (en) 2020-02-07 2025-05-20 British Broadcasting Corporation Chroma intra prediction in video coding and decoding

Similar Documents

Publication Publication Date Title
WO2018128466A1 (en) Device and method for encoding or decoding image
WO2011139099A2 (en) Method and apparatus for processing a video signal
WO2016200043A1 (en) Method and apparatus for inter prediction on basis of virtual reference picture in video coding system
WO2013069932A1 (en) Method and apparatus for encoding image, and method and apparatus for decoding image
WO2011087271A2 (en) Processing method and device for video signals
WO2019135628A1 (en) Method and device for encoding or decoding image
KR20180082330A (en) Apparatus and Method for Video Encoding or Decoding
WO2020222484A1 (en) Method and device for processing video signal on basis of intra prediction
WO2019194500A1 (en) Intra-prediction-based image coding method and device therefor
WO2020251260A1 (en) Video signal processing method and device using block dpcm prediction method
WO2013165143A1 (en) Method and apparatus for encoding multi-view images, and method and apparatus for decoding multi-view images
WO2020185009A1 (en) Method and apparatus for efficiently coding residual blocks
WO2019059721A1 (en) Image encoding and decoding using resolution enhancement technique
WO2019132567A1 (en) Video coding method and device which use sub-block unit intra prediction
WO2018169267A1 (en) Device and method for encoding or decoding image
WO2018079873A1 (en) Video coding method and apparatus using any types of block partitioning
WO2018074812A1 (en) Device and method for encoding or decoding image
CN112823526B (en) Method and apparatus for processing video signals by using cross-component linear models
WO2021137445A1 (en) Method for determining transform kernels for video signal processing and apparatus therefor
WO2020231219A1 (en) Image encoding and decoding method and device
WO2020242181A1 (en) Intra mode candidate configuration method and image decoding device
WO2022114742A1 (en) Apparatus and method for video encoding and decoding
WO2019135636A1 (en) Image coding/decoding method and apparatus using correlation in ycbcr
WO2018124686A1 (en) Image encoding and decoding using intra prediction
WO2018212582A1 (en) Intra prediction encoding or decoding method and device

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18736194

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18736194

Country of ref document: EP

Kind code of ref document: A1

点击 这是indexloc提供的php浏览器服务,不要输入任何密码和下载