CN105144713A - 用于解码器设置的对视频进行编码的方法及其装置以及基于解码器设置对视频进行解码的方法及其装置 - Google Patents
用于解码器设置的对视频进行编码的方法及其装置以及基于解码器设置对视频进行解码的方法及其装置 Download PDFInfo
- Publication number
- CN105144713A CN105144713A CN201480016629.3A CN201480016629A CN105144713A CN 105144713 A CN105144713 A CN 105144713A CN 201480016629 A CN201480016629 A CN 201480016629A CN 105144713 A CN105144713 A CN 105144713A
- Authority
- CN
- China
- Prior art keywords
- information
- video
- unit
- coding unit
- size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/39—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving multiple description coding [MDC], i.e. with separate layers being structured as independently decodable descriptions of input picture data
-
- A—HUMAN NECESSITIES
- A47—FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
- A47K—SANITARY EQUIPMENT NOT OTHERWISE PROVIDED FOR; TOILET ACCESSORIES
- A47K7/00—Body washing or cleaning implements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B31—MAKING ARTICLES OF PAPER, CARDBOARD OR MATERIAL WORKED IN A MANNER ANALOGOUS TO PAPER; WORKING PAPER, CARDBOARD OR MATERIAL WORKED IN A MANNER ANALOGOUS TO PAPER
- B31D—MAKING ARTICLES OF PAPER, CARDBOARD OR MATERIAL WORKED IN A MANNER ANALOGOUS TO PAPER, NOT PROVIDED FOR IN SUBCLASSES B31B OR B31C
- B31D1/00—Multiple-step processes for making flat articles ; Making flat articles
- B31D1/04—Multiple-step processes for making flat articles ; Making flat articles the articles being napkins, handkerchiefs, towels, doilies, or the like
-
- D—TEXTILES; PAPER
- D21—PAPER-MAKING; PRODUCTION OF CELLULOSE
- D21F—PAPER-MAKING MACHINES; METHODS OF PRODUCING PAPER THEREON
- D21F1/00—Wet end of machines for making continuous webs of paper
- D21F1/36—Guiding mechanisms
- D21F1/42—Jets
-
- D—TEXTILES; PAPER
- D21—PAPER-MAKING; PRODUCTION OF CELLULOSE
- D21H—PULP COMPOSITIONS; PREPARATION THEREOF NOT COVERED BY SUBCLASSES D21C OR D21D; IMPREGNATING OR COATING OF PAPER; TREATMENT OF FINISHED PAPER NOT COVERED BY CLASS B31 OR SUBCLASS D21G; PAPER NOT OTHERWISE PROVIDED FOR
- D21H21/00—Non-fibrous material added to the pulp, characterised by its function, form or properties; Paper-impregnating or coating material, characterised by its function, form or properties
- D21H21/14—Non-fibrous material added to the pulp, characterised by its function, form or properties; Paper-impregnating or coating material, characterised by its function, form or properties characterised by function or properties in or on the paper
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/112—Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/129—Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
提供了一种用于发送对于精确地再现由解码器重构的图像所需的配置信息的视频编码方法和设备。提供了一种用于接收对于精确地再现由解码器重构的图像所需的配置信息的视频解码方法和设备。视频解码方法包括:接收包括网络抽象层(NAL)单元的数据流;从数据流获得指示是否存在关于画面的采样的布置类型的约束的约束信息;基于约束信息确定通过对编码画面进行解码而产生的重构的采样的布置方法。
Description
技术领域
本公开涉及一种视频编码方法和视频解码方法,更具体地讲,涉及对用于解码器配置的信息进行编码和解码的方法。
背景技术
随着用于再现和存储高分辨率或高质量视频内容的硬件正被开发和提供,对于用于有效地对高分辨率或高质量视频内容进行编码或解码的视频编解码器的需求正在增加。根据传统的视频编解码器,基于具有预定尺寸的宏块,根据受限的编码方法来对视频进行编码。
空间域的图像数据经过频率变换被变换为频域的系数。根据视频编解码器,将图像划分为具有预定尺寸的块,对每个块执行离散余弦变换(DCT),以块为单位对频率系数进行编码,以用于频率变换的快速计算。与空间域的图像数据相比,更容易对频域的系数进行压缩。具体地讲,由于根据经由视频编解码器的帧间预测或帧内预测的预测误差来表达空间域的图像像素值,因此当对预测误差执行了频率变换时,可将大量的数据变换为0。根据视频编解码器,可通过使用少量的数据代替连续且重复地产生的数据来减少数据量。
多层视频编解码器对基础层视频和至少一个增强层视频进行编码和解码。可通过去除基础层视频和增强层视频的时间/空间冗余和层冗余来减少基础层视频和增强层视频的数据量。
发明内容
技术问题
本公开提供一种用于发送对于精确地再现由解码器重构的图像所需的配置信息的视频编码方法和设备。本公开提供一种用于接收对于精确地再现由解码器重构的图像所需的配置信息的视频解码方法和设备。
解决方案
根据本公开的一方面,提供了一种视频解码方法,包括:接收包括网络抽象层(NAL)单元的数据流;从数据流获得指示是否存在对画面的采样的布置类型的约束的约束信息;基于约束信息确定通过对编码的画面进行解码而产生的重构的采样的布置方法。
有益效果
关于采样布置方法的约束信息和分段(segmentation)最大尺寸信息中的至少一个可被确定为关于解码器配置的约束信息。解码器可基于分段最大尺寸信息通过适当地对来自数据流的编码的画面数据的子区域进行分类来针对每个子区域并行地执行解码操作。此外,解码器可基于关于采样布置方法的约束信息,适当地布置基于每个画面/帧而重构的采样。
附图说明
图1是根据一些实施例的视频编码设备的框图。
图2是根据一些实施例的视频解码设备的框图。
图3是根据实施例的用于描述编码单元的概念的示图。
图4是根据实施例的基于编码单元的图像编码器的框图。
图5是根据实施例的基于编码单元的图像解码器的框图。
图6是示出根据实施例的根据深度的较深层编码单元以及分区的示图。
图7是根据实施例的用于描述编码单元和变换单元之间的关系的示图。
图8是根据实施例的用于描述与编码深度相应的编码单元的编码信息的示图。
图9是根据实施例的根据深度的较深层编码单元的示图。
图10至图12是根据实施例的用于描述编码单元、预测单元和变换单元之间的关系的示图。
图13是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图;
图14是根据各个实施例的用于解码器配置的视频编码方法的流程图。
图15是根据各个实施例的用于解码器配置的视频解码方法的流程图。
图16和图17示出用于解码器配置的语法的各个实施例。
图18至图21是用于描述各个帧封装类型的图像的重构处理的示图。
图22示出用于解码器配置的语法的另一实施例。
图23是用于描述可变长语法和定长语法的字节对齐方法的示图。
图24是根据实施例的存储有程序的盘的物理结构的示图。
图25是通过使用盘来记录和读取程序的盘驱动器的示图。
图26是用于提供内容分发服务的内容供应系统的整体结构的示图。
图27和图28分别是应用了根据实施例的视频编码方法和视频解码方法的移动电话的外部结构和内部结构的示图。
图29是根据实施例的应用了通信系统的数字广播系统的示图。
图30是使用根据实施例的视频编码设备和视频解码设备的云计算系统的网络结构的示图。
最佳模式
根据本公开的一方面,提供了一种视频解码方法,包括:接收包括网络抽象层(NAL)单元的数据流;从数据流获得指示是否存在关于画面的采样的布置类型的约束的约束信息;基于约束信息确定通过对编码画面进行解码而产生的重构的采样的布置方法。
获得步骤可包括:从NAL单元之中的视频参数集原始字节序列负荷(RBSP)区域获得由最多48比特组成的约束信息。
获得步骤可包括:获得无符号整数类型的具有固定长度的分段最大尺寸信息,其中,分段最大尺寸信息指示关于通过对编码画面进行空间划分而获得的每个子区域的最大尺寸的限制。
视频解码方法还可包括:基于由分段最大尺寸信息指示的等于或大于0且小于4096的由12比特组成的整数,确定分段的亮度采样的数量的最大值;通过将编码画面划分为子区域来针对每个子区域对编码画面进行解码。
约束信息可包括指示重构的采样是否按照逐行扫描类型被布置的逐行扫描信息,确定步骤可包括基于逐行扫描信息确定重构的采样是否按照逐行扫描顺序被布置。
约束信息可包括指示画面采样是否仅以画面单位和帧单位之中的帧单位被编码的帧约束信息,确定步骤可包括基于帧约束信息确定重构的采样是否包括至少一个帧。
约束信息可包括指示重构的采样是否按照隔行扫描类型被布置的隔行扫描信息,确定步骤可包括基于隔行扫描信息确定重构的采样是否按照隔行扫描顺序被布置。
约束信息可包括指示重构的采样是否按照除帧封装类型以外的类型被布置的非帧封装约束信息,确定步骤可包括基于非帧封装约束信息确定重构的采样是否按照除帧封装类型以外的类型被布置。
根据本公开的另一方面,提供了一种视频编码方法,包括:对画面的采样进行编码;基于采样的布置方法确定指示是否存在关于采样的布置类型的约束的约束信息;产生包括包含约束信息的网络抽象层(NAL)单元的数据流。
确定步骤可包括确定由最多48比特组成的约束信息,产生步骤可包括将约束信息插入到NAL单元之中的视频参数集原始字节序列负荷(RBSP)区域。
编码步骤可包括通过将画面划分为至少一个子区域来针对每个子区域对画面进行编码。
根据本公开的另一方面,提供了一种视频解码设备,包括:数据获得器,被配置为接收包括网络抽象层(NAL)单元的数据流,并从数据流获得指示是否存在关于画面的采样的布置类型的约束的约束信息;画面解码器,被配置为通过对从数据流获得的符号进行解码来对采样进行重构,并基于约束信息确定重构的采样的布置方法。
根据本公开的另一方面,提供了一种视频编码设备,包括:编码器,被配置为对画面的采样进行编码;数据流产生器,被配置为基于采样的布置方法确定指示是否存在关于采样的布置类型的约束的约束信息,并产生包括包含约束信息的网络抽象层(NAL)单元的数据流。
根据本公开的另一方面,提供了一种记录有用于执行视频解码方法的程序的计算机可读记录介质。根据本公开的另一方面,提供了一种记录有用于执行视频编码方法的程序的计算机可读记录介质。
具体实施方式
以下,将参照图1至图13描述基于具有树结构的编码单元的视频编码技术和视频解码技术。此外,将参照图14至图24描述由视频编码设备和视频解码设备基于具有树结构的编码单元确定用于解码器配置的信息的技术。此外,将参照图24至图30描述可应用参照图1至图24提出的视频编码方法和视频解码方法的各个实施例。
以下,“图像”可表示视频的静止图像或运动图像或视频本身。
以下,“采样”表示分配到图像的采样位置的数据,其中,该数据是处理目标。例如,空间域的图像的像素可以是采样。
首先,将参照图1至图13描述基于具有树结构的编码单元和变换单元的视频编码方法、视频编码设备、视频解码方法和视频解码设备。
图1是根据实施例的基于根据树结构的编码单元的视频编码设备100的框图。
根据实施例的视频编码设备100(涉及基于根据树结构的编码单元的视频预测)包括画面编码器120和数据流产生器130。以下,为了便于描述,根据实施例的视频编码设备100(涉及基于根据树结构的编码单元的视频预测)被称为“视频编码设备100”。
画面编码器120可基于用于图像的当前画面的最大编码单元(即,具有最大尺寸的编码单元)对当前画面进行划分。如果当前画面大于最大编码单元,则可将当前画面的图像数据划分为至少一个最大编码单元。根据实施例的最大编码单元可以是尺寸为32×32、64×64、128×128、256×256等的数据单元,其中,数据单元的形状是宽度和长度为2的若干次方的正方形。
根据实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从最大编码单元被空间划分的次数,并且随着深度加深,根据深度的较深层编码单元可从最大编码单元被划分到最小编码单元。最大编码单元的深度为最高深度,最小编码单元的深度为最低深度。由于随着最大编码单元的深度加深,与每个深度相应的编码单元的尺寸减小,因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元,并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据深度对根据实施例的最大编码单元进行划分,因此可根据深度对包括在最大编码单元中的空间域的图像数据进行分层地分类。
可预先确定编码单元的最大深度和最大尺寸,其中,所述最大深度和最大尺寸限制对最大编码单元的高度和宽度进行分层划分的总次数。
画面编码器120对通过根据深度对最大编码单元的区域进行划分而获得的至少一个划分区域进行编码,并且根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换句话说,画面编码器120通过根据当前画面的最大编码单元按照根据深度的较深层编码单元对图像数据进行编码,并选择具有最小编码误差的深度,来确定编码深度。确定的编码深度和根据确定的编码深度的编码的图像数据被输出到数据流产生器。
基于与等于或低于最大深度的至少一个深度相应的较深层编码单元,对最大编码单元中的图像数据进行编码,并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对较深层编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。
随着编码单元根据深度而被分层地划分并且随着编码单元的数量增加,最大编码单元的尺寸被划分。此外,即使在一个最大编码单元中编码单元与同一深度相应,也通过分别测量每个编码单元的图像数据的编码误差来确定是否将与同一深度相应的每个编码单元划分为更低深度。因此,即使当图像数据被包括在一个最大编码单元中时,在所述一个最大编码单元中编码误差可根据区域而不同,因此在图像数据中编码深度可根据区域而不同。因此,可在一个最大编码单元中确定一个或更多个编码深度,并且可根据至少一个编码深度的编码单元来对最大编码单元的图像数据进行划分。
因此,根据实施例的画面编码器120可确定包括在最大编码单元中的具有树结构的编码单元。根据实施例的“具有树结构的编码单元”包括最大编码单元中所包括的所有较深层编码单元之中的与被确定为编码深度的深度相应的编码单元。可在最大编码单元的相同区域中根据深度来分层地确定编码深度的编码单元,并可在不同区域中独立地确定编码深度的编码单元。类似地,可与另一区域中的编码深度相独立地确定当前区域中的编码深度。
根据实施例的最大深度是与从最大编码单元到最小编码单元的划分次数有关的索引。根据实施例的第一最大深度可表示从最大编码单元到最小编码单元的总划分次数。根据实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度等级的总数。例如,当最大编码单元的深度是0时,对最大编码单元划分一次的编码单元的深度可被设置为1,对最大编码单元划分两次的编码单元的深度可被设置为2。这里,如果最小编码单元是对最大编码单元划分四次的编码单元,则存在深度0、1、2、3和4的5个深度等级,并因此第一最大深度可被设置为4,第二最大深度可被设置为5。
可根据最大编码单元执行预测编码和变换。还根据最大编码单元,基于根据等于或小于最大深度的深度的较深层编码单元来执行预测编码和变换。
由于每当根据深度对最大编码单元进行划分时,较深层编码单元的数量增加,因此对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了便于描述,在最大编码单元中,现在将基于当前深度的编码单元来描述预测编码和变换。
根据实施例的视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行诸如预测编码、变换和熵编码的操作,此时,可针对所有操作使用相同的数据单元,或者可针对每个操作使用不同的数据单元。
例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可选择不同于编码单元的数据单元,以便对编码单元中的图像数据执行预测编码。
为了在最大编码单元中执行预测编码,可基于与编码深度相应的编码单元(即,基于不再被划分到与更低深度相应的编码单元的编码单元)来执行预测编码。在下文中,不再被划分且成为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元而获得的分区可包括通过对从预测单元的高度和宽度中选择的至少一个进行划分而获得的预测单元或数据单元。分区是编码单元的预测单元被划分的数据单元,预测单元可以是与编码单元具有相同的尺寸的分区。
例如,当2N×2N(其中,N是正整数)的编码单元不再被划分,并且成为2N×2N的预测单元时,分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。分区类型的示例包括通过对预测单元的高度或宽度进行对称地划分而获得的对称分区、通过对预测单元的高度或宽度进行非对称地划分(诸如,1:n或n:1)而获得的分区、通过对预测单元进行几何地划分而获得的分区、以及具有任意形状的分区。
预测单元的预测模式可以是从帧内模式、帧间模式和跳过模式中选择的至少一个。例如,可对2N×2N、2N×N、N×2N或N×N的分区执行帧内模式或帧间模式。另外,可仅对2N×2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码,从而选择具有最小编码误差的预测模式。
根据实施例的视频编码设备100不仅可基于用于对图像数据进行编码的编码单元,还可基于与编码单元不同的数据单元,来对编码单元中的图像数据执行变换。为了在编码单元中执行变换,可基于具有小于或等于编码单元的尺寸的数据单元来执行变换。例如,用于变换的数据单元可包括帧内模式的数据单元和帧间模式的数据单元。
以与根据实施例的基于树结构划分编码单元的方式类似的方式,编码单元中的变换单元可被递归地划分为更小尺寸的区域。因此,还可基于根据变换深度的具有树结构的变换单元,对编码单元的残差数据进行划分。
根据实施例,还可在变换单元中设置变换深度,其中,变换深度表示通过对编码单元的高度和宽度进行划分以达到变换单元的划分次数。例如,在2N×2N的当前编码单元中,当变换单元的尺寸是2N×2N时,变换深度可以为0,当变换单元的尺寸是N×N时,变换深度可以为1,当变换单元的尺寸是N/2×N/2时,变换深度可以为2。换句话说,可根据变换深度设置具有树结构的变换单元。
根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息,还需要关于与预测编码和变换相关的信息的信息。因此,画面编码器120不仅确定具有最小编码误差的编码深度,还确定预测单元中的分区类型、根据预测单元的预测模式和用于变换的变换单元的尺寸。
稍后将参照图10至图20详细描述根据实施例确定最大编码单元中的根据树结构的编码单元和确定预测单元/分区以及变换单元的方法。
画面编码器120可通过使用基于拉格朗日乘数的率失真优化,测量根据深度的较深层编码单元的编码误差。
数据流产生器130在数据流中输出最大编码单元的图像数据和关于根据编码深度的编码模式的信息,其中,所述最大编码单元的图像数据基于由画面编码器120确定的至少一个编码深度被编码。
可通过对图像的残差数据进行编码来获得编码图像数据。
关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于预测单元中的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。
可通过使用根据深度的划分信息来定义关于编码深度的信息,其中,根据深度的划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是编码深度,则对当前编码单元中的图像数据进行编码和输出,因此可将划分信息定义为不将当前编码单元划分到更低深度。可选地,如果当前编码单元的当前深度不是编码深度,则对更低深度的编码单元执行编码,并因此可将划分信息定义为对当前编码单元进行划分来获得更低深度的编码单元。
如果当前深度不是编码深度,则对被划分到更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,因此对更低深度的每个编码单元重复执行编码,并且因此可对具有相同深度的编码单元递归地执行编码。
由于针对一个最大编码单元确定具有树结构的编码单元,并且针对编码深度的编码单元确定关于至少一个编码模式的信息,所以可针对一个最大编码单元确定关于至少一个编码模式的信息。此外,由于根据深度对最大编码单元中的图像数据进行分层划分,从而最大编码单元的图像数据的编码深度可根据编码单元的位置而不同,因此可针对图像数据设置关于编码深度和编码模式的信息。
因此,根据实施例的数据流产生器130可将关于相应的编码深度和编码模式的编码信息分配给从包括在最大编码单元中的编码单元、预测单元和最小单元中选择的至少一个。
根据实施例的最小单元是通过将构成最低深度的最小编码单元划分为4份而获得的正方形数据单元。可选择地,根据实施例的最小单元可以是可包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大正方形数据单元。
例如,通过数据流产生器130输出的编码信息可被分类为根据较深层编码单元的编码信息和根据预测单元的编码信息。根据较深层编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式的插值方法的信息。
根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到数据流的头、序列参数集或画面参数集。
可通过比特流的头、序列参数集或画面参数集输出针对当前视频允许的关于变换单元的最大尺寸的信息和关于变换单元的最小尺寸的信息。数据流产生器130可对与预测有关的参考信息、预测信息和条带类型信息进行编码,并输出这些信息。
在视频编码设备100中,较深层编码单元可以是通过将更高深度(更高一层)的编码单元的高度或宽度划分成两份而获得的编码单元。换句话说,在当前深度的编码单元的尺寸是2N×2N时,更低深度的编码单元的尺寸是N×N。此外,尺寸为2N×2N的当前深度的编码单元可包括最多4个更低深度的编码单元。
因此,视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元的尺寸和最大深度,通过针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。此外,由于可通过使用各种预测模式和变换中的任意一个对每个最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的特征来确定最优编码模式。
因此,如果以传统宏块对具有高分辨率或大数据量的图像进行编码,则每个画面的宏块的数量极度增加。因此,针对每个宏块产生的压缩信息的条数增加,因此难以发送压缩的信息,并且数据压缩效率降低。然而,通过使用视频编码设备100,由于考虑图像的尺寸,在增加编码单元的最大尺寸的同时,考虑图像的特征来调整编码单元,因此图像压缩效率可增加。
以上参照图1描述的层间视频编码设备10可包括与层的数量一样多的视频编码设备100,以便根据多层视频的层对单个层图像进行编码。例如,第一编码器层12可包括一个视频编码设备100,第二层编码器14可包括与第二层的数量一样多的视频编码设备100。
当视频编码设备100对第一层图像进行编码时,画面编码器120可针对每个最大编码单元确定用于根据具有树结构的编码单元的帧间预测的预测单元,并根据预测单元执行帧间预测。
即使在视频编码设备100对第二层图像进行编码时,画面编码器120也可针对每个最大编码单元确定用于根据具有树结构的编码单元的帧间预测的预测单元,并根据预测单元执行帧间预测。
视频编码设备100可对亮度差进行编码,以便补偿第一层图像与第二层图像之间的亮度差。这里,可基于编码单元的编码模式确定是否补偿亮度差。例如,可仅针对尺寸为2N×2N的预测单元补偿亮度。
图2是根据一些实施例的基于具有树结构的编码单元的视频解码设备200的框图。
根据实施例的视频解码设备200(涉及基于具有树结构的编码单元的视频预测)包括数据获得器220和画面解码器230。以下,为便于描述,根据实施例的视频解码设备200(涉及基于具有树结构的编码单元的视频预测)被称为“视频解码设备200”。
用于视频解码设备200的解码操作的各种术语(诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与参照图1和视频编码设备100描述的那些术语相同。
数据获得器220接收和解析编码视频的数据流。数据获得器220从解析的比特流,针对每个编码单元提取编码图像数据,并将提取的图像数据输出到画面解码器230,其中,编码单元具有根据每个最大编码单元的树结构。数据获得器220可从关于当前画面的头、序列参数集或画面参数集提取关于当前画面的编码单元的最大尺寸的信息。
此外,数据获得器220从解析的比特流,根据每个最大编码单元,提取关于具有树结构的编码单元的编码深度和编码模式的信息。提取的关于编码深度和编码模式的信息被输出到画面解码器230。换句话说,编码图像数据被划分为最大编码单元,使得画面解码器230针对每个最大编码单元对图像数据进行解码。
可针对关于与编码深度相应的至少一个编码单元的信息设置关于根据最大编码单元的编码深度和编码模式的信息,关于编码模式的信息可包括关于与编码深度相应的相应编码单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。此外,根据深度的划分信息可被提取为关于编码深度的信息。
由数据获得器220提取的关于根据每个最大编码单元的编码深度和编码模式的信息是关于这样的编码深度和编码模式的信息:该编码深度和编码模式被确定为在编码器(诸如,根据实施例的视频编码设备100)根据每个最大编码单元对根据深度的每个较深层编码单元重复地执行编码时产生最小编码误差。因此,视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来重构图像。
由于根据实施例的关于编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元和最小单元之中的预定数据单元,因此数据获得器220可根据预定数据单元,提取关于编码深度和编码模式的信息。如果根据预定数据单元记录了关于相应最大编码单元的编码深度和编码模式的信息,则可将被分配了相同的关于编码深度和编码模式的信息的预定数据单元推断为是包括在同一最大编码单元中的数据单元。
画面解码器230基于关于根据最大编码单元的编码深度和编码模式的信息,通过对每个最大编码单元中的图像数据进行解码,来重构当前画面。换句话说,画面解码器230可基于提取出的关于包括在每个最大编码单元中的具有树结构的编码单元之中的每个编码单元的分区类型、预测模式和变换单元的信息,对编码图像数据进行解码。解码处理可包括预测(包含帧内预测和运动补偿)和逆变换。
画面解码器230可基于关于根据编码深度的编码单元的预测单元的分区类型和预测模式的信息,根据每个编码单元的分区和预测模式,执行帧内预测或运动补偿。
此外,画面解码器230可读取关于根据每个编码单元的树结构的变换单元的信息,以基于每个编码单元的变换单元来执行逆变换,从而针对每个最大编码单元执行逆变换。通过逆变换,可重构编码单元的空间域的像素值。
画面解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的编码深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度是编码深度。因此,画面解码器230可通过使用关于与编码深度相应的每个编码单元的预测单元的分区类型、预测模式和变换单元的尺寸的信息,对当前最大编码单元中的编码数据进行解码。
换句话说,可通过观察分配给编码单元、预测单元和最小单元之中的预定数据单元的编码信息集来收集包含包括相同划分信息的编码信息的数据单元,并且收集的数据单元可被认为是将由画面解码器230以相同编码模式进行解码的一个数据单元。这样,通过针对每个编码单元获得关于编码模式的信息,可对当前编码单元执行解码。
以上参照图2描述的层间视频解码设备20可包括与层数一样多的视频解码设备200,以便通过对第一层图像流和第二层图像流进行解码来重构第一层图像和第二层图像。
当接收到第一层图像流时,视频解码设备200的画面解码器230可将由数据获得器220从第一层图像流提取的第一层图像的采样划分为具有树结构的编码单元。画面解码器230可通过对第一层图像的采样进行划分而获得的具有树结构的编码单元执行根据用于帧间预测的预测单元的运动补偿,来重构第一层图像。
当接收到第二层图像流时,视频解码设备200的画面解码器230可将由数据获得器220从第二层图像流提取的第二层图像的采样划分为具有树结构的编码单元。画面解码器230可通过对第二层图像的采样进行划分而获得的具有树结构的编码单元执行根据用于帧间预测的预测单元的运动补偿,来重构第二层图像。
数据获得器220可从比特流获得与亮度误差相关的信息,以便补偿第一层图像和第二层图像之间的亮度误差。这里,可基于编码单元的编码模式确定是否补偿亮度差。例如,可仅针对尺寸为2N×2N的预测单元补偿亮度。
因此,视频解码设备200可获得关于这样的至少一个编码单元的信息,并可使用该信息对当前画面进行解码,其中,在针对每个最大编码单元递归地执行了编码时,所述至少一个编码单元产生最少的编码误差。换句话说,可对在每个最大编码单元中被确定为最优编码单元的具有树结构的编码单元进行解码。
因此,即使图像数据具有高分辨率和大量的数据,也可通过使用从编码器接收到的关于最优编码模式的信息,通过使用根据图像数据的特性自适应地确定的编码单元的尺寸和编码模式,来有效地对图像数据进行解码和和重构。
图3是用于描述根据一些实施例的编码单元的概念的示图。
可按照宽度×高度表示编码单元的尺寸,并且编码单元的尺寸可以是64×64、32×32、16×16和8×8。64×64的编码单元可被划分为64×64、64×32、32×64或32×32的分区,32×32的编码单元可被划分为32×32、32×16、16×32或16×16的分区,16×16的编码单元可被划分为16×16、16×8、8×16或8×8的分区,8×8的编码单元可被划分为8×8、8×4、4×8或4×4的分区。
在视频数据310中,分辨率是1920×1080,编码单元的最大尺寸是64,最大深度是2。在视频数据320中,分辨率是1920×1080,编码单元的最大尺寸是64,最大深度是3。在视频数据330中,分辨率是352×288,编码单元的最大尺寸是16,最大深度是1。图3中示出的最大深度表示从最大编码单元到最小编码单元的划分总次数。
如果分辨率高或数据量大,则编码单元的最大尺寸可能较大,从而不仅提高编码效率,而且准确地反映图像的特征。因此,比视频数据330具有更高分辨率的视频数据310和320的编码单元的最大尺寸可以是64。
由于视频数据310的最大深度是2,因此由于通过对最大编码单元划分两次,深度加深至两层,因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元和长轴尺寸为32和16的编码单元。由于视频数据330的最大深度是1,因此由于通过对最大编码单元划分一次,深度加深至一层,因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元和长轴尺寸为8的编码单元。
由于视频数据320的最大深度是3,因此由于通过对最大编码单元划分三次,深度加深至3层,因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长轴尺寸为32、16和8的编码单元。随着深度加深,详细信息可被精确地表示。
图4是根据一些实施例的基于编码单元的图像编码器400的框图。
根据实施例的图像编码器400执行视频编码设备100的编码单元确定器120的操作来对图像数据进行编码。换句话说,帧内预测器410在帧内模式下对当前帧405之中的编码单元执行帧内预测,运动估计器420和运动补偿器425通过使用当前帧405和参考帧495,在帧间模式下对当前帧405中的编码单元分别执行帧间估计和运动补偿。
从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为量化后的变换系数。量化后的变换系数通过反量化器460和逆变换器470被重构为空间域中的数据,重构的空间域中的数据在通过去块单元480和偏移调整单元490后处理之后被输出为参考帧495。量化后的变换系数可通过熵编码器450被输出为比特流455。
为了将图像编码器400应用到根据实施例的视频编码设备100中,图像编码器400的所有元件(即,帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、逆变换器470、去块单元480和偏移调整单元490)在考虑每个最大编码单元的最大深度的同时,基于具有树结构的编码单元之中的每个编码单元执行操作。
具体地,帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度的同时,确定具有树结构的编码单元之中的每个编码单元的分区和预测模式,变换器430确定具有树结构的编码单元之中的每个编码单元中的变换单元的尺寸。
图5是根据一些实施例的基于编码单元的图像解码器500的框图。
解析器510从比特流505解析将被解码的编码图像数据和解码所需的关于编码的信息。编码图像数据通过熵解码器520和反量化器530被输出为反量化的数据,反量化的数据通过逆变换器540被重构为空间域中的图像数据。
针对空间域中的图像数据,帧内预测器550在帧内模式下对编码单元执行帧内预测,运动补偿器560通过使用参考帧585在帧间模式下对编码单元执行运动补偿。
通过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和偏移调整器580后处理之后被输出为重构帧595。此外,通过去块单元570和偏移调整器580后处理的图像数据可被输出为参考帧585。
为了在视频解码设备200的图像数据解码器230中对图像数据进行解码,根据实施例的图像解码器500可执行在解析器510之后执行的操作。
为了将图像解码器500应用到视频解码设备200中,图像解码器500的所有元件(即,解析器510、根据实施例的熵解码器520、反量化器530、逆变换器540、帧内预测器550、运动补偿器560、去块单元570和偏移调整器580)针对每个最大编码单元,基于具有树结构的编码单元执行操作。
具体地,帧内预测器550和运动补偿器560基于针对具有树结构的编码单元中的每个编码单元的分区和预测模式来执行操作,并且逆变换器540基于每个编码单元的变换单元的尺寸执行操作。
图4的编码操作和图5的解码操作分别是单个层中的视频流编码操作和视频流解码操作。因此,当图1的编码器12对至少两个层的视频流进行编码时,图像编码器400可被包括在每个层中。类似地,当图2的解码器26对至少两个层的视频流进行解码时,图像解码器500可被包括在每个层中。
图6是示出根据一些实施例的根据深度的较深层编码单元以及分区的示图。
根据实施例的视频编码设备100和根据实施例的视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度,或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。
在根据实施例的编码单元的分层结构600中,编码单元的最大高度和最大宽度均是64,最大深度是3。在这种情况下,最大深度是指编码单元从最大编码单元被划分到最小编码单元的总次数。由于沿着根据实施例的分层结构600的垂直轴深度加深,因此较深层编码单元的高度和宽度均被划分。此外,预测单元和分区沿着分层结构600的水平轴被示出,其中,所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。
换句话说,在分层结构600中,编码单元610是最大编码单元,其中,深度为0且尺寸(即,高度乘宽度)为64×64。深度沿着垂直轴加深,存在尺寸为32×32且深度为1的编码单元620、尺寸为16×16且深度为2的编码单元630、尺寸为8×8且深度为3的编码单元640。尺寸为8×8且深度为3的编码单元640是最小编码单元。
编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换句话说,如果尺寸为64×64且深度为0的编码单元610是预测单元,则可将预测单元划分成包括在编码单元610中的分区,即,尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614或尺寸为32×32的分区616。
类似地,可将尺寸为32×32且深度为1的编码单元620的预测单元划分成包括在编码单元620中的分区,即,尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624和尺寸为16×16的分区626。
类似地,可将尺寸为16×16且深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区,即,包括在编码度单元630中的尺寸为16×16的分区630、尺寸为16×8的分区632、尺寸为8×16的分区634和尺寸为8×8的分区636。
类似地,可将尺寸为8×8且深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区,即,包括在编码单元640中的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644和尺寸为4×4的分区646。
为了确定构成最大编码单元610的编码单元的至少一个编码深度,根据实施例的视频编码设备100的编码单元确定器120对包括在最大编码单元610中的与每个深度相应的编码单元执行编码。
随着深度加深,包括相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如,需要四个与深度2相应的编码单元来覆盖包括在与深度1相应的一个编码单元中的数据。因此,为了根据深度比较对相同数据进行编码的结果,与深度1相应的编码单元和四个与深度2相应的编码单元均被编码。
为了针对深度之中的当前深度执行编码,可沿着分层结构600的水平轴,通过对与当前深度相应的编码单元中的每个预测单元执行编码,来针对当前深度选择最小编码误差。可选地,随着深度沿着分层结构600的垂直轴加深,可通过针对每个深度执行编码,比较根据深度的最小编码误差,来搜索最小编码误差。编码单元610中的具有最小编码误差的深度和分区可被选为编码单元610的编码深度和分区类型。
图7是用于描述根据一些实施例的编码单元和变换单元之间的关系的示图。
根据实施例的视频编码设备100或根据实施例的视频解码设备200针对每个最大编码单元,根据具有小于或等于最大编码单元的尺寸的编码单元,对图像进行编码或解码。可基于不大于相应的编码单元的数据单元,选择用于在编码期间进行变换的变换单元的尺寸。
例如,在根据实施例的视频编码设备100或根据实施例的视频解码设备200中,如果编码单元710的尺寸是64×64,则可通过使用尺寸为32×32的变换单元720来执行变换。
此外,可通过对小于64×64的尺寸为32×32、16×16、8×8和4×4的每个变换单元执行变换,来对尺寸为64×64的编码单元710的数据进行编码,然后可选择具有最小编码误差的变换单元。
图8是用于描述根据一些实施例的与编码深度相应的编码单元的编码信息的示图。
根据实施例的视频编码设备100的数据流产生器130可对与编码深度相应的每个编码单元的关于分区类型的信息800、关于预测模式的信息810以及关于变换单元尺寸的信息820进行编码,并将信息800、信息810和信息820作为关于编码模式的信息来发送。
信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信息,其中,所述分区是用于对当前编码单元进行预测编码的数据单元。例如,可将尺寸为2N×2N的当前编码单元CU_0划分成以下分区中的任意一个:尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808。这里,关于分区类型的信息800被设置来指示尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808中的一个。
信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的分区执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。
信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧内变换单元828。
根据实施例的视频解码设备200的数据获得器220可根据每个较深层编码单元,提取并使用用于解码的信息800、810和820。
图9是根据一些实施例的根据深度的较深层编码单元的示图。
划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。
用于对深度为0且尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括以下分区类型的分区:尺寸为2N_0×2N_0的分区类型912、尺寸为2N_0×N_0的分区类型914、尺寸为N_0×2N_0的分区类型916和尺寸为N_0×N_0的分区类型918。图9仅示出了通过对称地划分预测单元910而获得的分区类型912至918,但是分区类型不限于此,并且预测单元910的分区可包括非对称分区、具有预定形状的分区和具有几何形状的分区。
根据每种分区类型,对尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区重复地执行预测编码。可对尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分区执行帧内模式和帧间模式下的预测编码。可仅对尺寸为2N_0×2N_0的分区执行跳过模式下的预测编码。
如果在分区类型912至916中的一个分区类型中编码误差最小,则可不将预测单元910划分到更低深度。
如果在分区类型918中编码误差最小,则深度从0改变到1以在操作920中划分分区类型918,并对深度为2且尺寸为N_0×N_0的编码单元930重复地执行编码来搜索最小编码误差。
用于对深度为1且尺寸为2N_1×2N_1(=N_0×N_0)的编码单元930进行预测编码的预测单元940可包括以下分区类型的分区:尺寸为2N_1×2N_1的分区类型942、尺寸为2N_1×N_1的分区类型944、尺寸为N_1×2N_1的分区类型946以及尺寸为N_1×N_1的分区类型948。
如果在分区类型948中编码误差最小,则深度从1改变到2以在操作950中划分分区类型948,并对深度为2且尺寸为N_2×N_2的编码单元960重复执行编码来搜索最小编码误差。
当最大深度是d时,根据每个深度的划分操作可被执行直到深度变成d-1,并且划分信息可被编码直到深度是0到d-2中的一个。换句话说,当编码被执行直到在与d-2的深度相应的编码单元在操作970中被划分之后深度是d-1时,用于对深度为d-1且尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括以下分区类型的分区:尺寸为2N_(d-1)×2N(d-1)的分区类型992、尺寸为2N_(d-1)×N(d-1)的分区类型994、尺寸为N_(d-1)×2N(d-1)的分区类型996和尺寸为N_(d-1)×N(d-1)的分区类型998。
可对分区类型992至998之中的尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区重复地执行预测编码,以搜索具有最小编码误差的分区类型。
即使当分区类型998具有最小编码误差时,由于最大深度是d,因此深度为d-1的编码单元CU_(d-1)不再被划分到更低深度,构成当前最大编码单元900的编码单元的编码深度被确定为d-1,并且当前最大编码单元900的分区类型可被确定为N_(d-1)×N(d-1)。此外,由于最大深度是d,因此不设置深度为d-1的编码单元952的划分信息。
数据单元999可以是用于当前最大编码单元的“最小单元”。根据实施例的最小单元可以是通过将最小编码单元980划分成4份而获得的正方形数据单元。通过重复地执行编码,根据实施例的视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定编码深度,并将相应分区类型和预测模式设置为编码深度的编码模式。
这样,在所有深度1至d中对根据深度的最小编码误差进行比较,并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关于编码模式的信息被编码并被发送。此外,由于编码单元从深度0被划分到编码深度,因此仅编码深度的划分信息被设置为0,并且除了编码深度以外的深度的划分信息被设置为1。
根据实施例的视频解码设备200的数据获得器220可提取并使用关于编码单元900的编码深度和预测单元的信息,来对分区912进行解码。根据实施例的视频解码设备200可通过使用根据深度的划分信息,将划分信息为0的深度确定为编码深度,并且使用关于相应深度的编码模式的信息来进行解码。
图10至图12是用于描述根据一些实施例的编码单元、预测单元和变换单元之间的关系的示图。
编码单元1010是最大编码单元中的与由根据实施例的视频编码设备100确定的编码深度相应的具有树结构的编码单元。预测单元1060是每个编码单元1010中的预测单元的分区,变换单元1070是每个编码单元1010的变换单元。
当在编码单元1010中最大编码单元的深度是0时,编码单元1012和编码单元1054的深度是1,编码单元1014、1016、1018、1028、1050和1052的深度是2,编码单元1020、1022、1024、1026、1030、1032和1048的深度是3,编码单元1040、1042、1044和1046的深度是4。
在预测单元1060中,通过划分编码单元1010中的编码单元来获得一些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说,编码单元1014、1022、1050和1054中的分区类型的尺寸是2N×N,编码单元1016、1048和1052中的分区类型的尺寸是N×2N,编码单元1032的分区类型的尺寸是N×N。编码单元1010的预测单元和分区小于或等于每个编码单元。
在小于编码单元1052的数据单元中的变换单元1070中,对编码单元1052的图像数据执行变换或逆变换。此外,在尺寸和形状方面,变换单元1070中的编码单元1014、1016、1022、1032、1048、1050、1052和1054不同于预测单元1060中的编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说,根据实施例的视频编码设备100和视频解码设备200可对同一编码单元中的数据单元独立地执行帧内预测、运动估计、运动补偿、变换和逆变换。
因此,对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行编码来确定最优编码单元,从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表1示出可由根据实施例的视频编码设备100和视频解码设备200设置的编码信息。
[表1]
根据实施例的视频编码设备100的数据流产生器130可输出关于具有树结构的编码单元的编码信息,根据实施例的视频解码设备200的数据获得器220可从接收到的比特流提取关于具有树结构的编码单元的编码信息。
划分信息指示是否将当前编码单元划分成更低深度的编码单元。如果当前深度d的划分信息是0,则当前编码单元不再被划分成更低深度的深度是编码深度,从而可针对所述编码深度来定义关于分区类型、预测模式和变换单元的尺寸的信息。如果当前编码单元根据划分信息被进一步划分,则对更低深度的四个划分编码单元独立地执行编码。
预测模式可以是帧内模式、帧间模式和跳过模式中的一种。可在所有分区类型中定义帧内模式和帧间模式,仅在尺寸为2N×2N的分区类型中定义跳过模式。
关于分区类型的信息可指示通过对称地划分预测单元的高度或宽度而获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区类型,以及通过非对称地划分预测单元的高度或宽度而获得的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的非对称分区类型。可通过按1:3和3:1划分预测单元的高度来分别获得尺寸为2N×nU和2N×nD的非对称分区类型,可通过按1:3和3:1划分预测单元的宽度来分别获得尺寸为nL×2N和nR×2N的非对称分区类型。
可将变换单元的尺寸设置成帧内模式下的两种类型和帧间模式下的两种类型。换句话说,如果变换单元的划分信息是0,则变换单元的尺寸可以是2N×2N,即当前编码单元的尺寸。如果变换单元的划分信息是1,则可通过对当前编码单元进行划分来获得变换单元。此外,如果尺寸为2N×2N的当前编码单元的分区类型是对称分区类型,则变换单元的尺寸可以是N×N,如果当前编码单元的分区类型是非对称分区类型,则变换单元的尺寸可以是N/2×N/2。
根据实施例的关于具有树结构的编码单元的编码信息可包括从与编码深度相应的编码单元、预测单元和最小单元中选择的至少一个。与编码深度相应的编码单元可包括从包含相同编码信息的预测单元和最小单元中选择的至少一个。
因此,通过比较邻近数据单元的编码信息来确定邻近数据单元是否被包括在与编码深度相应的同一编码单元中。此外,通过使用数据单元的编码信息来确定与编码深度相应的相应编码单元,并因此可确定最大编码单元中的编码深度的分布。
因此,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则可直接参考并使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。
可选地,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则使用数据单元的编码信息来搜索与当前编码单元邻近的数据单元,并可参考搜索到的邻近编码单元以对当前编码单元进行预测。
图13是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间的关系的示图。
最大编码单元1300包括编码深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里,由于编码单元1318是编码深度的编码单元,因此划分信息可以被设置成0。可将关于尺寸为2N×2N的编码单元1318的分区类型的信息设置成以下分区类型中的一种:尺寸为2N×2N的分区类型1322、尺寸为2N×N的分区类型1324、尺寸为N×2N的分区类型1326、尺寸为N×N的分区类型1328、尺寸为2N×nU的分区类型1332、尺寸为2N×nD的分区类型1334、尺寸为nL×2N的分区类型1336以及尺寸为nR×2N的分区类型1338。
变换单元的划分信息(TU尺寸标记)是一类变换索引。与变换索引相应的变换单元的尺寸可根据编码单元的预测单元类型或分区类型而改变。
例如,当分区类型被设置成对称(即,分区类型1322、1324、1326或1328)时,如果变换单元的TU尺寸标记是0,则设置尺寸为2N×2N的变换单元1342,如果TU尺寸标记是1,则设置尺寸为N×N的变换单元1344。
当分区类型被设置成非对称(即,分区类型1332、1334、1336或1338)时,如果TU尺寸标记是0,则设置尺寸为2N×2N的变换单元1352,如果TU尺寸标记是1,则设置尺寸为N/2×N/2的变换单元1354。
参照图20,TU尺寸标记是具有值0或1的标记,但是TU尺寸标记不限于1比特,在TU尺寸标记从0增加的同时,变换单元可被分层划分以具有树结构。变换单元的划分信息(TU尺寸标记)可以是变换索引的示例。
在这种情况下,根据示例性实施例,可通过使用变换单元的TU尺寸标记以及变换单元的最大尺寸和最小尺寸来表示实际上已使用的变换单元的尺寸。视频编码设备100能够对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码。对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码的结果可被插入SPS中。视频解码设备200可通过使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记来对视频进行解码。
例如,(a)如果当前编码单元的尺寸是64×64并且最大变换单元尺寸是32×32,则(a-1)当TU尺寸标记为0时,变换单元的尺寸可以是32×32,(a-2)当TU尺寸标记为1时,变换单元的尺寸可以是16×16,(a-3)当TU尺寸标记为2时,变换单元的尺寸可以是8×8。
作为另一示例,(b)如果当前编码单元的尺寸是32×32并且最小变换单元尺寸是32×32,则(b-1)当TU尺寸标记为0时,变换单元的尺寸可以是32×32。这里,由于变换单元的尺寸不能够小于32×32,因此TU尺寸标记不能够被设置为除了0以外的值。
作为另一示例,(c)如果当前编码单元的尺寸是64×64并且最大TU尺寸标记为1,则TU尺寸标记可以是0或1。这里,TU尺寸标记不能够被设置为除了0或1以外的值。
因此,当TU尺寸标记为0时,如果定义最大TU尺寸标记为“MaxTransformSizeIndex”,最小变换单元尺寸为“MinTransformSize”,并且变换单元尺寸为“RootTuSize”,则可通过等式(1)来定义可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”:
CurrMinTuSize=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex))…(1)
与可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”相比,当TU尺寸标记为0时,变换单元尺寸“RootTuSize”可指示可在系统中选择的最大变换单元尺寸。在等式(1)中,“RootTuSize/(2∧MaxTransformSizeIndex)”指示当TU尺寸标记为0时,变换单元尺寸“RootTuSize”被划分了与最大TU尺寸标记相应的次数时的变换单元尺寸,“MinTransformSize”指示最小变换尺寸。因此,“RootTuSize/(2^MaxTransformSizeIndex)”和“MinTransformSize”之中较小的值可以是可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”。
根据示例性实施例,最大变换单元尺寸RootTuSize可根据预测模式的类型而改变。
例如,如果当前预测模式是帧间模式,则可通过使用以下的等式(2)来确定“RootTuSize”。在等式(2)中,“MaxTransformSize”指示最大变换单元尺寸,“PUSize”指示当前预测单元尺寸:
RootTuSize=min(MaxTransformSize,PUSize)……(2)
也就是说,如果当前预测模式是帧间模式,则当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前预测单元尺寸之中较小的值。
如果当前分区单元的预测模式是帧内模式,则可通过使用以下的等式(3)来确定“RootTuSize”。在等式(3)中,“PartitionSize”指示当前分区单元的尺寸:
RootTuSize=min(MaxTransformSize,PartitionSize)……(3)
也就是说,如果当前预测模式是帧内模式,则当TU尺寸标记为0时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前分区单元的尺寸之中较小的值。
然而,根据分区单元中的预测模式的类型而改变的当前最大变换单元尺寸“RootTuSize”仅是示例,示例性实施例不限于此。
根据参照图1至图13所述的基于具有树结构的编码单元的视频编码方法,针对对树结构的每个编码单元对空间域的图像数据进行编码。根据基于具有树结构的编码单元的视频解码方法,针对每个最大编码单元执行解码以重构空间域的图像数据。因此,可重构画面以及作为画面序列的视频。可通过再现设备来再现重构的视频,并将重构的视频存储在存储介质中,或通过网络来发送。
以下,将参照图14至图24来描述用于由视频编码设备100和视频解码设备200基于具有树结构的编码单元确定用于解码器配置的信息的技术。
图14是根据各个实施例的用于解码器配置的视频编码方法的流程图。
在操作1410,视频编码设备100的画面编码器120可对图像的采样进行编码。
此外,如以上参照图1至图13所述,画面编码器120可根据包括在每个画面中的最大编码单元,基于具有树结构的编码单元对每个编码单元的采样执行编码。
在操作1420,视频编码设备100的数据流产生器130可确定关于是否存在关于编码的图像的解码器配置的约束的信息。可确定图像的关于解码器配置的信息或关于是否存在受约束的解码器配置的信息,使得解码器对图像进行解码和再现。
例如,解码器可能需要关于编码的画面的采样的布置方法的信息。可基于画面的采样根据逐行扫描顺序还是隔行扫描顺序被布置来将解码器配置确定为逐行的或隔行的。
当对两个图像而不是相同的图像序列进行编码时,可按照两个图像的像素被布置在一个图像上的帧封装结构来执行编码,或者,可通过将不同的图像序列用作单独的层来执行编码。稍后将参照图18至图21来详细描述帧封装结构。
编码器可基于按照帧封装结构还是单独的层对画面进行编码,来确定在一个帧中对两种类型的图像进行编码还是在一个帧中对一种类型的图像进行编码。解码器需要确定从一个帧中一种类型的图像被解码还是两种类型的图像被解码。因此,解码器可能需要关于采样是否按照帧封装结构被布置的信息。
可选择地,只要画面的采样以帧的形式被布置,就可依次再现包括重构的采样的帧,而不需确定画面按照场还是帧的形式被编码。因此,解码器可能需要关于采样是否按照帧结构被有限度地布置的信息。
因此,在操作1420,数据流产生器130可将关于编码的画面的采样的布置类型的约束信息确定为关于是否存在关于编码的图像解码器配置的约束的信息。
根据一些实施例,约束信息可包括指示重构的采样是否根据逐行扫描类型被布置的逐行扫描信息。
根据一些实施例,约束信息可包括指示重构的采样是否根据隔行扫描类型被布置的隔行扫描信息。
根据一些实施例,约束信息可包括指示重构的采样是否按照除帧封装类型以外的布置方法被布置的非帧封装约束信息。
根据一些实施例,约束信息可包括指示画面的采样是否仅按照图像单位和帧单位之中的帧单位被编码的帧约束信息。
在操作1430,数据流产生器130可产生包括包含解码器配置的约束信息的网络抽象层(NAL)单元的数据流。
根据实施例的约束信息可以是最多48比特,并可将约束信息包括在NAL单元之中的视频参数集原始字节序列负荷(RBSP)区域中。
此外,画面编码器120可针对每个子区域对图像进行编码。用于视频编码操作和视频解码操作的并行处理的子区域的示例包括波前并行处理(WPP)的并行块和线程(thread)。
数据流产生器130可确定指示关于画面中的每个子区域的最大尺寸的限制的分段(segmentation)最大尺寸信息。
可基于由根据实施例的分段最大尺寸信息指示的等于或大于0并小于4096的12比特的整数,来确定分段的亮度采样数的最大值。因此,数据流产生器130可将分段最大尺寸信息确定为具有固定长度的无符号整数类型,作为解码器配置的约束信息。
根据实施例的数据流产生器130可将分段最大尺寸信息作为视频可用性信息(VUI)插入到NAL单元之中的序列参数集(SPS)。
相应地,根据一些实施例的视频编码设备100可确定关于解码器配置的约束信息,使得解码器适当地从数据流对编码的画面数据的子区域进行分类,并针对每个画面适当地布置重构的采样。此外,视频编码设备100可产生包括关于采样布置方法的约束信息和分段最大尺寸信息中的至少一个的数据流。
图15是根据各个实施例的用于解码器配置的视频解码方法的流程图。
在操作1510,视频解码设备200的数据获得器220可接收包括NAL单元的数据流。
数据获得器220可从数据流获得编码的数据和编码符号。视频解码设备的画面解码器230可通过使用编码符号对编码的数据执行解码,来重构画面的采样。
如以上参照图1至图13所述,画面解码器230可通过基于根据包括在每个画面中的最大编码单元的具有树结构的编码单元对每个编码单元执行解码来重构采样。
此外,在操作1520,数据获得器220可从数据流获得关于是否存在关于编码的图像的解码器配置的约束的信息。数据获得器220可获得关于图像的解码器配置的信息和关于是否存在受约束的解码器配置的信息中的至少一个作为约束信息,使得解码器可对图像进行解码和再现。。
可获得关于编码的画面的采样的布置方法的约束信息作为关于是否存在关于编码的图像的解码器配置的约束的信息。
根据一些实施例,数据获得器220可从数据流获得指示画面的重构的采样是否根据逐行扫描类型被布置的逐行扫描信息,作为约束信息。
根据一些实施例,数据获得器220可从数据流获得指示画面的重构的采样是否仅按照图像单位和帧单位之中的帧单位被编码的帧约束信息,作为约束信息。
根据一些实施例,数据获得器220可从数据流获得指示重构的采样是否根据隔行扫描类型被布置的隔行扫描信息,作为约束信息。
根据一些实施例,数据获得器220可从数据流获得指示重构的采样是否按照除帧封装类型意外的布置方法被布置的非帧封装约束信息,作为约束信息。
在操作1530,视频编码设备100的画面解码器230可通过根据适当的布置方法将重构的采样对齐来重构每个画面。
画面解码器230可从约束信息确定解码的画面的采样的布置方法。基于逐行扫描信息和隔行扫描信息确定解码器配置是逐行还是隔行。因此,基于逐行扫描信息和隔行扫描信息确定画面的采样是按照逐行扫描顺序还是隔行扫描顺序被布置。
因此,可基于逐行扫描信息对根据逐行扫描方法的图像进行重构。可基于隔行扫描信息对根据隔行扫描方法的图像进行重构。
根据另一示例,画面解码器230可基于非帧封装约束信息确定重构的画面采样是否具有非帧封装结构。例如,在帧封装结构中,可从一个编码的画面重构具有不同属性的两个图像的像素。然而,在非帧封装结构中,可从一个帧重构单个图像的像素。换句话说,可从单个层重构一个图像序列。
根据另一示例,画面解码器230可基于帧约束信息确定重构的采样是否仅按照帧单位被重构。当画面的采样仅按照帧的形式被布置时,包括重构的采样的帧可被依次重构,而不需确定画面是按照场还是帧的形式被编码。
根据实施例的数据获得器220可从NAL单元之中的视频参数集RBSP获得约束信息。可获得由总共48比特组成的约束信息。
此外,数据获得器220可从数据流获得指示关于画面中的每个子区域的最大尺寸的限制的分段最大尺寸信息。根据实施例的数据获得器220可获得具有固定长度的无符号整数类型的分段最大尺寸信息,作为解码器配置的约束信息。
根据实施例的画面解码器230可基于由分段最大尺寸信息指示的等于或大于0且小于4096的12比特的整数,确定分段的亮度采样数的最大值。
画面解码器230可通过基于由分段最大尺寸信息指示的值将图像划分为子区域来执行解码。当视频解码设备200包括能够同时并行处理的多核处理器时,画面解码器230可并行地对子区域执行解码操作。
根据示例性实施例的数据获得器220可从NAL单元之中的SPS获得分段最大尺寸信息作为VUI参数。
相应地,根据一些实施例的视频解码设备200可获得关于采样布置方法的约束信息和分段最大尺寸信息中的至少一个作为关于解码器配置的约束信息。视频解码设备200可通过适当地从数据流对编码的画面数据的子区域进行分类来针对每个子区域并行地执行解码操作。此外,视频解码设备200可基于关于采样布置方法的约束信息针对每个画面适当地布置重构的采样。
以下,参照图16至图23提出根据各个实施例的指示解码器配置信息的语法。视频编码设备100可根据图16、图17和图22中示出的至少一个语法的顺序和比特数,产生包括用于解码器配置的参数的数据流。视频解码设备200可根据图16、图17和图22中示出的至少一个语法的顺序和比特数,从数据流获得和读取用于解码器配置的参数。
图16和图17示出用于解码器配置的语法的各个实施例。
在图16中,“HEVCDecoderConfiguratoinRecord”1600可指示根据实施例的解码器配置信息。“HEVCDecoderConfiguratoinRecord”1600可包括指示约束信息的参数“constraint_indicator_flags”1610和指示分段最大尺寸信息的参数“min_spatial_segmentation”1620,作为解码器配置信息。
根据实施例的指示约束信息的参数“constraint_indicator_flags”1610可被确定为由总共48比特组成。在48比特之中,具有特定长度的比特可指示关于画面采样布置方法的约束信息,并且剩余比特可用作用于设置稍后扩展的功能的保留比特。
根据实施例的指示分段最大尺寸信息的参数“min_spatial_segmentation”1620可以是等于或大于0且小于4095的整数,并被确定为由12比特组成。然而,如稍后将参照图23所述,由于需要字节对齐使得“HEVCDecoderConfiguratoinRecord”1600的语法的总长度是2的N次方,因此可将4比特1630添加到由12比特组成的参数“min_spatial_segmentation”1620之前。
图17示出根据另一实施例的包括关于采样布置方法的约束信息的高级语法。
视频参数集(VPS)RBSP语法可包括型-层-等级(profile-tier-level)参数“profile-tier-level()”1700,其中,“profile-tier-level()”1700包括关于型、层和等级的配置信息。
型、层和等级均指定各种类型的关于比特流的约束信息,并提供关于解码器对比特流进行解码所需的最低功能和配置的信息。一般来说,由于型对分析语法所需的算法进行约束,因此仅满足型的解码器对比特流进行解码。
层和等级可对每个语法的参数值进行约束。可针对每个层(诸如,层0或层1)确定参数值的约束范围,并可针对每个等级(诸如,等级0或等级1)确定参数值的约束范围。
这里,层0可具有比层1差的性能。可针对一个层设置若干个等级。在同一层中,与高等级相比,在低等级中性能可能较差。
根据另一实施例的关于采样布置方法的约束信息1710可包括1比特的指示逐行扫描信息的参数“general_progressive_source_flag”、1比特的指示隔行扫描信息的参数“general_inerlaced_source_flag”、1比特的指示非帧封装约束信息的参数“general_non_packed_constraint_flag”、1比特的指示帧约束信息的参数“general_frame_only_constraint_flag”以及44比特的保留比特“general_reserved_zero_44bits”。这样,可确定由总共48比特组成的约束信息1710。
此外,当对多个层中的视频进行解码时,与关于用于对一般层进行编码和解码的采样布置方法的约束信息1710类似,可将关于用于对子层进行编码和解码的采样布置方法的约束信息1720包括在型-层-等级参数“profile_tier_leverl()”1700中。
相应地,即使对于在子层中被解码的视频,也可确定包括以下参数的由总共48比特组成的约束信息1720:1比特的指示逐行扫描信息的参数“general_layerl_progressive_source_flag”、1比特的指示隔行扫描信息的参数“sub_layer_inerlaced_source_flag”、1比特的指示非帧封装约束信息的参数“sub_layer_non_packed_constraint_flag”、1比特的指示帧约束信息的参数“sub_layer_frame_only_constraint_flag”以及44比特的保留比特“sub_layer_reserved_zero_44bits”。
相应地,视频解码设备200可从解码器配置信息“HEVCDecoderConfiguratoinRecord”1600或型-层-等级参数“profile_tier_level()”1700获得关于采样布置方法的约束信息和分段最大尺寸信息,并确定重构的采样的布置方法和关于分段的最大尺寸的限制。
如以上参照图17所述,根据实施例的型-层-等级参数“profile_tier_level()”1700可包括非帧封装约束信息(“general_non_packed_constraint_flag”或“sub_layer_non_packed_constraint_flag”)。现将参照图18至图21描述帧封装类型图像结构。
图18至图21是用于描述各个帧封装类型的图像的重构处理的示图。
帧封装类型的示例可包括并排(side-by-side)类型、顶-底(top-bottom)类型和时间交错(temporalinterleaving)帧类型。在图18至图21中,描述了根据帧封装类型将由画面解码器230解码的重构的帧1800至2100中的每个重构为两个帧的操作。
两个帧可以是具有不同属性的图像。例如,可对包括左视点帧的采样和右视点帧的采样的帧封装类型的帧进行解码,当对帧封装类型的帧进行解码时,可从重构的帧分离出左视点帧和右视点帧。
这里,重构的帧1800至2100中的每个特定颜色分量采样。换句话说,重构的帧1800至2100可以是亮度分量采样或色度分量采样的重构的帧。
在图18中,重构的帧1800是并排封装类型的帧。在并排封装类型的帧中,由“X”指示的左半部份的采样和由“O”指示的右半部份的采样属于具有不同属性的原始帧。
相应地,可经由并排封装重新对齐操作1810从重构的帧1800分离出包括左半部分采样的半帧01820以及包括右半部分采样的半帧11840。
重构的帧1800的分辨率可与原始帧的原始分辨率相同。半帧01820和半帧11840中的每个的分辨率可以是重构的帧1800的原始帧的一半。
可经由沿水平像素方向的上转换(up-conversion)操作1830将半帧01820重构为具有与重构的帧1800相同的分辨率的帧01860。可经由沿水平像素方向的上转换操作1850将半帧11840重构为具有与重构的帧1800相同的分辨率的帧11880。对于上转换操作1830和1850,可执行沿水平像素方向的插值。
因此,可从并排封装类型的重构的帧1800重构具有原始分辨率的帧01860和帧11880。
图19的重构的帧1900是顶-底封装类型的帧。在顶-底封装类型的帧中,由“X”指示的上半部分采样和由“O”指示的下半部分采样属于具有不同属性的原始帧。
相应地,可经由顶-底封装重新对齐操作1910从重构的帧1900分离出包括上半部分采样的半帧01920和包括下半部分采样的半帧11940。
可经由沿垂直像素方向的上转换操作1930和1950分别将半帧01920和半帧11940重构为具有与重构的帧1900相同的分辨率的帧01960和帧11980。因此,可从重构的帧1900重构具有原始分辨率的帧01960和帧11980。
在图20中,重构的帧2000是并排封装类型的帧。在并排封装类型的帧中,由“X”指示的左半部分采样和由“O”指示的右半部分采样属于具有不同属性的原始帧。
因此,可经由并排封装重新对齐操作2010从重构的帧2000分离出包括上半部分采样的半帧02020和包括下半部分采样的半帧12040。
在图18中,沿垂直行布置了从并排封装类型的重构的帧1800分离出的半帧01820和半帧11840的像素。然而,在图20中,按照棋盘的样式布置了从并排封装类型的重构的帧2000分离出的半帧02020和半帧12040的像素。
因此,可经由沿垂直/水平像素方向的上转换操作2030和2050分别将半帧02020和半帧12040重构为具有与重构的帧2000相同的分辨率的帧02060和帧12080。因此,可从重构的帧2000重构具有原始分辨率的帧02060和帧12080。
在图21中,重构的帧2100是时间交错帧类型的帧。在时间交错帧类型的帧序列中,第偶数个帧和第奇数个帧属于具有不同属性的原始帧序列。
因此,可经由时间交错帧重新对齐操作2110从重构的帧2100重构包括由“X”指示的第偶数个帧的帧序列2010和包括由“X”指示的第奇数个帧的帧序列2140。
在图16中,已提出了将由12比特组成的指示分段最大尺寸信息的参数“min_spatial_segmentation”1620和用于字节对齐的4比特1630插入到包括解码器配置信息的“HEVCDecoderConfiguratoinRecord”1600的实施例。以下,将参照图22和图23描述根据其他实施例的分段最大尺寸信息的语法。
图22示出用于解码器配置的语法的另一实施例。
可将根据另一实施例的解码器配置信息包含在VUI参数2200中。此外,可将VUI参数2200包含在NAL单元之中的SPSRBSP区域中。
VUI参数2200可包括各种类型的信息以增加视频的可用性。例如,VUI参数2200可包括指示是否包括关于纵横比的信息的参数、指示是否包括关于过扫描(overscanning)的信息的参数、指示是否包括关于视频信号类型的信息的参数、指示是否包括关于与亮度分量相比较的色度分量的位置的参数以及指示是否包括关于比特流结构的约束信息的参数。
当VUI参数2200包括关于比特流结构的约束信息时,VUI参数2200还可包括指示分段最大尺寸信息的参数“min_spatial_segmentation_idc”2210。
如上所述,根据实施例,将指示分段最大尺寸信息的参数被确定为固定长度。现将参照图23描述在将语法配置为定长参数时将考虑的内容。
图23是用于描述变长语法和定长语法的字节对齐方法的示图。
如上所述,参数“min_spatial_segmentation”1620和参数“min_spatial_segmentation_idc”2210均可具有等于或大于0且小于4095的由12比特组成的值。
在第一数据流2300、第二数据流2330和第三数据流2360中,A至E均指示形成数据流的语法的参数。
这里,包括第一数据流2300和第二数据流2330的C参数2310和2340的深色的参数是变长参数。剩余参数都是定长参数。这里,长度表示比特数。
由于在第一数据流2300和第二数据流2330中,C参数2310和2340具有可变长度,因此视频解码设备200可分析C参数2310和2340的变长代码的额外操作,以便获得D参数。
然而,当如在第三数据流2360中,C参数2370具有固定长度时,视频解码设备200可容易地访问在C参数之后的D参数,而不需分析变长代码。
此外,为了按照8比特(即,以字节为单位)定义语法,可将语法的总比特长度确定为8的倍数。因此,如上所述,当参数“min_spatial_segmentation”1620和参数“min_spatial_segmentation_idc”2210均具有等于或大于0且小于4095的12比特的值时,解码器配置信息1600或VUI参数2200的语法的总比特数可以不是8的倍数的比特。
因此,根据实施例的视频编码设备100可将4比特的虚拟数据添加到12比特的分段最大尺寸信息。因此,视频解码设备200可从按照8比特的倍数的长度定义的解码器配置信息1600或VUI参数220提取分段最大尺寸信息,并从分段最大尺寸信息获得指示对于排除虚拟数据的实际分段的最大尺寸的限制的值。
因此,可将关于采样布置方法的约束信息和分段最大尺寸信息中的至少一个确定为以上参照图14至图23所述的关于解码器配置的约束信息。视频解码设备200可从数据流适当地对编码的画面数据的子区域进行分类,并基于分段最大尺寸信息并行地针对每个区域执行解码操作。此外,视频解码设备200可基于关于采样布置方法的约束信息针对每个画面/帧适当地布置重构的采样。
以下,参照图24至图30提出了上述视频编码方法和视频解码方法可应用到的各个实施例。
为便于描述,以上参照图1至图23描述的视频编码方法将被统称为“视频编码方法”。另外,以上参照图1至图23描述的视频解码方法将被称为“视频解码方法”。
此外,以上参照图1至图23描述的视频编码设备100或包括图像编码器400的视频编码设备将被统称为“视频编码设备”。另外,以上参照图1至图23描述的视频解码设备200或包括图像解码器500的视频解码设备将被统称为“视频解码设备”。
现将详细描述根据实施例的存储有程序的计算机可读记录介质(例如,盘26000)。
图24是根据一些实施例的存储有程序的盘26000的物理结构的示图。作为存储介质的盘26000可以是硬盘驱动器、致密盘只读存储器(CD-ROM)盘、蓝光盘或数字多功能盘(DVD)。盘26000包括多个同心磁道Tr,其中,所述多个同心磁道Tr沿盘26000的圆周方向均被划分成预定数量的扇区Se。在盘26000的特定区域中,可分配并存储上述用于执行量化参数确定方法、视频编码方法和视频解码方法的程序。
现将参照图22来描述通过使用存储以下程序的存储介质来实现的计算机系统,其中,所述程序用于执行上述视频编码方法和视频解码方法。
图25是通过使用盘26000来记录并读取程序的盘驱动器26800的示图。计算机系统27000可经由盘驱动器26800将用于执行从根据示例性实施例的视频编码方法和视频解码方法中选择的的至少一个的程序存储在盘26000中。为了在计算机系统27000上运行存储在盘26000中的程序,可通过使用盘驱动器27000从盘26000读取程序并将程序发送到计算机系统26700。
用于执行从根据示例性实施例的视频编码方法和视频解码方法中选择的至少一个的程序不仅可被存储在图24或图25中示出的盘26000中,还可被存储在存储卡、ROM卡带或固态驱动器(SSD)中。
以下将描述应用了上述的视频编码方法和视频解码方法的系统。
图26是用于提供内容分发服务的内容供应系统11000的整体结构的示图。将通信系统的服务区域划分成预定尺寸的小区,并将无线基站11700、11800、11900和12000分别安装在这些小区中。
内容供应系统11000包括多个独立装置。例如,诸如计算机12100、个人数字助理(PDA)12200、视频相机12300和移动电话12500的多个独立装置经由互联网服务提供器11200、通信网络11400和无线基站11700、11800、11900和12000连接到互联网11100。
然而,内容供应系统11000不限于如图26中所示的结构,并且装置可选择性地被连接到内容供应系统11000。多个独立装置可不经由无线基站11700、11800、11900和12000而直接连接到通信网络11400。
视频相机12300是能够拍摄视频图像的成像装置,诸如,数字视频相机。移动电话12500可使用各种协议(例如,个人数字通信(PDC)、码分多址(CDMA)、宽带码分多址(W-CDMA)、全球移动通信系统(GSM)和个人手持电话系统(PHS))之中的至少一种通信方法。
视频相机12300可经由无线基站11900和通信网络11400连接到流服务器11300。流服务器11300允许经由视频相机12300从用户接收到的内容经由实时广播被流传输。可使用视频相机12300或流服务器11300来对从视频相机12300接收到的内容进行编码。通过视频相机12300捕捉到的视频数据可经由计算机12100被发送到流服务器11300。
通过相机12600捕捉到的视频数据也可经由计算机12100被发送到流服务器11300。与数码相机类似,相机12600是能够捕捉静止图像和视频图像两者的成像装置。可使用相机12600或计算机12100对通过相机12600捕捉到的视频数据进行编码。可将对视频执行编码和解码的软件存储在可由计算机12100访问的计算机可读记录介质(例如,CD-ROM盘、软盘、硬盘驱动器、SSD或存储卡)中。
如果视频数据通过内置在移动电话12500中的相机被捕捉到,则可从移动电话12500接收视频数据。
还可通过安装在视频相机12300、移动电话12500或相机12600中的大规模集成电路(LSI)系统来对视频数据进行编码。
内容供应系统1100可对由用户使用视频相机12300、相机12600、移动电话12500或另一成像装置所记录的内容数据(例如,在音乐会中记录的内容)进行编码,并将编码后的内容数据发送到流服务器11300。流服务器11300可将编码后的内容数据按照流传输内容的形式发送到请求内容数据的其它客户端。
客户端是能够对编码后的内容数据进行解码的装置,例如计算机12100、PDA12200、视频相机12300或移动电话12500。因此,内容供应系统11000允许客户端接收并再现编码后的内容数据。此外,内容供应系统11000允许客户端实时接收编码后的内容数据并对编码后的内容数据进行解码和再现,从而能够进行个人广播。
包括在内容供应系统11000中的多个独立装置的编码操作和解码操作可与根据示例性实施例的视频编码上班和视频解码设备的编码操作和解码操作类似。
现将参照图27和图28更详细描述根据示例性实施例的内容供应系统11000中包括的移动电话12500。
图27示出根据一些实施例的应用了视频编码方法和视频解码方法的移动电话12500的外部结构。移动电话12500可以是智能电话,其中,所述智能电话的功能不受限,并且所述智能电话的大量功能可被改变或扩展。
移动电话12500可包括与图21的无线基站12000交换射频(RF)信号的内部天线12510,并包括用于显示通过相机12530捕捉的图像或经由天线12510接收到并被解码的图像的显示屏12520(例如,液晶显示器(LCD)或有机发光二极管(OLED)屏幕)。移动电话12500包括包含有控制按钮和触摸面板的操作面板12540。如果显示屏12520是触摸屏,则操作面板12540还包括显示屏12520的触摸感测面板。移动电话12500包括用于输出语音和声音的扬声器12580或其它类型的声音输出单元、以及用于输入语音和声音的麦克风12550或其它类型的声音输入单元。移动电话12500还包括用于捕捉视频或静止图像的相机12530,诸如电荷耦合器件(CCD)相机。移动电话12500还可包括:存储介质12570,用于存储通过相机12530捕捉的、或经由电子邮件接收到的、或按其它方式获得的被编码或解码的数据(例如,视频或静止图像);插槽12560,存储介质12570经由插槽12560被装入移动电话12500中。存储介质12570可以是闪存,诸如包括在塑料壳中的安全数字(SD)卡或电可擦除可编程只读存储器(EEPROM)。
图28示出移动电话12500的内部结构。为了系统地控制包括显示屏12520和操作面板12540的移动电话12500的部件,供电电路12700、操作输入控制器12640、图像编码单元12720、相机接口12630、LCD控制器12620、图像解码单元12690、复用器/解复用器12680、记录/读取单元12670、调制/解调单元12660以及声音处理器12650经由同步总线12730被连接到中央控制器12710。
如果用户操作电源按钮以从“电源关闭”状态设置为“电源开启”状态时,供电电路12700从电池组向移动电话12500的每个部件供电,从而将移动电话12500设置为操作模式。
中央控制器12710包括CPU、ROM和RAM。
在移动电话12500将通信数据发送到外部的同时,在中央控制器12710的控制下,由移动电话12500产生数字信号。例如,声音处理器12650可产生数字声音信号,图像编码单元12720可产生数字图像信号,并且消息的文本数据可经由操作面板12540和操作输入控制单元12640被产生。当在中央控制器12710的控制下,数字信号被发送到调制/解调单元12660时,调制/解调单元12660对数字信号的频带进行调制,并且通信电路12610对经过频带调制的数字声音信号执行数模转换(DAC)和频率转换。从通信电路12610输出的发送信号可经由天线12510被发送到语音通信基站或无线基站12000。
例如,当移动电话12500处于会话模式时,在中央控制器12710的控制下,经由麦克风12550获得的声音信号被声音处理器12650变换成数字声音信号。数字声音信号可经由调制/解调单元12660和通信电路12610被变换成变换信号,并可经由天线12510被发送。
当文本消息(例如,电子邮件)在数据通信模式下被发送时,文本消息的文本数据经由操作面板12540被输入,并经由操作输入控制器12640被发送到中央控制器12610。在中央控制器12610的控制下,文本数据经由调制/解调单元12660和通信电路12610被变换成发送信号,并经由天线12510被发送到无线基站12000。
为了在数据通信模式下发送图像数据,通过相机12530捕捉的图像数据经由相机接口12630被提供给图像编码单元12720。捕捉的图像数据可经由相机接口12630和LCD控制器12620被直接显示在显示屏12520上。
图像编码单元12720的结构可与以上描述的视频编码设备100的结构相应。图像编码单元12720可根据以上描述的视频编码方法,将从相机12530接收的图像数据变换为经过压缩和编码的图像数据,然后将编码的图像数据输出到复用器/解复用器12680。在相机12530的记录操作期间,经由移动电话12500的麦克风12550获得的声音信号还可经由声音处理器12650被变换成数字声音数据,并且数字声音数据可被发送到复用器/解复用器12680。
复用器/解复用器12680对从图像编码单元12720接收的编码的图像数据与从声音处理器12650接收的声音数据一起进行复用。复用数据的结果可经由调制/解调单元12660和通信电路12610被变换成发送信号,并可经由天线12510被发送。
当移动电话12500从外部接收通信数据时,可对经由天线12510接收到的信号执行频率回复和ADC,以将该信号变换成数字信号。调制/解调单元12660对数字信号的频带进行调制。经过频带调制的数字信号根据数字信号的类型被发送到视频解码单元12690、声音处理器12650或LCD控制器12620。
在会话模式下,移动电话12500对经由天线12510接收到的信号进行放大,并通过对放大的信号执行频率转换和ADC来产生数字声音信号。在中央控制器12710的控制下,接收到的数字声音信号经由调制/解调单元12660和声音处理器12650被变换成模拟声音信号,并且模拟声音信号经由扬声器12580被输出。
当在数据通信模式下接收到在互联网网站上访问的视频文件的数据时,经由调制/解调单元12660将经由天线12510从无线基站12000接收到的信号输出为复用的数据,并且复用的数据被发送到复用器/解复用器12680。
为了对经由天线12510接收到的复用的数据进行解码,复用器/解复用器12680将复用的数据解复用成编码的视频数据流和编码的音频数据流。经由同步总线12730,编码的视频数据流和编码的音频数据流分别被提供给视频解码单元12690和声音处理器12650。
图像解码单元12690的结构可与以上描述的视频解码设备200的结构相应。图像解码单元12690可根据以上描述的视频解码方法,对编码的视频数据进行解码来获得重构的视频数据,并经由LCD控制器12620将恢复的视频数据提供给显示屏12520。
因此,可将在互联网网站上访问的视频文件的视频数据显示在显示屏12520上。同时,声音处理器12650可将音频数据变换成模拟声音信号,并将模拟声音信号提供给扬声器12580。因此,也可经由扬声器12580再现在互联网网站上访问的视频文件中包含的音频数据。
移动电话12500或其它类型的通信终端可以是包括根据一些实施例的视频编码设备和视频解码设备两者的收发终端,可以是仅包括分解一些实施例的视频编码设备的收发终端,或者可以是仅包括根据一些实施例的视频解码设备的收发终端。
通信系统不限于以上参照图24描述的通信系统。例如,图29示出根据一些实施例的采用通信系统的数字广播系统。图29的数字广播系统可通过使用根据一些实施例的视频编码设备和视频解码设备来接收经由卫星或地面网络发送的数字广播。
详细地,广播站12890通过无线电波将视频数据流发送到通信卫星或广播卫星12900。广播卫星12900发送广播信号,广播信号经由家用天线12860被发送到卫星广播接收器。在每家中,可通过TV接收器12810、机顶盒12870或其它装置对编码的视频流进行解码和再现。
当根据一些实施例的视频解码设备被实现在再现设备12830中时,再现设备12830可对记录在存储介质12820(诸如盘或存储卡)上的编码的视频流进行解析和解码以恢复数字信号。因此,可在例如监视器12840上再现恢复的视频信号。
在被连接到用于接收卫星/地面广播的天线12860或用于接收有线电视(TV)广播的有线天线12850的机顶盒12870中,可安装根据一些实施例的视频解码设备。从机顶盒12870输出的数据也可被再现在TV监视器12880上。
作为另一实力,可将根据一些实施例的视频解码设备安装在TV接收器12810中,而不是机顶盒12870中。
具有合适天线12910的汽车12920可接收从卫星12900或无线基站11700发送的信号。可在安装在汽车12920中的汽车导航系统12930的显示屏上再现解码的视频。
视频信号可通过根据一些实施例的视频编码设备来编码,并可被存储在存储介质中。详细地讲,可通过DVD记录器将图像信号存储在DVD盘12960中,或可通过硬盘记录器12950将图像信号存储在硬盘中。作为另一示例,可将视频信号存储在SD卡12970中。如果硬盘记录器12950包括根据实施例的视频解码设备时,则记录在DVD盘12960、SD卡12970或其它存储介质上的视频信号可被再现于TV监视器12880上。
汽车导航系统12930可不包括图26的相机12530、相机接口12630和图像编码单元12720。例如,计算机12100和TV接收器12810也可不包括在图26的相机12530、相机接口12630和图像编码单元12720中。
图30是示出根据一些实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构的示图。
根据一些实施例的云计算系统可包括云计算服务器14000、用户数据库(DB)14100、多个计算资源14200和用户终端。
响应于用户终端的请求,云计算系统经由数据通信网络(例如,互联网)提供多个计算资源14200的点播外包服务。在云计算环境下,服务提供商通过使用虚拟化技术整合位于不同物理位置的数据中心的计算资源,为用户提供期望的服务。服务用户不必将计算资源(诸如应用、存储器、操作系统(OS)和安全)安装在他/她自己的终端中以使用所述计算资源,而是可在想要的时间点根据需要在通过虚拟化技术产生的虚拟空间中从多个服务中选择和使用期望的服务。
特定服务用户的用户终端经由包括互联网和移动通信网络的数据通信网络连接到云计算服务器14000。可从云计算服务器14000向用户终端提供云计算服务,特别是视频再现服务。用户终端可以是能够被连接到互联网的任意类型的电子装置,诸如桌上型PC14300、智能TV14400、智能电话14500、笔记本计算机14600、便携式多媒体播放器(PMP)14700、平板PC14800等。
云计算服务器14000可整合分布在云网络中的多个计算资源14200,并向用户终端提供整合的结果。所述多个计算资源14200可包括各种数据服务,并可包括从用户终端上传的数据。如上所述,云计算服务器14000可通过根据虚拟化技术整合分布在不同区域中的视频数据库来向用户终端提供请求的服务。
将已经订购云计算服务的用户的用户信息存储在用户DB14100中。用户信息可包括用户的登陆信息、地址、姓名和个人信用信息。用户信息还可包括视频的索引。这里,所述索引可包括已经被再现的视频的列表、正被再现的视频的列表、之前被再现的视频的暂停点等。
可在用户装置之间共享存储在用户DB14100中的关于视频的信息。例如,当响应于笔记本计算机14600的请求将视频服务提供给笔记本计算机14600时,所述视频服务的再现历史被存储在用户DB14100中。当从智能电话14500接收到用于再现该视频服务的请求时,云计算服务器14000基于用户DB14100搜索并再现此视频服务。当智能电话14500从云计算服务器14000接收到视频数据流时,通过对视频数据流进行解码来再现视频的处理与以上参照图24描述的移动电话12500的操作类似。
云计算服务器14000可参照存储在用户DB14100中的期望的视频服务的再现历史。例如,云计算服务器14000从用户终端接收用于再现存储在用户DB14100中的视频的请求。如果此视频之前被再现过,则由云计算服务器14000执行的对此视频进行流传输的方法可根据来自用户终端的请求(即,根据是将从视频的起点还是视频的暂停点开始再现视频)而不同。例如,如果用户终端请求从视频的起点开始再现视频,则云计算服务器14000将视频的从视频的第一帧开始的流数据发送到用户终端。如果用户终端请求从视频的暂停点开始再现视频,则云计算服务器14000将视频的从与暂停点相应的帧开始的流数据发送到用户终端。
在这种情况下,用户终端可包括以上参照图1至图23描述的视频解码设备。作为另一示例,用户终端可包括以上参照图1至图23描述的视频编码设备。此外,用户终端可包括以上参照图1至图23描述的视频解码设备和视频编码设备两者。
以上参照图24至图30描述了以上参照图1至图23描述的根据实施例的视频编码方法和视频解码方法以及视频编码设备和视频解码设备的各种应用。然而,根据各个实施例的将视频编码方法和视频解码方法存储在存储介质中的方法,或者将视频编码设备和视频解码设备实现在装置中的方法不限于参照图24至图30描述的实施例。
可将示例性实施例编写为计算机程序,并可实现在使用计算机可读记录介质执行程序的通用数字计算机中。计算机可读记录介质的示例包括磁存储介质(例如,ROM、软盘、硬盘等)和光学记录介质(例如,CD-ROM或DVD)。
虽然已参照本公开的实施例具体示出并描述了本公开,但是本领域的普通技术人员将理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可在其中进行形式和细节上的各种改变。实施例应被认为仅是描述性的意义,而不是为了限制的目的。因此,本发明的范围不由本公开的详细描述限定,而是由权利要求来限定,并且所述范围内的所有差异将被解释为包括在本公开中。
Claims (15)
1.一种视频解码方法,包括:
接收包括网络抽象层NAL单元的数据流;
从所述数据流获得指示是否存在关于画面的采样的布置类型的约束的约束信息;
基于约束信息确定通过对编码画面进行解码而产生的重构的采样的布置方法。
2.如权利要求1所述的视频解码方法,其中,获得步骤包括:从NAL单元之中的视频参数集原始字节序列负荷RBSP区域获得由最多48比特组成的约束信息。
3.如权利要求1所述的视频解码方法,其中,获得步骤包括:获得无符号整数类型的具有固定长度的分段最大尺寸信息,其中,分段最大尺寸信息指示关于通过对编码画面进行空间划分而获得的每个子区域的最大尺寸的限制。
4.如权利要求3所述的视频解码方法,还包括:
基于由分段最大尺寸信息指示的等于或大于0且小于4096的由12比特组成的整数,确定分段的亮度采样的数量的最大值;
通过将编码画面划分为子区域来针对每个子区域对编码画面进行解码。
5.如权利要求1所述的视频解码方法,其中,约束信息包括指示重构的采样是否按照逐行扫描类型被布置的逐行扫描信息,
确定步骤包括基于逐行扫描信息确定重构的采样是否按照逐行扫描顺序被布置。
6.如权利要求1所述的视频解码方法,其中,约束信息包括指示画面的采样是否仅以画面单位和帧单位之中的帧单位被编码的帧约束信息,
确定步骤包括基于帧约束信息确定重构的采样是否包括至少一个帧。
7.如权利要求1所述的视频解码方法,其中,约束信息包括指示重构的采样是否按照隔行扫描类型被布置的隔行扫描信息,
确定步骤包括基于隔行扫描信息确定重构的采样是否按照隔行扫描顺序被布置。
8.如权利要求1所述的视频解码方法,其中,约束信息包括指示重构的采样是否按照除帧封装类型以外的类型被布置的非帧封装约束信息,
确定步骤包括基于非帧封装约束信息确定重构的采样是否按照除帧封装类型以外的类型被布置。
9.一种视频编码方法,包括:
对画面的采样进行编码;
基于采样的布置方法确定指示是否存在关于采样的布置类型的约束的约束信息;
产生包括包含约束信息的网络抽象层NAL单元的数据流。
10.如权利要求9所述的视频编码方法,其中,确定步骤包括确定由最多48比特组成的约束信息,
产生步骤包括将约束信息插入到NAL单元之中的视频参数集原始字节序列负荷RBSP区域。
11.如权利要求9所述的视频编码方法,其中,编码步骤包括通过将画面划分为至少一个子区域来针对每个子区域对画面进行编码,
确定步骤包括确定无符号整数类型的具有固定长度的分段最大尺寸信息,其中,分段尺寸信息指示关于所述至少一个子区域中的每个子区域的最大尺寸的限制,
其中,基于由分段最大尺寸信息指示的等于或大于0且小于4096的由12比特组成的整数来确定分段的亮度采样的数量的最大值。
12.一种视频解码设备,包括:
数据获得器,被配置为接收包括网络抽象层NAL单元的数据流,并从所述数据流获得指示是否存在关于画面的采样的布置类型的约束的约束信息;
画面解码器,被配置为通过对从所述数据流获得的符号进行解码来对采样进行重构,并基于约束信息确定重构的采样的布置方法。
13.一种视频编码设备,包括:
编码器,被配置为对画面的采样进行编码;
数据流产生器,被配置为基于采样的布置方法确定指示是否存在关于采样的布置类型的约束的约束信息,并产生包括包含约束信息的网络抽象层NAL单元的数据流。
14.一种记录有用于执行权利要求1至权利要求8中的任意一项权利要求所述的视频解码方法的程序的计算机可读记录介质。
15.一种记录有用于执行权利要求9至权利要求11中的任意一项权利要求所述的视频编码方法的程序的计算机可读记录介质。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201361753610P | 2013-01-17 | 2013-01-17 | |
| US61/753,610 | 2013-01-17 | ||
| PCT/KR2014/000523 WO2014112830A1 (ko) | 2013-01-17 | 2014-01-17 | 디코더 설정을 위한 비디오 부호화 방법 및 그 장치, 디코더 설정에 기초한 비디오 복호화 방법 및 그 장치 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN105144713A true CN105144713A (zh) | 2015-12-09 |
| CN105144713B CN105144713B (zh) | 2019-04-05 |
Family
ID=51209859
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201480016629.3A Expired - Fee Related CN105144713B (zh) | 2013-01-17 | 2014-01-17 | 用于解码器设置的对视频进行编码的方法及其装置以及基于解码器设置对视频进行解码的方法及其装置 |
Country Status (9)
| Country | Link |
|---|---|
| US (1) | US20150358633A1 (zh) |
| EP (1) | EP2947879B1 (zh) |
| JP (1) | JP6113865B2 (zh) |
| KR (1) | KR102284110B1 (zh) |
| CN (1) | CN105144713B (zh) |
| BR (1) | BR112015017059A2 (zh) |
| CA (1) | CA2897599C (zh) |
| MX (1) | MX349110B (zh) |
| WO (1) | WO2014112830A1 (zh) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN107360431A (zh) * | 2017-06-30 | 2017-11-17 | 武汉斗鱼网络科技有限公司 | 一种帧类型的判断方法及装置 |
| CN109565612A (zh) * | 2016-08-22 | 2019-04-02 | 索尼公司 | 发送装置、发送方法、接收装置和接收方法 |
| CN111917988A (zh) * | 2020-08-28 | 2020-11-10 | 长沙摩智云计算机科技有限公司 | 一种云手机的远程摄像头应用方法、系统及介质 |
| CN115174938A (zh) * | 2016-05-10 | 2022-10-11 | 三星电子株式会社 | 用于对图像进行编码/解码的方法及其装置 |
Families Citing this family (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9819945B2 (en) | 2014-06-25 | 2017-11-14 | Qualcomm Incorporated | Multi-layer video coding |
| US10440401B2 (en) | 2016-04-07 | 2019-10-08 | Dolby Laboratories Licensing Corporation | Backward-compatible HDR codecs with temporal scalability |
| US11025933B2 (en) | 2016-06-09 | 2021-06-01 | Apple Inc. | Dynamic video configurations |
| US10999602B2 (en) | 2016-12-23 | 2021-05-04 | Apple Inc. | Sphere projected motion estimation/compensation and mode decision |
| US11259046B2 (en) | 2017-02-15 | 2022-02-22 | Apple Inc. | Processing of equirectangular object data to compensate for distortion by spherical projections |
| US10924747B2 (en) | 2017-02-27 | 2021-02-16 | Apple Inc. | Video coding techniques for multi-view video |
| US11093752B2 (en) | 2017-06-02 | 2021-08-17 | Apple Inc. | Object tracking in multi-view video |
| US10754242B2 (en) | 2017-06-30 | 2020-08-25 | Apple Inc. | Adaptive resolution and projection format in multi-direction video |
| KR102589477B1 (ko) * | 2018-09-14 | 2023-10-13 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 포인트 클라우드 코딩에서 개선된 속성 계층 및 시그널링 |
| US11270471B2 (en) | 2018-10-10 | 2022-03-08 | Bentley Systems, Incorporated | Efficient refinement of tiles of a HLOD tree |
| EP3864626A1 (en) * | 2018-10-14 | 2021-08-18 | Bentley Systems, Incorporated | Dynamic frontend-driven generation of an hlod tree |
| WO2020081347A1 (en) | 2018-10-14 | 2020-04-23 | Bentley Systems, Incorporated | Conversion of infrastructure model geometry to a tile format |
| WO2020256085A1 (en) * | 2019-06-21 | 2020-12-24 | Panasonic Intellectual Property Corporation Of America | System and method for video coding |
| US11936880B2 (en) | 2019-09-27 | 2024-03-19 | Tencent America LLC | Method for signaling output subpicture layer set |
| KR20230091114A (ko) | 2020-10-26 | 2023-06-22 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | Vvc 비디오 코딩의 디코더 구성 정보 |
| CN113657428B (zh) * | 2021-06-30 | 2023-07-14 | 北京邮电大学 | 网络流量数据的抽取方法及装置 |
| EP4604525A1 (en) * | 2022-10-11 | 2025-08-20 | LG Electronics Inc. | Image encoding/decoding method and apparatus using image segmentation, and recording medium on which bitstream is stored |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20050152448A1 (en) * | 2003-09-07 | 2005-07-14 | Microsoft Corporation | Signaling for entry point frames with predicted first field |
| CN101507280A (zh) * | 2006-08-25 | 2009-08-12 | 汤姆逊许可公司 | 用于降低分辨率划分的方法和装置 |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6111913A (en) * | 1997-05-20 | 2000-08-29 | International Business Machines Corporation | Macroblock bit regulation schemes for video encoder |
| JP2007013436A (ja) * | 2005-06-29 | 2007-01-18 | Toshiba Corp | 符号化ストリーム再生装置 |
| KR20070098429A (ko) * | 2006-03-30 | 2007-10-05 | 엘지전자 주식회사 | 비디오 신호의 디코딩 방법 |
| WO2008108566A1 (en) * | 2007-03-02 | 2008-09-12 | Lg Electronics Inc. | A method and an apparatus for decoding/encoding a video signal |
| KR101301181B1 (ko) * | 2007-04-11 | 2013-08-29 | 삼성전자주식회사 | 다시점 영상의 부호화, 복호화 방법 및 장치 |
| EP2149262A4 (en) * | 2007-04-25 | 2010-09-01 | Lg Electronics Inc | METHOD AND DEVICE FOR DECODING / CODING A VIDEO SIGNAL |
| US20120294353A1 (en) * | 2011-05-16 | 2012-11-22 | Mediatek Inc. | Apparatus and Method of Sample Adaptive Offset for Luma and Chroma Components |
| HUE033604T2 (en) * | 2012-04-13 | 2017-12-28 | Ge Video Compression Llc | Low delay picture coding |
| US20140078249A1 (en) * | 2012-09-20 | 2014-03-20 | Qualcomm Incorporated | Indication of frame-packed stereoscopic 3d video data for video coding |
| US9432664B2 (en) * | 2012-09-28 | 2016-08-30 | Qualcomm Incorporated | Signaling layer identifiers for operation points in video coding |
-
2014
- 2014-01-17 BR BR112015017059-5A patent/BR112015017059A2/pt not_active IP Right Cessation
- 2014-01-17 JP JP2015553655A patent/JP6113865B2/ja not_active Expired - Fee Related
- 2014-01-17 CN CN201480016629.3A patent/CN105144713B/zh not_active Expired - Fee Related
- 2014-01-17 KR KR1020140006260A patent/KR102284110B1/ko active Active
- 2014-01-17 CA CA2897599A patent/CA2897599C/en not_active Expired - Fee Related
- 2014-01-17 WO PCT/KR2014/000523 patent/WO2014112830A1/ko not_active Ceased
- 2014-01-17 EP EP14740467.7A patent/EP2947879B1/en not_active Not-in-force
- 2014-01-17 US US14/761,781 patent/US20150358633A1/en not_active Abandoned
- 2014-01-17 MX MX2015009266A patent/MX349110B/es active IP Right Grant
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20050152448A1 (en) * | 2003-09-07 | 2005-07-14 | Microsoft Corporation | Signaling for entry point frames with predicted first field |
| CN101507280A (zh) * | 2006-08-25 | 2009-08-12 | 汤姆逊许可公司 | 用于降低分辨率划分的方法和装置 |
Non-Patent Citations (1)
| Title |
|---|
| ANTHONY VETRO等: "Overview of the Stereo and Multiview Video Coding Extensions of the H.264/MPEG-4 AVC Standard", 《PROCEEDINGS OF THE IEEE》 * |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN115174938A (zh) * | 2016-05-10 | 2022-10-11 | 三星电子株式会社 | 用于对图像进行编码/解码的方法及其装置 |
| CN115174937A (zh) * | 2016-05-10 | 2022-10-11 | 三星电子株式会社 | 用于对图像进行编码/解码的方法及其装置 |
| US12126801B2 (en) | 2016-05-10 | 2024-10-22 | Samsung Electronics Co., Ltd. | Method for encoding/decoding image and device therefor |
| CN109565612A (zh) * | 2016-08-22 | 2019-04-02 | 索尼公司 | 发送装置、发送方法、接收装置和接收方法 |
| CN107360431A (zh) * | 2017-06-30 | 2017-11-17 | 武汉斗鱼网络科技有限公司 | 一种帧类型的判断方法及装置 |
| CN107360431B (zh) * | 2017-06-30 | 2019-08-02 | 武汉斗鱼网络科技有限公司 | 一种帧类型的判断方法及装置 |
| CN111917988A (zh) * | 2020-08-28 | 2020-11-10 | 长沙摩智云计算机科技有限公司 | 一种云手机的远程摄像头应用方法、系统及介质 |
| CN111917988B (zh) * | 2020-08-28 | 2021-12-10 | 湖南多行云计算机科技有限公司 | 一种云手机的远程摄像头应用方法、系统及介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP6113865B2 (ja) | 2017-04-12 |
| KR102284110B1 (ko) | 2021-07-30 |
| EP2947879B1 (en) | 2018-11-07 |
| US20150358633A1 (en) | 2015-12-10 |
| CA2897599A1 (en) | 2014-07-24 |
| BR112015017059A2 (pt) | 2018-09-25 |
| MX2015009266A (es) | 2015-10-15 |
| WO2014112830A1 (ko) | 2014-07-24 |
| JP2016507988A (ja) | 2016-03-10 |
| MX349110B (es) | 2017-07-12 |
| EP2947879A4 (en) | 2016-07-06 |
| KR20140093641A (ko) | 2014-07-28 |
| CN105144713B (zh) | 2019-04-05 |
| EP2947879A1 (en) | 2015-11-25 |
| CA2897599C (en) | 2018-03-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN105027568B (zh) | 用于对条带段进行熵编码的方法及其设备以及用于对条带段进行熵解码的方法及其设备 | |
| CN104620578B (zh) | 用于随机访问的多层视频编码的方法和设备以及用于随机访问的多层视频解码的方法和设备 | |
| CN108965891B (zh) | 用于视频编码和解码的方法和设备 | |
| KR102254118B1 (ko) | 인트라 블록 복사 예측을 이용한 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치 | |
| CN105144713A (zh) | 用于解码器设置的对视频进行编码的方法及其装置以及基于解码器设置对视频进行解码的方法及其装置 | |
| CN108600752B (zh) | 视频编码方法和设备以及计算机可读存储介质 | |
| CN104396252B (zh) | 使用用于多视点视频预测的参考画面集的多视点视频编解码方法及其装置 | |
| CN105103552A (zh) | 用于补偿亮度差的对层间视频进行编码的方法及其装置以及用于对视频进行解码的方法及其装置 | |
| US10063878B2 (en) | Interlayer video encoding method using brightness compensation and device thereof, and video decoding method and device thereof | |
| CN104604237A (zh) | 依据块尺寸来确定帧间预测参考画面列表的用于对视频进行编码的方法和设备以及用于对视频进行解码的方法和设备 | |
| CN106464908A (zh) | 用于传输深度图像的预测模式以供层间视频编码和解码的方法和装置 | |
| CN105684443B (zh) | 屏幕图像编码方法及其装置和屏幕图像解码方法及其装置 | |
| CN105594212A (zh) | 用于确定运动矢量的方法及其设备 | |
| CN106105210A (zh) | 管理用于对多层视频进行编码和解码的缓冲器的方法和设备 | |
| CN107690806A (zh) | 视频编码方法和视频编码设备以及视频解码方法和视频解码设备 | |
| CN105308964A (zh) | 用于随机访问的多层视频编码方法及其装置以及用于随机访问的多层视频解码方法及其装置 | |
| CN105308967A (zh) | 根据用于多视点视频的预测结构的视频流编码方法及其装置以及根据用于多视点视频的预测结构的视频流解码方法及其装置 | |
| CN111263149A (zh) | 视频编码方法和设备以及视频解码方法和设备 | |
| CN106717005A (zh) | 根据参考频率控制参考图像数据的视频编码/解码方法和设备 | |
| CN105340273B (zh) | 用于预测用于层间视频解码的视差矢量的方法以及编码方法和设备 | |
| CN105532005A (zh) | 用于层间编码的方法和设备以及用于使用残差预测对视频进行层间解码的方法和设备 | |
| KR102281283B1 (ko) | 인터 뷰 예측을 이용한 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치 | |
| US20170332092A1 (en) | Method and device for encoding or decoding image |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant | ||
| CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190405 Termination date: 20220117 |
|
| CF01 | Termination of patent right due to non-payment of annual fee |