CN1322442A - 用于压缩视频序列的编码方法 - Google Patents

用于压缩视频序列的编码方法 Download PDF

Info

Publication number
CN1322442A
CN1322442A CN00802012A CN00802012A CN1322442A CN 1322442 A CN1322442 A CN 1322442A CN 00802012 A CN00802012 A CN 00802012A CN 00802012 A CN00802012 A CN 00802012A CN 1322442 A CN1322442 A CN 1322442A
Authority
CN
China
Prior art keywords
subband
space
pixel
coding
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN00802012A
Other languages
English (en)
Other versions
CN1181690C (zh
Inventor
B·佩斯奎特-波佩斯库
M·贝尼蒂雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1322442A publication Critical patent/CN1322442A/zh
Application granted granted Critical
Publication of CN1181690C publication Critical patent/CN1181690C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Abstract

本发明涉及一个对图像序列的压缩编码方法,该图像序列被划分为利用三维(3D)小波变换而分解成的帧组。根据这个方法,基于分级子带编码方法SPIHT并被用于规定了所获得的变换系数的分级金字塔内的空-时关系的一个空-时方向树的带通子带,利用固定预测系数或考虑情况变化的自适应预测系数,一个向量DPCM被用于对最低频率空-时子带进行单独编码,且当为在上述子带的每个帧中具有分量的变换系数的每个向量建立一个空-时预测器时,所观察到的预测错误的量化依靠一个分级或向量量化来进行。由这些调制和量化步骤中产生的最终二进制流通过一个最小化整个消息的墒的无损技术来进行编码。

Description

用于压缩视频序列的编码方法
发明领域
本发明涉及一种用于压缩视频序列的编码方法,该视频序列被划分为多个帧组,这些帧组依靠导致可以产生指定数量的连续清晰度等级的三维(3D)小波变换来进行分解,该方法基于一个被称作“在分级树中设置分区”(SPIHT)的分级子带编码过程,且导致可以从每组帧的图像元素(像素)的原始集合来变换用二进制格式编码的系数并构成一个分级金字塔,这些系数借助于涉及由三个已排序的列表即非重要的集合列表(LIS)、非重要的像素(LIP)列表和重要的像素列表(LSP)所表示的像素的幅度测试来进行排序,这些测试被顺序执行,以便根据一个一直持续到每个重要系数都在上述二进制表示法内被编码的划分过程来将上述的图像元素的原始集合划分成分段子集,并且在一个空-时方向树中,根是由3D小波变换产生的近似子带的像素构成的,这些像素中的每一个的后代(offspring)是由对应于由这些根像素定义的图像量的较高的子带的像素构成的,所述空-时方向树定义了上述分级金字塔内部的空-时关系。
发明背景
在视频压缩方法中,时间冗余的减少主要是通过两种方法获得的。根据第一个方法,所谓的“混合“或预测方法,当前帧的预测被基于先前发送的帧而计算,且只有预测错误被帧内编码并发送。在第二个方法中,时间冗余依靠时间变换而被利用,该变换类似于用于去除冗余的空间技术。在后面的这个技术(所谓的3D或2D+t方法)中,帧序列被作为一个3D量处理,且用于图像编码的子带分解通过用可分变换(例如,依靠滤波器组来实现的小波或小波分组变换)扩展到3D空-时数据。通过在时间和空间方向使用不同的滤波器组,3D结构中的各向异性可以被考虑进来(哈尔滤波器通常被选择用于空间滤波,由于较长的滤波器的增加的延迟是不合需要的;而且,作为双抽头滤波器的哈尔滤波器是没有边界效应的唯一理想的重建正交滤波器)。
已知3D编码方法的编码效率可以通过在低时间子带中在时间分解的每个等级中执行运动估计/补偿来提高。因此,该方法包括子带内的运动估计/补偿且3D子带分解被应用于被补偿的帧组。图1中描述了一个完整的三级时间分解。在输入图像序列中的每个帧组必须含有等于2的幂的多个帧(通常是16,在本例中是8)。直线箭头指示低通(L)时间滤波(连续箭头)和高通(H)时间滤波(虚线箭头),且曲线箭头标明两帧之间的运动补偿。在最后的时间分解等级中,有两帧处在最低的时间子带。在时间子带的每个帧中,执行空间分解。在这个结构中,数据的三维结构子带编码可以作为空间子带编码技术的扩展来被实现。
在视频技术电路及系统IEEE学报vol.6,N3,1996年6月第243-250页中,Said和W.A.Pearlman的题为“一个新的快速而有效的基于分级树中的设置分区的图像编解码器”的文章中,描述了图像压缩最有效的基于小波的方法之一,它最近被扩展到子带3D结构,该方法是分级树中的二维集合划分(即2D SPIHT)。用于这一3D编码技术中的基本概念如下:对应于相同位置的空-时树在小波域中被形成;然后,这些树中的小波变换系数被划分成由在这些系数值的比特平面表示中最高高有效比特级别定义的集合;最后,最高的剩余比特平面被编码且最后得到的比特被发送。
上面提出的SPIHT算法的2D和3D形式的一个共同特征是空间的、相应的空-时的方向树被规定从最低频率子带开始,并且代表涉及相同空间或空-时位置的系数。在这个方法中,除了最低频带外,所有的父代(parent)有四个(在2D时)或8个(在3D时)子代(children)。令(i,j,k)代表3D变换域中的一个图像元素(像素)的坐标:如果它不在最低空-时频率子带中且它不在最后的清晰度等级子带中的一个之中,则它的后代有坐标:O={(2i,2j,2k),(2i+1,2j,2k),(2i,2j+1,2k),(2i,2j,2k+1),(2i+1,2j+1,2k),(2i+1,2j,2k+1),(2i,2j+1,2k+1),(2i+1,2j+1,2k+1)}为简单起见,静止图像的情况在图2中示例出(子带s-LLLL,s-LLLH…等)。
在图像编码域中,在最近几年中零树压缩算法被广泛研究且提出了几个改进。例如,在MPEG-4标准中,这样一个算法的变化方案(见例如在有关信号处理的IEEE学报vok.41,N12,1993年12月,第3445-3462页中J.M.Shapiro的题为“利用小波系数的零树的嵌入式图像编码”的文章)被采纳用于静止图像编码模式,其中最低空间子带使用DPCM技术进行独立编码。然后,空间方向树的构成是以详细的子带(除第一个子带s-LLLL外的所有子带)的形式开始的。
发明概要
本发明的一个目的是提出一个3D情况中的新型视频编码方法。
为此,本发明涉及诸如在前言中说明定义的、并具有如下特征的编码方法:
(A)根据下面的条件,向量差分脉冲编码调制(DPCM)被用于对最低频率空-时子带或近似子带进行单独编码:
(a)为近似子带中的每个帧中具有分量的系数的每个向量构造一个空-时预测量,该预测量不仅使用视频序列中过去的帧中相同的位置的值,还使用当前帧中的相邻值,上述向量编码特性来源于这样的事实:最低频率子带含有来自至少两个帧的空间低频子带;
(b)上述DPCM使用常量预测系数;
(B)预测错误的量化依靠对两向量分量的分级量化而被执行,其后跟随着与针对每一对指定的被量化的值而计算出的概率相关的唯一的二进制码的分配;
(C)由步骤(A)和(B)产生的二进制流通过一个用于最小化整个消息的熵的无损过程来进行编码。
在另一个实施方案中,发明涉及一个类似的方法,但其特征为:
(A)根据下面的条件,向量差分脉冲编码调制(DPCM)被用于对最低频率空-时子带或近似子带进行单独编码:
(a)为近似子带中的每个帧中具有分量的系数的每个向量构造一个时空预测量,该预测量不仅使用图像序列中过去的帧中相同的位置的值,还使用当前帧中的相邻值,上述向量编码特征来源于这样的事实:最低频率子带含有来自至少两个帧的空间低频子带;
(b)上述DPCM使用常量预测系数;
(B)预测错误的量化依靠向量量化来实现,为此要使用一个最优量化器并且要基于广义Lloyd-Max算法,一个针对所述优化而考虑的被量化的预测错误向量的两个分量的联合Laplacian概率密度函数;
(C)由步骤(A)和(B)产生的二进制流通过一个用于最小化整个消息的熵的无损过程来进行编码。
无论是哪个实施方案,上述DPCM都可以是自适应的,空-时预测器的系数依靠每个帧组的这些系数的最小均方估值来考虑情况变化。
附图简述
现在连同附图参考下文描述的实施方案来解释和考虑发明的特性和优势,其中:
-图1示例了对一个以具有运动补偿的三维子带分解形式出现的输入图像序列中的一个8帧的组的时间子带分解;
-图2给出了在静止图像情况下,2D-SPIHT中的空间方向树;
-图3给出了对于二维零树编码(s-LLLL被独立编码)的MPEG-4类的空间方向树;
-图4示例了一个已知的SPIHT算法的方块图;
-图5和6分别给出了3D-SPIHT中的空-时方向树和修正的空-时方向树;
-图7给出了用于建立最低子带中的两个帧的向量DPCM编码中的空-时预测器的像素;
-图8示例了根据本发明的编码方法的方块图。
发明详述
利用这里提出的3D图像方案,3D空-时分解的最低频率子带被独立编码,其它子带被利用3D SPIHT算法来编码。然而,这意味着一些重要的修改。本发明的兴趣集中在3D结构。
在这种情况下,SPIHT算法的一个特殊的特征将被再调用,其方块图在图4中被示例。对于最低空-时子带,父-子关系被如下定义:形成8个相邻像素的多个块,每个方向上包括两个像素。它们的后代被定义成对应于在7个相邻细节子带中相同位置的8像素的组。8像素的组中的一个像素没有后代,其它的每个像素有作为后代的一个8像素块。如果用M,N,T代表初始帧组的维,并且考虑J个分解等级,则最低频率子带的维是MJ=M/2J,NJ=N/2J,TJ=T/2J。位于最低频率子带中的(i,j,k)处的系数的后代为:,O={(i-1+MJ,j-1+NJ,k-1+TJ),(i+MJ,j-1+NJ,k-1+TJ),(i-1+MJ,j+NJ,k-1+TJ),(i+MJ,J+NJ,k-1+TJ),(i-1+MJ,j-1+NJ,k+TJ),(i+MJ,j-1+NJ,k+TJ),(i-1+MJ,j+NJ,k+TJ),(i+MJ,j+NJ,k+TJ)}。
这样,把最低频率子带中的像素作为根,则可形成树。用于3D图像编码中的这一技术也被用于实施3D医学图像压缩,但在这种情况下运动补偿和压缩阶段被跳过。
在这个体制中,这里提出的(图6)对于3D SPIHT算法(图5)的修改是对最低空-时子带t-LL-s-LLLL独立进行编码。由于该子带含有最低时间子带中的两个帧的最低空间频率子带,所以在该范围内的信息可以被看成是向量信息:在这两个空间子带中有相同索引的像素被分成继承了相同索引的向量组。这在图7中针对被包含在最低时间子带中的两个帧(特别是针对这些帧中的最低空间频率子带)而给出了示例。为了压缩这一信息,建议使用一种向量自适应DPCM(差分脉冲编码调制)技术(很清楚,对两个帧单独编码会导致较低的性能)。
利用在分级树中设置分区的零树编码只被用于细节子带的编码。利用这样的观点,即如果在金字塔中的高层的一个小波系数对于一个指定的阈值是无关紧要的,则对应于该金字塔的低一些层中相同的空-时位置的所有系数对于该阈值也是无关紧要的。因此,所有这些系数可以用一个称作零树根的单一符号被有效地编码。如果一个小波系数的绝对值大于该阈值,则该小波系数就被称作是重要的,否则就是无关紧要的。对于发送,小波系数被按照二进制表达法排列,且最高有效比特被首先发送。
现在来描述用于对最低空-时频率子带进行编码的向量自适应DPCM技术。为此,用(i,j)代表最低频率子带中的当前像素的坐标,用xi,j,yi,j代表最低时间子带的第一个和相应的第二个帧的这个索引处的系数值(见图7)。对于向量 s i , j = x i , j y i , j , 一个线性空-时预测器被基于下列等式,其中(n,m)∈Λ而建立: s i , j P = Σ n , m P n , m · s i - n , j - m ( 1 ) 其中: s i - n , j - m = x i - n , j - m y i - m , j - m , s i , j = x i , j y i , j 最近的邻居, s i , j P = x i , j P y i , j P 代表 s i , j = x i , j y i , j 的预测器,且 P n , m = a n , m b n , m c n , m d n , m 是预测系数的矩阵。例如,参考图7,它可以是:si,j P=P1,1·si-1,j-1+Pi,0·si-1,j+P0,1·si,j-1(2) s i , j P = P 1,1 · s i - 1 , j - 1 + P 1,0 · s i - 1 , j + P 0,1 · s i , j - 1 ( 2 ) 其中 P 1,1 = a 1,1 b 1,1 c 1,1 d 1,1 , P 1,0 = a 1,0 b 1,0 c 1,0 d 1,0 , P 0,1 = a 0,1 b 0,1 c 0,1 d 0,1
在等式(2)中,系数a1,1’a1,0’a0,1实现帧1中的一个空间预测,d1,1’d1,0’d1,0形成帧2中的一个空间预测,同时由b1,1’b1,0’b0,1和c1,1’c1,0’c0,1所代表的系数对应于空-时预测。在等式(1)中,可以使用固定预测系数。
另一个可能的实施方案是基于最小化预测错误的均方差来为每组帧找到最佳的预测系数。这是一个自适应策略,在付出了需要计算复杂度的代价下,它能获得比固定情况下好一些的结果。预测错误是向量si,j的实际值及其预测值si,j P之间的差。利用基于一个一般化的Lloyd-Max算法的优化量化器,预测错误可以被以向量方式量化。为了优化,一个简单的选择是考虑一个被量化的预测错误向量的两个分量的联合Laplacian概率密度函数。
这里选择的实施方案是基于两向量分量中的一个分级量化,其后跟随着对该对分量的唯一的二进制码的分配。如果对于每对被量化的值都计算这一事件的概率并将它与一个唯一的二进制码相关,从而最小化消息的墒,则这是可能的。用来选择这个码的技术是算术墒编码,它在例如I.H.Witten等的“用于数据压缩的算法编码”(ACM通信,1987年6月,vol.30,N.6,第520-540页)中被描述。被提议的视频编码系统的总体图在图8中给出,很清楚地看到,其中3D空-时分解的最低频率子带(通过检查“是否是细节?”而被检测到)在一个依靠向量墒编码的分级量化之后被独立编码。
其它子带依靠3D SPIHT算法被处理然后墒被编码。然后这些细节子带被利用零树原理来进行编码,该原理在上述的文献“嵌入式图像编码…“中已经描述,该实施方案的主要方法与SPIHT算法中规定的将系数集合与减少的阈值进行比较是相同。第一个阈值被选择为2的幂
Figure A0080201200101
这样所有小波系数的最大值(即M)为 2 n max ≤ M ≤ 2 n max + 1 . 小波系数按照编码器方和解码器方都已知的一个预定顺序来与这个阈值进行比较。这样就没必要在比特流中发送它。例如,利用图6中的表示法,空-时子带的扫描顺序可以是:t-LL-s-LLLH,t-LL-s-LLHL,t-LL-s-LLHH,t-LH-s-LLLL,t-LH-s-LLLH,t-LH-LLHL,t-LH-s-LLHH,t-LL-s-LLH,t-LL-s-LHL,t-LL-s-LHH,t-LH-s-LLH,t-LH-s-LHL,t-LH-s-LHH等。其它的子带扫描顺序也是可能的。在每个子带内部,一个简单的解决方案是使用扫描的一个光栅次序。实际上,其它扫描策略也可以被实施,它们对应于每个子带中细节的优先的方向:对于最后索引字母为LL和LH的子带的水平方向、对于最后索引字母为HL的垂直扫描方向和对于最后索引字母为HH的对角线扫描方向。
附图及其描述是为了说明而不是限制本发明,很清楚在本发明的范围之内可以提出大量可供选择的方案。还必须指出的是,本发明不局限于针对空-时预测器所考虑的相邻像素的数量和位置、用于运动估计和补偿的方法、用于三维分析及合成的线性小波变化的类型、或者允许计算预测器系数的自适应算法。

Claims (6)

1.一种用于压缩视频序列的编码方法,该视频序列被划分为多个帧组,这些帧组依靠导致可以产生指定数量的连续清晰度等级的三维(3D)小波变换来进行分解,该方法基于一个被称作“在分级树中设置分区”(SPIHT)的分级子带编码过程,且导致可以从每组帧的图像元素(像素)的原始集合来变换用二进制格式编码的系数并构成一个分级金字塔,这些系数借助于涉及由三个已排序的列表即非重要的集合列表(LIS)、非重要的像素(LIP)列表、和重要的像素列表(LSP)所表示的像素的幅度测试来进行排序,这些测试被顺序地执行,以便根据一个一直持续到每个重要系数都在上述二进制表示法内被编码的划分过程来将上述的图像元素的原始集合划分成分段子集,并且在一个空-时方向树中,根是由3D小波变换产生的近似子带的像素构成的,这些像素中的每一个的的后代是由对应于由这些根像素定义的图像量的较高的子带的像素构成的,所述空-时方向树定义了上述分级金字塔内部的空-时关系,应用于所述空-时树的带通子带的该方法的特征进一步为:
(A)根据下面的条件,向量差分脉冲编码调制(DPCM)被用于对最低频率空-时子带或近似子带进行单独编码:
(a)为近似子带中的每个帧中具有分量的系数的每个向量构造一个空-时预测量,该预测量不仅使用视频序列中过去的帧中相同的位置的值,还使用当前帧中的相邻值,上述向量编码特性来源于这样的事实:最低频率子带含有来自至少两个帧的空间低频子带;
(b)上述DPCM使用常量预测系数;
(B)预测错误的量化依靠对两向量分量的分级量化而被执行,其后跟随着与针对每一对指定的被量化的值而计算出的概率相关的唯一的二进制码的分配;
(C)由步骤(A)和(B)产生的二进制流通过一个用于最小化整个消息的熵的无损过程来进行编码。
2.一种用于压缩视频序列的编码方法,该视频序列被划分为多个帧组,这些帧组依靠导致可以产生指定数量的连续清晰度等级的三维(3D)小波变换来进行分解,该方法基于一个被称作“在分级树中设置分区”(SPIHT)的分级子带编码过程,且导致可以从每组帧的图像元素(像素)的原始集合来变换用二进制格式编码的系数并构成一个分级金字塔,这些系数借助于涉及由三个已排序的列表即非重要的集合列表(LIS)、非重要的像素(LIP)列表、和重要的像素列表(LSP)所表示的像素的幅度测试来进行排序,这些测试被顺序地执行,以便根据一个一直持续到每个重要系数都在上述二进制表示法内被编码的划分过程来将上述的图像元素的原始集合划分成分段子集,并且在一个空-时方向树中,根是由3D小波变换产生的近似子带的像素构成的,这些像素中的每一个的的后代是由对应于由这些根像素定义的图像量的较高的子带的像素构成的,所述空-时方向树定义了上述分级金字塔内部的空-时关系,应用于所述空-时树的带通子带的该方法的特征进一步为:
(A)根据下面的条件,向量差分脉冲编码调制(DPCM)被用于对最低频率空-时子带或近似子带进行单独编码:
(a)为近似子带中的每个帧中具有分量的系数的每个向量构造一个时空预测量,该预测量不仅使用图像序列中过去的帧中相同的位置的值,还使用当前帧中的相邻值,上述向量编码特征来源于这样的事实:最低频率子带含有来自至少两个帧的空间低频子带;
(b)上述DPCM使用常量预测系数;
(B)预测错误的量化依靠向量量化来实现,为此要使用一个最优量化器并且要基于广义Lloyd-Max算法,一个针对所述优化而考虑的被量化的预测错误向量的两个分量的联合Laplacian概率密度函数;
(C)由步骤(A)和(B)产生的二进制流通过一个用于最小化整个消息的熵的无损过程来进行编码。
3.根据权利要求1和2中的任何一项的编码方法,其中DPCM成为自适应的,空-时预测器的系数依靠每组帧的这些系数的最小均方估计来考虑情况变化。
4.根据权利要求3的编码方法,其中要确定预测器受空间预测或是时间预测的影响最大。
5.根据权利要求1到4中的任何一项的编码方法,其中上述无损方法基于算术编码。
6.根据权利要求1到4中的任何一项的编码方法,其中上述无损方法基于哈夫曼编码。
CNB008020124A 1999-07-20 2000-07-13 用于压缩视频序列的编码方法 Expired - Fee Related CN1181690C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP99401823 1999-07-20
EP99401823.2 1999-07-20

Publications (2)

Publication Number Publication Date
CN1322442A true CN1322442A (zh) 2001-11-14
CN1181690C CN1181690C (zh) 2004-12-22

Family

ID=8242068

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB008020124A Expired - Fee Related CN1181690C (zh) 1999-07-20 2000-07-13 用于压缩视频序列的编码方法

Country Status (6)

Country Link
US (1) US6519284B1 (zh)
EP (1) EP1114555A1 (zh)
JP (1) JP2003504987A (zh)
KR (1) KR20010075232A (zh)
CN (1) CN1181690C (zh)
WO (1) WO2001006794A1 (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1327672C (zh) * 2004-10-29 2007-07-18 清华大学 一种基于数值微分的流量分配方法
CN100368983C (zh) * 2006-02-21 2008-02-13 广州矽金塔电子有限公司 一种通过屏幕传输信号的方法及其接收装置
CN100370484C (zh) * 2002-05-06 2008-02-20 皇家飞利浦电子股份有限公司 增强编码的数字视频的清晰度的系统和方法
CN100370835C (zh) * 2003-01-29 2008-02-20 三星电子株式会社 用于视频数据压缩的系统和方法
CN100401778C (zh) * 2002-09-17 2008-07-09 弗拉迪米尔·切佩尔科维奇 具有高压缩率和最小必需资源的快速codec
CN100407792C (zh) * 2002-03-18 2008-07-30 西门子共同研究公司 用于数据压缩和显像的方法和系统
CN100459460C (zh) * 2001-11-27 2009-02-04 三星电子株式会社 对数据进行编码和译码的方法和装置
US7676102B2 (en) 2006-04-24 2010-03-09 Fujitsu Limited Image compression apparatus, image compression program and image compression method
CN101252686B (zh) * 2008-03-20 2010-04-14 上海交通大学 基于交织预测的视频帧内无损编解码方法及系统
CN101980466A (zh) * 2010-11-11 2011-02-23 北京航空航天大学 一种联合spiht压缩与不等差错保护编码的码流传输方法
CN102187383A (zh) * 2008-07-09 2011-09-14 奥斯坦多科技公司 基于图像构建的视频显示系统
CN1765103B (zh) * 2003-03-26 2011-11-09 英国电讯有限公司 在网络上的发送
CN102271251A (zh) * 2010-06-02 2011-12-07 华晶科技股份有限公司 无失真的图像压缩方法
CN102783154A (zh) * 2010-02-26 2012-11-14 捷讯研究有限公司 采用双码集的编码和解码方法和设备
US8681185B2 (en) 2009-03-05 2014-03-25 Ostendo Technologies, Inc. Multi-pixel addressing method for video display drivers
CN104040592A (zh) * 2011-11-07 2014-09-10 汤姆逊许可公司 预测位置编码
CN104350752A (zh) * 2012-01-17 2015-02-11 华为技术有限公司 用于高性能视频编码中的无损编码模式的环内滤波
CN1941910B (zh) * 2001-11-27 2015-03-11 三星电子株式会社 编码坐标内插符、解码比特数据流的装置及方法
CN104486631A (zh) * 2014-12-31 2015-04-01 哈尔滨工业大学 一种基于人眼视觉与自适应扫描的遥感图像压缩方法
CN109067405A (zh) * 2018-07-27 2018-12-21 深圳还是威健康科技有限公司 一种数据压缩的方法、装置、终端及计算机可读存储介质
CN117375631A (zh) * 2023-12-07 2024-01-09 深圳市丽台电子有限公司 一种基于哈夫曼编码的快速编码方法

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6920179B1 (en) * 1999-11-16 2005-07-19 Agere Systems Inc. Method and apparatus for video transmission over a heterogeneous network using progressive video coding
EP1320831A2 (en) * 2000-09-12 2003-06-25 Koninklijke Philips Electronics N.V. Video coding method
US6801573B2 (en) * 2000-12-21 2004-10-05 The Ohio State University Method for dynamic 3D wavelet transform for video compression
AUPR222500A0 (en) 2000-12-21 2001-01-25 Unisearch Limited Method for efficient scalable compression of video
KR100366638B1 (ko) * 2001-02-07 2003-01-09 삼성전자 주식회사 웨이블릿 변환을 기본으로하여 트리-구조의 벡터 양자화기법을 이용한 영상 부호화 장치 및 부호화 방법
AU2002366825A1 (en) * 2001-12-20 2003-07-09 Koninklijke Philips Electronics N.V. Video encoding and decoding method and device
AUPS291002A0 (en) * 2002-06-12 2002-07-04 Unisearch Limited Method and apparatus for scalable compression of video
WO2004004355A1 (en) * 2002-06-28 2004-01-08 Koninklijke Philips Electronics N.V. Subband video decoding method and device
WO2004052017A1 (en) * 2002-12-04 2004-06-17 Koninklijke Philips Electronics N.V. Video coding method and device
KR20050085571A (ko) * 2002-12-11 2005-08-29 코닌클리케 필립스 일렉트로닉스 엔.브이. 비디오 부호화 방법 및 대응하는 컴퓨터 프로그램
DE10301572B4 (de) * 2003-01-16 2005-02-03 Marco Nordmann Verfahren zum Komprimieren einer Folge von Bildern
FR2852179A1 (fr) 2003-03-06 2004-09-10 Thomson Licensing Sa Procede de codage d'une image video
JP2007519273A (ja) * 2003-06-30 2007-07-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーバーコンプリート・ウェーブレット符号化と循環予測写像とを用いてビデオ処理を行うシステム及び方法
US8306113B2 (en) 2003-07-09 2012-11-06 Nec Corporation Moving picture encoding method, moving picture decoding method, moving picture encoding device, moving picture decoding device, and computer program
US7602851B2 (en) * 2003-07-18 2009-10-13 Microsoft Corporation Intelligent differential quantization of video coding
US10554985B2 (en) 2003-07-18 2020-02-04 Microsoft Technology Licensing, Llc DC coefficient signaling at small quantization step sizes
US7580584B2 (en) * 2003-07-18 2009-08-25 Microsoft Corporation Adaptive multiple quantization
US7738554B2 (en) 2003-07-18 2010-06-15 Microsoft Corporation DC coefficient signaling at small quantization step sizes
US8218624B2 (en) * 2003-07-18 2012-07-10 Microsoft Corporation Fractional quantization step sizes for high bit rates
CN100450181C (zh) * 2003-07-23 2009-01-07 西北工业大学 一种基于小波变换的嵌入式图像压缩技术
EP1658727A1 (en) * 2003-08-22 2006-05-24 Koninklijke Philips Electronics N.V. Joint spatial-temporal-orientation-scale prediction and coding of motion vectors for rate-distortion-complexity optimized video coding
DE60317670T2 (de) * 2003-09-09 2008-10-30 Mitsubishi Denki K.K. Verfahren und Vorrichtung zur 3D-Teilbandvideokodierung
TWI255146B (en) * 2003-12-04 2006-05-11 Nec Corp Moving picture encoding method and device, and moving picture decoding method and device, and storage medium
FR2867329A1 (fr) * 2004-03-02 2005-09-09 Thomson Licensing Sa Procede de codage d'une sequence d'images par analyse temporelle hierarchique.
US7689051B2 (en) * 2004-04-15 2010-03-30 Microsoft Corporation Predictive lossless coding of images and video
JP4579237B2 (ja) * 2004-04-22 2010-11-10 三菱電機株式会社 画像符号化装置及び画像復号装置
US7801383B2 (en) * 2004-05-15 2010-09-21 Microsoft Corporation Embedded scalar quantizers with arbitrary dead-zone ratios
ITMI20041971A1 (it) * 2004-10-15 2005-01-15 Uni Degli Studi Brescia Metodo di codifica video scalabile
KR100664932B1 (ko) * 2004-10-21 2007-01-04 삼성전자주식회사 비디오 코딩 방법 및 장치
WO2006080665A1 (en) * 2004-10-21 2006-08-03 Samsung Electronics Co., Ltd. Video coding method and apparatus
US8422546B2 (en) 2005-05-25 2013-04-16 Microsoft Corporation Adaptive video encoding using a perceptual model
KR100809603B1 (ko) 2005-12-01 2008-03-06 한국전자통신연구원 화소 단위 기반 영상 부호화 및 복호화 장치 및 방법
FR2896371B1 (fr) 2006-01-19 2008-11-07 Canon Kk Procede et dispositif de traitement d'une sequence d'images numeriques au format extensible
US7995649B2 (en) 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US8059721B2 (en) 2006-04-07 2011-11-15 Microsoft Corporation Estimating sample-domain distortion in the transform domain with rounding compensation
US8503536B2 (en) * 2006-04-07 2013-08-06 Microsoft Corporation Quantization adjustments for DC shift artifacts
US8130828B2 (en) 2006-04-07 2012-03-06 Microsoft Corporation Adjusting quantization to preserve non-zero AC coefficients
US7974340B2 (en) * 2006-04-07 2011-07-05 Microsoft Corporation Adaptive B-picture quantization control
US8711925B2 (en) * 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
WO2007139266A1 (en) * 2006-06-01 2007-12-06 Electronics And Telecommunications Research Institute Method and apparatus for video coding on pixel-wise prediction
US8238424B2 (en) * 2007-02-09 2012-08-07 Microsoft Corporation Complexity-based adaptive preprocessing for multiple-pass video compression
US8498335B2 (en) * 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US8243797B2 (en) * 2007-03-30 2012-08-14 Microsoft Corporation Regions of interest for quality adjustments
US8442337B2 (en) 2007-04-18 2013-05-14 Microsoft Corporation Encoding adjustments for animation content
US8331438B2 (en) 2007-06-05 2012-12-11 Microsoft Corporation Adaptive selection of picture-level quantization parameters for predicted video pictures
US8189933B2 (en) * 2008-03-31 2012-05-29 Microsoft Corporation Classifying and controlling encoding quality for textured, dark smooth and smooth video content
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
CN101984666A (zh) * 2010-11-19 2011-03-09 南京邮电大学 一种基于提升小波变换的图像无损压缩和解压方法
CN102572423B (zh) * 2011-12-16 2014-12-03 辽宁师范大学 一种基于重要性概率平衡树的视频编码方法
TW201409994A (zh) 2012-08-30 2014-03-01 Novatek Microelectronics Corp 立體視訊的編碼方法與編碼裝置
US9232225B2 (en) * 2013-03-14 2016-01-05 Chirp Inc. Low complexity and memory efficient image CODEC
US10223810B2 (en) * 2016-05-28 2019-03-05 Microsoft Technology Licensing, Llc Region-adaptive hierarchical transform and entropy coding for point cloud compression, and corresponding decompression
US10694210B2 (en) 2016-05-28 2020-06-23 Microsoft Technology Licensing, Llc Scalable point cloud compression with transform, and corresponding decompression
US11297346B2 (en) 2016-05-28 2022-04-05 Microsoft Technology Licensing, Llc Motion-compensated compression of dynamic voxelized point clouds

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5412741A (en) * 1993-01-22 1995-05-02 David Sarnoff Research Center, Inc. Apparatus and method for compressing information
US6229927B1 (en) * 1994-09-21 2001-05-08 Ricoh Company, Ltd. Reversible embedded wavelet system implementation
US6141446A (en) * 1994-09-21 2000-10-31 Ricoh Company, Ltd. Compression and decompression system with reversible wavelets and lossy reconstruction
US6226450B1 (en) * 1997-01-21 2001-05-01 Myoung Jun Lee Electric field shielding apparatus
AUPO600897A0 (en) * 1997-04-04 1997-05-01 Canon Information Systems Research Australia Pty Ltd An efficient method of image compression comprising a low resolution image in the bit stream
AUPO951297A0 (en) * 1997-09-29 1997-10-23 Canon Information Systems Research Australia Pty Ltd Method and apparatus for digital data compression

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100459460C (zh) * 2001-11-27 2009-02-04 三星电子株式会社 对数据进行编码和译码的方法和装置
CN1941910B (zh) * 2001-11-27 2015-03-11 三星电子株式会社 编码坐标内插符、解码比特数据流的装置及方法
CN100407792C (zh) * 2002-03-18 2008-07-30 西门子共同研究公司 用于数据压缩和显像的方法和系统
CN100370484C (zh) * 2002-05-06 2008-02-20 皇家飞利浦电子股份有限公司 增强编码的数字视频的清晰度的系统和方法
CN100401778C (zh) * 2002-09-17 2008-07-09 弗拉迪米尔·切佩尔科维奇 具有高压缩率和最小必需资源的快速codec
CN100370835C (zh) * 2003-01-29 2008-02-20 三星电子株式会社 用于视频数据压缩的系统和方法
CN1765103B (zh) * 2003-03-26 2011-11-09 英国电讯有限公司 在网络上的发送
CN1327672C (zh) * 2004-10-29 2007-07-18 清华大学 一种基于数值微分的流量分配方法
CN100368983C (zh) * 2006-02-21 2008-02-13 广州矽金塔电子有限公司 一种通过屏幕传输信号的方法及其接收装置
US7676102B2 (en) 2006-04-24 2010-03-09 Fujitsu Limited Image compression apparatus, image compression program and image compression method
CN101064850B (zh) * 2006-04-24 2010-09-29 富士通株式会社 图像压缩装置和图像压缩方法
CN101252686B (zh) * 2008-03-20 2010-04-14 上海交通大学 基于交织预测的视频帧内无损编解码方法及系统
US8970646B2 (en) 2008-07-09 2015-03-03 Ostendo Technologies, Inc. Image construction based video display system
CN102187383A (zh) * 2008-07-09 2011-09-14 奥斯坦多科技公司 基于图像构建的视频显示系统
CN102187383B (zh) * 2008-07-09 2016-11-09 奥斯坦多科技公司 基于图像构建的视频显示系统
US8681185B2 (en) 2009-03-05 2014-03-25 Ostendo Technologies, Inc. Multi-pixel addressing method for video display drivers
CN102783154A (zh) * 2010-02-26 2012-11-14 捷讯研究有限公司 采用双码集的编码和解码方法和设备
CN102783154B (zh) * 2010-02-26 2015-07-15 黑莓有限公司 采用双码集的编码和解码方法和设备
CN102271251A (zh) * 2010-06-02 2011-12-07 华晶科技股份有限公司 无失真的图像压缩方法
CN102271251B (zh) * 2010-06-02 2013-01-16 华晶科技股份有限公司 无失真的图像压缩方法
CN101980466B (zh) * 2010-11-11 2012-12-12 北京航空航天大学 一种联合spiht压缩与不等差错保护编码的码流传输方法
CN101980466A (zh) * 2010-11-11 2011-02-23 北京航空航天大学 一种联合spiht压缩与不等差错保护编码的码流传输方法
CN104040592A (zh) * 2011-11-07 2014-09-10 汤姆逊许可公司 预测位置编码
CN104350752A (zh) * 2012-01-17 2015-02-11 华为技术有限公司 用于高性能视频编码中的无损编码模式的环内滤波
CN104486631A (zh) * 2014-12-31 2015-04-01 哈尔滨工业大学 一种基于人眼视觉与自适应扫描的遥感图像压缩方法
CN104486631B (zh) * 2014-12-31 2017-06-06 哈尔滨工业大学 一种基于人眼视觉与自适应扫描的遥感图像压缩方法
CN109067405A (zh) * 2018-07-27 2018-12-21 深圳还是威健康科技有限公司 一种数据压缩的方法、装置、终端及计算机可读存储介质
CN109067405B (zh) * 2018-07-27 2022-10-11 深圳市元征科技股份有限公司 一种数据压缩的方法、装置、终端及计算机可读存储介质
CN117375631A (zh) * 2023-12-07 2024-01-09 深圳市丽台电子有限公司 一种基于哈夫曼编码的快速编码方法
CN117375631B (zh) * 2023-12-07 2024-02-06 深圳市丽台电子有限公司 一种基于哈夫曼编码的快速编码方法

Also Published As

Publication number Publication date
US6519284B1 (en) 2003-02-11
JP2003504987A (ja) 2003-02-04
WO2001006794A1 (en) 2001-01-25
CN1181690C (zh) 2004-12-22
KR20010075232A (ko) 2001-08-09
EP1114555A1 (en) 2001-07-11

Similar Documents

Publication Publication Date Title
CN1181690C (zh) 用于压缩视频序列的编码方法
Tang et al. Three-dimensional wavelet-based compression of hyperspectral images
Hsiang Embedded image coding using zeroblocks of subband/wavelet coefficients and context modeling
EP1110180B1 (en) Embedded quadtree wavelets image compression
CN1251509C (zh) 帧序列的编码方法
Ellinas et al. Stereo image compression using wavelet coefficients morphology
CN1197381C (zh) 使用小波分解的视频编码方法
KR20020026240A (ko) 비디오 열의 압축을 위한 인코딩 방법
Raja et al. Image compression using WDR & ASWDR techniques with different wavelet codecs
Inouri et al. A fast and efficient approach for image compression using curvelet transform
US8331708B2 (en) Method and apparatus for a multidimensional discrete multiwavelet transform
Brahimi et al. A new, enhanced EZW image codec with subband classification
Singh et al. Design and implementation of ezw & spiht image coder for virtual images
Chandra et al. 3D-Memory efficient listless set partitioning in hierarchical trees for hyperspectral image sensors
Pan et al. Efficient and low-complexity image coding with the lifting scheme and modified SPIHT
JP3660548B2 (ja) 画像符号化方法及び画像復号方法、画像符号化装置及び画像復号装置、並びにそれらのプログラムを記憶した媒体
Su et al. Wavelet tree classification and hybrid coding for image compression
Oliver et al. A new fast lower-tree wavelet image encoder
Muzaffar et al. Linked significant tree wavelet-based image compression
Yang et al. Low bit-rate SAR image encoding using Bandelets with adaptive quadtree partition
WANG et al. AN IMAGE COMPRESSION TECHNIQUE BASED ON ZERO TREE WAVELET CODER
Kun et al. Wavelet image compression algorithm based on bitplane coding and optimization implementation on multiple dsp platform
Enrıquez et al. Video encoder based on lifting transforms on graphs
Zhang et al. An improved SPECK algorithm with bit plane lifting and the optimal single value prediction
Li et al. Partitioning morphological wavelet image coding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee