CN1377499A - 采用可变时间/频率分辨率和时间/频率转换的有效频谱包络编码方法 - Google Patents

采用可变时间/频率分辨率和时间/频率转换的有效频谱包络编码方法 Download PDF

Info

Publication number
CN1377499A
CN1377499A CN00813602A CN00813602A CN1377499A CN 1377499 A CN1377499 A CN 1377499A CN 00813602 A CN00813602 A CN 00813602A CN 00813602 A CN00813602 A CN 00813602A CN 1377499 A CN1377499 A CN 1377499A
Authority
CN
China
Prior art keywords
frequency
time
resolution
signal
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN00813602A
Other languages
English (en)
Other versions
CN1172293C (zh
Inventor
拉尔斯·G·李杰德
克里斯托弗·科林
伯·埃斯特兰德
弗里德里克·亨恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
ENCODE TECHNOLOGY SWIDEN AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=20417226&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN1377499(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority claimed from SE9903552A external-priority patent/SE9903552D0/xx
Application filed by ENCODE TECHNOLOGY SWIDEN AB filed Critical ENCODE TECHNOLOGY SWIDEN AB
Publication of CN1377499A publication Critical patent/CN1377499A/zh
Application granted granted Critical
Publication of CN1172293C publication Critical patent/CN1172293C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Abstract

本发明提供了一种用于进行频谱包络编码的新型方法和设备。本发明说明了如何实现包络表示的时间/频率映射以及如何发送包络表示的时间/频率映射,此外,还利用自适应时间/频率定向编码对频谱包络数据进行有效编码。该方法可以应用于自然音频编码系统和语言编码系统,并且该方法特别适于采用SBR[WO 98/57436]或其它高频重构的编码器。

Description

采用可变时间/频率分辨率和时间/频率转换 的有效频谱包络编码方法
技术领域
本发明涉及一种在音频编码系统中对频谱包络进行有效编码的新型方法和设备。该方法既可以应用于自然音频编码过程,也可以应用于语音编码过程,并且该方法特别适于采用SBR[WO 98/57436]或其它高频重构方法的编码器。
背景技术
可以将音源编码技术分为两种:自然音编码和语音编码。自然音编码通常以中等位速率用于音乐信号或任意信号,通常提供宽音频带宽。语音编码器基本限制在语音重现,但是从另一方面来说,即使具有低音频带宽,但可以以非常低的位速率使用它。在这两种技术中,通常将信号分离为两个主要信号分量:“频谱包络”信号和相应的“剩余”信号。在以下说明中,在一般意义上,术语“频谱包络”指信号的粗频谱分布,例如,基于线性预测的编码器内的滤波因数,或子带滤波器内的一组子带采样时频平均值。在一般意义上,术语“剩余”指细频谱分布,例如,利用上述时频平均值归一化的LPC误差信号或子带采样。“包络数据”指被量化、被编码的频谱包络,“剩余数据”指被量化、被编码的剩余。在中等位速率和高位速率情况下,剩余数据构成位流的主要部分。在非常低位速率情况下,包络数据构成大部分位流。因此,在采用低位速率时,用压缩方法表示频谱包络的确重要。
为了实现良好时间分辨率,现有技术的音频编码器和大多数语言编码器均采用固定长度、相对较短的时段来产生包络数据。然而,这样就防碍对由心理声学所得知的频域屏蔽的最佳利用。为了提高利用具有陡倾斜窄滤波器频带的编码增益,并在瞬时频段时仍实现良好时间分辨率,当前的音频编码器均采用自适应窗口转换,也就是说,它们根据信号统计量转换时间段长度。显然,短时间段的最少使用量是最大编码增益的先决条件。不幸的是,需要长变迁窗口来改变时间段的长度,这样就限制了转换的适应性。
频谱包络是两个变量,时间和频率,的函数。通过在时频平面的两个方向上使用冗余码,可以进行编码。通常,利用增量编码过程(DPCM)或向量量化过程(VQ),在频率方向对频谱包络进行编码。
发明内容
本发明提供了一种用于频谱包络编码的新型方法和设备。该编码方法用于满足其特定频率范围内的剩余信号被排斥在发射数据外的系统的特殊要求。例如,采用HFR(高频重构),特别是SBR(频谱带复制),或者参量编码器的系统。在一种实施过程中,通过将固定大小滤波器频带内的子带采样自适应分组为分别产生一个包络采样的频带和时间段,获得频谱包络的非均匀时间采样和非均匀频率采样。这样就允许在有限滤波器频带内瞬时选择任意时间和频率分辨率。在接近变迁时,使用较短时间段,从而使用较大频率级以使数据量保持在限制范围内。为了使时间上的非均匀采样的益处实现最大化,采用可变长度位流帧或区组(granule)。可变时间/频率分辨率方法还可以应用于基于预测的包络编码过程。不是对子带采样进行分组,而是根据系统,对可变长度时间段产生预测因数。
本发明描述了两种用于发送所采用的时间分辨率和频率分辨率的方法。通过显式发送时间段边缘分辨率和频率分辨率,第一种方法允许进行任意选择。为了降低发送开销,使用4级区组,从而提供不同成本/适应性折衷方案。第二种方法采用典型节目内容性质,至少由时间Tnmin将各瞬间分开以进一步减少控制位的数量。编码器内、以等于正常区组长度的Tdet<=Tnmin的时间间隔运行的瞬态检测器确定可能瞬态的开始位置。对间隔内的此位置进行编码并发送到解码器。编码器和解码器共同遵守规定频谱包络采样的时间/频率分布给出连续控制信号的特定组合、确保对包络数据进行无歧义解码的规则。
本发明提供了一种用于进行比例因数冗余编码的新型有效方法。时域内的狄拉克脉冲转换为频域内的常数,并且频域内的狄拉克,即单个正弦波对应于频域内具有固定振幅的信号。具体地说,在短时间内,信号在一种域内比在另一种域内显式较小的变化。因此,利用预测编码过程或增量编码过程,如果根据信号特性在时间方向或频率方向对频谱包络进行编码,则可以提高编码效率。
附图说明
现在,将参考附图,利用不限制本发明实质或范围的说明性实例对本发明进行说明,附图包括:
图1a至图1b示出频谱包络均匀时间采样和相应非均匀时间采样;
图2a至图2b定义、说明4级区组的用途;
图3a至图3b示出区组的两个例子以及相应的控制信号;
图4a至图4c示出位置发送系统;
图5示出时间/频率转换增量编码;
图6示出根据本发明采用包络编码过程的编码器的方框图;
图7示出根据本发明采用包络编码保持的解码器的方框图。
优选实施例的说明
以下说明的优选实施例仅用于说明进行有效包络编码的本发明原理。显然,本技术领域内的其它熟练技术人员可以对其设置和细节进行调整和变换。因此,只有之后的本发明权利要求来限定本发明的实质范围,而在此对各实施例所做的说明和解释中的特定细节对本发明实质范围没有限制意义。
包络数据的产生过程
大多数音频编码器和语言编码器在解码器进行合成期间,共同发送并合并包络数据和剩余数据。两个例外是采用PNS[“ImprovingAudio Codecs by Noise Substitution”,D.Schultz,JAES,vol.44,no.7/8,1996]的编码器和采用SBR的编码器。对于SBR,关于高频带,只有频谱粗结构需要被发送,因为剩余信号是由低频带重构的。因此非常需要知道如何产生包络数据,特别是因为在初始剩余信号内没有“时间”信息。现在将利用实例说明此问题。
图1示出持续和弦与主要为高频内容的尖锐瞬态组合在一起的音乐信号的时间/频率图。在低频带,和弦功率高,瞬态功率低,而在高频带则恰好相反。利用高间歇瞬态功率对在出现瞬态的时间间隔期间产生的包络数据进行控制。在解码器进行SBR处理时,使用与对初始高频带进行分析所使用的相同瞬时时间分辨率/频率分辨率,估计转置信号的频谱包络。然后,根据各频谱包络内的不同之处,对转置信号进行均衡处理。例如,利用初始信号与转置信号平均功率的商数的平方根计算包络调节滤波器频带内的放大系数。对于这种信号,产生的问题是:转置信号与低频带具有相同“和弦-瞬态”功率比。对于含有瞬态能量的包络数据的整个时长,为了将转置瞬态调节到正确电平所需的增益会相对于初始高频带电平放大转置和弦。如图1a所示,会将这些瞬间太高和弦片段感觉为瞬态的超前回声和滞后回声。以下将这种失真称为“增益诱导超前回声和滞后回声”。通过以这样的高速率,即保证更新与任意位置瞬态之间的时间短到足以不被人耳所分辨,持续更新包络数据,就可以消除这种现象。然而,这种方法显著提高待发送的数据量,因此不可行。
因此提出了一种新型包络数据产生方法。该方法是在音频频段期间保持低更新速率,音频频段构成典型节目内容的主要部分,利用瞬态检测器确定瞬态位置,对靠近脉冲前沿的包络数据进行更新,参考图1b。这样就消除了增益诱导超前回声。为了很好地表示瞬态衰变,在瞬态开始后的时间间隔内瞬间提高更新速率。这样就可以消除增益诱导滞后回声。衰变期间进行时间分段不象发现瞬态开始那么重要,如下所述。为了补偿小时间步长,在瞬态期间使用大频率级,从而使数据量保持在限制范围内。上述在时间上和频率上的非均匀采样可以应用于基于滤波器组和线性预测的包络编码过程。可以对瞬态时段和准稳(音频)时段采用不同预测顺序。
对于基于预测的编码器,已知现有技术中没有实现时间/频率分辨率转换的方法。然而,某些基于滤波器组的编码器采用可变时间/频率分辨率。通常,这是通过转换滤波器组的大小实现的。改变滤波器组大小的过程不可能立即实现,因此需要所谓转换窗口,而且不能自由选择更新点。在采用SBR或任何其它HFR方法时,目标不同:滤波器组用于满足所需最高时间分辨率和最高频率分辨率以提取有效包络图。因此,通过将固定大小滤波器组产生的子带采样分组为“频带”和“时间段”,可以获得频谱包络的非均匀时间采样和频率采样。然后,对每个频带和时间段计算一个包络采样。在以下说明中,“频率分辨率”指用于对特定时间段进行包络估计的一组特定频带、LPC因数等。换句话说,从包络编码的观点出发,可以同时获得高频分辨率和高时间分辨率。
从语法观点出发,所有实际编解码器位流均包括分别对应于输入信号的短时间段的数据周期。以下将与此数据周期有关的时间段称为“区组”。典型编码器采样固定长度区组。区组边界的出现会对包络估计过程使用的时间段的计算过程产生制约。产生这些时间段的算法表明在特定位置需要时间段“边缘”,并且后续时间段应该具有特定长度。然而,如果因为固定长度区组,区组边界落入此间隔内,则必须将该时间段分割为两部分。这具有双重意义:第一,提高了待编码的时间段数量,因此有可能提高待发送的数据量。第二,强制边缘会产生太短以致不能估计可靠平均功率的各时间段。为了避免这些缺陷,本发明采用可变长度区组。这样就要求编码器预测先行,同时要求解码器具有附加缓冲器。
假定术语“栅格”表示用于特定信号的时间段分辨率和相应频率分辨率,“局部栅格”表示一个区组的栅格。显然,必须将栅格发送到解码器,以对包络采样进行正确解码。然而,在低位速率应用中,此“控制信号”的位数必须保持最少。本发明建议了两种发送方法。在详细说明它们之前,先建立“基线系统”和一些设计规则。
设频谱包络的时间量化级为Tq。可以将这些量化级看作“子区组”,该“子区组”被分组为上述各时间段。在一般情况下,区组包括S个子区组,其中各区组的S互不相同。区组内的可能分段组合数在一个分段到S个分段之间,由下式给出:
为了发送C状态,根据每个子区组一位,需要ceil(ln2C)=ceil(ln2(2S))=S位。可以利用S-1位发送任意细分的区组,表示连续子区组,说明前导分段边缘是否出现在相应子区组。(在此无需发送第一个和最后一个区组边缘。)由于S可变,所以必须发送它,并且如果此方法与固定长度区组低频带编解码器结合,则还必须发送与固定长度区组相位的位置。可以利用分配的控制位,例如每个分段一位,发送分段频率分辨率。显然,这种直通方法会导致不可接受的大量控制信号位。
如下所述,等式1表示的许多状态不太可能,但是也可能产生太多的包络数据以致实际上以有限位速率是不可能的。
可以以如下方式估计音乐节目内容中连续瞬态之间的最小时间跨距:在乐谱中,利用被表示为分数A/B的时间记号来表示韵律“拍子”,其中A表示每节线“节拍”数,1/B是一个节拍的音符类型,例如,1/4音符,通常称为四分之一音符。设t表示每分钟节拍(BPM)形式的速度。下式给出1/C类型的每个音符的时间:
    Tn=(60/t)*(B/C)[s]                          (等式2)
大多数片段在70-160BPM范围内,并且对于由1/32或第32音符构成的大多数实际片段,4/4时间记号是最快韵律模式。这样会产生最短时间Tnmin=(60/160)*4(4/32)=47毫秒。当然,还会产生比此低的时间周期,但是这种快速序列(>每秒21个事件)几乎获得蜂音特性,因此不需要被全部分辨。
还必须建立所需时间分辨率Tq。在某些情况下,瞬态信号的主要能量位于待重构的高频带。这意味着,编码频谱包络必须携带所有“时间”详细。要求时间精度确定用于编码脉冲前沿所需的分辨率。Tq比最短音符周期Tnmin短得多,因为在该周期内可以清晰地听到小时间偏差,瞬态主要具有低频带能量。上述说明的增益诱导超前回声必须在人听觉系统的所谓超前掩蔽或后向掩蔽时间Tm内,这样才听不到它。因此,Tq必须满足两个条件:
    Tq<<Tnmin                                   (等式3)
    Tq<Tm                                        (等式4)
显然,Tm<Tnmin(否则音符就太快了,以致不能分辨它们)并且根据[“Modeling the Additivity of Nonsimultaneous Masking”,Hearing Res.,vol.80,pp.105-118(1994)],Tm约为10-20毫秒。由于Tnmin在50毫秒范围内,所以根据等式3适当选择的Tq也满足第二个条件。当然,在选择Tq时,必须考虑在编码器内进行瞬态检测的精度以及分析/合成滤波器组的时间分辨率。
跟踪脉冲后沿并不重要,这有几个原因:第一,没有音符的位置对可感韵律影响小甚或没有影响。第二,大多数乐器不能表现陡峭脉冲后沿,而可以表现平滑衰减曲线,即不存在良好定义的无音符时间。第三,滞后掩蔽时间或前向掩蔽时间大致长于超前掩蔽时间。
总之,利用对实际信号质量不产生影响或产生少量影响的情况进行如下简化:
1.只有瞬态开始位置需要以最高精度Tq进行发送。
2.只有用Tp>>Tq分离的瞬态需要在包络数据内进行充分分解。
为了减少发送开销,根据本发明的两种系统均采用两种时间采样模式:均匀时间采样和非均匀时间采样。在准稳时段采用均匀模式,因此采用固定长度分段,并且需要少量额外发送。在瞬态附近,系统转换到非均匀运行并使用可变长度区组,从而与全部理想栅格实现良好配合。
分级发送系统
在第一种系统中,将区组分割为4级,并且对各级的特定需要产生控制信号。图2中对各级进行了定义。级“FixFix”对应于传统固定长度区组。级“FixVar”具有可移动停止边界,这样就允许区组长度可变。级“VarFix”具有可变开始边界,因此停止边缘是固定的。最后一级“VarVar”在两端具有可变边界。所有可变边界可以相对于“正常位置”偏离-a/+b。
图2b示出序列区组的一个例子。该系统设定为级FixFix。瞬态检测器(或心理声学模型)在当前区组之前的时间范围内运行,如图所示。在检测到瞬态时,使用级FixVar,系统从均匀运行转换为非均匀运行。通常,此区组之后为级VarFix,由于瞬态在大多数时间被多个所有实际选择区组长度的区组分离。在连续帧瞬态情况下,采用VarVar级帧。
图3a示出级FixVar-VarFix对的一个例子,以及相应的控制信号。示出一个瞬态,并且用t表示脉冲前沿(量化为Tq)。位流的第一部分是“级”信号。由于采用4基,所以用2位表示此信号。对于FixVar级或VarFix级,下一个信号描述可变边界的位置,该位置被表示为正常位置的偏离。将此边界称为“绝对边缘”。利用“相对边缘”表示区组内的分段边缘:绝对边缘用作基准,将其它边缘表示为对基准的累积距离。相对边缘数是可变的,并且可以在绝对边缘之后,被发送到解码器。0数量意味着区组仅包括一个时间段。因此,对于级FixVar,在逆向序列中发送分段长度,并在区组的末端与绝对边缘分离。根据相对边缘和总长度获得FixVar区组内的第一分段的长度,但是不发送第一分段的长度。将级VarFix相对边缘信号插入前向序列的位流内,从而排除最后分段长度。该位流信号顺序与级FixVar位流信号顺序相同,即:[级,绝对边缘,相对边缘数量,相对边缘0,相对边缘1,...,相对边缘N-1]。在该图中,在“明码”中说明该信号,而非在位流的实际二进制码字中说明该信号。
图3b示出该信号的另一种编码过程。当在给定全部栅格对分段进行分组时,可变边界具有通用性。因此,可以在此电平对某些有效负载进行控制,例如,以均衡各区组的位数。这样会停止低频带编码器的运行过程。如果预测先行足够,则可以实现多通路编码过程,并且可以采用局部栅格最佳组合。
为了减少用于发送相对边缘的符号组数量,并减少每个符号的位数,如果绝对边缘具有精确Tq,则可以将这些长度量化为Tq的整数倍(>1)。在这种情况下,除了上述功能之外,绝对边缘用于定位一组在瞬态附近、精度为Tq的边界。换句话说,最高精度始终可以可以用于对瞬态脉冲前沿进行编码,并且利用粗分辨率跟踪衰减过程。
VarVar级帧利用FixVar和VarFix的组合例如交错发送:[级,左绝对边缘,d:0右,左相对边缘数量,d:0右,[左相对边缘0,...,左相对边缘N-1],[d:0右]]。在局部栅格选择中,此级提供最高适应性,但代价是增加了发送开销。最后,除了级信号本身之外,FixFix级不需要其它信号,在这种情况下,例如,使用两个(同样长度)分段。然而,可以附加使得可以在一组预定栅格内进行选择的信号。例如,可以对两个分段计算频谱包络,并且如果两个包络的差别不大于某个量,则仅发送一组包络数据。
以上对仅对时间分段过程进行了说明。因为许多原因,最好将对应于瞬态前缘的边界发送到解码器。这可以通过发送指向相关边缘的“指针”来实现。基准方向沿着相对边缘的方向,并且0值意味着在当前区组内没有瞬态开始。此外,还必须定义用于单独分段的频率分辨率(功率估计数量或预测顺序)。与在“基线系统”内相同,可以显式发送,也可以隐式发送,即,分辨率与分段长度相连,尽可能与指针位置相连。
在使用易出错传输信道时,重要的是避免差错传播。在上述系统中,利用相应区组的控制信号完整描述局部栅格。因此,在控制信号中不存在帧间依赖性。这意味着,区组边界被“过编码”,因为在两个连续区组内发送区组相交区。此冗余可以用于简单纠错,即如果边缘不匹配,则会产生传输差错,并激活隐蔽误差。
位置发送系统
以下将第二系统称为“位置发送系统”,它适于非常低的位速率应用。为了进一步降低控制信号位的数量,所以在很大程度上仍采用上述说明的设计规则。根据本发明,瞬态开始信息可以用于显式发送分段边缘和瞬态附近的频率分辨率。现在,将对此进行说明,假定根据NTq<=Tnmin,即根据在区组内可能会产生一个最长瞬态,选择N个子区组的标称区组大小,参考图4a,其中N=8。如图4b所示,采用以位于当前区组之前N/2的、长度为N的间隔运行的瞬态检测器。在检测到瞬态时,设置与此范围有关的标志。在此例中,瞬态检测器在时间n-1检测到子区组2内的瞬态,在时间n检测到子区组3内的瞬态。这些位置,pos(n-1)和pos(n)以及相应的标志,flag(n-1)和flag(n)用作栅格产生算法的输入,并且区组n的相应局部栅格可以是如图4c所示的那样。从该图中可以看出,时间n-1区组的子区组3包括在区组n的时间/频率栅格内。送到位流的信号只有flag(n)[1位]和pos(n)[ceil(ln2(N))位]。因为解码器已知栅格算法,所以这些信号与先前区组n-1的相应信号一起足以无歧义重构编码器所需的栅格。在未检测到瞬态时,可以废弃该位置信号,并且可以例如利用1位信号代替该位置信号,说明是使用一个分段还是使用两个分段。因此,均匀模式运行过程与分级发送系统的运行过程相同。可以将该系统看作有限态自动机,其中上述信号控制状态间的变迁,变迁状态定义局部栅格。显然,可以用存储在编码器和解码器内的表来表示状态。由于栅格被硬编码,所以牺牲了自适应改变有效负载的能力。适当方法是保持时间/频率数据矩阵的大小(即功率估计数量)接近常数。假定高分辨率分段内的比例因数或系数的数量是低分辨率分段内的比例因数或系数的两倍,则一个高分辨率分段可以换取两个低分辨率分段。
时间/频率转换比例因数编码过程
利用时间频率转换过程,显式时域内的脉冲与频域内的平频谱对应,并且频域内的“脉冲”,即单个正弦波与时域内的准稳信号对应。换句话说,通常,信号在一种域中比在另一种域中显式出更强的瞬态特性。在光频图中,即在时间/频率矩阵显式中,此特性明显,并且在对频谱包络进行编码时,使用此特性具有优势。
音频稳信号具有的非常稀疏频谱,不适于在频率方向进行增量编码,但是却很适于在时域内进行增量编码,反之亦然。图5示出这种情况。在以下说明中,时间n0时计算的比例因数向量表示频谱包络
    Y(k,n0)=[a1,a2,a3,...,ak,...,aN]         (等式5)
其中a1...aN是不同频率的振幅值。普通作法是在给定时间对频率方向上的相邻各值之间的差值进行编码,这样会产生:
   D(k,n0)=[a2-a1,a3-a2,...,aN-aN-1]       (等式6)
为了能够对此进行解码,需要发送开始值a1。如上所述,如果该频谱仅含有少量固定音,则可以证明此增量编码方法效率最低。这样会导致增量编码过程的位速率比规则PCM编码过程的位速率高。为了解决此问题,建议了一种时间/频率转换方法,以下简称为T/F编码:在时间方向和频率方向量化并编码比例因数。在这两种情况下,对于给定编码错误计算所需位数,或者对于给定位数计算编码错误。根据此,选择最有利的编码方向。
例如,可以采用DPCM和霍夫曼冗余编码过程。计算两个向量,Df和Dt
  Df(k,n0)=[a2-a1,a3-a2,...,aN-aN-1]        (等式7)
 Dt(k,n0)=[a1(n0)-a1(n0-1),a2(n0)-a2(n0-1),...,aN(n0)-aN-1(n0-1)](等式8)
一个用于表示频率方向、一个用于表示时间方向的相应霍夫曼表示出了对向量进行编码所需的位数。需要最少位数被编码的编码向量表示较好的编码方向。首先,利用一些最小间距作为时间/频率转换判据,产生该表。
每当在频率方向对频谱包络进行编码,而非在时间方向进行编码时,就发送开始值,因为通过先前的包络,解码器使用它们。建议算法还需要发送附加信息,即表示以哪个方向对频谱包络进行编码的时间/频率标志。T/F算法的优势在于可以与不同于DPCM和霍夫曼方法的、比例因数包络表示的几种不同编码方法(例如:ADPCM、LPC以及向量量化)一起使用。建议的T/F算法给出频谱包络数据的显著位速率减缩。
实际实现过程
图6示出本发明编码器端的一个例子。将模拟输入信号送到A/D转换器601,用于产生数字信号。将数字音频信号送到感觉音频编码器602,感觉音频编码器602对音源进行编码。此外,将该数字信号送到瞬态检测器603和分析滤波器组604,分析滤波器组604将该信号分割为其频谱等效信号(子带信号)。瞬态检测器可以对分析滤波器组输出的子带信号进行检测,但是假定其一般用途是直接对数字时域采样进行检测。瞬态检测器将该信号分割为各区组,并根据本发明确定区组内的哪个子区组被标志为瞬态。将此信息发送到包络分组模块605,包络分组模块605规定待用于当前区组的时间/频率栅格。根据此栅格,该模块将均匀采样子带信号组合在一起以产生非均匀采样包络值。例如,这些值可以表示分组子带采样的平均功率密度。将包络值与分组信息一起送到包络编码器模块606。包络编码器模块606判定在哪个方向(时间方向或频率方向)编码该包络值。将结果信号、音频编码器的输出、宽带包络信息以及控制信号送到复用器607以产生带发送或存储的串行位流。
图7示出本发明的解码器端,利用SBR转置作为产生丢失剩余信号的例子。解复用器701恢复该信号并将正确部分送到音频解码器702,音频解码器702产生低频带数字音频信号。将包络信息从解复用器送到包络解码模块703,包络解码模块703利用控制数据确定在哪个方向对当前包络进行编码并解码该数据。音频解码器输出的低频带信号选择到转置模块704,转置模块704利用低频带产生复制的高频带信号。将该高频带信号送到分析滤波器组706,分析滤波器组706与编码器端的分析滤波器组属于同一种类型。比例因数分组单元707将子带信号组合在一起。利用解复用器输出的控制数据,在此采用的组合和子带采样的时间/频率分布类型与在编码器端采用的相同。增益控制模块708对解复用器输出的包络信息和比例因数分组单元输出的信息进行处理。增益控制模块708计算待施加到子带采样的增益系数,然后在合成滤波器组模块709内对子带采样进行重新组合。因此,合成滤波器组的输出即包络调节高频带音频信号。将该信号附加到延迟单元705的输出端,将低频带音频信号送到延迟单元705。延迟对高频带信号的处理时间进行补偿。最后,数模转换器710将获得的数字宽带信号转换为模拟音频信号。

Claims (17)

1.一种在信源编码系统中进行频谱包络编码的方法,其中所述系统包括:编码器,表示在存储或传输之前执行的所有操作;以及解码器,表示在存储或传输之后执行的所有操作,并且其中对应于特定频率范围的剩余信号被排除在发送数据或存储数据之外,并在所述解码器内合成一个新剩余信号,其特征在于:
所述编码器对输入信号进行统计分析;
根据所述分析的结果,选择用于频谱包络表示的栅格;
利用所述栅格,产生表示所述频谱包络的数据;
将所述数据与描述所述栅格的控制信号一起发送;以及
所述解码器将所述控制信号和所述数据用于分析输出信号。
2.根据权利要求1所述的方法,其特征在于,通过将单元分组为所述输入信号的时间/频率表示,可以获得所述瞬时时间分辨率和频率分辨率,并对每个所述组计算比例因数。
3.根据权利要求2所述的方法,其特征在于,利用滤波器组产生所述时间/频率表示。
4.根据权利要求3所述的方法,其特征在于,所述滤波器组具有固定大小。
5.根据权利要求1所述的方法,其特征在于,利用线性预测器产生所述数据。
6.根据权利要求1所述的方法,其特征在于,所述分析过程采用瞬态检测器。
7.根据权利要求6所述的方法,其特征在于,在瞬态开始时,将所述瞬时分辨率从高频率分辨率与低时间分辨率的默认组合转换为低频率分辨率与高时间分辨率的组合。
8.根据权利要求1所述的方法,其特征在于,所述控制信号描述位于固定更新速率区组内的、通过进行所述分析产生的位置,并且根据当前区组和相邻区组内的位置,利用对所述编码器和所述解码器均有效的规则,选择所述瞬时分辨率。
9.根据权利要求8所述的方法,其特征在于,一个位置至多发送一个区组。
10.根据权利要求1所述的方法,其特征在于,采用可变长度区组。
11.根据权利要求10所述的方法,其特征在于,采用4级区组,其中
第一级具有固定位置区组边界和长度L;
第二级具有固定位置开始边界和可变位置停止边界;
第三级具有可变位置开始边界和固定位置停止边界;
第四级具有可变位置开始和停止边界;以及
所述固定位置与基准位置一致,被间距L分离,并且相对于所述基准位置,所述可变位置偏离[-a,b]。
12.根据权利要求2所述的方法,其特征在于,在时间方向和频率方向对所述比例因数进行编码,确定瞬时最有利方向,将所述最有利方向用于所述传输过程。
13.根据权利要求12所述的方法,其特征在于,对于给定位数,选择产生最少编码错误的方向。
14.根据权利要求12所述的方法,其特征在于,对于给定编码错误,选择产生最少位数的方向。
15.根据权利要求14所述的方法,其特征在于,采用无损失编码过程,将分离的表格用于所述时间方向和频率方向,特别是所述表格用于选择编码方向。
16.一种用于对待被解码器解码的信号的频谱包络进行编码的设备,其特征在于,
装置,用于对输入信号进行统计分析;
装置,用于根据所述分析的结果,选择待用于所述输入信号的频谱包络表示的瞬时时间分辨率和频率分辨率;
装置,用于利用所述分辨率,产生表示所述频谱包络的数据;以及
装置,用于一起传输所述数据和描述所述分辨率的控制信号。
17.一种用于对待被编码器编码的信号的频谱包络进行解码的设备,其特征在于,
装置,用于翻译接收的控制信号以确定在编码信号的频谱包络表示中使用的瞬时时间分辨率和频率分辨率;
装置,用于根据所述频谱包络表示,利用所述控制信号,对接收的包络数据进行解码;以及
装置,将所述解码包络数据用于合成输出信号。
CNB008136025A 1999-10-01 2000-09-29 有效频谱包络编码方法及其编解码设备 Expired - Lifetime CN1172293C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
SE9903552A SE9903552D0 (sv) 1999-01-27 1999-10-01 Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching
SE99035529 1999-10-01
PCT/SE2000/000158 WO2000045378A2 (en) 1999-01-27 2000-01-26 Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
WOPCT/SE00/00158 2000-01-26

Publications (2)

Publication Number Publication Date
CN1377499A true CN1377499A (zh) 2002-10-30
CN1172293C CN1172293C (zh) 2004-10-20

Family

ID=20417226

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB008136025A Expired - Lifetime CN1172293C (zh) 1999-10-01 2000-09-29 有效频谱包络编码方法及其编解码设备

Country Status (14)

Country Link
US (3) US6978236B1 (zh)
EP (1) EP1216474B1 (zh)
JP (3) JP4035631B2 (zh)
CN (1) CN1172293C (zh)
AT (1) ATE271250T1 (zh)
AU (1) AU7821200A (zh)
BR (1) BRPI0014642B1 (zh)
DE (1) DE60012198T2 (zh)
DK (1) DK1216474T3 (zh)
ES (1) ES2223591T3 (zh)
HK (1) HK1049401B (zh)
PT (1) PT1216474E (zh)
RU (1) RU2236046C2 (zh)
WO (1) WO2001026095A1 (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009089728A1 (fr) * 2007-12-27 2009-07-23 Huawei Technologies Co., Ltd. Procédé de reconstruction de bande de haute fréquence, codeur et décodeur associés
CN101149928B (zh) * 2006-09-20 2010-06-02 富士通株式会社 声音信号处理方法、声音信号处理设备及计算机程序
CN101071569B (zh) * 2003-04-30 2011-06-22 杜比国际公司 基于复指数调制的滤波器组的高级处理和自适应时间信号传送方法
CN101866649B (zh) * 2009-04-15 2012-04-04 华为技术有限公司 语音编码处理方法与装置、语音解码处理方法与装置、通信系统
CN101800049B (zh) * 2003-09-16 2012-05-23 松下电器产业株式会社 编码装置和译码装置
CN102844809A (zh) * 2010-01-12 2012-12-26 弗劳恩霍弗实用研究促进协会 基于先前解码频谱值的范数来获得脉络子区值的音频编码器、音频解码器、编码及解码音频信息的方法及计算机程序
CN101218850B (zh) * 2005-07-08 2013-01-30 奥迪康有限公司 消除听力装置中的反馈和噪声的系统及方法
CN102007537B (zh) * 2008-07-11 2013-08-28 弗劳恩霍弗实用研究促进协会 时间扭曲轮廓计算方法及计算器、音频编码方法及编码器
CN105261373A (zh) * 2015-09-16 2016-01-20 深圳广晟信源技术有限公司 用于带宽扩展编码的自适应栅格构造方法和装置
CN105280190A (zh) * 2015-09-16 2016-01-27 深圳广晟信源技术有限公司 带宽扩展编码和解码方法以及装置
CN105431902A (zh) * 2013-06-10 2016-03-23 弗朗霍夫应用科学研究促进协会 用于通过应用分布量化和编码建模累积和表示的音频信号包络编码、处理和解码的装置和方法
US9978380B2 (en) 2009-10-20 2018-05-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a detection of a group of previously-decoded spectral values
CN108828427A (zh) * 2018-03-19 2018-11-16 深圳市共进电子股份有限公司 信号完整性测试的判据查找方法、装置、设备及存储介质
CN111210832A (zh) * 2018-11-22 2020-05-29 广州广晟数码技术有限公司 基于频谱包络模板的带宽扩展音频编解码方法及装置

Families Citing this family (110)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
KR100830857B1 (ko) * 2001-01-19 2008-05-22 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 전송 시스템, 오디오 수신기, 전송 방법, 수신 방법 및 음성 디코더
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
JP3469567B2 (ja) * 2001-09-03 2003-11-25 三菱電機株式会社 音響符号化装置、音響復号化装置、音響符号化方法及び音響復号化方法
EP1423847B1 (en) * 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
KR100949232B1 (ko) 2002-01-30 2010-03-24 파나소닉 주식회사 인코딩 장치, 디코딩 장치 및 그 방법
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7536305B2 (en) 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
US7328150B2 (en) * 2002-09-04 2008-02-05 Microsoft Corporation Innovations in pure lossless audio compression
DE602004030594D1 (de) * 2003-10-07 2011-01-27 Panasonic Corp Verfahren zur entscheidung der zeitgrenze zur codierung der spektro-hülle und frequenzauflösung
KR101106026B1 (ko) * 2003-10-30 2012-01-17 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
JP2007524124A (ja) * 2004-02-16 2007-08-23 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ トランスコーダ及びそのための符号変換方法
WO2005091275A1 (en) * 2004-03-17 2005-09-29 Koninklijke Philips Electronics N.V. Audio coding
WO2005104094A1 (ja) 2004-04-23 2005-11-03 Matsushita Electric Industrial Co., Ltd. 符号化装置
US8065139B2 (en) 2004-06-21 2011-11-22 Koninklijke Philips Electronics N.V. Method of audio encoding
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
KR100721537B1 (ko) * 2004-12-08 2007-05-23 한국전자통신연구원 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
JP5046654B2 (ja) * 2005-01-14 2012-10-10 パナソニック株式会社 スケーラブル復号装置及びスケーラブル復号方法
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US7788106B2 (en) * 2005-04-13 2010-08-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Entropy coding with compact codebooks
US20060235683A1 (en) * 2005-04-13 2006-10-19 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Lossless encoding of information with guaranteed maximum bitrate
EP1869671B1 (de) * 2005-04-28 2009-07-01 Siemens Aktiengesellschaft Verfahren und vorrichtung zur geräuschunterdrückung
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
US8473298B2 (en) * 2005-11-01 2013-06-25 Apple Inc. Pre-resampling to achieve continuously variable analysis time/frequency resolution
JP4876574B2 (ja) 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
EP2040252A4 (en) 2006-07-07 2013-01-09 Nec Corp AUDIO CODING DEVICE, AUDIO CODING METHOD, AND PROGRAM THEREOF
EP2458588A3 (en) * 2006-10-10 2012-07-04 Qualcomm Incorporated Method and apparatus for encoding and decoding audio signals
US8417532B2 (en) * 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8041578B2 (en) 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8126721B2 (en) * 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
JP4918841B2 (ja) * 2006-10-23 2012-04-18 富士通株式会社 符号化システム
US8295507B2 (en) 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
JP5141180B2 (ja) 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
US20080243518A1 (en) * 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
US20080208575A1 (en) * 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
JP4984983B2 (ja) 2007-03-09 2012-07-25 富士通株式会社 符号化装置および符号化方法
WO2008114080A1 (en) * 2007-03-16 2008-09-25 Nokia Corporation Audio decoding
US8630863B2 (en) * 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
US20090006081A1 (en) * 2007-06-27 2009-01-01 Samsung Electronics Co., Ltd. Method, medium and apparatus for encoding and/or decoding signal
US8788264B2 (en) * 2007-06-27 2014-07-22 Nec Corporation Audio encoding method, audio decoding method, audio encoding device, audio decoding device, program, and audio encoding/decoding system
CA2697920C (en) 2007-08-27 2018-01-02 Telefonaktiebolaget L M Ericsson (Publ) Transient detector and method for supporting encoding of an audio signal
ES2748843T3 (es) * 2007-08-27 2020-03-18 Ericsson Telefon Ab L M Análisis/síntesis espectral de baja complejidad utilizando resolución temporal seleccionable
US9159325B2 (en) * 2007-12-31 2015-10-13 Adobe Systems Incorporated Pitch shifting frequencies
EP2242047B1 (en) * 2008-01-09 2017-03-15 LG Electronics Inc. Method and apparatus for identifying frame type
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
KR101441897B1 (ko) * 2008-01-31 2014-09-23 삼성전자주식회사 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치
KR101230481B1 (ko) * 2008-03-10 2013-02-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 이벤트를 갖는 오디오 신호를 조작하기 위한 장치 및 방법
US8386271B2 (en) 2008-03-25 2013-02-26 Microsoft Corporation Lossless and near lossless scalable audio codec
KR101278546B1 (ko) 2008-07-11 2013-06-24 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 대역폭 확장 출력 데이터를 생성하기 위한 장치 및 방법
PL2346029T3 (pl) * 2008-07-11 2013-11-29 Fraunhofer Ges Forschung Koder sygnału audio, sposób kodowania sygnału audio i odpowiadający mu program komputerowy
RU2491658C2 (ru) * 2008-07-11 2013-08-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Синтезатор аудиосигнала и кодирующее устройство аудиосигнала
CA2730232C (en) 2008-07-11 2015-12-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. An apparatus and a method for decoding an encoded audio signal
US8326640B2 (en) * 2008-08-26 2012-12-04 Broadcom Corporation Method and system for multi-band amplitude estimation and gain control in an audio CODEC
MY154633A (en) * 2008-10-08 2015-07-15 Fraunhofer Ges Forschung Multi-resolution switched audio encoding/decoding scheme
CN101751926B (zh) * 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码系统
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
UA99878C2 (ru) 2009-01-16 2012-10-10 Долби Интернешнл Аб Гармоническое преобразование, усовершенствованное перекрестным произведением
KR101316979B1 (ko) * 2009-01-28 2013-10-11 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 코딩
EP2214165A3 (en) * 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
CN102067211B (zh) 2009-03-11 2013-04-17 华为技术有限公司 一种线性预测分析方法、装置及系统
CA2754671C (en) 2009-03-17 2017-01-10 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI643187B (zh) 2009-05-27 2018-12-01 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
EP2273493B1 (en) * 2009-06-29 2012-12-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Bandwidth extension encoding and decoding
WO2011048010A1 (en) 2009-10-19 2011-04-28 Dolby International Ab Metadata time marking information for indicating a section of an audio object
EP3291231B1 (en) * 2009-10-21 2020-06-10 Dolby International AB Oversampling in a combined transposer filterbank
TWI484473B (zh) 2009-10-30 2015-05-11 Dolby Int Ab 用於從編碼位元串流擷取音訊訊號之節奏資訊、及估算音訊訊號之知覺顯著節奏的方法及系統
EP2372704A1 (en) * 2010-03-11 2011-10-05 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Signal processor and method for processing a signal
JP5850216B2 (ja) * 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
JP5712293B2 (ja) * 2010-08-25 2015-05-07 インディアン インスティテュート オブ サイエンスIndian Institute Of Science 不均一な間隔の周波数での有限長シーケンスのスペクトルサンプルの決定
US9008811B2 (en) 2010-09-17 2015-04-14 Xiph.org Foundation Methods and systems for adaptive time-frequency resolution in digital data coding
JP5707842B2 (ja) * 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5724338B2 (ja) * 2010-12-03 2015-05-27 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
JP5633431B2 (ja) 2011-03-02 2014-12-03 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
WO2012122299A1 (en) 2011-03-07 2012-09-13 Xiph. Org. Bit allocation and partitioning in gain-shape vector quantization for audio coding
WO2012122303A1 (en) 2011-03-07 2012-09-13 Xiph. Org Method and system for two-step spreading for tonal artifact avoidance in audio coding
WO2012122297A1 (en) 2011-03-07 2012-09-13 Xiph. Org. Methods and systems for avoiding partial collapse in multi-block audio coding
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
RU2464649C1 (ru) 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала
JP5807453B2 (ja) * 2011-08-30 2015-11-10 富士通株式会社 符号化方法、符号化装置および符号化プログラム
JP6088532B2 (ja) 2011-10-21 2017-03-01 サムスン エレクトロニクス カンパニー リミテッド 無損失符号化方法
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
EP2717261A1 (en) 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
KR101804649B1 (ko) 2013-01-29 2018-01-10 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 마찰음들 또는 파찰음들의 온셋들 또는 오프셋들의 시간 근접도에서의 증가된 시간 해상도를 사용하는 오디오 인코더들, 오디오 디코더들, 시스템들, 방법들 및 컴퓨터 프로그램들
US10043528B2 (en) 2013-04-05 2018-08-07 Dolby International Ab Audio encoder and decoder
JP6439682B2 (ja) * 2013-04-11 2018-12-19 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
US9881624B2 (en) 2013-05-15 2018-01-30 Samsung Electronics Co., Ltd. Method and device for encoding and decoding audio signal
AU2014280256B2 (en) 2013-06-10 2016-10-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding
EP2830058A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
EP2830054A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
EP2830055A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
CN105849803B (zh) * 2013-10-18 2019-10-15 瑞典爱立信有限公司 谱峰位置的编码与解码
US20150149157A1 (en) * 2013-11-22 2015-05-28 Qualcomm Incorporated Frequency domain gain shape estimation
EP3108474A1 (en) 2014-02-18 2016-12-28 Dolby International AB Estimating a tempo metric from an audio bit-stream
GB2528460B (en) * 2014-07-21 2018-05-30 Gurulogic Microsystems Oy Encoder, decoder and method
WO2016024853A1 (ko) * 2014-08-15 2016-02-18 삼성전자 주식회사 음질 향상 방법 및 장치, 음성 복호화방법 및 장치와 이를 채용한 멀티미디어 기기
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
EP3382700A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
US11232804B2 (en) * 2017-07-03 2022-01-25 Dolby International Ab Low complexity dense transient events detection and coding
CN113571073A (zh) * 2020-04-28 2021-10-29 华为技术有限公司 一种线性预测编码参数的编码方法和编码装置

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6439897A (en) 1987-08-06 1989-02-10 Canon Kk Communication control unit
DE69127842T2 (de) * 1990-03-09 1998-01-29 At & T Corp Hybride wahrnehmungsgebundene Kodierung von Audiosignalen
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
JP3144009B2 (ja) 1991-12-24 2001-03-07 日本電気株式会社 音声符号復号化装置
JP3088580B2 (ja) * 1993-02-19 2000-09-18 松下電器産業株式会社 変換符号化装置のブロックサイズ決定法
US5581653A (en) 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
JP3277692B2 (ja) 1994-06-13 2002-04-22 ソニー株式会社 情報符号化方法、情報復号化方法及び情報記録媒体
US6141353A (en) * 1994-09-15 2000-10-31 Oki Telecom, Inc. Subsequent frame variable data rate indication method for various variable data rate systems
US5682463A (en) * 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
US5852806A (en) 1996-03-19 1998-12-22 Lucent Technologies Inc. Switched filterbank for use in audio signal coding
JP3266819B2 (ja) * 1996-07-30 2002-03-18 株式会社エイ・ティ・アール人間情報通信研究所 周期信号変換方法、音変換方法および信号分析方法
JP3464371B2 (ja) 1996-11-15 2003-11-10 ノキア モービル フォーンズ リミテッド 不連続伝送中に快適雑音を発生させる改善された方法
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
EP0878790A1 (en) 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
KR100330196B1 (ko) * 1997-05-16 2002-03-28 다치카와 게이지 가변길이 프레임 전송방법과 전송장치 및 수신장치
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP4216364B2 (ja) 1997-08-29 2009-01-28 株式会社東芝 音声符号化/復号化方法および音声信号の成分分離方法
DE19747132C2 (de) 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
JP2000221988A (ja) * 1999-01-29 2000-08-11 Sony Corp データ処理装置、データ処理方法、プログラム提供媒体及び記録媒体
US6658382B1 (en) * 1999-03-23 2003-12-02 Nippon Telegraph And Telephone Corporation Audio signal coding and decoding methods and apparatus and recording media with programs therefor
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101071569B (zh) * 2003-04-30 2011-06-22 杜比国际公司 基于复指数调制的滤波器组的高级处理和自适应时间信号传送方法
CN101800049B (zh) * 2003-09-16 2012-05-23 松下电器产业株式会社 编码装置和译码装置
CN101218850B (zh) * 2005-07-08 2013-01-30 奥迪康有限公司 消除听力装置中的反馈和噪声的系统及方法
CN101149928B (zh) * 2006-09-20 2010-06-02 富士通株式会社 声音信号处理方法、声音信号处理设备及计算机程序
WO2009089728A1 (fr) * 2007-12-27 2009-07-23 Huawei Technologies Co., Ltd. Procédé de reconstruction de bande de haute fréquence, codeur et décodeur associés
CN102007537B (zh) * 2008-07-11 2013-08-28 弗劳恩霍弗实用研究促进协会 时间扭曲轮廓计算方法及计算器、音频编码方法及编码器
CN101866649B (zh) * 2009-04-15 2012-04-04 华为技术有限公司 语音编码处理方法与装置、语音解码处理方法与装置、通信系统
US11443752B2 (en) 2009-10-20 2022-09-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a detection of a group of previously-decoded spectral values
US9978380B2 (en) 2009-10-20 2018-05-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a detection of a group of previously-decoded spectral values
CN102844809A (zh) * 2010-01-12 2012-12-26 弗劳恩霍弗实用研究促进协会 基于先前解码频谱值的范数来获得脉络子区值的音频编码器、音频解码器、编码及解码音频信息的方法及计算机程序
CN102844809B (zh) * 2010-01-12 2015-02-18 弗劳恩霍弗实用研究促进协会 基于先前解码频谱值的范数来获得上下文子区值的音频编码器、音频解码器、编码及解码音频信息的方法
US9633664B2 (en) 2010-01-12 2017-04-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a modification of a number representation of a numeric previous context value
CN105431902B (zh) * 2013-06-10 2020-03-31 弗朗霍夫应用科学研究促进协会 用于音频信号包络编码、处理和解码的装置和方法
CN105431902A (zh) * 2013-06-10 2016-03-23 弗朗霍夫应用科学研究促进协会 用于通过应用分布量化和编码建模累积和表示的音频信号包络编码、处理和解码的装置和方法
CN105280190A (zh) * 2015-09-16 2016-01-27 深圳广晟信源技术有限公司 带宽扩展编码和解码方法以及装置
CN105280190B (zh) * 2015-09-16 2018-11-23 深圳广晟信源技术有限公司 带宽扩展编码和解码方法以及装置
CN105261373A (zh) * 2015-09-16 2016-01-20 深圳广晟信源技术有限公司 用于带宽扩展编码的自适应栅格构造方法和装置
CN108828427A (zh) * 2018-03-19 2018-11-16 深圳市共进电子股份有限公司 信号完整性测试的判据查找方法、装置、设备及存储介质
CN108828427B (zh) * 2018-03-19 2020-10-27 深圳市共进电子股份有限公司 信号完整性测试的判据查找方法、装置、设备及存储介质
CN111210832A (zh) * 2018-11-22 2020-05-29 广州广晟数码技术有限公司 基于频谱包络模板的带宽扩展音频编解码方法及装置

Also Published As

Publication number Publication date
WO2001026095A1 (en) 2001-04-12
ATE271250T1 (de) 2004-07-15
RU2236046C2 (ru) 2004-09-10
BR0014642A (pt) 2002-06-18
JP4334526B2 (ja) 2009-09-30
AU7821200A (en) 2001-05-10
JP4628921B2 (ja) 2011-02-09
JP2006031053A (ja) 2006-02-02
US20060031065A1 (en) 2006-02-09
EP1216474B1 (en) 2004-07-14
HK1049401A1 (en) 2003-05-09
US20060031064A1 (en) 2006-02-09
JP2003529787A (ja) 2003-10-07
DE60012198D1 (de) 2004-08-19
DK1216474T3 (da) 2004-10-04
JP2006065342A (ja) 2006-03-09
ES2223591T3 (es) 2005-03-01
BRPI0014642B1 (pt) 2016-04-26
US6978236B1 (en) 2005-12-20
HK1049401B (zh) 2005-11-18
PT1216474E (pt) 2004-11-30
EP1216474A1 (en) 2002-06-26
US7181389B2 (en) 2007-02-20
JP4035631B2 (ja) 2008-01-23
DE60012198T2 (de) 2005-08-18
CN1172293C (zh) 2004-10-20
US7191121B2 (en) 2007-03-13

Similar Documents

Publication Publication Date Title
CN1172293C (zh) 有效频谱包络编码方法及其编解码设备
CN101189662B (zh) 带多级码本和冗余编码的子带话音编解码器
CN101268351B (zh) 健壮解码器
AU2006270171B2 (en) Frequency segmentation to obtain bands for efficient coding of digital media
KR101246991B1 (ko) 오디오 신호 처리 방법
AU2006270263B2 (en) Modification of codewords in dictionary used for efficient coding of digital media spectral data
US9135923B1 (en) Pitch synchronous speech coding based on timbre vectors
JP2009524100A (ja) 符号化/復号化装置及び方法
KR20060121655A (ko) 넓은-뜻의 지각적 유사성을 이용하는 디지털 미디어스펙트럼 데이터의 효과적인 코딩
JPH05197400A (ja) 低ビット・レート・ボコーダ手段および方法
CN114550732B (zh) 一种高频音频信号的编解码方法和相关装置
WO2000045378A2 (en) Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
CN102226945A (zh) 一种多速率语音频编码的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1049401

Country of ref document: HK

C56 Change in the name or address of the patentee

Owner name: DUBI SWEDEN STOCK CO., LTD.

Free format text: FORMER NAME: ENCODING TECHNOLOGY STOCK CO., LTD.

CP03 Change of name, title or address

Address after: Stockholm

Patentee after: Dolby Sweden AG

Address before: Stockholm

Patentee before: Coding Technologies Sweden AB

C56 Change in the name or address of the patentee

Owner name: DOLBY INTERNATIONAL COMPANY

Free format text: FORMER NAME: DOLBY SWEDEN AB COMPANY

CP03 Change of name, title or address

Address after: Amsterdam

Patentee after: Dolby International AB

Address before: Stockholm

Patentee before: Dolby Sweden AG

EE01 Entry into force of recordation of patent licensing contract

Assignee: Guangdong OPPO Mobile Communications Co., Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2012990000215

Denomination of invention: Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching

Granted publication date: 20041020

License type: Common License

Open date: 20021030

Record date: 20120411

EE01 Entry into force of recordation of patent licensing contract

Assignee: Qingdao Haier Electric Appliance Co., Ltd.

Assignor: Dolby Laboratories Licensing Corp,|Dolby International AB

Contract record no.: 2012990000481

Denomination of invention: Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching

Granted publication date: 20041020

License type: Common License

Open date: 20021030

Record date: 20120706

EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20021030

Assignee: Lenovo Mobile Communication Technology Ltd.

Assignor: Dolby Laboratories Licensing Corp,|Dolby International AB

Contract record no.: 2012990000858

Denomination of invention: Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching

Granted publication date: 20041020

License type: Common License

Record date: 20121129

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20021030

Assignee: Lenovo (Beijing) Co., Ltd.

Assignor: Dolby Laboratories Licensing Corp,|Dolby International AB

Contract record no.: 2013990000005

Denomination of invention: Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching

Granted publication date: 20041020

License type: Common License

Record date: 20130106

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20021030

Assignee: Beijing millet Communication Technology Co., Ltd.

Assignor: Dolby Laboratories Licensing Corp,|Dolby International AB

Contract record no.: 2013990000048

Denomination of invention: Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching

Granted publication date: 20041020

License type: Common License

Record date: 20130206

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20021030

Assignee: Guangzhou Huaduo Network Technology Co., Ltd.

Assignor: Via licensing company

Contract record no.: 2014990000616

Denomination of invention: Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching

Granted publication date: 20041020

License type: Common License

Record date: 20140804

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
CX01 Expiry of patent term

Granted publication date: 20041020

CX01 Expiry of patent term