CN1848241B - 多通道音频编码器 - Google Patents

多通道音频编码器 Download PDF

Info

Publication number
CN1848241B
CN1848241B CN2006100817855A CN200610081785A CN1848241B CN 1848241 B CN1848241 B CN 1848241B CN 2006100817855 A CN2006100817855 A CN 2006100817855A CN 200610081785 A CN200610081785 A CN 200610081785A CN 1848241 B CN1848241 B CN 1848241B
Authority
CN
China
Prior art keywords
audio
subband
subframe
code
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN2006100817855A
Other languages
English (en)
Other versions
CN1848241A (zh
Inventor
斯蒂芬·M·史密斯
迈克尔·H·史密斯
威廉·保罗·史密斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DTS Inc
Original Assignee
DTS Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DTS Inc filed Critical DTS Inc
Publication of CN1848241A publication Critical patent/CN1848241A/zh
Application granted granted Critical
Publication of CN1848241B publication Critical patent/CN1848241B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Abstract

一种子带声编码器(12)采用了完全/非完全重构滤波器(34)、预测/非预测子带编码(72)、瞬变分析器(106)、和心理声学/最小均方差(mmse)相对时间的位分配(30)、频率以及多声道对数据流进行编码/解码以产生高保真度的重构声音。声编码器(64)对多通道声信号进行划分以便把帧尺寸即字节数量限制在所需的范围内,并对编码数据进行格式化处理以便当接收到各子帧时能进行播放从而减少伪象。此外,声编码器处理声频带宽的基带部分0-24kHz以便用相同的编码/解码算法对48kHz或更高的频率进行采样从而使声编码器的结构在未来具有兼容性。

Description

多通道音频编码器
本申请是申请号为03156927.7、申请日为1996年11月21日、发明名称为“多通道声码器”的中国专利申请的分案申请。
技术领域
本发明涉及多通道音频信号的高质量编码和解码,更确切地说,是关于一种子带编码器,此编码器在时间域、频率域和多个音频通道之间运用了完全/非完全重构滤波器组、预测/非预测子带编码、瞬态分析、和心理声学/最小均方差(MMSE)比特率分配等方法,以产生可使其相应解码计算量受到约束的数据流。
背景技术
公知的高质量音频和音乐编码器可以分成两大类方案。第一类是具有中高频率分辨率的子带/变换编码器,该类编码器能根据心理声学的掩蔽计算结果自适应地量化其分析窗内的子带或系数采样数据。第二类是频率分辨率较低的子带编码器,这种编码器通过ADPCM(自适应差分脉冲编码调制)对子带采样数据进行处理来补偿其频率分辨率的不足。
第一类编码器利用了音乐信号中大量的短时频谱变化差异,使其比特率分配根据信号的频谱能量进行自我调整。由于其频率分辨率高的特性,这些编码器变换后的频域信号能被直接应用于建立在听觉的临界频带理论上的心理声学模型。托德(Todd)等人在1994年2月发表于音响工程协会年会的“AC-3:音频传输和存储的灵活感知型编码”一文中的Dolby AC-3音频编码器,就典型地对各个PCM信号进行1024-点ffts(快速傅立叶变换)计算,并将心理声学模型应用于每个通道的1024个频率系数以决定其比特率。Dolby系统并将窗口尺寸减小到256个采样以隔离信号的瞬态响应,进行瞬态分析。AC-3编码器采用了专用的后向自适应算法对比特率分配信息进行解码。这样便减少了随编码音频数据一同发送的比特率分配信息量。其结果是,相对于前向自适应方法来说,可用于音频的带宽得以增加,从而改善了音质。
在第二类编码器中,子带差分信号或是被固定量化,或是在量化时可动态调整以使所有或部分分段频带上的量化噪声减至最小,它们并没有明确参照心理声学掩蔽理论。由于在码率分配处理之前很难估计预测器性能,通常认为不能将心理声学失真阈值直接应用到预测/差分子带信号上。而量化噪声对预测过程的反作用使问题进一步复杂化。
这类编码器能有效工作是因为听觉感知中重要的音频信号通常在长时间段中展示出的周期性特征。这种周期性可被预测差分量化过程充分利用。把信号分成少数子带可降低可以听觉的噪声调制效应,并可有效利用音频信号含有的长时频谱分量差异。然而随着子带数量的增加,每个子带内的预测增益将不断降低,增加到某一程度时预测增益将趋于零。
数字影院系统公司(DTS),L.P.采用了一种音频编码器,它将每个PCM声道过滤分成四个子带,而且用后向ADPCM编码器对每个子带进行编码,且所述后向ADPCM编码器中的预测器系数可根据子带数据作自适应调整。编码器在每个声道上采用相同的固定比特码率分配,且低频子带较高频子带优先得以分配更多比特码率。固定码率分配方法提供了例如4∶1的固定压缩比。迈克·史密斯(Mike Smyth)和斯蒂芬·史密斯(Stephen Smyth)在“APT-X100:用于广播的低延时、低码率、子带ADPCM音频编码器”,第十次国际AES会议汇编,1991年,第41-56页中描述了此类DTS编码器。
此两类音频编码器还具有其它共同的局限性。首先,公知的音频编码器编码/解码时使用固定框架/帧尺寸,即采样数据数量或帧所占时间段是固定的。结果是,当编码的传输率相对于采样频率增加时,帧内的数据量也增加。因此,解码器缓冲器的尺寸必须设计得能容纳最坏情况以避免数据溢出。这样将会增加作为解码器主要成本成分的RAM的用量。其次,公知的音频编码器不易扩展应用于大于48kHz的采样频率。若这样做将出现已有解码器与新编码器所需格式不兼容的情形。缺乏未来兼容性是一个严重的局限性。此外,对PCM数据进行编码所用的公知格式要求解码器必须读入整个帧的数据之后才能开始播放。这又需要把缓冲器的尺寸限制在100ms左右的数据块,从而不产生过长的延时或滞后而干扰听者。
此外,虽然这些编码器的编码能力高达24kHz,但较高频子带却常常被割舍。这样会降低高频保真度或解译再造信号的听觉氛围。公知编码器通常使用两种错码检测方案中的一种。最常用的是里德所罗门编码(Reed Solomon coding),其编码器将产生的检测码加入到数据流的辅助信息之中。这样便易于检测和纠正辅助信息中出现的任何错误。然而,它没有检测出音频数据中的错误。另一种方法是检验数据帧及其头信息区域是否有无效码状态。例如,假设某个3比特参数只允许有3种有效状态。那么发现其它五种状态中的任何一种代表着错误的发生。这种方法只是提供了某种检测能力,而音频数据中的错误仍不能被发现。
发明内容
鉴于上述问题,本发明提供了一种多通道音频编码器,其灵活性可容纳广大范围的压缩比要求,采用高比特码率时能产生比CD更好的质量,使用低比特码率时亦能改善听觉感知质量。它同时还具备降低播放延时、简化误差检测、改善预回音失真、及可延伸至未来更高采样率的特性。
这是用子带编码器实现的,子带编码器把每个声道的音频信号用窗口法分成音频帧序列数据,然后将各帧数据进行滤波分成基带和高频区,再把每个基带信号分解成多个子带。子带编码器在码率较低时通常选择非完全滤波器以分解基带信号,而在码率足够高时选择完全滤波器。高频区信号独立于基带信号在高频编码阶段进行编码。基带编码阶段则包括分别用于较高频和较低频子带编码的VQ和ADPCM编码器。每个子带帧包括至少一个子帧,每个子帧进一步细分为多个子子帧。每个子帧被用作分析单元,以便估计ADPCM编码器的预测增益,且当预测增益较低时可终止使用其预测能力。子帧分析单元还被用来检测瞬变状态以调节瞬变状态前后的SFs(比例因数)。
全局比特管理(GBM)系统利用多个声道、多个子带和当前帧内各子帧之间的差别把比特码率按需分配到每个子帧。GBM系统首先计算经过预测增益加以修正的SMR(信号掩蔽值比),并以心理声学模型为基础将比特码率分配到每个子帧。然后,GBM系统按照MMSE方法分配所有剩余比特码率,它或者马上切换到MMSE分配法以降低总噪声底值,或逐渐趋变到MMSE分配分案。
多路复用器产生输出帧数据,此输出帧包含有同步字节、帧头信息、音频头信息和至少一个子帧,并以传输速率用多路复用形式合并成为数据流。帧头信息包括窗口尺寸和当前输出帧的尺寸。音频头信息表示音频帧数据的打包安排和编码格式。每个音频子帧包括独立于其它子帧的音频解码辅助信息、高频VQ编码数据、多个基带音频子子帧(每个子子帧以多路复用形式包装着来自各声道的、较低频子带的音频数据)、一个高频音频数据块(以多路复用形式包装着来自各声道的、高频区域音频数据,用来支持多通道音频信号在解码时可取用多种高采样率)、以及用于核实检验子帧结束的拆包同步字节。
窗口尺寸的选择决定于传输速率与编码器采样频率之比,从而把输出帧的尺寸限制在要求的范围内。当压缩量相对较低时,窗口尺寸减小从而使帧尺寸不会超过上限最大值。因此解码器可以采用相对较少的、固定数量的RAM作为输入缓冲器。当压缩量相对较高时,窗口尺寸增加。GBM系统因此能利用较大的时间窗进行比特率分配,由此改善编码性能。
对于熟悉本领域的技术人员来说,本发明的这些及其它特征和优点将会通过以下对优选实施例所作的详细说明而变得清晰。这些详细说明阐述将会结合附随图表,其中:
附图说明
图1是按照本发明所述的5声道音频编/解码器的框图;
图2是多通道编码器的框图;
图3是基带编码器和解码器的框图;
图4a和图4b分别是高采样率编码器和解码器的框图;
图5是单声道编码器的框图;
图6是使用不同传输率每帧字节与帧尺寸之间的关系图;
图7是NPR(非完全)和PR(完全)重构滤波器的幅值响应曲线图;
图8是重构滤波器的子带混叠示意图;
图9是NPR和PR滤波器的失真曲线图;
图10是单个子带编码器的示意图;
图11A和11B分别图解说明子帧中的瞬态检测和比例因数计算;
图12描述对量化后TMODES的熵编码过程;
图13描述比例因数的量化过程;
图14描述信号掩蔽曲线与信号的频率响应的卷积以产生SMR;
图15是人的听觉响应的曲线图;
图16是子带的SMRs曲线图;
图17是用于心理声学和mmse比特率分配的误差信号曲线图;
图18A和图18B分别是子带能量曲线图和其倒置曲线图,描述了mmse“注水式”比特率分配过程;
图19是数据流中单帧结构的框图;
图20是相应解码器的示意图;
图21是编码器一种硬件实现方法的框图;和
图22是解码器一种硬件实现方法的框图。
附表说明
表1列出了使用各种采样频率和传输率时可取的最大帧尺寸;
表2列出了被用各种采样频率和传输率时可取的最大帧尺寸(字节单位);
表3显示了ABIT索引值、量化级数量及所产生的子带SNR(信噪比)之间的关系。
具体实施方式
多通道音频编码系统
如图1所示,本发明在其一体多通道音频编码器10中结合了两类已知编码方案的特征并加入了新的优点特征。所用编码算法是按照节目原制作室质量水平即“好于CD”级质量而设计,其应用范围广泛,可满足在压缩量、采样频率、采样字长、声道数量及感知听觉质量等方面的不同要求。
编码器12把通常在48kHz下以16-24位字长采样的多通道PCM声数据14编码成已知传输率的数据流16,合适的传输率范围为32-4096kbps。与已知的音频编码器不同是,本结构能扩展到更高的采样频率(48-192kHz),而不会使已有的、为基带采样频率或任何中间采样频率而设计的解码器出现不兼容的情况。此外,PCM数据14被窗口法分成帧块逐一编码,而每个帧的优先选择是分成1-4个子帧。音频信号窗的尺寸,即其PCM采样数,则决定于相对的采样频率和传输率取值,它的选择使得输出帧的尺寸,即其相应解码器18读出的每帧数据字节数,被适当地限制在5.3-8千字节之间。
其结果是,解码器中用于缓冲输入数据流的RAM数量可保持在较低水平,从而降低了解码器成本。低码率时可以使用较大的窗口尺寸将PCM数据构成帧,这样便改善了编码性能。在较高的码率下,必须使用较小的窗口尺寸以便满足这种数据尺寸限制。这必然会使编码性能降低,但对较高码率来说这影响不大。而且,这种将PCM数据分成帧的方式给了解码器18时间,在全部输出帧读入缓冲器之前能够初始化以启动放音。这样可减少音频编码器的延时或滞后时间。
编码器12使用了高分辨率滤波器组,优选方法是它可根据码率不同选择不完全(NPR)和完全(PR)重构滤波器,以便把每个音频声道14分解为多个子带信号。预测编码器和矢量量化(VQ)编码器分别用来对低频段和高频段子带进行编码。VQ子带的起始频段或可固定或可根据当前信号的特性来动态确定。在低码率情况下,可以采用联合频率编码同时对多个声道的较高频子带进行编码。
预测编码器的优选方法是可根据子带预测增益在APCM和ADPCM模式之间转换。瞬态分析器把每个子带的子帧分段为预回波和后回波信号(子子帧)并计算预、后回波子子帧各自的比例因数,从而降低预回波失真。编码器根据所有PCM声道及当前帧各子带的需要不同(应用心理声学或mse),从可用的码率中合理地调节分配它们各自的码率,以达到最佳编码效率。通过把预测编码和心理声学模型彼此结合,低码率编码效率得到提高,从而降低了达到主观透明度所需的编码率。诸如计算机或键盘等可编程控制器19可用来与编码器12相连,以传达输入音频模式信息参数,包括理想码率、声道数量、PR或NPR重构、采样频率及传输率等。
编码信号和辅助信息(即附图中的边信息)被打包并多路复用式地合并为数据流16,其形式将解码计算负荷限制在所需的范围内。数据流16既可编码到例如CD、数字视盘(DVD)等传输媒体20或可通过直播卫星进行传输广播。解码器18对各子带信号进行解码并完成逆滤波操作以产生多通道音频信号22,该信号主观质量上相当于原始多通道音频信号14。诸如家庭影院或多媒体计算机等等的音频系统24可为用户播放音频信号。
多通道编码器
如图2所示,编码器12包括多个单独的通道编码器26,合适选择为五个(左前、中置、右前、左后和右后),每通道编码器产生其相应一组编码子带信号28,合适选择为每个声道32个子带信号。编码器12采用全局比特管理(GBM)系统30,对可用的、共同的比特码率之和(共同比特池)在声道之间、各声道子带之间及各子带的各帧数据之内进行动态比特码率分配。编码器12还利用各声道在较高频率子带上可能的相关特性会相应采用联合频率编码技术。此外,编码器12可以在不易感觉到的较高频率子带上使用VQ以便在非常低的码率下提供基本的高频保真度或氛围。用这种方式,编码器利用了不同的信号要求,例如,多个声道的子带rms(均方根)值和心理声学掩蔽等级,每个声道信号能量随频率的非均匀分布及其在任给定帧内随时间的变化。
比特分配概述
GBM系统30首先确定将对哪些声道的子带进行联合频率编码并对其数据进行平均,然后确定对哪些子带进行VQ编码并从总可用码率中减去其所用码率。对哪些子带进行VQ编码可以被认作为首先可定的,譬如将所有大于某个频率阈值的子带都应用VQ编码,或由每帧中各子带的心理声学掩蔽效应来决定。之后,GBM系统30应用心理声学掩蔽效应对剩余各子带分配其比特率(ABIT)从而达到优化解码音频信号主观质量的目的。如果尚有附加比特码率,编码器可以转换到纯mmse方案,即“注水式”分配(waterfilling),并根据子带相应的rms值对所有的码率进行再分配从而使误差信号的rms值降至最小。这种方法可在极高码率的情况下运用。优选的方法是保留心理声学码率分配的结果,只是将附加比特码率按照mmse方案进行分配。这样可保持用心理声学掩蔽而产生的噪声信号的形状,并均匀地降低了其噪声基底。
另一种方法是对以上优选方法进行修正,使其附加比特码率根据rms值和心理声学掩蔽等级之间的差来进行分配。结果是,心理声学分配曲线随着码率的不断增加变成为mmse分配曲线,从而在两种技术之间形成了平滑过渡。上述技术特别适用于固定码率系统。此外,编码器12可以按主观条件或mse设定失真等级,并允许改变总比特码率以保持失真等级。多路复用器32按照设定的数据格式把子带信号和辅助信息多路合并为数据流16。具体的数据格式将在下面的图20中讨论。
基带编码
对于8-48kHz范围的采样频率而言,如图3中所示的通道编码器26采用了均匀式512-节、32-频带的分析滤波器组34,该滤波器组34以48kHz的采样频率工作,把每个声道0-24kHz的音频谱分解成32个带宽为750Hz的子带。编码部分36对每个子带信号进行编码并将它们多路复用38成压缩数据流16。解码器18接收压缩的数据流,利用拆包器40分解出每个子带的编码数据,对每个子带信号42进行解码,并采用512-节、32-频带的均匀式内插滤波器组44对每个声道重构PCM数字音频信号(Fsamp=48kHz)。
在本结构中,所有编码策略,例如48kHz、96kHz或192kHz的采样频率,都在其最低音频基带上,例如在0-24kHz,使用了32-频带编码/解码方法。因此,目前根据48kHz采样频率设计和制成的解码器能与将来设计的、利用更高频率分量的编码器兼容。前期存在的解码器总能读取编码信号中的基带部分(0-24kHz)并丢弃更高频率编码数据。
高采样率编码
对于48-96kHz范围的采样频率而言,优选法是通道编码器26把音频频谱分成两部分,并对下半部分采用均匀式32-频带分析滤波器组而对上半部采用8-频带的分析滤波器组。如图4a和图4b所示,0-48kHz的音频频谱首先采用256-节、2-频带抽取预滤波器组46被一分为二,形成的带宽为每频段24kHz。下半部分频带(0-24kHz)如以上按图3所述方式分割成32个均匀频带并编码。然而上半部分频带(24-48kHz)则被分割成8个均匀频带进行编码。如果8-频带抽取/内插滤波器组48的延时与32-频带滤波器组的相应延时值不相等,则必须在24-48kHz信号通路中加入延时补偿50,以确保在解码器中两个时域波形在进入2-频带重组滤波器组之前对齐。在96kHz采样频率编码系统中,24-48kHz音频频带被延迟了384个采样点,然后用128-节内插滤波器组将其分成8个均匀频带。每个3kHz频宽的子带被分别进行编码52,其数据与来自0-24kHz频带的编码数据打包54形成压缩数据流16。
当到达解码器18时,压缩数据流16被进行拆包分离56,用于32-频带解码器(0-24kHz区)和8-频带解码器(24-48kHz区)的编码数据分别被送到它们各自的解码级42和58中。其8个和32个解码子带分别用128-节和512-节的均匀式内插滤波器组60和44进行重构。解出的子带然后用256-节、2-频带均匀式内插滤波器组62重新结合以产生单一的采样频率为96kHz的PCM数字音频信号。如果解码器需要以压缩数据流采样频率的一半进行操作,可以方便地通过放弃高端频带编码数据(24-48kHz)并只解出0-24kHz音频区域内的32-音频子带便可达到。
通道编码器
在上述所有的编码策略中,32-频带编码/解码方法是针对音频带宽为0-24kHz间的基带部分进行的。如图5所示,取帧器64为PCM声道开窗将其分段为连续的数据帧66。PCM音频窗确定了连续输入的采样数量,该输入采样数量通过编码过程产生数据流中的一幅输出帧。窗口尺寸是根据压缩量即传输率与采样频率之比来设定的,以限制每帧内的编码数据量。每个连续的数据帧66通过32-频带、512-节的FIR(有限冲击响应)抽取滤波器组34被分成32个均匀频带68。每个子带的输出采样数据被缓冲并应用于32-频带编码功能级36。
分析级70(将在图10-19中详细描述)为被缓冲的子带采样数据产生最佳预测器系数、差分量化器比特率分配和最佳量化器比例因数。分析级70还可以在没有预置定值时,决定将对哪个子带进行矢量量化(VQ)和对哪些声道进行联合频率编码。这些数据或辅助信息被向前送到选定的ADPCM级72、VQ级73或联合频率编码(JFC)级74以及数据多路复用器32(打包器)。子带采样数据然后通过ADPCM或VQ方法进行编码,且量化后的编码被输入至多路复用器。JFC级74实际上并不对子带采样数据进行编码,而是产生代码字以指示哪些声道的子带被联合处理以及它们的编码被放于数据流何处。来自每个子带的量化编码和辅助信息被打包形成数据流16并传输送入解码器。
到达解码器18时,数据流被多路分解40或拆包变回成各自的子带数据。比例因数和比特率分配首先被设置装入逆量化器75中,每个子带的预测器系数亦被同时装入。然后差分码可直接利用ADPCM方法76或逆VQ方法77进行重构,或对指定子带进行逆JFC处理78。最后这些子带用32-频带内插滤波器组44合并成为单一的PCM音频信号22。
PCM信号框构成帧
如图6所示,当传输率相对于给定采样频率发生变化时,图5中所示的取帧器64将改变窗口79的尺寸,从而使每个输出帧80的字节数量被限制在例如5.3K字节和8K字节之间。表1和表2分别为对给定采样频率和传输率为设计者提供选择最佳窗口尺寸和解码缓冲器尺寸(帧尺寸)的设计表。在低传输率下,帧尺寸可以相对较大。这使编码器可以利用音频信号在不同时段上的、不平坦的幅值方差分布以改善音频编码器的性能。在高传输率下,需减小帧尺寸以便使字节的总量不会溢出解码缓冲器。结果,设计者在解码器上可使用8K字节RAM就可以满足所有传输率要求。这降低了解码器的成本。通常,音频窗口的尺寸由下式得出:
其中帧尺寸是指解码缓冲器的尺寸,Fsamp是采样频率,而Trate是传输率。音频窗口的尺寸与声道的数量无关。然而,随着声道数量的增加,压缩量也必须相应增加以保持所需的传输率。
表1
                            Fsamp(kHz)
Trate           8-12    16-24    32-48    64-96    128-192
≤512kbps       1024    2048     4096     ★       ★
≤1024kbps      ★      1024     2048     ★       ★
≤2048kbps      ★      ★       1024     2048     ★
≤4096kbps      ★      ★       ★       1024     2048
表2
                            Fsamp(kHz)
Trate           8-12    16-24    32-48    64-96    128-192
<512kbps       8-5.3k  8-5.3k   8-5.3k   ★       ★
<1024kbps     ★       8-5.3k   8-5.3k   ★       ★
<2048kbps     ★       ★       8-5.3k   8-5.3k   ★
<4096kbps     ★       ★       ★       8-5.3k   8-5.3k
子带滤波
所用的32-频带、512-节均匀式抽取滤波器组34是从两种多相滤波器组中选一用来将数据帧66分割成图5所示的32个带宽均匀的子带68。这两种滤波器组具有不同的重构特性,以重构精度折衷子带编码增益。其中一类滤波器称为完全重构(PR)滤波器。当PR抽取滤波器(编码)和它相应的内插滤波器(解码)前后直接衔接时,其重构信号是“完全”的,在此,“完全”被定义为在24比特的分辨率时误差小于0.5lsb(最小比特)。另一类滤波器被称为不完全重构(NPR)滤波器,因为其重构信号具有非零的噪声基底值,这与其滤波过程中混叠频率不能完全相抵消的特性有关。
图7中分别示出了对于单个子带的NPR和PR滤波器的传递函数82和84。由于NPR滤波器不受完全重构要求的限制,它们的邻近阻带排斥(NSBR)比,即通带与第一旁瓣之比,相比PR滤波器更大(110dB相对于85dB)。如图8所示,滤波器的旁瓣使原本处于第三子带中的信号86混叠到相邻的子带上。子带增益测量相邻子带中的信号抑制情况,因此表明了滤波器对音频信号的去相关能力。由于NPR滤波器比PR滤波器具有更大的NSBR比,所以它们将具有更大的子带增益。结果,NPR滤波器提供了更高的编码效率。
如图9所示,无论是PR还是NPR滤波器,随着总比特码率的增加,压缩数据流中的总失真将减小。然而,在低码率下,两种滤波器之间子带增益性能的差异大于与NPR滤波器相关的噪声底值。因此,NPR滤波器的相关失真曲线90低于PR滤波器的相关失真曲线92。所以,在低码率下音频编码器选择NPR滤波器组。当码率增加到某个点94时,编码器的量化误差降至NPR滤波器的噪声底值之下,继续增加ADPCM编码器比特码位不再带来相应的收益。这时候,音频编码器切换使用PR滤波器组。
ADPCM编码
ADPCM编码器72根据H个先前的重构采样的线性组合产生预测采样p(n)。然后从输入x(n)中减去该预测采样,从而给出差分采样d(n)。这些差分采样数据然后通过用除以RMS(或PEAK)比例因数进行比例运算,使比例运算后的差分采样的RMS幅值与量化编码器特性曲线Q相匹配。比例运算后的差分采样数据ud(n)然后被应用到具有L级、步长为SZ等特征的量化器上,其特征由当前采样分配数据所分配的比特位数ABIT决定。量化器对于每个经比例运算的差分采样ud(n)产生分级层码QL(n)。这些分级层码最终被传送到解码器的ADPCM级。为了更新预测器历史,量化器的分级层码QL(n)在本地用与量化器Q相同特征的逆量化器1/Q进行解码以产生量化后、比例运算后的差分采样ud’(n)。此数量ud’(n)通过与RMS(或PEAK)比例因数相乘再进行反比例运算可得到d’(n)。通过把起始预测采样p(n)与量化差分采样d’(n)相加便可重构初始输入采样x(n)的量化形式x’(n)。然后用该采样更新预测器历史。
矢量量化
预测器系数和高频子带采样皆使用矢量量化(VQ)进行编码。预测器VQ具有4个采样值的矢量长度(4维)和每采样值3比特的码率。因此其最后代码本由4096个4维代码矢量构成。搜索匹配矢量的过程被分成一个两层的树结构,树中的每个节点具有64个分枝。顶层存储了64个只在编码器中需要用来帮助完成搜索过程的节点代码矢量。底层直接包含了4096个在编码器和解码器中都需要的最终代码矢量。就每次搜索而言,需要进行128次4维MSE计算。代码本和顶层的节点矢量是利用LBG方法对超过5百万个预测系数进行训练优化而成。训练矢量集是通过编制大量音频材料、并在所有显示出明显正向预测增益的子带中累积而成。使用训练集中内的矢量进行测试可得到大约30dB的平均SNRs(信噪比)。
高频VQ具有32个采样数据的矢量长度(32维,子帧的长度),其码率为每采样值0.3125比特。因此最后的代码本由1024个32维代码矢量构成。匹配矢量的搜索为两层树结构,树中的每个节点具有32个分枝。顶层存储32个只在编码器中需要的节点代码矢量。底层包含1024个在编码器和解码器中都需要的最终代码矢量。就每次搜索而言,需要进行64次32维MSE计算。代码本和顶层的节点矢量是利用LBG方法对超过7百万个高频子带采样训练矢量进行训练优化而成。形成训练矢量集的数据是通过编制大量采样频率为48kHz的音频材料、并从第16-32子带的输出中累积而成。在48kHz的采样频率下,这些训练采样代表了12-24kHz范围内的音频。使用训练集内的测试矢量预计得到大约3dB的平均SNRs。3dB的SNR尽管很小,但是足以提供高频保真度或在高频上的氛围效应。这在听觉感知上要比简单放弃高频子带的公知技术好得多。
联合频率编码
在极低比特码率的应用中,总的重构信号保真度可以通过对来自两个或更多通道的高频子带信号之和进行编码以代替逐个独立地编码来加以改善。联合频率编码之所以可行,是因为高频子带往往具有相似的能量分布,而且人的听觉系统主要对高频分量的“强度”而不是对它们的细微结构敏感。于是,因在任何比特码率下都会有更多的比特率用于感知上重要的低段频率的编码,平均来说重构信号提供了很好的综合保真度。
联合频率编码索引值(JOINX)被直接传送到解码器中以指出哪个通道和子带已经被联合处理以及联合编码信号在数据流中的位置。解码器重构指定声道中的信号并将其复制到其它每个声道中。每个声道然后根据其相应的RMS比例因数进行比例运算。由于联合频率编码对时间信号按它们能量分布的相似性进行平均,所以会降低重构保真度。因此它的应用通常限于低比特码率编码应用,而且主要针对10-20kHz间的信号。在中高比特码率应用中,联合频率编码通常被停止使用。
子带编码器
图10详细地显示了单个子带运用ADPCM/APCM方法的编码过程,特别是描述了如图5所示的分析级70及ADPCM编码器72和如图2中所示的全局比特管理系统30之间的相互作用。图11-19详细描述了图10中所述的各组件过程。滤波器组34把PCM音频信号14分成32个子带信号x(n),并写入相应的子带采样缓冲器96中。假设音频窗的尺寸为4096个采样,每个子带采样缓冲器96则存储含有128个采样的完整帧,这个帧被分成4个32采样的子帧。可见,一个含有1024采样的窗口尺寸会只产生单一的32采样子帧。采样数据x(n)被送到分析级70,以便确定每个子帧的预测系数、预测模式(PMODE)、瞬态模式(TMODE)和比例因数(SF)。这些采样数据x(n)同时还被提供给GBM系统30,由系统确定每个声道中每个子带的每个子帧的比特分配(ABIT)。此后,这些采样数据x(n)以每次一个子帧的形式被传递到ADPCM编码器72。
最佳预测系数的估计
每个子帧的H阶(合适的为四阶)预测系数可通过对子带采样数据x(n)块采用标准自相关方法98,即Weiner-Hopf或Yule-Walker公式,进行优化处理分别产生。
最佳预测系数的量化
每组四个预测器系数的量化优选方法是使用如上所述的4-元素树搜索、12-比特矢量代码本(每个系数3比特)。这个12-比特矢量代码本包括4096个系数矢量,这些系数矢量已运用标准群集算法并按理想的概率分布特性进行了优化。矢量量化(VQ)搜索100则选择出一个与最佳系数之间有着最低加权均方差的系数矢量。这些“量化”矢量然后用来代替每个子帧的最佳系数。一个逆VQ LUT(查找表)101用于向ADPCM编码器72提供量化后的预测器系数。
预测差分信号d(n)的估计
对ADPCM来说一个很大的难题是在实现递归过程72之前不易预测差分采样序列d(n)。对前向自适应子带ADPCM的基本要求是在进行ADPCM编码之前知道差分信号的能量,以便计算出合适的量化器比特分配,从而明确所产生的量化误差或重构采样信号的噪声量级。差分信号能量的特性也需要了解以便在编码之前确定最佳差分比例因数。
遗憾的是,差分信号能量不仅取决于输入信号的特性而且还取决于预测器的性能。除了已知的例如预测器阶数和预测系数优化程度等限制之外,预测器性能还受重构采样信号中引入的量化误差程度或噪声的影响。由于量化噪声是由最终比特分配ABIT和差分比例因数RMS(或PEAK)值本身来确定,差分信号能量的估计必须通过迭代法来取得102。
步骤1.假设量化误差为零
差分信号的第一次估计(差分信号估计初值)是将缓冲的子带采样x(n)通过ADPCM过程而并不对差分信号进行量化。这可以通过在ADPCM编码循环中停止量化和RMS比例运算功能来实现。用这种方式估计差分信号d(n),可以从计算中去除比例因数和比特分配值的影响。然而,由于使用了矢量量化的预测系数,这个过程仍然考虑了量化误差对预测器系数的影响。逆VQ LUT104被用来提供量化预测系数。为了进一步提高估算预测器的精度,应在计算之前把来自前一数据块处理结束后累积的、真正被ADPCM预测器所用的历史采样值复制到当前预测器中。由此可确保预测器可以紧接前一输入缓冲结束时ADPCM预测器的真实状态工作。
该估计值ed(n)和实际过程的d(n)之间的主要差别是忽略了量化噪声对重构采样x(n)和对降低预测精度的影响。对于有大量层次的量化器来说,通常噪声水平较小(假设通过合适的比例运算),因此实际的差分信号能量与在此估计计算出的结果非常相近。然而,当量化器层次的数量较少时,即在典型的低比特码率音频编码器情况下,实际的预测信号及由此的差分信号能量可能和如此的估计值差别很大。这样便产生了与早先在自适应比特分配过程中所预测值不同的编码噪声底值。
尽管如此,预测性能的变化对于所用的应用或比特码率来说影响并不很大。因此,这些估计结果可以不经过迭代直接用来计算比特分配和比例因数。另一个改进方法是,如果一个子带很可能被分配使用层数很少的量化器,则可以对差分信号能量有意地作出过高的估计来补偿性能的损失。这种过高估计还可以根据量化器层数的变化进行分级以提高精度。
步骤2.用估计的比特分配和比例因数进行再计算
一旦用差分信号估计初值得出了比特分配(ABIT)和比例因数(SF),就可以将估算出的ABIT和RMS(或PEAK)值运用于ADPCM循环72,进行进一步的ADPCM估计过程以测试它们的最佳性。与估计初值时一样,在开始计算之前,实际的ADPCM预测器系数被复制用作估计预测器历史,从而保证两次预测器运算从同一点开始。在缓冲的输入采样数据全部经过第二估计循环处理之后,所得的每个子带中的噪声底值与在自适应比特分配过程中预测的噪声底值进行比较。任何明显的差异则通过修正比特分配和/或比例因数进行补偿。
步骤2可以重复使用以适当改进噪声底值在子带上的分布,每次重复时需用最新的估计差分信号来计算下一组比特分配和比例因数。通常,如果比例因数的变化大于约2-3dB,则需重新计算。否则,比特分配可能会违背由心理声学掩蔽过程或mmse过程产生的信号-掩蔽比。一般来说,一次重复就足够了。
子带预测模式(PMODE)的计算
为了提高编码效率,预测过程可以被一个控制器106在当前子帧中的预测增益降到某一阈值以下时,通过设置PMODE指示值任意地终止。当在估计阶段对输入采样块测得的预测增益(输入信号的能量与估计的差分信号能量之比)超出某个正阈值时,PMODE指示值将置1。相反,如果测得的预测增益小于正阈值,相应子带的ADPCM预测器系数则同时在编码器和解码器中置0,而且其PMODE也置0。预测增益阈值的设定必须补偿等于因传输预测器系数矢量而使用消耗的比特码所带来的失真率。这样做是为了确保当PMODE=1时,ADPCM过程的编码增益总是大于或等于前向自适应PCM(APCM)编码过程的增益。不然则将PMODE置零并将其预测器系数重置为零,ADPCM过程就简单地转换成APCM。
如果ADPCM编码增益的变化对应用来说不是很重要,则可以在任何或所有子带中将PMODEs置于高电平。相反,PMODEs亦可以为以下情况置于低电平,例如某些子带完全不用编码,或是应用的比特率足够高而不需要用预测增益来保持音频的主观质量,或是信号的瞬变含量很高,或者象在音频剪辑应用情况下ADPCM编码音频的剪辑接合性不够令人满意等。
每个子带相应的预测模式(PMODE)值被分离传输且其速率等于编码器和解码器ADPCM过程中的线性预测器的更新速率。PMODE参数的用途是向解码器传送并指示某特定子带是否在其编码音频数据块中含有任何相关的预测器系数矢量地址。当任何子带的PMODE=1时,数据流中将总是包含其预测器系数矢量地址。当任何子带的PMODE=0时,数据流中则不会包含预测器系数矢量地址,编码器和解码器的ADPCM级预测器系数必须置0。
PMODE的计算首先对缓冲的子带输入信号能量及其相应缓冲的、从第一阶段估计所得的估计差分信号能量进行对比分析,这里假定没有量化误差。每个子带的输入采样数据x(n)和估计的差分采样数据ed(n)皆被分开缓冲处理。缓冲器尺寸等于每个预测器更新周期内所包含的采样数,例如子帧的尺寸。预测增益则可按下列公式计算:
Pgain(dB)=20.0*Log10(RMSx(n)/RMSed(n))
其中RMSx(n)=缓冲输入采样x(n)的均方根值,RMSed(n)=缓冲估计差分采样ed(n)的均方根值。
正的预测增益表示差分信号平均起来小于输入信号,所以对于相同的比特码率,用ADPCM过程相比APCM可以降低重构信号的噪声底值。负增益则表示ADPCM编码器产生的差分信号平均大于输入信号,这导致了在相同比特码率下比APCM更高的噪声底值。通常,用以启用PMODE(即置1)的预测增益阈值是正的,而且其值已经考虑了因传输预测器系数矢量地址而消耗的额外通道容量。
子带瞬态变化模式(TMODE)的计算
控制器106计算每个子带中每个子帧的瞬态模式(TMODE)。TMODEs指示了比例因数和采样数据的数量及其相应有效的部分,这些采样数据当PMODE=1时是缓冲器中的估计差分信号ed(n),当PMODE=0时是缓冲器中的输入子带信号x(n)。TMODEs被传送到解码器,其更新频率与预测系数矢量地址相同。瞬态模式的目的是在信号出现瞬变时降低编码带来的、可听见的“预回波”人为噪音。
瞬变可定义为在低幅值信号和高幅值信号之间的快速过渡。由于比例因数在一整块子带差分采样数据上进行平均运算而来,那么如果在这信号块上发生快速幅值变化,即瞬变,所计算出的比例因数往往比那些处于瞬变前的低幅值采样需要的最佳值大得多。因此对于瞬变前的采样数据来说,量化误差可能会很大。这种噪声听觉上则被称为预回波失真。
在实际运用中,瞬态模式是用来修正用于平均计算子带比例因数的数据块长度,以限制瞬变对那些紧靠瞬变前的差分采样的比例运算的影响。这样做的动机是因为人听觉系统中存在的、固有的预掩蔽现象,此现象表明在出现瞬态变化时,它之前的噪声如果持续时间很短则可被瞬态变化本身掩蔽不被察觉。
根据PMODE的取值不同,子带采样缓冲器中的x(n)的内容,即子帧,或估计的差分缓冲器ed(n)的内容被复制到瞬变分析缓冲器中。根据分析缓冲器的采样尺寸,缓冲器中的内容均匀地分成2、3或4个子子帧。例如,如果分析缓冲器包含了32个子带采样(21.3ms@1500Hz),缓冲器可分区为各含有8个采样的4个子子帧,在子带采样率为1500Hz的情况下,其时间分辨率为5.3ms。换一种情形,如果分析窗由16个子带采样构成,那么只需将缓冲器分成两个子子帧以提供相同时间分辨率。
每个子子帧内的信号被加以分析并确定除第一子子帧之外的、每个子子帧的瞬变模式状态。如果任何子子帧被认作为瞬态,则将为分析缓冲器即当前子帧产生两个独立的比例因数。第一个比例因数是从瞬变子子帧之前子子帧中的采样计算而来。第二个比例因数则根据瞬变子子帧中的采样并结合所有以后子子帧计算而来。
第一子子帧的瞬变状态不用计算,因为其处于分析窗开始的位置本身已可自动限制其量化噪声。如果有一个以上的子子帧被认作出现瞬变,则只考虑首先出现的那个子子帧。如果没有子缓冲器被检测到出现瞬变,则只需用分析缓冲器中的所有采样数据计算单个比例因数。用这种方式,用瞬变采样数据计算的比例因数值不会用于超出一子子帧时段之前的早期采样数据的比例运算。由此,把预瞬变量化噪声限制在一个子子帧周期之内。
瞬态的确认声明
如果一子子帧相比前一子缓冲器的能量比超出瞬变阈值(TT),而且前一子子帧中的能量低于预瞬变阈值(PTT)则声明在该子子帧中有瞬变。TT和PTT的取值决定于比特码率和所需的预回波抑制程度。这些值通常可以变化调节直至感到的预回波失真与其它人为编码噪声(如果有的话)能级相近。增加TT和/或减小PTT的值都将减小子子帧被认作为含有瞬变的可能性,由此降低了用于比例因数传输的比特码率。反之,减小TT和/或增加PTT的值将增加子子帧被认作为含有瞬变的可能性,并由此增加了用于比例因数传输的比特码率。
由于TT和PTT是对于每个子带分别设定的,所以编码器中所有子带的瞬态检测的灵敏度可以自由设定。例如,如果发现高频子带中的预回波相比低频子带中的预回波不易觉察,那么其阈值可以相应设定来减小高频子带被认作为含有瞬变的机会。此外,由于TMODEs被嵌入压缩的数据流中,解码器不必知道在编码器中使用的瞬变检测算法亦可对TMODE信息进行适当的解码。
四种子缓冲器的结构配置
如图11a所示,如果子带分析缓冲器109中的第一子子帧108出现瞬变,或如果没有检测到任何瞬变子子帧,则TMODE=0。如果第二子子帧出现瞬变而第一子子帧没有,则TMODE=1。如果第三子子帧出现瞬变而第一或第二子子帧都没有,则TMODE=2。如果只有第四子子帧出现瞬变则TMODE=3。
比例因数的计算
如图11b所示,当TMODE=0时,比例因数110在所有子子帧上计算。当TMODE=1时,第一个比例因数在第一子子帧上计算,第二个比例因数在所有之后的子子帧上计算。当TMODE=2时,第一个比例因数在第一和第二子子帧上计算,第二个比例因数在所有之后的子子帧上计算。当TMODE=3时,第一个比例因数在第一、第二和第三子子帧上计算,第二个比例因数在第四子子帧上计算。
用TMODE进行ADPCM编码和解码
当TMODE=0时,整个分析缓冲器期间即子帧内的子带差分采样数据用单个比例因数进行比例运算,该比例因数还传至解码器以进行反比例运算。当TMODE>0时,需要两个比例因数对子带差分采样数据进行比例运算且两者皆需传至解码器。不管是什么TMODE,在一组差分采样数据上产生的比例因数只用于这组数据的比例运算。
子带比例因数(RMS或PEAK)的计算
根据每个子带的PMODE取值不同,用来计算其比例因数的数据或是估计的差分采样ed(n),或是输入的子带采样x(n)。TMODEs在此计算中则用来确定比例因数的数量以及在缓冲器中它们对应的子子帧。
RMS比例因数计算
对第j个子带而言,rms比例因数可按下列公式计算:
当TMODE=0时,单个rms的值是:
RMS j = ( Σ n = 1 L ed ( n ) 2 / L ) 0.5
其中L是子帧中的采样数量。
当TMODE>0时,那么两个rms值为:
RMS 1 j = ( Σ n = 1 k ed ( n ) 2 / L ) 0.5
RMS 2 j = ( Σ n = 1 k + 1 ed ( n ) 2 / L ) 0.5
其中k=(TMODE*L/NSB),NSB是均匀尺寸子子帧的数量。
如果PMODE=0,则用输入采样xj(n)替换差分采样edj(n)。
PEAK比例因数的计算
就第j个子带而言,峰值比例因数可按下列公式计算:
当TMODE=0时,单个峰值是:
PEAKj=MAX(ABS(edj(n))),n=1,L
当TMODE>0时,两个峰值是:
PEAK1j=MAX(ABS(edj(n))),n=1,(TMODE*L/NSB)
PEAK2j=MAX(ABS(edj(n))),n=(1+TMODE*L/NSB),L
如果PMODE=0,则用输入采样xj(n)替换差分采样edj(n)。
PMODE、TMODE和比例因数的量化
PMODEs的量化
预测模式标记值只取两个值,开或关,可直接作为1-比特编码送至解码器。
TMODEs的量化
瞬变模式标记值最多具有4个值:0、1、2和3,它可直接作为2-比特无符号整数代码送至解码器,或可通过使用一个4-层熵编码表以争取将传输TMODEs的平均字长降至2比特以下。通常,熵编码只是在低比特码率应用时才选择运用以节省比特位数。
图12中详细示出的熵编码过程112可描述如下:把j个子带的瞬态模式码TMODE(j)与多个(p)4-层中值上升、可变长度代码本进行相配比较,其中每个代码本是根据不同的输入统计特性优化设计的。TMODE值与这些4-层表114进行相配比较并计算与每个表相关的总比特位数用量(NBp)116。在相配过程中能提供最少比特用量的码表就被选中并记作THUFF索引值。从该表格中取出的匹配码字VTMODE(j),将其与THUFF索引字一道被打包并送到解码器。拥有同样一组4-层反向表格的解码器可利用THUFF索引值将输入的可变长度编码VTMODE(j)送至合适的表格并解出TMODE索引值。
子带比例因数的量化
为了将比例因数传送到解码器必须将它们量化成已知的编码格式。在该系统中,比例因数通过使用均匀64-层对数特性、或均匀128-层对数特性、或可变速编码的均匀64-层对数特性量化器进行量化120。其中,两种64-层的量化器显示的步长皆为2.25dB,而128-层的步长为1.25dB。64-层量化用于低至中比特码率,附加的可变速率编码用于低比特码率应用,而128-层通常用于高比特码率应用。
图13示出了量化过程120。以RMS或PEAK表示的比例因数先从缓冲器121中读出,转换成对数域122,然后根据编码器模式控制器128的判断将其送到64-层或128-层均匀量化器124、126。然后把对数量化的比例因数写入缓冲器130中。128-层和64-层量化器的范围分别可以满足动态范围约为160dB和144dB的比例因数。把128-层的上限设定为能覆盖24-位输入PCM数字音频信号的动态范围。把64-层的上限设定为能覆盖20-位输入PCM数字音频信号的动态范围。
对数比例因数然后与量化器进行相配比较并用最接近的量化器层代码RMSQL(或PEAKQL)代替比例因数。在使用64-层量化器的情况下,这些代码为6-比特长,代码范围为0-63。在使用128-层量化器的情况下,代码长度为7-位,其范围为0-127。
逆量化131可简便地通过把各层代码运用其各自的逆量化特性实现,以产生RMSq(或PEAKq)值。对ADPCM(或当PMODE=0时为APCM)差分采样的比例运算而言,编码器及解码器都使用了量化过的比例因数,由此可确保比例运算和反比例运算在两处的过程同步一致。
如果64-层量化器编码的比特码率仍需要降低,则要进一步进行熵、或变字长编码。j个子带的64-层编码从第二子带(j=2)开始到最高有效子带被进行一阶差分编码132。该过程也可以用于对PEAK比例因数进行编码。有符号的差分编码DRMSQL(j)(或DPEAKQL(j))的最大范围为+/-63而且将这些编码存储在缓冲器134中。为了在原始的6-位编码上降低它们的比特码率,这些差分编码与多个(p)127-层中值上升、可变长度代码本进行相配比较,其中每个代码本是根据不同的输入统计特性优化设计的。
对有符号的差分编码进行熵编码的过程与图12中所示用于瞬变模式的熵编码过程相同,只是使用了p个127-层可变长度代码本。在比较过程中提供最低比特用量的表格则以SHUFF索引值形式被选中。其匹配的编码VDRMSQL(j)从表格中取出,与SHUFF索引字一道打包并传送到解码器。具有同样一组(p)127-层反向表的解码器,可利用SHUFF索引值把进入的可变长度编码送入合适的表中,以便对其进行解码使之回到差分量化器代码层。下列程序可用来将差分代码层转回成绝对值:
RMSQL(1)=DRMSQL(1)
RMSQL(j)=DRMSQL(j)+RMSQL(j-1)   j=2,…K
而用下列程序可使PEAK差分代码层转回成绝对值:
PEAKQL(1)=DPEAKQL(1)
PEAKQL(j)=DPEAKQL(j)+PEAKQL(j-1)j=2,··K
在以上两种情况下,K=有效子带的数量。
全局比特分配
图10所示的全局码率管理系统30在多通道音频编码器中管理比特分配(ABIT),确定有效子带(SUBS)的数量和联合频率策略(JOINX)以及VQ策略,以在降低的比特码率情况下提供主观透明编码。这不但增加了固定媒体上可编码和储存的音频声道的数量并/或延长播放时间,同时还保持或提高了音频保真度。通常,GBM系统30首先根据编码器中经预测增益修正的心理声学分析结果将比特分配到每个子带。然后根据mmse方案分配所剩余的比特以便降低总噪声底值。为了优化编码效率,GBM系统同时考虑所有声道、所有子带及整个数据帧并进行比特分配。此外,可以利用联合频率编码策略。用这种方式,系统充分利用了声道之间、频率范围内及时域上的信号能量的非均匀分布特性。
心理声学分析
心理声学测量是用来决定音频信号中存在的、感知上不相关的信息。感知上不相关的信息可定义为音频信号中不能为人类听众所听到的部分,它可以在时域上、频域上或以其它一些方式进行测量。J.D.约翰斯顿(J.D.Johnston):“采用感知噪声标准的音频信号变换编码”,见IEEE Journal on Selected Areas in Communications,第JSAC-6期,第2号,第314~323页,1988年2月,其中描述了心理声学编码的总则原理。
两个主要因素将影响心理声学测量。一个是人类听力的、与频率有关的绝对阈值。另一个是掩蔽效应,即人听到的第一声音能将与其同时演奏或甚至在其之后的第二声音掩盖住的事实。换句话说,第一声音能阻止我们听到第二声音,也就是说将其掩蔽掉。
在子带编码器中,心理声学计算的最终结果是一组数,指定在某瞬间对于每个子带的、不再能听觉的噪声量级。该计算方法是公知的而且被并入MPEG1压缩标准ISO/IEC DIS 11172“信息技术-用于约1.5Mbits/s以内的的数字存储媒体的运动图象和相关声音的编码”1992。这些数随音频信号动态变化。编码器借助比特分配过程以调节子带中的量化噪声底值,以使这些子带中的量化噪声小于可听觉的量级。
精确的心理声学计算通常需要在时间-频率变换中具备高频率分辨率。这意味着时间-频率变换时需要较大的分析窗。标准的分析窗尺寸是1024个采样,相应于压缩音频数据的子帧。长度为1024的fft的频率分辨率大致与人耳的时间分辨率匹配。
心理声学模型的输出对32个子带中每一个都产生了一个信号-掩蔽(SMR)比。SMR表示了其子带所能承受的量化噪声量,因此还表示了量化其子带采样数据所需的比特位数。具体地说,大的SMR(>>1)表示需要的比特位数很多,而小的SMR(>0)则表示需要的比特位数较少。如果SMR<0,则音频信号低于噪声掩蔽阈值,这时不需要量化比特。
如图14所示,每个连续帧的SMR通常通过下列步骤产生。1)对PCM音频采样数据进行fft计算,优选长度为1024,得出一系列频率系数142,2)对每个子带将产生的频率系数与其心理声学、频率相关的音调和噪声掩蔽值144进行卷积,3)对每个子带上产生的系数进行平均以得出SMR的量级,和4)作为可选步骤,根据图15所示的人的听觉响应146对SMRs进行归一化处理。
人耳的灵敏度在频率接近4KHz时最高并随着频率的进一步升高或降低而下降。因此,要想感受相同的音量强度,20kHz的信号必须比4kHz的信号强得多。因此一般来说,4kHz频率周围的SMRs与边远频率比较要重要得多。然而,曲线的精确形状与传送给听者的信号平均功率有关。随着音量的增加,听觉响应范围146受到压缩。因此,在某特定音量之下优化的系统对其它音量来说只是次优的。结果是,或者选择一指定功率级对SMR量级进行归一化处理,或者不用归一化处理。图16中示出了产生的用于32个子带的SRMs148。
比特分配程序
GBM系统30首先选择合适的编码策略,决定哪些子带用VQ和ADPCM算法进行编码以及是否启用JFC。之后,GBM系统将选择心理声学或者是MMSE比特分配方法。例如,在高比特码率下,系统可能停用心理声学模式而使用真正的mmse分配方案。这样可降低计算的复杂性而且在重构音频信号中并不感到有任何听觉变化。相反,在低速率下,系统能够启用如上所述的联合频率编码方案从而提高较低频率的重构保真度。GBM系统能够根据信号中的瞬变含量在帧与帧之间进行正常心理声学分配和mmse分配方法的切换。当瞬变含量高时,计算SMRs时使用的稳态假设就不再有效,因此mmse方案可以提供更好的特性。
就心理声学分配方法而言,GBM系统首先分配可用比特以满足心理声学效应,然后对剩余比特进行分配以便降低总噪声底值。第一步如上所述是确定当前帧每个子带的SMRs。下一步是按各子带中的预测增益(Pgain)调节其SMRs从而产生掩蔽-噪声比(MNRs)。其原理是ADPCM编码器将提供一部分所需的SMR。所以用更少的比特位数便可达到听不到的心理声学噪声级。
假设PMODE=1,则第j个子带的MNR由下式给出:
MNR(j)=SMR(j)-Pgain(j)*PEF(ABIT)
其中PEF(ABIT)是量化器的预测效率因数。为了计算MNR(j),设计者必须估计比特分配(ABIT)情况,这可以通过只用SMR(j)比值进行比特分配或通过假设PEF(ABIT)=1而得到。在中高比特码率下,有效预测增益近似等于计算的预测增益。然而,在低比特码率下,有效预测增益将降低。用例如5-层量化器得到的有效预测增益近似为估计的预测增益的0.7倍,而65-层量化器则使有效预测增益近似等于估计的预测增益,PEF=1.0。在极限情况下,当比特码率为零时,实际上预测编码被停止使用,有效预测增益为零。
在下一步骤中,GBM系统30产生一个满足每个子带MNR的比特码位分配方案。这是利用1比特约等于6dB的信号失真的近似方法而实现的。为了确保编码失真小于心理声学听觉阈值,分配的比特率是MNR除以6dB得到值上舍入后的最大整数,由下式给出:
通过用这种方式进行比特分配,重构信号中的噪声级156将如图17所示随信号本身157而变化。因此,在信号很强的频率上,噪声级将比较高,但仍将保持在听力察觉范围之外。在信号比较弱的频率上,噪声底值将很小且不会被听到。使用这种心理声学模型的平均误差总是大于mmse噪声级158,但是就其听力可感知部分来说性能更好,特别是在低比特码率下更是如此。
在所有声道、每个子带上分配的比特总和大于或小于目标比特码率的情况下,GBM程序将重复迭代以减小或增加各子带的比特分配。另外一种方法是计算每个声道的目标比特码率。这虽然是次佳方法但硬件实现时特别容易。例如,可用比特可以在声道中均匀地分布,或是按每个声道的平均SMR或RMS成比例分布。
在局部比特分配总和(包含VQ码位和辅助信息在内)超过目标比特码率的情况下,全局码率管理程序将逐步降低局部子带的比特分配。有多种具体方法可用于降低平均比特码率。首先,用于计算比特码率的上舍入整数函数可变为下舍入整数函数。其次可以从最小MNRs的子带中减去1比特。此外,可以停止对较高频率子带的编码或启用联合频率编码。所有降低比特码率的策略均遵循适度地、逐渐地降低编码分辨率的基本原则,首先使用的是感知音质损失最小的策略,损失大的策略则最后使用。
在目标比特码率大于局部比特分配总和(包含VQ码位和辅助信息在内)的情况下,全局码率管理程序将逐步、迭代地增加局部子带的比特分配以降低重构信号的总噪声底值。这样情况下,先前被分配了零比特的子带可能又进入编码之列。计算这种‘接通’的子带的比特用量时,需要考虑到其可能启用PMODE时用于传输任何预测器系数的成本。
GBM程序可以从三个不同方案中选择其一以便分配剩余比特。一种方案是对所有比特用mmse方法进行再分配以产生近似平坦的噪声底值。这相当于放弃了起初的心理声学模型。为了达到mmse噪声底值,图18a所示的子带RMS值曲线160被倒置成如图18b所示的形式,所有比特然后进行“注水式”分配直至耗尽。这种公知技术被称为注水是因为随着分配比特位数量的增加失真度均匀地降低。在图中所示的例子中,第一比特分配给了子带1,第二和第三比特分配给了子带1和2,第四至第七比特分配给了子带1、2、4和7,等等。另外一种方法是先给每个子带分配1比特以保证对每个子带进行编码,此后将剩余比特以注水式分配。
第二种也是优选的方案是按照上述mmse方法和RMS曲线来分配剩余比特。这种方法的效果是既均匀降低了如图17所示的噪声底值157又保持了原心理声学掩蔽曲线形状。这提供了一种很好的介于心理声学和mse失真之间的折衷方案。
第三种方法是根据子带的RMS和MNR值之间的差值曲线使用mmse方法分配剩余比特。这种方法的效果是,随着比特码率的增加,噪声底值的形状可从最佳心理声学形状157平滑过渡至最佳(平坦的)mmse形状158。无论使用这些方案的哪一种,如果任何子带中的编码误差相对于源PCM来说下降至0.5LSB之下,该子带就不再有进一步比特分配。一种可选择的方法是使用固定的子带比特分配最大值来限定各子带可以分配到的最大比特位数。
在上面讨论的编码系统中,我们假定了每个采样值的平均比特率是固定的,而且是以重构音频信号保真度最大为目的产生了比特分配。另外一种方法是先固定设置mse或感知失真度,然后允许比特码率变化以满足失真度。在mmse方法中,RMS曲线可以被简单地进行注水式分配直至满足失真度量级。所需的比特码率将根据子带的RMS量级而改变。在心理声学方法中,则以满足各MNRs来进行比特分配。结果是其比特率将根据各SMRs和预测增益而改变。这种分配方法目前用途不广,因为当前的解码器均以固定的码率工作。然而,其它的传媒系统如ATM或随机存取储存媒体可能在不久的将来使可变码率编码成为实际可用的方法。
比特分配索引值(ABIT)的量化
在全局比特管理过程中,自适应比特分配程序对每个子带和每个声道产生其比特分配索引值(ABIT)。编码器产生此索引值的目的是为了指示如图10所示的必需的量化层数目162,用此层数在量化差分信号时使解码音频达到主观最佳重构噪声底值。在解码器中,这些索引值指示了逆量化所需的层数。每个分析缓冲窗产生一组索引值,其取值范围为0-27。索引值、量化层的数目和其相应的差分子带信噪比SNQR近似值之间的关系如表3所示。由于差分信号被归一化,步长164被设定等于1。
表3
ABIT  变址  量化层的数目   编码长度(位)     SN Q R(dB)
0           0              0                -
1           3              可变的           8
2           5              可变的           12
3           7(或8)         可变的(或3)      16
4           9              可变的           19
5           13             可变的           21
6           17(或16)       可变的(或4)      24
7           25             可变的           27
8           33(或32)       可变的(或5)      30
9           65(或64)       可变的(或6)      36
10          129(或128)     可变的(或7)      42
11          256            8                48
12          512            9                54
13          1024           10               60
14          2048           11               66
15          4096           12               72
16          8192           13               78
17          16384          14               84
18          32768          15               90
19          65536          16               96
20          131072         17               102
21          262144         18               108
22          524268         19               114
23          1048576        20               120
24          2097152        21               126
25          4194304        22               132
26          8388608        23               138
27          16777216       24               144
比特分配索引值(ABIT)可以用4-比特无符号的整数代码字、5-位无符号的整数代码字或用12-层熵表直接传输到解码器。通常,熵编码可用于低比特码率应用以节省比特。ABIT的编码方法在编码器中通过模式控制来设定并传至解码器。熵编码过程如图12所示,把ABIT索引值相配比较166到一个由BHUFF索引值指定的代码本上,并从一具有12-层ABIT表的代码本中匹配比较出特定码VABIT。
全局比特码率控制
由于辅助信息和差分子带采样数据皆可以选择用熵编码可变长度代码本进行编码,所以当以固定的速率传输压缩比特流时,必须使用某种机制来调节编码器产生的比特码率。由于辅助信息一旦计算后通常不希望更改,比特码率的调节最好通过重复迭代地改变ADPCM编码器中的差分子带采样量化过程来达到,直至满足比特码率限制条件。
在上述系统中,图10中的全局码率控制(GRC)系统178通过改变分层码值的统计分布来调节在量化器层码与熵表比较相配过程中产生的比特码率。所有熵表都被假定具有层码值越大码字越长的相似趋向。在这种情况下,平均比特码率随着低值编码层概率的增加而降低,反之亦然。在ADPCM(或APCM)量化过程中,比例因数的大小决定了分层编码值的分布或使用。例如,随着比例因数尺寸的增加差分采样值将趋于在较低层上量化,因此代码值将逐渐变小。这样又将导致较小的熵代码字长和更低的比特码率。
这种方法的缺点是比例因数尺寸的增加相应地、成比例地提升了子带采样中的重构噪声。然而在实际应用中,对比例因数的调节通常不大于1dB-3dB。如果需要进行更大的调节,则最好是回到比特分配以减少总比特分配,而不应冒险因使用过大的比例因数而使子带中可能出现可听觉的量化噪声。
为了调节熵编码ADPCM的比特分配,每个子带的预测历史采样值应存储在临时缓冲器中,以便ADPCM编码过程需要重复的情形。接着,利用从子带LPC分析推导出的预测系数AH以及比例因数RMS(或PEAK)、量化器比特分配ABIT、瞬变模式TMODE、和从估计的差分信号中推导出的预测模式PMODE,所有子带采样缓冲器可通过完整的ADPCM过程进行编码。所产生的量化器层代码被进行缓冲并映射到具有最低比特用量的熵可变长度代码本上,代码本大小再次使用比特分配索引值来确定。
随后,GRC系统对所有索引值分组分析,对有相同比特分配索引值的每个子带统一计算使用的比特位数。例如,当ABIT=1时,全局比特管理中的比特分配计算可以假定每个子带采样为1.4的平均比特码率(即,最佳层代码幅值分布假设时熵编码本的平均码率)。如果所有ABIT=1的子带的总比特位数用量大于1.4x(子带采样的总数),那么所有这些子带的比例因数都可以增加从而造成比特码率的下降。调节子带比例因数的决定最好是留在得到所有ABIT索引值码率之后。由此,低于比特分配过程中假定码率的索引值可用来补偿那些高于假定比特码率的索引值。这种评估过程可在适当时扩展应用于所有音频声道。
为了降低总比特码率,建议的程序是从超过阈值的最低ABIT索引值比特率开始,增加每个具有这种比特分配率的子带的比例因数。实际达到的比特位数目的减少量是这些子带原先高于该分配率指定的码率。如果修正后的比特用量仍然超出允许的最大值,那么下一个比特用量超出指定值的、较高ABIT索引值子带中的比例因数将会增加。这个过程持续进行直到修正的比特用量低于最大值为止。
一旦达到这一目的,就将旧的历史数据装入预测器中,并且对已经修正了比例因数的那些子带重复进行ADPCM编码过程72。此后,将层代码再次映射至最佳熵代码本并重新计算比特用量。如果任何一个比特用量仍超过指定码率,那么要进一步增加比例因数并且重复进行上述循环。
修正比例因数的方式有两种。第一种是向解码器对每个ABIT索引值发送一个调整系数。例如,一个2-比特字能够代表0、1、2和3dB的调整范围。由于使用相同ABIT索引值的子带都使用相同的调整系数,而且只有索引值为1-10可以使用熵编码,对于所有子带来说需要传送的调整系数的最大数目是10。另一种方法是,通过选择高量化器层可以改变每个子带中的比例因数。然而,由于比例因数量化器的步长分别为1.25和2.5dB,所以其比例因数的调节只限于这些步长。此外,当使用该技术时,如果启用熵编码的话,则需要重新计算比例因数的差分编码及其产生的比特用量。
一般说来,当比特率低于所需的码率时,可以使用同样的程序来增加比特码率。在这种情况下,比例因数将被减小使得差分采样更好地利用量化器的外高层,并因此而使用熵表中更长的代码字。
如果在合理的迭代运算次数之后,比特分配索引值的比特用量不能再降低,或在传送比例因数调节系数时调节步长已经达到极限,那么有两种可能的修正方法。首先,可以增加那些码率已在指定范围内的子带的比例因数以此降低总比特码率。另一种方法是,放弃整个ADPCM编码过程并重新计算所有子带的自适应比特分配,这一次使用更少的比特位数。
数据流格式
图10所示的多路复用器32将每个声道的数据打包,然后把每个声道的打包数据多路复用成输出帧以形成数据流16。打包和多路复用数据的方法,即图19所示的帧格式186,其设计具有下列特性,使得音频编码器可以用于广大范围的应用之中,能扩展到更高的采样频率,每帧内的数据量受到限制,播放可以在每个子子帧中独立启动从而减少延迟,以及降低解码错误。
如图所示,单个帧186(4096个PCM采样值/声道)确立了比特位数据流的边界,它含有足够信息以适当解码出相应音频块,该单个帧由4个子帧188(1024个PCM采样值/声道)构成,而每个子帧又由4个子子帧190(256个PCM采样值/声道)构成。帧同步字192位于每个音频帧的开始。帧头信息194主要提供与帧186的结构、编码器产生比特流时的配置以及各种可选操作特性如嵌入动态范围控制和时间码等有关的信息。可选性的帧头信息196告知解码器是否需要下向声道混音、是否进行了动态范围补偿和数据流是否包含了辅助数据字节。音频编码头信息198指示编码器所用的、组装编码‘辅助信息’的打包装置和编码格式,‘辅助信息’即,比特分配、比例因数、PMODES、TMODES、代码本等等。剩余的帧由SUBFS个连续音频子帧188构成。
每个子帧的开始包含了音频编码辅助信息200,该信息将压缩音频多个关键编码系统的相关信息传至解码器。这些信息包括了瞬变检测、预测编码、自适应比特分配、高频矢量量化、强度编码和自适应比例运算。这些数据中的很多是从数据流中用以上的音频编码头信息拆包取得的。高频VQ编码数据列202是由用VQSUB索引值指示的、每高频子带为10-比特的索引值组成。低频效应数据列204为可选项,代表了用于驱动如低音炮扬声器的极低频率数据。
音频数据列206用霍夫曼/固定逆量化器进行解码,并被分成多个子子帧(SSC),每子子帧为每个声道可解出最多是256个PCM采样。超采样频音频数据列208只有当采样频率大于48kHz时才会存在。为了保持兼容,不能在采样频率高于48kHz时工作的解码器应当跳过该音频数据阵列。DSYNC210是用来验证音频帧中子帧的结束位置。如果此位置没有验证,则该子帧中解出的音频应认作为不可靠。相应结果要么对此帧进行静音处理要么重复前一帧。
子带解码器
图20是子带采样解码器18的方框图。解码器与编码器相比相当简单,而且并不涉及对重构音频质量来说具有基本重要意义的计算(例如比特分配)。在同步后,拆包器40对压缩的音频数据流16进行拆包,检测并按需纠正因传输而引入的错误,并且把数据多路分解为各音频声道。子带差分信号被重新量化成PCM信号,每个音频声道被进行反向滤波以把信号转回到时域。
接收音频帧和拆包头信息
编码数据流是在编码器中打包(或成帧)的,它每帧中除了包括真正的音频码字本身还包含了附加数据,用于解码器同步、误差检测及纠正、音频编码状态标记值和编码辅助信息。拆包器40检测到SYNC字并取出帧尺寸FSIZE。编码的比特流由连续的音频帧组成,每一帧都以32-位(0×7ffe8001)同步字(SYNC)开始。音频帧的实际尺寸FSIZE从同步字之后的字节中取出。这样便允许程序员设定一个‘帧结束’定时器以减少软件运算代价。接着取出NBlks使解码器能算出音频窗口尺寸(32(Nblks+1))。这告知解码器取出什么样的辅助信息和产生多少重构采样。
帧头信息字节组(sync,ftype,surp,nblks,fsize,amode,sfreq,rate,mixt,dynf,dynct,time,auxcnt,lff,hflag)一旦被收到,就可以用里德所罗门校验字节HCRC来验证最前12个字节的有效性。这些程序可在14个字节中发生1个错误字节时进行纠正,或在发生2个错误字节时进行警示。在完成了错误校验之后,这些头信息被用来更新解码器标记值。
位于HCRC之后直至可选信息的部分是头信息参数(filts,vernum,chist,pcmr,unspec),可被取出并用来更新解码器标记值。由于这些信息不会逐帧改变,所以可以用多数表决方案来补偿其比特误差。可选的头数据(times,mcoeff,dcoeff,auxd,ocrc)则可根据mixct,dynf,time和auxcnt等头参数来取出。可选数据可以使用可选的里德所罗门校验字节OCRC来验证。
音频编码帧中的头参数(subfs,subs,chs,vqsub,joinx,thuff,shuff,bhuff,sel5,sel7,sel9,sel13,sel17,sel25,sel33,sel65,sel129,ahcrc)每帧传输一次。它们可以使用音频里德所罗门校验字节AHCRC来验证。大多数头信息相对于每个音频声道重复,音频声道数由CHS定义。
拆包子帧编码辅助信息
音频编码帧被分成多个子帧(SUBFS)。每个子帧包含所有正确解出音频必需的辅助信息(pmode,pvq,tmode,scales,abits,hfreq)而无须参考任何其它子帧。每个连续子帧的解码首先通过拆包其辅助信息。
对于所有音频声道的每一个有效子带,一个1-比特的预测模式(PMODE)标记值将被传输。PMODE标记值对当前子帧有效。PMODE=0意味着该子带的音频帧中不包含预测器系数。在这种情况下,此频带的预测器系数在该子帧的时段内被置零。PMODE=1意味着辅助信息内包含了该子带的预测器系数。在这种情况下,这些预测器系数被取出并在该子帧的时段内被装入用于其预测器中。
对于pmode数据列中的每个PMODE=1,数据列PVQ中含有其相应的预测系数VQ地址索引。这些索引值为固定的、无符号的12-比特整数字,通过把12-比特整数映射至矢量表266,可以从查寻表中取出4个预测系数。
比特分配索引值(ABIT)表示在逆量化器中的层数,逆量化器把子带音频代码转换成绝对值。每个音频声道中的ABITs其拆包格式各不相同,决定于它的BHUFF索引和具体的VABIT代码256。
瞬态模式辅助信息(TMODE)238被用来表示每个子带中瞬变在子帧中的位置。每个子帧被分成1-4个子子帧。从子带采样数量来说,每个子子帧由8个采样构成。最大子帧尺寸是32个子带采样。如果瞬变发生在第一子子帧内,则tmode=0。当tmode=1时表示瞬变出现在第二子子帧内,以此类推。为了控制瞬变失真如预回波等,TMODE大于零的子帧子带将传输两个比例因数。从音频头参数中取出的THUFF索引值决定了用于解码TMODEs的方法。当THUFF=3时,TMODEs作为无符号2-比特整数拆包。
比例因数索引值的传输使每个子帧内的子带音频码可以进行适当比例运算。如果TMODE等于零,则传输一个比例因数。如果任何子带的TMODE大于零,那么同时传输两个比例因数。从音频头参数中取出的SHUFF索引值240决定了每个不同音频声道用于解码SCALES的方法。VDRMSQL索引值确定了RMS比例因数的值。
在某些模式下,SCALES索引值的拆包需要从五个129-层带符号的霍夫曼逆量化器中选一进行。然而,其产生的逆量化索引值仍为差分编码形式,需按下列方法转换成绝对值:
ABS_SCALE(n+1)=SCALES(n)-SCALES(n+1)
其中n是在音频声道中从第一子带开始数的第n个差分比例因数。
在低比特码率音频编码模式下,音频编码器利用矢量量化直接对高频子带音频采样进行有效编码。这些子带不使用差分编码,与正常ADPCM过程有关的所有数据列必须保持置零状态。VQSUB表示了用VQ编码的第一个子带,在此之上的、直至SUBS的所有子带都用这种方式进行编码。
高频索引值(HFREQ)被拆包248为固定的、10-比特无符号整数。通过应用合适的索引值,从Q4分数式二进制LUT中可取出每个子带子帧所需的32个采样。这一过程对每个启用高频VQ模式的声道进行重复。
低音效果声道的抽取因数总是X128。LFE中的8-比特效果采样的数量当PSC=0时可由SSC*2给出,或当PSC为非零值时由(SSC+1)*2给出。LFE数据列之后还包含有一附加7比特比例因数(无符号整数),用7-比特LUT可将其转换成rms。
拆包子子帧音频码数据列
子带音频码的抽取过程是通过ABIT索引值来实现的,且在ABIT<11的情况下还需使用SEL索引值。音频代码采用可变长度的霍夫曼码或固定的线性代码进行格式。通常,低于或等于10的ABIT索引值意味着采用了霍夫曼可变长度编码,其码本由代码VQL(n)258选定,而大于10的ABIT总是代表采用了固定长度码。所有量化器都具有中点取值、均匀步长的特性。对于固定码(Y2)量化器而言,最低的负数量化层被放弃不用。音频码被打包成子子帧,每个子子帧代表了最多为8个子带采样值,且在当前子帧中最多可有4个子子帧。
如果采样频率标记值(SFREQ)表示的采样频率高于48kHz,那么音频帧中将存在超音频数据阵列。该数据列中的头两个字节将表示超音频的字节尺寸。此外,解码器硬件的采样频率应根据具体高频采样频率值设定成SFREQ/2或SFREQ/4进行工作。
拆包同步校验
在每个子帧结束时,应对数据拆包同步校验字DSYNC=0xffff进行检测以便验证拆包的完好性。如果头信息参数、辅助信息或音频数据列因比特错误而遭到破坏,在辅助信息和音频码字中使用可变长度代码字节(即低比特码率音频的情形)可能导致拆包数据错位。如果拆包指针没有指向DSYNC的始端,那么可以认为前一个子帧的音频是不可靠的。
一旦所有的辅助信息和音频数据都进行了拆包,解码器一次一个子帧地重构多通道音频信号。图20示出了用于单个声道中单个子带的基带解码器部分。
重构RMS比例因数
解码器对ADPCM、VQ和JFC算法重构RMS比例因数(SCALES)。具体来说,VTMODE和THUFF索引值被逆映射以识别当前子帧的瞬态模式(TMODE)。此后,SHUFF索引值、VDRMSQL代码和TMODE被逆映射以便重构差分RMS编码。差分RMS编码被进行逆差分编码242以便选择RMS码,RMS码再被逆量化244以形成RMS比例因数。
逆量化高频矢量
解码器对高频矢量进行逆量化以重构子带音频信号。具体是,由起始VQ子带(VQSUBS)所指示而取出的、有符号的8-位分数式(Q4)二进制数,即高频采样(HFREQ),被映射至逆VQ查值表248。选中的表格值被逆量化250,并通过RMS比例因数进行比例运算252。
逆量化音频码
在进入ADPCM循环运算之前,音频码被进行逆量化和比例运算以形成重构子带差分采样。逆量化的实现首先通过逆映射VABIT和BHUFF索引值,以指定用于确定步长和量化层数量的ABIT索引值,同时逆映射用于产生量化器层代码QL(n)的SEL索引值和VQL(n)音频码。然后,代码字QL(n)映射到由ABIT和SEL索引值指定的逆量化器查找表260。虽然代码是按ABIT排列顺序,但是每个不同的音频声道都有其不同的SEL值。查找过程将产生带符号的量化器层数,它们可通过乘以量化器步长被转换成单位rms。这些单位rms值然后乘以指定的RMS比例因数(SCALES)262可以被转换成最后差分采样值。
1.QL[n]=1/Q[码[n]],其中1/Q是逆量化器查找表
2.Y[n]=QL[n]*步长[abits]
3.Rd[n]=Y[n]*比例因数,其中Rd=重构的差分采样逆ADPCM
ADPCM解码过程按照下列方式对每个子带差分采样执行:
1.从逆VQ查值表268中装入预测系数。
2.将当前的预测器系数与保留在预测器历史数据列268中的前4个重构子带采样进行卷积运算,产生预测采样。
p[n]=sum(Coeff[i]*R[n-i]),n=当前采样周期,i=1,4
3.将预测采样与重构的差分采样相加产生重构的子带采样270。
R[n]=Rd[n]+P[n]
4.更新预测器的历史,即把当前的重构子带采样值复制到历史数据列的顶部。
R[n-i]=R[n-i+1],i=4,1
在PMODE=0的情况下,预测器系数将为零,预测采样也为零,而且重构子带采样等于差分子带采样。虽然在这种情况下不需要进行预测计算,重要的是仍需要保持预测器历史的更新,以便PMODE在将来的子帧中又重新启用。此外,如果HFLAG在当前音频帧中有效,则应在解码该帧中第一个子子帧之前清除预测器历史。此点以后的历史则应该照常更新。
对于高频VQ子带或非编码(即位于SUBS限值以上)子带来说,预测器历史应保持清零状态,直到其子带预测器被启用为止。
ADPCM、VQ和JFC解码的选择控制
第一个“开关”控制了ADPCM或VQ输出的选择。VQSUBS索引值识别出VQ编码的起始子带。因此,如果当前子带低于VQSUBS,开关将选择ADPCM输出。否则它将选择VQ输出。第二个“开关”278控制了直接声道输出或JFC编码输出的选择。JOINX索引值确定了哪些声道被联合及重构信号是在哪一个声道中产生的。重构的JFC信号形成了其它声道中JFC输入的强度源。因此,如果当前子带是JFC的一部分而且不是指定声道,则开关将选择JFC输出。一般情况下开关选择声道输出。
下混音矩阵
数据流的音频编码模式由AMODE指出。解码的音频声道然后可被重新定向以与解码器硬件280上的实际输出声道安排相匹配。
动态范围控制数据
在编码阶段282,动态范围系数DCOEFF可被选择性地嵌入音频帧中。这个特性的目的是便于在解码器的输出中实现音频动态范围的压缩。动态范围的压缩对于某些收听环境尤为重要,这些环境的高环境噪声级使低能量信号不能被察觉,除非冒着在高音量部分损坏扬声器的危险。20-比特PCM音频录音技术的日益广泛应用使该问题进一步复杂化,此类录音具有高达110dB的动态范围。
根据帧的窗口尺寸(NBLKS),无论哪种编码模式,每个声道可传输一、二或四个系数(DYNF)。如果传输单个系数,则它可用于整个帧。如果传输两个系数,则第一个系数用于帧的前半部分,而第二个系数用于帧的后半部分。四个系数则分布在每个帧的四等份上。更高的时间分辨率可在本地对传输值进行内插运算达到。
每个系数是8-位带符号的分数式Q2二进制数,而且代表了如表(53)所示出的对数增益值,该表给出范围为+/-31.75dB,步长为0.25dB。这些系数按照声道数进行排序。动态范围压缩通过将解码音频采样乘以这些线性系数达到。
解码器通过适当调节这些系数值可以改变压缩的程度,或可以忽略这些系数而完全中止动态范围压缩。
32-频带内插滤波器组
32-频带内插滤波器组44将每个声道的32个子带转换成单个PCM时域信号。当FILTS=0时使用非完全重构系数(512-节FIR滤波器)。当FILTS=1时使用完全重构系数。通常余弦调制系数可预先计算并存储在ROM(只读存储器)中。内插程序可扩展用于重构大尺寸数据块以降低循环程序的代价。然而,在终止帧的情况下,需要的最小分辨率的是32个PCM采样。内插算法如下:建立余弦调制系数,将32个新子带采样读入数据列XIN,乘以余弦调制系数和建立临时数据列SUM和DIFF,存储历史值,乘以滤波器系数,建立32个PCM输出采样,更新工作数据列,和输出32个新PCM采样。
根据所使用的比特码率和编码方案,比特流既可以指定非完全或完全重构内插滤波器组系数(FILTS)。由于编码器抽取滤波器组是用40-比特浮点精度来计算的,所以编码器达到最大理论重构精度的能力取决于源PCM字长和DSP核心用于计算卷积的精度以及操作中比例运算的方式。
低频率效果PCM内插
与低频效果声道相关的音频数据独立于主音频声道。该声道是用8-比特APCM过程对X128抽取的(120Hz带宽)20-比特PCM输入进行编码。抽取的效果音频在时间上需与主音频声道的当前子帧音频对齐。因此,由于所有32-频带内插滤波器组的延迟是256个采样(512-节),所以必须注意确保内插的低频效果声道在输出前也与其它音频声道对齐。如果效果内插FIR也是512节,则不需要进行补偿。
LFT算法使用512节的128X内插FIR进行如下操作:把7-比特比例因数映射成rms,乘以7-比特量化器的步长,由归一化值产生子采样值,以及利用低通滤波器进行内插128,例如为每个子采样设置的那样。
硬件实现
图21和22描述了一个6声(通)道编码器和解码器硬件实现的基本功能结构,它可在32、44.1和48kHz等采样频率进行操作。参照图22,八个模拟器件公司的ADSP21020 40-比特浮点数字信号处理器(DSP)芯片296被用来实现一个6声道数字音频编码器298。六个DSPs中每个被用来对所有声道的其中之一进行编码,第七和第八个DSP则用来分别实现“全局比特分配与管理”和“数据流格式化及误差编码”功能。每个ADSP21020以33MHz的时钟驱动,并使用外接的(48比特X32k)程序读写存储器(PRAM)300,(40比特X32k)数据读写存储器(SRAM)302进行算法运算。在编码器情况下,还用了(8比特X512k)的EPROM 304来存储固定常数,例如可变长度的熵代码本。用于数据流格式化的DSP使用了里德所罗门CRC(循环冗余校验)芯片306以使解码器可以进行检错与纠错操作。编码器DSPs和全局比特分配及管理之间的信息交流是通过双端口静态读写存储器(RAM)308实现的。
编码处理的流程如下。三个AES/EBU数字音频接收器的任意之一可输出一个2-声道数字音频PCM数据流310。这些双声道数据流中的第一声道分别导向CH1、3和5编码器DPSs,其第二声道分别导向CH2、4和6。串行PCM字被转换成并行(s/p)以将PCM采样读入DSPs。如前所述,每个编码器累积一帧PCM采样然后对此帧数据进行编码。每个声道中有关估计差分信号(ed(n))和子带采样(x(n))的信息通过双端口RAM传输到全局比特分配和管理DSP中。然后用同样的方式读回每个编码器的比特分配策略。编码过程完成之后,6个声道的编码数据和辅助信息通过全局比特分配和管理DSP传至数据流格式化DSP中。在这一阶段,CRC校验字节可被选择性地产生并加到编码数据中以便在解码器中提供误差保护。最后,整个数据包16被组装输出。
图22描述了一个6声道解码器的硬件实现。单个模拟器件公司的ADSP21020 40-比特浮点数字信号处理器(DSP)芯片324被用来实现6声道数字音频解码器。此ADSP21020以33MHz的时钟驱动,并使用外接的(48比特X32k)程序读写存储器(PRAM)326,(40比特X32k)数据读写存储器(SRAM)328进运行解码算法。此外还用了附加的(8比特X512k)EPROM330来存储诸如可变长度熵和预测系数矢量代码本等固定常数。
解码过程的流程如下。压缩数据流16通过串行/并行转换器(s/p)332被输入到DSP。数据如前面所述被进行拆包和解码。每个通道的子带采样被重构成单个PCM数据流22并通过三个并行/串行转换器(p/s)335输出到三个AES/EBU数字音频输出芯片334中。
以上显示和描述了本发明的几个说明性实施例,但是对于那些熟悉本领域的技术人员来说可以做出大量改变和替换的实施例。例如,随着处理器速度的增加和存储器成本的降低,采样频率、传输率和缓冲器尺寸很可能增加。这些变动的和替换的实施例可以被预想和实现,但并没有脱离本发明如修正要求书中所定义构思和范围。

Claims (12)

1.一种用于从数据流重构多个音频通道的多通道音频解码器,其中每个音频通道以编码器采样率被采样,被再分为多个频率子带,被压缩和多路复用为某一传输率的数据流,该多通道音频解码器包括:
输入缓冲器,用于一次一个帧地读入并存储该数据流,每个所述帧包括同步字、帧头、音频头以及至少一个子帧,该子帧包括音频辅助信息和多个具有音频码的子子帧;
多路分解器,其a)检测同步字,b)拆包帧头以提取指示帧中的音频采样数的窗口尺寸和指示帧中的字节数的帧尺寸,所述窗口尺寸被设置为传输率与编码器采样率之比的函数,使得帧尺寸被限制为低于输入缓冲器的尺寸,c)拆包音频头以提取帧中的子帧数和经编码的音频通道的数量,以及d)相继拆包每个子帧以提取包含子子帧数的音频辅助信息,以及将每个子子帧中的音频码多路分解为多个音频通道并将每个音频通道拆包为其子带音频码;
解码器,其使用辅助信息将子带音频码一次一个子帧地解码为经重构的子带信号,而不需要参考任何其它子帧;以及
重构滤波器,其将每个通道的经重构的子带信号一次一个子帧地组合为经重构的多通道音频信号。
2.如权利要求1所述的多通道音频解码器,其中所述解码器包括多个后向自适应差分脉冲编码调制ADPCM编码器,用于解码相应的子带音频码,所述辅助信息包括用于相应的自适应差分脉冲编码调制编码器的预测系数和用于控制预测系数对相应的自适应差分脉冲编码调制编码器的应用以选择性地启用或禁用该自适应差分脉冲编码调制编码器的预测能力的预测模式PMODE。
3.如权利要求2所述的多通道音频解码器,其中所述辅助信息包括:
用于每个通道的子带的比特分配表,其中每个子带的比特率在整个子带上是固定的;
用于每个通道中的每个子带的至少一个比例因数;以及
用于每个通道中的每个子带的瞬变模式TMODE,该瞬变模式识别比例因数的数量及其相关的子子帧,所述解码器根据各子带的瞬变模式以相应的比例因数对子带的音频码进行比例运算以便于解码。
4.如权利要求2所述的多通道音频解码器,其中所述解码器包括:
反向预测编码器,用于解码较低频率子带;以及
逆矢量量化器VQ,用于解码较高频率子带。
5.一种用于从数据流重构多个音频通道的多通道音频解码器,其中每个音频通道以编码器采样率被采样,被再分为多个频率子带,被压缩和多路复用为数据流,该多通道音频解码器包括:
输入缓冲器,用于一次一个帧地读入并存储该数据流,每个所述帧包括同步字、包括选择非完全重构NPR滤波器组和完全重构PR滤波器组之一的滤波器码的帧头、音频头以及至少一个子帧,该子帧包括频率范围内的音频码块,以及拆包同步字;
多路分解器,其a)检测同步字,b)拆包帧头以提取编码器采样率,c)拆包音频头以提取打包方案和用于音频帧的编码格式,以及d)通过将音频码的每个块多路分解为多个音频通道并将每个音频通道拆包为其子带音频码;以及
解码器,其使用所选择的非完全重构或完全重构滤波器组一次一个子帧地将子带音频码解码为相应的经重构的子带信号;
重构滤波器,其将每个通道的经重构的子带信号一次一个子帧地组合为经重构的信号。
6.一种用于从数据流重构多个音频通道的多通道音频解码器,其中每个音频通道以编码器采样率被采样,被再分为多个频率子带,被压缩和多路复用为某一传输率的数据流,该多通道音频解码器包括:
输入缓冲器,用于一次一个帧地读入并存储该数据流,每个所述帧包括帧头、音频头以及至少一个子帧,该子帧包括音频辅助信息和音频码;
多路分解器,其a)拆包帧头以提取指示帧中的音频采样数的窗口尺寸,所述窗口尺寸被设置为传输率与编码器采样率之比的函数,使得帧尺寸被限制为小于输入缓冲器的尺寸,b)拆包音频头以提取帧中的子帧数和经编码的音频通道的数量,以及c)相继拆包每个子帧以提取音频辅助信息,以及将音频码多路分解为多个音频通道并将每个音频通道拆包为其子带音频码;以及
解码器,其使用辅助信息将音频码一次一个子帧地解码为经重构的子带信号;以及
重构滤波器,其将每个通道的经重构的子带信号一次一个子帧地组合为经重构的多通道音频信号。
7.如权利要求6所述的多通道音频解码器,其中每个子带包括用于该子帧而且仅用于该子帧的辅助信息,使得解码器一次一个子帧地分别解码子带音频码和高采样率音频码,而无需参考任何其它子帧。
8.如权利要求6所述的多通道音频解码器,其中重构滤波器包括非完全重构NPR滤波器组和完全重构PR滤波器组,并且所述帧头包括选择所述非完全重构和完全重构滤波器组之一的滤波器码。
9.一种从编码音频帧流重构多通道音频信号的方法,其中每个音频帧包括同步字,帧头,音频头和至少一个子帧,子帧包括音频辅助信息、在频率范围内具有音频码的多个子子帧、以及拆包同步,所述用于重构每个音频帧的方法包括:
检测同步字;
将帧头拆包以提取指示帧中的字节数的帧大小、指示音频帧中的音频采样数的窗口大小、以及编码器采样率;
将音频头拆包以提取子帧数和音频通道数;
通过以下步骤顺序拆包每个子帧:
提取音频辅助信息,
将每个子子帧中的音频码多路分解为多个音频通道,
以相应的子带频率将每个经多路分解的音频通道拆包为多个子带音频码,
检测拆包同步以验证子帧的结束;
根据子带音频码的辅助信息解码子带音频码,以便一次一个子帧地产生重构的子带信号而不需要参考任何其它子帧;
通过拆包帧头以提取重构滤波器码、在由重构滤波器码指示时选择非完全滤波器组以组合通道的音频帧、以及在由重构滤波器码指示时选择完全滤波器组以组合通道的音频帧,一次一个子帧地将通道的重构子带信号组合为相应的重构基带信号。
10.如权利要求9所述的方法,其中根据后向自适应差分脉冲编码调制ADPCM方案解码子带音频码,该方法还包括:
从辅助信息中提取预测系数的序列;
为每个子带音频码提取预测模式PMODE;
根据预测模式控制预测系数对不同自适应差分脉冲编码调制方案的应用,以选择性地启用和禁止自适应差分脉冲编码调制方案的预测能力。
11.如权利要求9所述的方法,其中解码子带音频码的步骤包括:
从辅助信息中提取子带音频码的比特分配表,其中对应于每个子带音频码的比特率在整个子帧内是固定的;
从辅助信息中提取比例因数的序列;
为每个子带音频码提取用于识别比例因数的数量及其在子带音频码中的相关子子帧位置的瞬变模式TMODE,以及
根据子带音频码的瞬变模式以它们相应的比例因数对子带音频码进行比例运算。
12.如权利要求9所述的方法,其中解码子带音频码的步骤包括:
在较低子带频率处后向自适应差分脉冲编码调制ADPCM解码子带音频码;以及
在较高子带频率处逆矢量量化子带音频码。
CN2006100817855A 1995-12-01 1996-11-21 多通道音频编码器 Expired - Lifetime CN1848241B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US789695P 1995-12-01 1995-12-01
US60/007,896 1995-12-01
US08/642,254 US5956674A (en) 1995-12-01 1996-05-02 Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US08/642,254 1996-05-02

Related Parent Applications (2)

Application Number Title Priority Date Filing Date
CN96199832A Division CN1132151C (zh) 1995-12-01 1996-11-21 多通道声解码器
CNB031569277A Division CN1303583C (zh) 1995-12-01 1996-11-21 多通道音频编码器

Publications (2)

Publication Number Publication Date
CN1848241A CN1848241A (zh) 2006-10-18
CN1848241B true CN1848241B (zh) 2010-12-15

Family

ID=26677495

Family Applications (5)

Application Number Title Priority Date Filing Date
CN2006100817855A Expired - Lifetime CN1848241B (zh) 1995-12-01 1996-11-21 多通道音频编码器
CN200610081786XA Expired - Lifetime CN1848242B (zh) 1995-12-01 1996-11-21 多通道音频编码器
CN2010101265919A Expired - Lifetime CN101872618B (zh) 1995-12-01 1996-11-21 多通道音频编码器
CNB031569277A Expired - Lifetime CN1303583C (zh) 1995-12-01 1996-11-21 多通道音频编码器
CN96199832A Expired - Lifetime CN1132151C (zh) 1995-12-01 1996-11-21 多通道声解码器

Family Applications After (4)

Application Number Title Priority Date Filing Date
CN200610081786XA Expired - Lifetime CN1848242B (zh) 1995-12-01 1996-11-21 多通道音频编码器
CN2010101265919A Expired - Lifetime CN101872618B (zh) 1995-12-01 1996-11-21 多通道音频编码器
CNB031569277A Expired - Lifetime CN1303583C (zh) 1995-12-01 1996-11-21 多通道音频编码器
CN96199832A Expired - Lifetime CN1132151C (zh) 1995-12-01 1996-11-21 多通道声解码器

Country Status (18)

Country Link
US (4) US5956674A (zh)
EP (1) EP0864146B1 (zh)
JP (1) JP4174072B2 (zh)
KR (1) KR100277819B1 (zh)
CN (5) CN1848241B (zh)
AT (1) ATE279770T1 (zh)
AU (1) AU705194B2 (zh)
BR (1) BR9611852A (zh)
CA (2) CA2238026C (zh)
DE (1) DE69633633T2 (zh)
DK (1) DK0864146T3 (zh)
EA (1) EA001087B1 (zh)
ES (1) ES2232842T3 (zh)
HK (4) HK1015510A1 (zh)
MX (1) MX9804320A (zh)
PL (3) PL183092B1 (zh)
PT (1) PT864146E (zh)
WO (1) WO1997021211A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11838738B2 (en) 2014-03-24 2023-12-05 Dolby Laboratories Licensing Corporation Method and device for applying Dynamic Range Compression to a Higher Order Ambisonics signal

Families Citing this family (539)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997029549A1 (fr) * 1996-02-08 1997-08-14 Matsushita Electric Industrial Co., Ltd. Codeur, decodeur, codeur-decodeur et support d'enregistrement de signal audio large bande
US8306811B2 (en) * 1996-08-30 2012-11-06 Digimarc Corporation Embedding data in audio and detecting embedded data in audio
JP3622365B2 (ja) * 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
JPH10271082A (ja) * 1997-03-21 1998-10-09 Mitsubishi Electric Corp 音声データ復号装置
US6741796B1 (en) * 1997-03-25 2004-05-25 Samsung Electronics, Co., Ltd. DVD-Audio disk, and apparatus and method for playing the same
US6449227B1 (en) 1997-03-25 2002-09-10 Samsung Electronics Co., Ltd. DVD-audio disk, and apparatus and method for playing the same
US7110662B1 (en) * 1997-03-25 2006-09-19 Samsung Electronics Co., Ltd. Apparatus and method for recording data on a DVD-audio disk
JP3339054B2 (ja) * 1997-03-28 2002-10-28 ソニー株式会社 データ符号化方法及び装置、データ復号方法及び装置、並びに記録媒体
US6298025B1 (en) * 1997-05-05 2001-10-02 Warner Music Group Inc. Recording and playback of multi-channel digital audio having different resolutions for different channels
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6636474B1 (en) * 1997-07-16 2003-10-21 Victor Company Of Japan, Ltd. Recording medium and audio-signal processing apparatus
US5903872A (en) * 1997-10-17 1999-05-11 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
WO1999033194A1 (en) * 1997-12-19 1999-07-01 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. Method and apparatus for phase estimation in a transform coder for high quality audio
US6591241B1 (en) * 1997-12-27 2003-07-08 Stmicroelectronics Asia Pacific Pte Limited Selecting a coupling scheme for each subband for estimation of coupling parameters in a transform coder for high quality audio
JP3802219B2 (ja) * 1998-02-18 2006-07-26 富士通株式会社 音声符号化装置
US6089714A (en) * 1998-02-18 2000-07-18 Mcgill University Automatic segmentation of nystagmus or other complex curves
JPH11234136A (ja) * 1998-02-19 1999-08-27 Sanyo Electric Co Ltd デジタルデータの符号化方法及び符号化装置
US6253185B1 (en) * 1998-02-25 2001-06-26 Lucent Technologies Inc. Multiple description transform coding of audio using optimal transforms of arbitrary dimension
KR100304092B1 (ko) 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
US6400727B1 (en) * 1998-03-27 2002-06-04 Cirrus Logic, Inc. Methods and system to transmit data acquired at a variable rate over a fixed rate channel
US6385345B1 (en) * 1998-03-31 2002-05-07 Sharp Laboratories Of America, Inc. Method and apparatus for selecting image data to skip when encoding digital video
JPH11331248A (ja) * 1998-05-08 1999-11-30 Sony Corp 送信装置および送信方法、受信装置および受信方法、並びに提供媒体
US6141645A (en) * 1998-05-29 2000-10-31 Acer Laboratories Inc. Method and device for down mixing compressed audio bit stream having multiple audio channels
US6141639A (en) * 1998-06-05 2000-10-31 Conexant Systems, Inc. Method and apparatus for coding of signals containing speech and background noise
DE69924922T2 (de) * 1998-06-15 2006-12-21 Matsushita Electric Industrial Co., Ltd., Kadoma Audiokodierungsmethode und Audiokodierungsvorrichtung
US6061655A (en) * 1998-06-26 2000-05-09 Lsi Logic Corporation Method and apparatus for dual output interface control of audio decoder
US6301265B1 (en) * 1998-08-14 2001-10-09 Motorola, Inc. Adaptive rate system and method for network communications
US7457415B2 (en) 1998-08-20 2008-11-25 Akikaze Technologies, Llc Secure information distribution system utilizing information segment scrambling
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6704705B1 (en) * 1998-09-04 2004-03-09 Nortel Networks Limited Perceptual audio coding
GB9820655D0 (en) * 1998-09-22 1998-11-18 British Telecomm Packet transmission
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
JP4193243B2 (ja) * 1998-10-07 2008-12-10 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体
US6463410B1 (en) * 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6219634B1 (en) * 1998-10-14 2001-04-17 Liquid Audio, Inc. Efficient watermark method and apparatus for digital signals
US6345100B1 (en) 1998-10-14 2002-02-05 Liquid Audio, Inc. Robust watermark method and apparatus for digital signals
US6330673B1 (en) 1998-10-14 2001-12-11 Liquid Audio, Inc. Determination of a best offset to detect an embedded pattern
US6320965B1 (en) 1998-10-14 2001-11-20 Liquid Audio, Inc. Secure watermark method and apparatus for digital signals
US6754241B1 (en) * 1999-01-06 2004-06-22 Sarnoff Corporation Computer system for statistical multiplexing of bitstreams
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6378101B1 (en) * 1999-01-27 2002-04-23 Agere Systems Guardian Corp. Multiple program decoding for digital audio broadcasting and other applications
US6931372B1 (en) * 1999-01-27 2005-08-16 Agere Systems Inc. Joint multiple program coding for digital audio broadcasting and other applications
US6357029B1 (en) * 1999-01-27 2002-03-12 Agere Systems Guardian Corp. Joint multiple program error concealment for digital audio broadcasting and other applications
TW477119B (en) * 1999-01-28 2002-02-21 Winbond Electronics Corp Byte allocation method and device for speech synthesis
FR2791167B1 (fr) * 1999-03-17 2003-01-10 Matra Nortel Communications Procedes de codage, de decodage et de transcodage audio
JP3739959B2 (ja) * 1999-03-23 2006-01-25 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
DE19914742A1 (de) * 1999-03-31 2000-10-12 Siemens Ag Verfahren zum Übertragen von Daten
JP2001006291A (ja) * 1999-06-21 2001-01-12 Fuji Film Microdevices Co Ltd オーディオ信号の符号化方式判定装置、及びオーディオ信号の符号化方式判定方法
US7283965B1 (en) * 1999-06-30 2007-10-16 The Directv Group, Inc. Delivery and transmission of dolby digital AC-3 over television broadcast
US6553210B1 (en) * 1999-08-03 2003-04-22 Alliedsignal Inc. Single antenna for receipt of signals from multiple communications systems
US6581032B1 (en) * 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
US7181297B1 (en) 1999-09-28 2007-02-20 Sound Id System and method for delivering customized audio data
US6496798B1 (en) * 1999-09-30 2002-12-17 Motorola, Inc. Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message
US6732061B1 (en) * 1999-11-30 2004-05-04 Agilent Technologies, Inc. Monitoring system and method implementing a channel plan
US6741947B1 (en) * 1999-11-30 2004-05-25 Agilent Technologies, Inc. Monitoring system and method implementing a total node power test
US7792681B2 (en) * 1999-12-17 2010-09-07 Interval Licensing Llc Time-scale modification of data-compressed audio information
US6842735B1 (en) * 1999-12-17 2005-01-11 Interval Research Corporation Time-scale modification of data-compressed audio information
CN1264382C (zh) * 1999-12-24 2006-07-12 皇家菲利浦电子有限公司 多通道音频信号处理装置和方法
EP1226578A4 (en) * 1999-12-31 2005-09-21 Octiv Inc TECHNIQUES TO IMPROVE THE CLARITY AND UNDERSTANDING OF AUDIO-REDUCED AUDIO SIGNALS IN A DIGITAL NETWORK
US6499010B1 (en) * 2000-01-04 2002-12-24 Agere Systems Inc. Perceptual audio coder bit allocation scheme providing improved perceptual quality consistency
TW499672B (en) * 2000-02-18 2002-08-21 Intervideo Inc Fast convergence method for bit allocation stage of MPEG audio layer 3 encoders
US7679678B2 (en) * 2000-02-29 2010-03-16 Sony Corporation Data processing device and method, and recording medium and program
EP1287617B1 (de) * 2000-04-14 2003-12-03 Siemens Aktiengesellschaft Verfahren zum kanaldecodieren eines datenstroms mit nutzdaten und redundanzdaten, vorrichtung zum kanaldecodieren, computerlesbares speichermedium und computerprogramm-element
US6782366B1 (en) * 2000-05-15 2004-08-24 Lsi Logic Corporation Method for independent dynamic range control
US7136810B2 (en) * 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
US6725110B2 (en) * 2000-05-26 2004-04-20 Yamaha Corporation Digital audio decoder
KR20020029672A (ko) * 2000-05-30 2002-04-19 요트.게.아. 롤페즈 씨.디. 오디오 상의 코딩된 정보
US6678647B1 (en) * 2000-06-02 2004-01-13 Agere Systems Inc. Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution
US7110953B1 (en) * 2000-06-02 2006-09-19 Agere Systems Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
US6778953B1 (en) * 2000-06-02 2004-08-17 Agere Systems Inc. Method and apparatus for representing masked thresholds in a perceptual audio coder
US6754618B1 (en) * 2000-06-07 2004-06-22 Cirrus Logic, Inc. Fast implementation of MPEG audio coding
US6678648B1 (en) 2000-06-14 2004-01-13 Intervideo, Inc. Fast loop iteration and bitstream formatting method for MPEG audio encoding
US6601032B1 (en) * 2000-06-14 2003-07-29 Intervideo, Inc. Fast code length search method for MPEG audio encoding
US6748363B1 (en) * 2000-06-28 2004-06-08 Texas Instruments Incorporated TI window compression/expansion method
US6542863B1 (en) 2000-06-14 2003-04-01 Intervideo, Inc. Fast codebook search method for MPEG audio encoding
US6745162B1 (en) * 2000-06-22 2004-06-01 Sony Corporation System and method for bit allocation in an audio encoder
JP2002014697A (ja) * 2000-06-30 2002-01-18 Hitachi Ltd ディジタルオーディオ装置
FI109393B (fi) 2000-07-14 2002-07-15 Nokia Corp Menetelmä mediavirran enkoodaamiseksi skaalautuvasti, skaalautuva enkooderi ja päätelaite
US6931371B2 (en) * 2000-08-25 2005-08-16 Matsushita Electric Industrial Co., Ltd. Digital interface device
SE519981C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
US20020075965A1 (en) * 2000-12-20 2002-06-20 Octiv, Inc. Digital signal processing techniques for improving audio clarity and intelligibility
RU2284671C2 (ru) * 2000-10-11 2006-09-27 Конинклейке Филипс Электроникс Н.В. Масштабируемое кодирование объектов мультимедиа
US20030023429A1 (en) * 2000-12-20 2003-01-30 Octiv, Inc. Digital signal processing techniques for improving audio clarity and intelligibility
US7526348B1 (en) * 2000-12-27 2009-04-28 John C. Gaddy Computer based automatic audio mixer
CN1205540C (zh) * 2000-12-29 2005-06-08 深圳赛意法微电子有限公司 含有解码器的电路、时分寻址的方法和一个微控制器
EP1223696A3 (en) * 2001-01-12 2003-12-17 Matsushita Electric Industrial Co., Ltd. System for transmitting digital audio data according to the MOST method
GB0103242D0 (en) * 2001-02-09 2001-03-28 Radioscape Ltd Method of analysing a compressed signal for the presence or absence of information content
GB0108080D0 (en) * 2001-03-30 2001-05-23 Univ Bath Audio compression
EP1386308B1 (en) * 2001-04-09 2006-04-12 Koninklijke Philips Electronics N.V. Adpcm speech coding system with specific step-size adaptation
JP2004519736A (ja) * 2001-04-09 2004-07-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 位相スメアリング及び位相デスメアリングフィルタを有するadpcm音声コーディングシステム
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
CN1240048C (zh) * 2001-04-18 2006-02-01 皇家菲利浦电子有限公司 音频编码
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7047201B2 (en) * 2001-05-04 2006-05-16 Ssi Corporation Real-time control of playback rates in presentations
US7447321B2 (en) 2001-05-07 2008-11-04 Harman International Industries, Incorporated Sound processing system for configuration of audio signals in a vehicle
US7451006B2 (en) 2001-05-07 2008-11-11 Harman International Industries, Incorporated Sound processing system using distortion limiting techniques
US6804565B2 (en) 2001-05-07 2004-10-12 Harman International Industries, Incorporated Data-driven software architecture for digital sound processing and equalization
JP4591939B2 (ja) * 2001-05-15 2010-12-01 Kddi株式会社 適応的符号化伝送装置および受信装置
WO2002102049A2 (en) * 2001-06-11 2002-12-19 Broadcom Corporation System and method for multi-channel video and audio encoding on a single chip
US6661880B1 (en) 2001-06-12 2003-12-09 3Com Corporation System and method for embedding digital information in a dial tone signal
EP1271470A1 (en) * 2001-06-25 2003-01-02 Alcatel Method and device for determining the voice quality degradation of a signal
US7460629B2 (en) * 2001-06-29 2008-12-02 Agere Systems Inc. Method and apparatus for frame-based buffer control in a communication system
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP3463752B2 (ja) * 2001-07-25 2003-11-05 三菱電機株式会社 音響符号化装置、音響復号化装置、音響符号化方法および音響復号化方法
JP3469567B2 (ja) * 2001-09-03 2003-11-25 三菱電機株式会社 音響符号化装置、音響復号化装置、音響符号化方法及び音響復号化方法
US7062429B2 (en) * 2001-09-07 2006-06-13 Agere Systems Inc. Distortion-based method and apparatus for buffer control in a communication system
US7333929B1 (en) 2001-09-13 2008-02-19 Chmounk Dmitri V Modular scalable compressed audio data stream
US6944474B2 (en) * 2001-09-20 2005-09-13 Sound Id Sound enhancement for mobile phones and other products producing personalized audio for users
US6732071B2 (en) * 2001-09-27 2004-05-04 Intel Corporation Method, apparatus, and system for efficient rate control in audio encoding
JP4245288B2 (ja) 2001-11-13 2009-03-25 パナソニック株式会社 音声符号化装置および音声復号化装置
CN1248194C (zh) * 2001-11-14 2006-03-29 松下电器产业株式会社 编码装置、解码装置及其系统和方法
CN100449628C (zh) * 2001-11-16 2009-01-07 皇家飞利浦电子股份有限公司 调整附加数据信号的方法和装置及设备
JP3870193B2 (ja) 2001-11-29 2007-01-17 コーディング テクノロジーズ アクチボラゲット 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7558947B1 (en) 2001-12-31 2009-07-07 Apple Inc. Method and apparatus for computing vector absolute differences
US7055018B1 (en) 2001-12-31 2006-05-30 Apple Computer, Inc. Apparatus for parallel vector table look-up
US7681013B1 (en) 2001-12-31 2010-03-16 Apple Inc. Method for variable length decoding using multiple configurable look-up tables
US6693643B1 (en) 2001-12-31 2004-02-17 Apple Computer, Inc. Method and apparatus for color space conversion
US6822654B1 (en) 2001-12-31 2004-11-23 Apple Computer, Inc. Memory controller chipset
US7034849B1 (en) 2001-12-31 2006-04-25 Apple Computer, Inc. Method and apparatus for image blending
US6877020B1 (en) 2001-12-31 2005-04-05 Apple Computer, Inc. Method and apparatus for matrix transposition
US6697076B1 (en) 2001-12-31 2004-02-24 Apple Computer, Inc. Method and apparatus for address re-mapping
US7015921B1 (en) 2001-12-31 2006-03-21 Apple Computer, Inc. Method and apparatus for memory access
US6931511B1 (en) 2001-12-31 2005-08-16 Apple Computer, Inc. Parallel vector table look-up with replicated index element vector
US6573846B1 (en) 2001-12-31 2003-06-03 Apple Computer, Inc. Method and apparatus for variable length decoding and encoding of video streams
US7467287B1 (en) 2001-12-31 2008-12-16 Apple Inc. Method and apparatus for vector table look-up
US7305540B1 (en) 2001-12-31 2007-12-04 Apple Inc. Method and apparatus for data processing
US7114058B1 (en) 2001-12-31 2006-09-26 Apple Computer, Inc. Method and apparatus for forming and dispatching instruction groups based on priority comparisons
US7848531B1 (en) * 2002-01-09 2010-12-07 Creative Technology Ltd. Method and apparatus for audio loudness and dynamics matching
US6618128B2 (en) * 2002-01-23 2003-09-09 Csi Technology, Inc. Optical speed sensing system
WO2003069954A2 (en) * 2002-02-18 2003-08-21 Koninklijke Philips Electronics N.V. Parametric audio coding
US20030161469A1 (en) * 2002-02-25 2003-08-28 Szeming Cheng Method and apparatus for embedding data in compressed audio data stream
US20100042406A1 (en) * 2002-03-04 2010-02-18 James David Johnston Audio signal processing using improved perceptual model
US7313520B2 (en) * 2002-03-20 2007-12-25 The Directv Group, Inc. Adaptive variable bit rate audio compression encoding
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7225135B2 (en) * 2002-04-05 2007-05-29 Lectrosonics, Inc. Signal-predictive audio transmission system
US20040125707A1 (en) * 2002-04-05 2004-07-01 Rodolfo Vargas Retrieving content of various types with a conversion device attachable to audio outputs of an audio CD player
US7428440B2 (en) * 2002-04-23 2008-09-23 Realnetworks, Inc. Method and apparatus for preserving matrix surround information in encoded audio/video
WO2003092327A1 (en) * 2002-04-25 2003-11-06 Nokia Corporation Method and device for reducing high frequency error components of a multi-channel modulator
JP4016709B2 (ja) * 2002-04-26 2007-12-05 日本電気株式会社 オーディオデータの符号変換伝送方法と符号変換受信方法及び装置とシステムならびにプログラム
JP4744874B2 (ja) * 2002-05-03 2011-08-10 ハーマン インターナショナル インダストリーズ インコーポレイテッド サウンドの検出および特定システム
US7096180B2 (en) * 2002-05-15 2006-08-22 Intel Corporation Method and apparatuses for improving quality of digitally encoded speech in the presence of interference
US7050965B2 (en) * 2002-06-03 2006-05-23 Intel Corporation Perceptual normalization of digital audio signals
US7747447B2 (en) * 2002-06-21 2010-06-29 Thomson Licensing Broadcast router having a serial digital audio data stream decoder
US7325048B1 (en) * 2002-07-03 2008-01-29 3Com Corporation Method for automatically creating a modem interface for use with a wireless device
KR100462615B1 (ko) * 2002-07-11 2004-12-20 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
US8228849B2 (en) * 2002-07-15 2012-07-24 Broadcom Corporation Communication gateway supporting WLAN communications in multiple communication protocols and in multiple frequency bands
BR0305555A (pt) * 2002-07-16 2004-09-28 Koninkl Philips Electronics Nv Método e codificador para codificar um sinal de áudio, aparelho para fornecimento de um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio codificado
CN100474780C (zh) * 2002-08-21 2009-04-01 广州广晟数码技术有限公司 用于从编码后的音频数据流中解码重建多声道音频信号的解码方法
CN1783726B (zh) * 2002-08-21 2010-05-12 广州广晟数码技术有限公司 用于从音频数据码流中解码重建多声道音频信号的解码器
EP1394772A1 (en) * 2002-08-28 2004-03-03 Deutsche Thomson-Brandt Gmbh Signaling of window switchings in a MPEG layer 3 audio data stream
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
ATE543178T1 (de) * 2002-09-04 2012-02-15 Microsoft Corp Entropische kodierung mittels anpassung des kodierungsmodus zwischen niveau- und lauflängenniveau-modus
TW573293B (en) * 2002-09-13 2004-01-21 Univ Nat Central Nonlinear operation method suitable for audio encoding/decoding and an applied hardware thereof
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
FR2846179B1 (fr) * 2002-10-21 2005-02-04 Medialive Embrouillage adaptatif et progressif de flux audio
US6707398B1 (en) 2002-10-24 2004-03-16 Apple Computer, Inc. Methods and apparatuses for packing bitstreams
US6707397B1 (en) 2002-10-24 2004-03-16 Apple Computer, Inc. Methods and apparatus for variable length codeword concatenation
US6781528B1 (en) 2002-10-24 2004-08-24 Apple Computer, Inc. Vector handling capable processor and run length encoding
US6781529B1 (en) 2002-10-24 2004-08-24 Apple Computer, Inc. Methods and apparatuses for variable length encoding
US7650625B2 (en) * 2002-12-16 2010-01-19 Lsi Corporation System and method for controlling audio and video content via an advanced settop box
US7555017B2 (en) * 2002-12-17 2009-06-30 Tls Corporation Low latency digital audio over packet switched networks
US7272566B2 (en) * 2003-01-02 2007-09-18 Dolby Laboratories Licensing Corporation Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique
KR100547113B1 (ko) * 2003-02-15 2006-01-26 삼성전자주식회사 오디오 데이터 인코딩 장치 및 방법
TW594674B (en) * 2003-03-14 2004-06-21 Mediatek Inc Encoder and a encoding method capable of detecting audio signal transient
CN100339886C (zh) * 2003-04-10 2007-09-26 联发科技股份有限公司 可以检测声音信号的暂态位置的编码器及编码方法
FR2853786B1 (fr) * 2003-04-11 2005-08-05 Medialive Procede et equipement de distribution de produits videos numeriques avec une restriction de certains au moins des droits de representation et de reproduction
ATE359687T1 (de) * 2003-04-17 2007-05-15 Koninkl Philips Electronics Nv Audiosignalgenerierung
CN1774956B (zh) * 2003-04-17 2011-10-05 皇家飞利浦电子股份有限公司 音频信号合成
US8073684B2 (en) * 2003-04-25 2011-12-06 Texas Instruments Incorporated Apparatus and method for automatic classification/identification of similar compressed audio files
CN100546233C (zh) * 2003-04-30 2009-09-30 诺基亚公司 用于支持多声道音频扩展的方法和设备
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
US7739105B2 (en) * 2003-06-13 2010-06-15 Vixs Systems, Inc. System and method for processing audio frames
CN100493199C (zh) * 2003-06-16 2009-05-27 松下电器产业株式会社 编码装置、编码方法和码本
KR100556365B1 (ko) * 2003-07-07 2006-03-03 엘지전자 주식회사 음성 인식장치 및 방법
US7454431B2 (en) * 2003-07-17 2008-11-18 At&T Corp. Method and apparatus for window matching in delta compressors
US7289680B1 (en) * 2003-07-23 2007-10-30 Cisco Technology, Inc. Methods and apparatus for minimizing requantization error
TWI220336B (en) * 2003-07-28 2004-08-11 Design Technology Inc G Compression rate promotion method of adaptive differential PCM technique
WO2005020210A2 (en) * 2003-08-26 2005-03-03 Sarnoff Corporation Method and apparatus for adaptive variable bit rate audio encoding
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
AU2003302486A1 (en) * 2003-09-15 2005-04-06 Zakrytoe Aktsionernoe Obschestvo Intel Method and apparatus for encoding audio
SG120118A1 (en) * 2003-09-15 2006-03-28 St Microelectronics Asia A device and process for encoding audio data
US20050083808A1 (en) * 2003-09-18 2005-04-21 Anderson Hans C. Audio player with CD mechanism
US7283968B2 (en) 2003-09-29 2007-10-16 Sony Corporation Method for grouping short windows in audio encoding
US7325023B2 (en) * 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
US7426462B2 (en) * 2003-09-29 2008-09-16 Sony Corporation Fast codebook selection method in audio encoding
US7349842B2 (en) * 2003-09-29 2008-03-25 Sony Corporation Rate-distortion control scheme in audio encoding
JP4767687B2 (ja) * 2003-10-07 2011-09-07 パナソニック株式会社 スペクトル包絡線符号化のための時間境界及び周波数分解能の決定方法
TWI226035B (en) * 2003-10-16 2005-01-01 Elan Microelectronics Corp Method and system improving step adaptation of ADPCM voice coding
BR122018007834B1 (pt) * 2003-10-30 2019-03-19 Koninklijke Philips Electronics N.V. Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador
KR20050050322A (ko) * 2003-11-25 2005-05-31 삼성전자주식회사 직교주파수다중화방식의 이동통신시스템에서 적응변조 방법
KR100571824B1 (ko) * 2003-11-26 2006-04-17 삼성전자주식회사 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
US20070118362A1 (en) * 2003-12-15 2007-05-24 Hiroaki Kondo Audio compression/decompression device
SE527670C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US7725324B2 (en) * 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP2005217486A (ja) * 2004-01-27 2005-08-11 Matsushita Electric Ind Co Ltd ストリーム復号装置
DE102004009949B4 (de) * 2004-03-01 2006-03-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes
CN102169693B (zh) 2004-03-01 2014-07-23 杜比实验室特许公司 多信道音频编码
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
TWI231656B (en) * 2004-04-08 2005-04-21 Univ Nat Chiao Tung Fast bit allocation algorithm for audio coding
US8032360B2 (en) * 2004-05-13 2011-10-04 Broadcom Corporation System and method for high-quality variable speed playback of audio-visual media
US7512536B2 (en) * 2004-05-14 2009-03-31 Texas Instruments Incorporated Efficient filter bank computation for audio coding
ATE387750T1 (de) * 2004-05-28 2008-03-15 Tc Electronic As Impulsbreitenmodulatorsystem
DE602004024773D1 (de) * 2004-06-10 2010-02-04 Panasonic Corp System und Verfahren für Laufzeit-Rekonfiguration
WO2005124722A2 (en) * 2004-06-12 2005-12-29 Spl Development, Inc. Aural rehabilitation system and method
KR100634506B1 (ko) * 2004-06-25 2006-10-16 삼성전자주식회사 저비트율 부호화/복호화 방법 및 장치
JP4988567B2 (ja) * 2004-06-27 2012-08-01 アップル インコーポレイテッド マルチパスのビデオ符号化
US20050285935A1 (en) * 2004-06-29 2005-12-29 Octiv, Inc. Personal conferencing node
US20050286443A1 (en) * 2004-06-29 2005-12-29 Octiv, Inc. Conferencing system
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
US20060015329A1 (en) * 2004-07-19 2006-01-19 Chu Wai C Apparatus and method for audio coding
US7391434B2 (en) * 2004-07-27 2008-06-24 The Directv Group, Inc. Video bit stream test
US7706415B2 (en) * 2004-07-29 2010-04-27 Microsoft Corporation Packet multiplexing multi-channel audio
US7508947B2 (en) * 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
CN101010724B (zh) * 2004-08-27 2011-05-25 松下电器产业株式会社 音频编码器
WO2006024977A1 (en) * 2004-08-31 2006-03-09 Koninklijke Philips Electronics N.V. Method and device for transcoding
US7725313B2 (en) * 2004-09-13 2010-05-25 Ittiam Systems (P) Ltd. Method, system and apparatus for allocating bits in perceptual audio coders
CN101055721B (zh) * 2004-09-17 2011-06-01 广州广晟数码技术有限公司 多声道数字音频编码设备及其方法
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
US7895034B2 (en) 2004-09-17 2011-02-22 Digital Rise Technology Co., Ltd. Audio encoding system
US7937271B2 (en) * 2004-09-17 2011-05-03 Digital Rise Technology Co., Ltd. Audio decoding using variable-length codebook application ranges
WO2006030754A1 (ja) * 2004-09-17 2006-03-23 Matsushita Electric Industrial Co., Ltd. オーディオ符号化装置、復号化装置、方法、及びプログラム
KR20070061843A (ko) * 2004-09-28 2007-06-14 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치 및 스케일러블 부호화 방법
JP4892184B2 (ja) * 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
US7061405B2 (en) * 2004-10-15 2006-06-13 Yazaki North America, Inc. Device and method for interfacing video devices over a fiber optic link
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
JP4815780B2 (ja) * 2004-10-20 2011-11-16 ヤマハ株式会社 オーバーサンプリングシステム、デコードlsi、およびオーバーサンプリング方法
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402651D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
US8340306B2 (en) * 2004-11-30 2012-12-25 Agere Systems Llc Parametric coding of spatial audio with object-based side information
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
WO2006060278A1 (en) 2004-11-30 2006-06-08 Agere Systems Inc. Synchronizing parametric coding of spatial audio with externally provided downmix
EP1713060A4 (en) * 2004-12-22 2007-04-25 Matsushita Electric Ind Co Ltd MPEG AUDIO DECODING METHOD
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
WO2006075079A1 (fr) * 2005-01-14 2006-07-20 France Telecom Procede d’encodage de pistes audio d’un contenu multimedia destine a une diffusion sur terminaux mobiles
US7208372B2 (en) * 2005-01-19 2007-04-24 Sharp Laboratories Of America, Inc. Non-volatile memory resistor cell with nanotip electrode
KR100707177B1 (ko) * 2005-01-19 2007-04-13 삼성전자주식회사 디지털 신호 부호화/복호화 방법 및 장치
KR100765747B1 (ko) * 2005-01-22 2007-10-15 삼성전자주식회사 트리 구조 벡터 양자화를 이용한 스케일러블 음성 부호화장치
CA2596338C (en) * 2005-01-31 2014-05-13 Sonorit Aps Method for weighted overlap-add
US7672742B2 (en) * 2005-02-16 2010-03-02 Adaptec, Inc. Method and system for reducing audio latency
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
JP4809370B2 (ja) * 2005-02-23 2011-11-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル音声符号化における適応ビット割り当て
DE102005010057A1 (de) * 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
WO2006126844A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
CN101185117B (zh) * 2005-05-26 2012-09-26 Lg电子株式会社 解码音频信号的方法和装置
JP5461835B2 (ja) * 2005-05-26 2014-04-02 エルジー エレクトロニクス インコーポレイティド オーディオ信号の符号化/復号化方法及び符号化/復号化装置
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
KR100718132B1 (ko) * 2005-06-24 2007-05-14 삼성전자주식회사 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치
EP1913576A2 (en) * 2005-06-30 2008-04-23 LG Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
EP1913578B1 (en) * 2005-06-30 2012-08-01 LG Electronics Inc. Method and apparatus for decoding an audio signal
US8082157B2 (en) * 2005-06-30 2011-12-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8032240B2 (en) 2005-07-11 2011-10-04 Lg Electronics Inc. Apparatus and method of processing an audio signal
US7693709B2 (en) * 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
US8225392B2 (en) * 2005-07-15 2012-07-17 Microsoft Corporation Immunizing HTML browsers and extensions from known vulnerabilities
US7539612B2 (en) 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7599840B2 (en) 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
KR100851970B1 (ko) * 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7684981B2 (en) * 2005-07-15 2010-03-23 Microsoft Corporation Prediction of spectral coefficients in waveform coding and decoding
CN1909066B (zh) * 2005-08-03 2011-02-09 昆山杰得微电子有限公司 音频编码码量控制和调整的方法
WO2007019533A2 (en) * 2005-08-04 2007-02-15 R2Di, Llc System and methods for aligning capture and playback clocks in a wireless digital audio distribution system
US7933337B2 (en) 2005-08-12 2011-04-26 Microsoft Corporation Prediction of transform coefficients for image compression
US7565018B2 (en) 2005-08-12 2009-07-21 Microsoft Corporation Adaptive coding and decoding of wide-range coefficients
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
US7822616B2 (en) 2005-08-30 2010-10-26 Lg Electronics Inc. Time slot position coding of multiple frame types
JP4859925B2 (ja) * 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
KR20070025905A (ko) * 2005-08-30 2007-03-08 엘지전자 주식회사 멀티채널 오디오 코딩에서 효과적인 샘플링 주파수비트스트림 구성방법
US7987097B2 (en) * 2005-08-30 2011-07-26 Lg Electronics Method for decoding an audio signal
US8319791B2 (en) * 2005-10-03 2012-11-27 Sharp Kabushiki Kaisha Display
US7696907B2 (en) * 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
KR100857115B1 (ko) 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US8755442B2 (en) 2005-10-05 2014-06-17 Lg Electronics Inc. Method of processing a signal and apparatus for processing a signal
US8068569B2 (en) 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
DE102005048581B4 (de) * 2005-10-06 2022-06-09 Robert Bosch Gmbh Teilnehmerschnittstelle zwischen einem FlexRay-Kommunikationsbaustein und einem FlexRay-Teilnehmer und Verfahren zur Übertragung von Botschaften über eine solche Schnittstelle
EP1949369B1 (en) * 2005-10-12 2012-09-26 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding audio data and extension data
RU2008114382A (ru) * 2005-10-14 2009-10-20 Панасоник Корпорэйшн (Jp) Кодер с преобразованием и способ кодирования с преобразованием
US20070094035A1 (en) * 2005-10-21 2007-04-26 Nokia Corporation Audio coding
US7761289B2 (en) 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths
TWI307037B (en) * 2005-10-31 2009-03-01 Holtek Semiconductor Inc Audio calculation method
WO2007063625A1 (ja) * 2005-12-02 2007-06-07 Matsushita Electric Industrial Co., Ltd. 信号処理装置および信号処理方法
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
JP4801174B2 (ja) 2006-01-19 2011-10-26 エルジー エレクトロニクス インコーポレイティド メディア信号の処理方法及び装置
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
KR100921453B1 (ko) 2006-02-07 2009-10-13 엘지전자 주식회사 부호화/복호화 장치 및 방법
JP2007249075A (ja) * 2006-03-17 2007-09-27 Toshiba Corp 音声再生装置および高域補間処理方法
JP4193865B2 (ja) * 2006-04-27 2008-12-10 ソニー株式会社 デジタル信号切換え装置及びその切換え方法
ATE527833T1 (de) * 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
DE102006022346B4 (de) 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8150065B2 (en) * 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8934641B2 (en) * 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
EP2036204B1 (en) * 2006-06-29 2012-08-15 LG Electronics Inc. Method and apparatus for an audio signal processing
US8682652B2 (en) 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
WO2008004649A1 (en) * 2006-07-07 2008-01-10 Nec Corporation Audio encoding device, audio encoding method, and program thereof
US7797155B2 (en) * 2006-07-26 2010-09-14 Ittiam Systems (P) Ltd. System and method for measurement of perceivable quantization noise in perceptual audio coders
US7907579B2 (en) * 2006-08-15 2011-03-15 Cisco Technology, Inc. WiFi geolocation from carrier-managed system geolocation of a dual mode device
CN100531398C (zh) * 2006-08-23 2009-08-19 中兴通讯股份有限公司 一种移动多媒体广播系统的多音轨实现方法
US7882462B2 (en) 2006-09-11 2011-02-01 The Mathworks, Inc. Hardware definition language generation for frame-based processing
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
JP4823001B2 (ja) * 2006-09-27 2011-11-24 富士通セミコンダクター株式会社 オーディオ符号化装置
JP5174027B2 (ja) * 2006-09-29 2013-04-03 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びミックス信号処理方法
US9418667B2 (en) 2006-10-12 2016-08-16 Lg Electronics Inc. Apparatus for processing a mix signal and method thereof
EP2337380B8 (en) * 2006-10-13 2020-02-26 Auro Technologies NV A method and encoder for combining digital data sets, a decoding method and decoder for such combined digital data sets and a record carrier for storing such combined digital data sets
EP1918909B1 (en) * 2006-11-03 2010-07-07 Psytechnics Ltd Sampling error compensation
US7616568B2 (en) * 2006-11-06 2009-11-10 Ixia Generic packet generation
WO2008060111A1 (en) * 2006-11-15 2008-05-22 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
KR101062353B1 (ko) 2006-12-07 2011-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 그 장치
JP5270566B2 (ja) * 2006-12-07 2013-08-21 エルジー エレクトロニクス インコーポレイティド オーディオ処理方法及び装置
US7508326B2 (en) * 2006-12-21 2009-03-24 Sigmatel, Inc. Automatically disabling input/output signal processing based on the required multimedia format
US8255226B2 (en) * 2006-12-22 2012-08-28 Broadcom Corporation Efficient background audio encoding in a real time system
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
WO2008084427A2 (en) * 2007-01-10 2008-07-17 Koninklijke Philips Electronics N.V. Audio decoder
US8275611B2 (en) * 2007-01-18 2012-09-25 Stmicroelectronics Asia Pacific Pte., Ltd. Adaptive noise suppression for digital speech signals
US20100121470A1 (en) * 2007-02-13 2010-05-13 Lg Electronics Inc. Method and an apparatus for processing an audio signal
JP2010518452A (ja) * 2007-02-13 2010-05-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
AU2008215232B2 (en) * 2007-02-14 2010-02-25 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
US8184710B2 (en) 2007-02-21 2012-05-22 Microsoft Corporation Adaptive truncation of transform coefficient data in a transform-based digital media codec
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
KR101149449B1 (ko) * 2007-03-20 2012-05-25 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
CN101272209B (zh) * 2007-03-21 2012-04-25 大唐移动通信设备有限公司 一种对多通道复用数据进行滤波的方法及设备
US9466307B1 (en) * 2007-05-22 2016-10-11 Digimarc Corporation Robust spectral encoding and decoding methods
ATE502377T1 (de) * 2007-06-15 2011-04-15 France Telecom Kodierung digitaler audiosignale
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7944847B2 (en) * 2007-06-25 2011-05-17 Efj, Inc. Voting comparator method, apparatus, and system using a limited number of digital signal processor modules to process a larger number of analog audio streams without affecting the quality of the voted audio stream
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8285554B2 (en) * 2007-07-27 2012-10-09 Dsp Group Limited Method and system for dynamic aliasing suppression
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
US8521540B2 (en) * 2007-08-17 2013-08-27 Qualcomm Incorporated Encoding and/or decoding digital signals using a permutation value
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
GB2454208A (en) * 2007-10-31 2009-05-06 Cambridge Silicon Radio Ltd Compression using a perceptual model and a signal-to-mask ratio (SMR) parameter tuned based on target bitrate and previously encoded data
US8199927B1 (en) 2007-10-31 2012-06-12 ClearOnce Communications, Inc. Conferencing system implementing echo cancellation and push-to-talk microphone detection using two-stage frequency filter
WO2009072685A1 (en) * 2007-12-06 2009-06-11 Lg Electronics Inc. A method and an apparatus for processing an audio signal
CN101903944B (zh) * 2007-12-18 2013-04-03 Lg电子株式会社 用于处理音频信号的方法和装置
US20090164223A1 (en) * 2007-12-19 2009-06-25 Dts, Inc. Lossless multi-channel audio codec
US8239210B2 (en) * 2007-12-19 2012-08-07 Dts, Inc. Lossless multi-channel audio codec
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8359196B2 (en) * 2007-12-28 2013-01-22 Panasonic Corporation Stereo sound decoding apparatus, stereo sound encoding apparatus and lost-frame compensating method
EP2248263B1 (en) * 2008-01-31 2012-12-26 Agency for Science, Technology And Research Method and device of bitrate distribution/truncation for scalable audio coding
KR101441898B1 (ko) * 2008-02-01 2014-09-23 삼성전자주식회사 주파수 부호화 방법 및 장치와 주파수 복호화 방법 및 장치
US20090210222A1 (en) * 2008-02-15 2009-08-20 Microsoft Corporation Multi-Channel Hole-Filling For Audio Compression
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
KR20090110242A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 신호를 처리하는 방법 및 장치
KR101599875B1 (ko) * 2008-04-17 2016-03-14 삼성전자주식회사 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 부호화 방법 및 장치, 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 복호화 방법 및 장치
EP2373067B1 (en) * 2008-04-18 2013-04-17 Dolby Laboratories Licensing Corporation Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience
US8179974B2 (en) 2008-05-02 2012-05-15 Microsoft Corporation Multi-level representation of reordered transform coefficients
US8630848B2 (en) 2008-05-30 2014-01-14 Digital Rise Technology Co., Ltd. Audio signal transient detection
CN101605017A (zh) * 2008-06-12 2009-12-16 华为技术有限公司 编码比特的分配方法和装置
US8909361B2 (en) * 2008-06-19 2014-12-09 Broadcom Corporation Method and system for processing high quality audio in a hardware audio codec for audio transmission
EP2304721B1 (fr) * 2008-06-26 2012-05-09 France Telecom Synthese spatiale de signaux audio multicanaux
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
WO2010005224A2 (en) * 2008-07-07 2010-01-14 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2301022B1 (en) 2008-07-10 2017-09-06 Voiceage Corporation Multi-reference lpc filter quantization device and method
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
TWI427619B (zh) * 2008-07-21 2014-02-21 Realtek Semiconductor Corp 音效混波裝置與方法
US8406307B2 (en) 2008-08-22 2013-03-26 Microsoft Corporation Entropy coding/decoding of hierarchically organized data
MY154633A (en) * 2008-10-08 2015-07-15 Fraunhofer Ges Forschung Multi-resolution switched audio encoding/decoding scheme
US8121830B2 (en) * 2008-10-24 2012-02-21 The Nielsen Company (Us), Llc Methods and apparatus to extract data encoded in media content
US8359205B2 (en) 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
AT509439B1 (de) * 2008-12-19 2013-05-15 Siemens Entpr Communications Verfahren und mittel zur skalierbaren verbesserung der qualität eines signalcodierverfahrens
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
JP2012525655A (ja) 2009-05-01 2012-10-22 ザ ニールセン カンパニー (ユー エス) エルエルシー 一次ブロードキャストメディアコンテンツに関連する二次コンテンツを提供するための方法、機器、及び製造品
JP5539992B2 (ja) * 2009-08-20 2014-07-02 トムソン ライセンシング レート制御装置、レート制御方法及びレート制御プログラム
GB0915766D0 (en) * 2009-09-09 2009-10-07 Apt Licensing Ltd Apparatus and method for multidimensional adaptive audio coding
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US8694947B1 (en) 2009-12-09 2014-04-08 The Mathworks, Inc. Resource sharing workflows within executable graphical models
US8861742B2 (en) * 2010-01-26 2014-10-14 Yamaha Corporation Masker sound generation apparatus and program
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
DE102010006573B4 (de) * 2010-02-02 2012-03-15 Rohde & Schwarz Gmbh & Co. Kg IQ-Datenkompression für Breitbandanwendungen
EP2365630B1 (en) * 2010-03-02 2016-06-08 Harman Becker Automotive Systems GmbH Efficient sub-band adaptive fir-filtering
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8374858B2 (en) * 2010-03-09 2013-02-12 Dts, Inc. Scalable lossless audio codec and authoring tool
CN102222505B (zh) * 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法系统及瞬态信号可分层编解码方法
JP5850216B2 (ja) * 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9378754B1 (en) 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
BR122019025121B1 (pt) * 2010-09-16 2021-04-27 Dolby International Ab Sistema e método para gerar um sinal de tempo alongado e/ou um sinal de frequência transposta a partir de um sinal de entrada e meio de armazenamento legível por computador não transitório
CN103262158B (zh) * 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
EP2450880A1 (en) 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
JP5609591B2 (ja) * 2010-11-30 2014-10-22 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
US9436441B1 (en) 2010-12-08 2016-09-06 The Mathworks, Inc. Systems and methods for hardware resource sharing
CN103370705B (zh) * 2011-01-05 2018-01-02 谷歌公司 用于便利文本输入的方法和系统
RU2560788C2 (ru) * 2011-02-14 2015-08-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для обработки декодированного аудиосигнала в спектральной области
SG192718A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Audio codec using noise synthesis during inactive phases
JP5603484B2 (ja) * 2011-04-05 2014-10-08 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
CN103415884B (zh) * 2011-04-20 2015-06-10 松下电器(美国)知识产权公司 用于执行霍夫曼编码的装置和方法
GB2490879B (en) * 2011-05-12 2018-12-26 Qualcomm Technologies Int Ltd Hybrid coded audio data streaming apparatus and method
TWI576829B (zh) * 2011-05-13 2017-04-01 三星電子股份有限公司 位元配置裝置
JP2013015598A (ja) * 2011-06-30 2013-01-24 Zte Corp オーディオ符号化/復号化方法、システム及びノイズレベルの推定方法
US9355000B1 (en) 2011-08-23 2016-05-31 The Mathworks, Inc. Model level power consumption optimization in hardware description generation
US8774308B2 (en) * 2011-11-01 2014-07-08 At&T Intellectual Property I, L.P. Method and apparatus for improving transmission of data on a bandwidth mismatched channel
US8781023B2 (en) * 2011-11-01 2014-07-15 At&T Intellectual Property I, L.P. Method and apparatus for improving transmission of data on a bandwidth expanded channel
FR2984579B1 (fr) * 2011-12-14 2013-12-13 Inst Polytechnique Grenoble Procede de traitement numerique sur un ensemble de pistes audio avant mixage
JP2015517121A (ja) * 2012-04-05 2015-06-18 ホアウェイ・テクノロジーズ・カンパニー・リミテッド インターチャネル差分推定方法及び空間オーディオ符号化装置
JP5998603B2 (ja) * 2012-04-18 2016-09-28 ソニー株式会社 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム
TWI505262B (zh) 2012-05-15 2015-10-21 Dolby Int Ab 具多重子流之多通道音頻信號的有效編碼與解碼
GB201210373D0 (en) * 2012-06-12 2012-07-25 Meridian Audio Ltd Doubly compatible lossless audio sandwidth extension
CN102752058B (zh) * 2012-06-16 2013-10-16 天地融科技股份有限公司 音频数据传输系统、音频数据传输装置及电子签名工具
AR091515A1 (es) * 2012-06-29 2015-02-11 Sony Corp Dispositivo y metodo para el procesamiento de imagenes
JP6065452B2 (ja) 2012-08-14 2017-01-25 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
JP5447628B1 (ja) * 2012-09-28 2014-03-19 パナソニック株式会社 無線通信装置及び通信端末
US9767815B2 (en) 2012-12-13 2017-09-19 Panasonic Intellectual Property Corporation Of America Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method
JP6173484B2 (ja) 2013-01-08 2017-08-02 ドルビー・インターナショナル・アーベー 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測
JP6179122B2 (ja) * 2013-02-20 2017-08-16 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
US9093064B2 (en) 2013-03-11 2015-07-28 The Nielsen Company (Us), Llc Down-mixing compensation for audio watermarking
US9794715B2 (en) 2013-03-13 2017-10-17 Dts Llc System and methods for processing stereo audio content
JP6146069B2 (ja) * 2013-03-18 2017-06-14 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
KR101754094B1 (ko) 2013-04-05 2017-07-05 돌비 인터네셔널 에이비 고급 양자화기
EP2800401A1 (en) * 2013-04-29 2014-11-05 Thomson Licensing Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation
US20140358565A1 (en) 2013-05-29 2014-12-04 Qualcomm Incorporated Compression of decomposed representations of a sound field
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
EP3046105B1 (en) 2013-09-13 2020-01-15 Samsung Electronics Co., Ltd. Lossless coding method
CN105637581B (zh) * 2013-10-21 2019-09-20 杜比国际公司 用于音频信号的参数重建的去相关器结构
CN105874819B (zh) * 2013-10-22 2018-04-10 韩国电子通信研究院 生成用于音频信号的滤波器的方法及其参数化装置
US10078717B1 (en) 2013-12-05 2018-09-18 The Mathworks, Inc. Systems and methods for estimating performance characteristics of hardware implementations of executable models
US9817931B1 (en) 2013-12-05 2017-11-14 The Mathworks, Inc. Systems and methods for generating optimized hardware descriptions for models
CA2934602C (en) 2013-12-27 2022-08-30 Sony Corporation Decoding apparatus and method, and program
US10986454B2 (en) 2014-01-06 2021-04-20 Alpine Electronics of Silicon Valley, Inc. Sound normalization and frequency remapping using haptic feedback
US8977376B1 (en) 2014-01-06 2015-03-10 Alpine Electronics of Silicon Valley, Inc. Reproducing audio signals with a haptic apparatus on acoustic headphones and their calibration and measurement
US8767996B1 (en) 2014-01-06 2014-07-01 Alpine Electronics of Silicon Valley, Inc. Methods and devices for reproducing audio signals with a haptic apparatus on acoustic headphones
PT3111560T (pt) * 2014-02-27 2021-07-08 Ericsson Telefon Ab L M Método e aparelho para indexação e desindexação de quantificação vetorial em pirâmide de vetores de amostra de áudio/vídeo
US9564136B2 (en) * 2014-03-06 2017-02-07 Dts, Inc. Post-encoding bitrate reduction of multiple object audio
US9685164B2 (en) * 2014-03-31 2017-06-20 Qualcomm Incorporated Systems and methods of switching coding technologies at a device
FR3020732A1 (fr) * 2014-04-30 2015-11-06 Orange Correction de perte de trame perfectionnee avec information de voisement
US9997171B2 (en) * 2014-05-01 2018-06-12 Gn Hearing A/S Multi-band signal processor for digital audio signals
JP6700507B6 (ja) * 2014-06-10 2020-07-22 エムキューエー リミテッド オーディオ信号のデジタルカプセル化
JP6432180B2 (ja) * 2014-06-26 2018-12-05 ソニー株式会社 復号装置および方法、並びにプログラム
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2988300A1 (en) * 2014-08-18 2016-02-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Switching of sampling rates at audio processing devices
RU2698779C2 (ru) * 2014-09-04 2019-08-29 Сони Корпорейшн Устройство передачи, способ передачи, устройство приема и способ приема
US9978388B2 (en) 2014-09-12 2018-05-22 Knowles Electronics, Llc Systems and methods for restoration of speech components
CN105632503B (zh) * 2014-10-28 2019-09-03 南宁富桂精密工业有限公司 信息隐藏方法及系统
US9659578B2 (en) * 2014-11-27 2017-05-23 Tata Consultancy Services Ltd. Computer implemented system and method for identifying significant speech frames within speech signals
US10262664B2 (en) * 2015-02-27 2019-04-16 Auro Technologies Method and apparatus for encoding and decoding digital data sets with reduced amount of data to be stored for error approximation
EP3067886A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
CN106161313A (zh) * 2015-03-30 2016-11-23 索尼公司 无线通信系统中的电子设备、无线通信系统和方法
US10043527B1 (en) * 2015-07-17 2018-08-07 Digimarc Corporation Human auditory system modeling with masking energy adaptation
EA034371B1 (ru) * 2015-08-25 2020-01-31 Долби Лэборетериз Лайсенсинг Корпорейшн Аудиодекодер и способ декодирования
EP3353786B1 (en) * 2015-09-25 2019-07-31 Dolby Laboratories Licensing Corporation Processing high-definition audio data
US10423733B1 (en) 2015-12-03 2019-09-24 The Mathworks, Inc. Systems and methods for sharing resources having different data types
EP3408851B1 (en) 2016-01-26 2019-09-11 Dolby Laboratories Licensing Corporation Adaptive quantization
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
US10756755B2 (en) * 2016-05-10 2020-08-25 Immersion Networks, Inc. Adaptive audio codec system, method and article
US10699725B2 (en) * 2016-05-10 2020-06-30 Immersion Networks, Inc. Adaptive audio encoder system, method and article
US10770088B2 (en) * 2016-05-10 2020-09-08 Immersion Networks, Inc. Adaptive audio decoder system, method and article
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
US20170330575A1 (en) * 2016-05-10 2017-11-16 Immersion Services LLC Adaptive audio codec system, method and article
WO2017196833A1 (en) * 2016-05-10 2017-11-16 Immersion Services LLC Adaptive audio codec system, method, apparatus and medium
CN105869648B (zh) * 2016-05-19 2019-11-22 日立楼宇技术(广州)有限公司 混音方法及装置
JP7039494B2 (ja) 2016-06-17 2022-03-22 ディーティーエス・インコーポレイテッド 近/遠距離レンダリングを用いた距離パニング
US10375498B2 (en) 2016-11-16 2019-08-06 Dts, Inc. Graphical user interface for calibrating a surround sound system
CN112397076A (zh) * 2016-11-23 2021-02-23 瑞典爱立信有限公司 用于自适应控制去相关滤波器的方法和装置
JP2018092012A (ja) * 2016-12-05 2018-06-14 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
US10362269B2 (en) * 2017-01-11 2019-07-23 Ringcentral, Inc. Systems and methods for determining one or more active speakers during an audio or video conference session
US10354667B2 (en) * 2017-03-22 2019-07-16 Immersion Networks, Inc. System and method for processing audio data
US10699721B2 (en) 2017-04-25 2020-06-30 Dts, Inc. Encoding and decoding of digital audio signals using difference data
CN109427338B (zh) * 2017-08-23 2021-03-30 华为技术有限公司 立体声信号的编码方法和编码装置
WO2019049543A1 (ja) * 2017-09-08 2019-03-14 ソニー株式会社 音声処理装置、音声処理方法及びプログラム
US10609503B2 (en) 2018-04-08 2020-03-31 Dts, Inc. Ambisonic depth extraction
JP7387634B2 (ja) 2018-04-11 2023-11-28 ドルビー ラボラトリーズ ライセンシング コーポレイション 機械学習に基づく音声符号化及び復号のための知覚に基づく損失関数
CN109243471B (zh) * 2018-09-26 2022-09-23 杭州联汇科技股份有限公司 一种快速编码广播用数字音频的方法
US10763885B2 (en) * 2018-11-06 2020-09-01 Stmicroelectronics S.R.L. Method of error concealment, and associated device
CN111341303B (zh) * 2018-12-19 2023-10-31 北京猎户星空科技有限公司 一种声学模型的训练方法及装置、语音识别方法及装置
CN109831280A (zh) * 2019-02-28 2019-05-31 深圳市友杰智新科技有限公司 一种声波通讯方法、装置及可读存储介质
KR20200123531A (ko) * 2019-04-22 2020-10-30 주식회사 쏠리드 통신 신호를 처리하는 방법 및 이를 이용하는 통신 노드
US11361772B2 (en) 2019-05-14 2022-06-14 Microsoft Technology Licensing, Llc Adaptive and fixed mapping for compression and decompression of audio data
US10681463B1 (en) 2019-05-17 2020-06-09 Sonos, Inc. Wireless transmission to satellites for multichannel audio system
WO2020232631A1 (zh) * 2019-05-21 2020-11-26 深圳市汇顶科技股份有限公司 一种语音分频传输方法、源端、播放端、源端电路和播放端电路
US10869152B1 (en) 2019-05-31 2020-12-15 Dts, Inc. Foveated audio rendering
CN110365342B (zh) * 2019-06-06 2023-05-12 中车青岛四方机车车辆股份有限公司 波形解码方法及装置
EP3751567B1 (en) * 2019-06-10 2022-01-26 Axis AB A method, a computer program, an encoder and a monitoring device
US11380343B2 (en) 2019-09-12 2022-07-05 Immersion Networks, Inc. Systems and methods for processing high frequency audio signal
GB2587196A (en) * 2019-09-13 2021-03-24 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
CN112530444B (zh) * 2019-09-18 2023-10-03 华为技术有限公司 音频编码方法和装置
US20210224024A1 (en) * 2020-01-21 2021-07-22 Audiowise Technology Inc. Bluetooth audio system with low latency, and audio source and audio sink thereof
US20230113561A1 (en) * 2020-03-13 2023-04-13 Immersion Networks, Inc. Loudness equalization system
CN111261194A (zh) * 2020-04-29 2020-06-09 浙江百应科技有限公司 一种基于pcm技术的音量分析方法
CN112037802B (zh) * 2020-05-08 2022-04-01 珠海市杰理科技股份有限公司 基于语音端点检测的音频编码方法及装置、设备、介质
CN111583942B (zh) * 2020-05-26 2023-06-13 腾讯科技(深圳)有限公司 语音会话的编码码率控制方法、装置和计算机设备
CN112187397B (zh) * 2020-09-11 2022-04-29 烽火通信科技股份有限公司 一种通用的多通道数据同步方法和装置
CN112885364B (zh) * 2021-01-21 2023-10-13 维沃移动通信有限公司 音频编码方法和解码方法、音频编码装置和解码装置
CN113485190B (zh) * 2021-07-13 2022-11-11 西安电子科技大学 一种多通道数据采集系统及采集方法
US20230154474A1 (en) * 2021-11-17 2023-05-18 Agora Lab, Inc. System and method for providing high quality audio communication over low bit rate connection
WO2024012666A1 (en) * 2022-07-12 2024-01-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding ar/vr metadata with generic codebooks
CN115171709B (zh) * 2022-09-05 2022-11-18 腾讯科技(深圳)有限公司 语音编码、解码方法、装置、计算机设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1065168A (zh) * 1991-02-19 1992-10-07 菲利浦光灯制造公司 传输系统以及用于该系统的接收机
US5268685A (en) * 1991-03-30 1993-12-07 Sony Corp Apparatus with transient-dependent bit allocation for compressing a digital signal

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3171990D1 (en) * 1981-04-30 1985-10-03 Ibm Speech coding methods and apparatus for carrying out the method
JPS5921039B2 (ja) * 1981-11-04 1984-05-17 日本電信電話株式会社 適応予測符号化方式
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
US4547816A (en) 1982-05-03 1985-10-15 Robert Bosch Gmbh Method of recording digital audio and video signals in the same track
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
US4817146A (en) * 1984-10-17 1989-03-28 General Electric Company Cryptographic digital signal transceiver method and apparatus
US4622680A (en) * 1984-10-17 1986-11-11 General Electric Company Hybrid subband coder/decoder method and apparatus
US5051991A (en) * 1984-10-17 1991-09-24 Ericsson Ge Mobile Communications Inc. Method and apparatus for efficient digital time delay compensation in compressed bandwidth signal processing
US4757536A (en) * 1984-10-17 1988-07-12 General Electric Company Method and apparatus for transceiving cryptographically encoded digital data
US4675863A (en) * 1985-03-20 1987-06-23 International Mobile Machines Corp. Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels
JPS62154368A (ja) 1985-12-27 1987-07-09 Canon Inc 記録装置
US4815074A (en) * 1986-08-01 1989-03-21 General Datacomm, Inc. High speed bit interleaved time division multiplexer for multinode communication systems
US4899384A (en) * 1986-08-25 1990-02-06 Ibm Corporation Table controlled dynamic bit allocation in a variable rate sub-band speech coder
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
US4881224A (en) 1988-10-19 1989-11-14 General Datacomm, Inc. Framing algorithm for bit interleaved time division multiplexer
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
EP0411998B1 (en) 1989-07-29 1995-03-22 Sony Corporation 4-Channel PCM signal processing apparatus
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
US5235623A (en) * 1989-11-14 1993-08-10 Nec Corporation Adaptive transform coding by selecting optimum block lengths according to variatons between successive blocks
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
JP2841765B2 (ja) * 1990-07-13 1998-12-24 日本電気株式会社 適応ビット割当て方法及び装置
JPH04127747A (ja) * 1990-09-19 1992-04-28 Toshiba Corp 可変レート符号化方式
US5365553A (en) * 1990-11-30 1994-11-15 U.S. Philips Corporation Transmitter, encoding system and method employing use of a bit need determiner for subband coding a digital signal
US5136377A (en) * 1990-12-11 1992-08-04 At&T Bell Laboratories Adaptive non-linear quantizer
US5123015A (en) * 1990-12-20 1992-06-16 Hughes Aircraft Company Daisy chain multiplexer
CA2077662C (en) * 1991-01-08 2001-04-17 Mark Franklin Davis Encoder/decoder for multidimensional sound fields
EP0506394A2 (en) * 1991-03-29 1992-09-30 Sony Corporation Coding apparatus for digital signals
ZA921988B (en) * 1991-03-29 1993-02-24 Sony Corp High efficiency digital data encoding and decoding apparatus
EP1126437B1 (en) * 1991-06-11 2004-08-04 QUALCOMM Incorporated Apparatus and method for masking errors in frames of data
JP3508138B2 (ja) 1991-06-25 2004-03-22 ソニー株式会社 信号処理装置
GB2257606B (en) * 1991-06-28 1995-01-18 Sony Corp Recording and/or reproducing apparatuses and signal processing methods for compressed data
AU665200B2 (en) * 1991-08-02 1995-12-21 Sony Corporation Digital encoder with dynamic quantization bit allocation
KR100263599B1 (ko) * 1991-09-02 2000-08-01 요트.게.아. 롤페즈 인코딩 시스템
JP3226945B2 (ja) * 1991-10-02 2001-11-12 キヤノン株式会社 マルチメディア通信装置
FR2685593B1 (fr) * 1991-12-20 1994-02-11 France Telecom Dispositif de demultiplexage en frequence a filtres numeriques.
US5642437A (en) * 1992-02-22 1997-06-24 Texas Instruments Incorporated System decoder circuit with temporary bit storage and method of operation
EP0559348A3 (en) * 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
CA2090052C (en) * 1992-03-02 1998-11-24 Anibal Joao De Sousa Ferreira Method and apparatus for the perceptual coding of audio signals
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
TW235392B (zh) * 1992-06-02 1994-12-01 Philips Electronics Nv
US5436940A (en) * 1992-06-11 1995-07-25 Massachusetts Institute Of Technology Quadrature mirror filter banks and method
JP2976701B2 (ja) * 1992-06-24 1999-11-10 日本電気株式会社 量子化ビット数割当方法
US5408580A (en) * 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
US5396489A (en) * 1992-10-26 1995-03-07 Motorola Inc. Method and means for transmultiplexing signals between signal terminals and radio frequency channels
US5381145A (en) * 1993-02-10 1995-01-10 Ricoh Corporation Method and apparatus for parallel decoding and encoding of data
US5657423A (en) * 1993-02-22 1997-08-12 Texas Instruments Incorporated Hardware filter circuit and address circuitry for MPEG encoded data
TW272341B (zh) * 1993-07-16 1996-03-11 Sony Co Ltd
US5451954A (en) * 1993-08-04 1995-09-19 Dolby Laboratories Licensing Corporation Quantization noise suppression for encoder/decoder system
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
JPH07202820A (ja) * 1993-12-28 1995-08-04 Matsushita Electric Ind Co Ltd ビットレート制御システム
US5608713A (en) * 1994-02-09 1997-03-04 Sony Corporation Bit allocation of digital audio signal blocks by non-linear processing
JP2778482B2 (ja) * 1994-09-26 1998-07-23 日本電気株式会社 帯域分割符号化装置
US5748903A (en) * 1995-07-21 1998-05-05 Intel Corporation Encoding images using decode rate control
ES2201929B1 (es) * 2002-09-12 2005-05-16 Araclon Biotech, S.L. Anticuerpos policlonales, metodo de preparacion y uso de los mismos.

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1065168A (zh) * 1991-02-19 1992-10-07 菲利浦光灯制造公司 传输系统以及用于该系统的接收机
US5268685A (en) * 1991-03-30 1993-12-07 Sony Corp Apparatus with transient-dependent bit allocation for compressing a digital signal

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11838738B2 (en) 2014-03-24 2023-12-05 Dolby Laboratories Licensing Corporation Method and device for applying Dynamic Range Compression to a Higher Order Ambisonics signal

Also Published As

Publication number Publication date
US5978762A (en) 1999-11-02
CN1848242B (zh) 2012-04-18
CN101872618A (zh) 2010-10-27
CA2238026C (en) 2002-07-09
CN1303583C (zh) 2007-03-07
HK1015510A1 (en) 1999-10-15
ES2232842T3 (es) 2005-06-01
CA2331611C (en) 2001-09-11
JP4174072B2 (ja) 2008-10-29
AU1058997A (en) 1997-06-27
KR100277819B1 (ko) 2001-01-15
DE69633633T2 (de) 2005-10-27
ATE279770T1 (de) 2004-10-15
CN1208489A (zh) 1999-02-17
MX9804320A (es) 1998-11-30
CN1132151C (zh) 2003-12-24
CN1848242A (zh) 2006-10-18
KR19990071708A (ko) 1999-09-27
AU705194B2 (en) 1999-05-20
HK1092271A1 (en) 2007-02-02
US5956674A (en) 1999-09-21
EA001087B1 (ru) 2000-10-30
CN101872618B (zh) 2012-08-22
CN1848241A (zh) 2006-10-18
DE69633633D1 (de) 2004-11-18
EA199800505A1 (ru) 1998-12-24
HK1149979A1 (en) 2011-10-21
EP0864146A4 (en) 2001-09-19
DK0864146T3 (da) 2005-02-14
JP2000501846A (ja) 2000-02-15
PL182240B1 (pl) 2001-11-30
WO1997021211A1 (en) 1997-06-12
US5974380A (en) 1999-10-26
PT864146E (pt) 2005-02-28
EP0864146B1 (en) 2004-10-13
CN1495705A (zh) 2004-05-12
PL183498B1 (pl) 2002-06-28
CA2331611A1 (en) 1997-06-12
BR9611852A (pt) 2000-05-16
PL183092B1 (pl) 2002-05-31
PL327082A1 (en) 1998-11-23
CA2238026A1 (en) 1997-06-12
HK1092270A1 (en) 2007-02-02
EP0864146A1 (en) 1998-09-16
US6487535B1 (en) 2002-11-26

Similar Documents

Publication Publication Date Title
CN1848241B (zh) 多通道音频编码器
JP3804968B2 (ja) 適応配分式符号化・復号装置及び方法
JP3404837B2 (ja) 多層符号化装置
CN102123341B (zh) 音源的参数联合编码
KR100310216B1 (ko) 다중채널오디오신호를위한코딩장치또는방법
KR100908117B1 (ko) 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
JP4925671B2 (ja) デジタル信号の符号化/復号化方法及びその装置並びに記録媒体
KR20070037945A (ko) 오디오 신호의 부호화/복호화 방법 및 장치
Musmann Genesis of the MP3 audio coding standard
Sinha et al. The perceptual audio coder (PAC)
Thiagarajan et al. Analysis of the MPEG-1 Layer III (MP3) algorithm using MATLAB
Johnston et al. AT&T perceptual audio coding (PAC)
US20010047256A1 (en) Multi-format recording medium
CN100349207C (zh) 高频耦合的伪小波5声道音频编/解码方法
JP2963710B2 (ja) 電気的信号コード化のための方法と装置
TW315561B (en) A multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
Noll et al. ISO/MPEG audio coding
JPH11330974A (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
KR20040051369A (ko) 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
Smyth An Overview of the Coherent Acoustics Coding System
JPH07181996A (ja) 情報処理方法、情報処理装置、及びメディア
Bosi et al. DTS Surround Sound for Multiple Applications
JPH0758707A (ja) 量子化ビット割当方式
JPH07161140A (ja) ディジタルオーディオ信号の伝送装置及び受信装置、並びにディジタルオーディオ信号の伝送方法及び受信方法
Jayant Digital audio communications

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1092270

Country of ref document: HK

ASS Succession or assignment of patent right

Owner name: DTS(BVI) CO., LTD.

Free format text: FORMER OWNER: DTS CO.,LTD.

Effective date: 20090605

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20090605

Address after: The British Virgin Islands

Applicant after: DTS Inc.

Address before: American California

Applicant before: Dts Licensing Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1092270

Country of ref document: HK

CX01 Expiry of patent term

Granted publication date: 20101215

EXPY Termination of patent right or utility model