CN1653521A - 用于音频代码转换中的自适应码本音调滞后计算的方法 - Google Patents

用于音频代码转换中的自适应码本音调滞后计算的方法 Download PDF

Info

Publication number
CN1653521A
CN1653521A CNA038106450A CN03810645A CN1653521A CN 1653521 A CN1653521 A CN 1653521A CN A038106450 A CNA038106450 A CN A038106450A CN 03810645 A CN03810645 A CN 03810645A CN 1653521 A CN1653521 A CN 1653521A
Authority
CN
China
Prior art keywords
subframe
tone
module
sluggishness
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA038106450A
Other languages
English (en)
Other versions
CN1653521B (zh
Inventor
M·A·加布里
J·W·王
S·乔吉
M·伊布拉西姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Di Lee Sim (for the benefit of creditors) Ltd.
Di Lee Sim Network Inc.
Dilithium Networks Inc
Original Assignee
Dilithium Networks Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dilithium Networks Inc filed Critical Dilithium Networks Inc
Publication of CN1653521A publication Critical patent/CN1653521A/zh
Application granted granted Critical
Publication of CN1653521B publication Critical patent/CN1653521B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Abstract

一种用于将自适应码本音调迟滞从一种基于CELP的标准处理为另一种基于CELP的标准的装置。该装置具有各种模块,它们执行至少这里所述的功能。该装置包括时基子帧检验器检查模块,它适用于使一个或多个输入子帧与目的编解码器的输出子帧相关。该装置还具有与时基子帧检查模块耦合的判定模块。该判定模块适用于在各两个或多个输入子帧中从多个音调迟滞参数中确定所需的音调迟滞参数。该装置具有与判定模块耦合的音调迟滞选择模块。音调迟滞选择模块适用于选择所需的音调迟滞参数。

Description

用于音频代码转换中的自适应码本音调滞后计算的方法
发明领域
本发明一般涉及处理电信信号。更特别地,本发明提供用于将数字语音分组从一种码激励线性预测编码(CELP)格式转化为另一种CELP格式的方法和装置。更特别地,它涉及一种方法和装置,用于将由第一CELP编码器作为输入获得的自适应码本音调迟滞(pitch lag)插入第二CELP编码器的另一个自适应码本音调滞后。仅作为实例,本发明已应用于话音代码转换,但可以理解,本发明还可以包括其它应用。
发明背景
电信技术已开发了很多年。仅作为实例,编码技术将用于在电信媒介上传输的信号打包。编码通常包括将未加工信号(语音、图像、视频等等)转换成服从传输或存储的格式的处理。编码通常导致大量压缩,但一般包括要实现有效的信号处理。编码的结果是根据给定压缩格式的被编码的参数的比特流(帧的序列)。通过使用模拟信号的各种技术统计地和感性地除去冗余信息来实现压缩。因此,被编码的格式被称作“压缩格式”或“参数空间”。解码器获得被压缩的比特流并重新生成原信号。在语音编码的情况中,压缩典型地引起信息损失。
可以用编解码器装置执行编码。作为实例,基于CELP(码激励线性预测编码)的编解码器可以被认为是一种算法,它使用语音产生的模型在采样语音和某些参数空间之间进行映射,即它编码和解码数字语音。一般,所有基于CELP的算法都对语音的帧进行操作,这些语音帧被进一步分成几个子帧。基于CELP的模型中使用的帧参数具有用于语音信号的短期预测的线性预测系数(LPC)(并物理地涉及声道、口腔和鼻腔和嘴唇),以及由自适应和固定码本组成的激励信号。自适应码本用于模拟语音中的长期音调信息。分析语音帧中的多数计算努力在于确定LPC系数和找到音调迟滞(或者等效地,自适应码字索引)。
存在着与多个不同端子连接的许多不同网络,这些端子中的每一个都支持许多基于CELP话音编码标准中的一种(或多种)。话音压缩标准之间缺乏内在的互用性常意味着当端对端呼叫横穿网络边界时需要进行转化。互连这些不同的网络和端子一般要求将话音从一种话音标准代码转化为另一种话音标准。这种代码转化的需要典型地存在于移动切换中心、媒体网关、多媒体消息系统中以及网络边缘上。
仅作为实例,不同无线、移动和有线线路网络的上下文中的话音编码说明不同标准上运行的网络。存在各种话音压缩和编码标准,它们用于不同网络-Voice overIP(VoIP)的G.729和G.723.1、GSM,GSM-AMR、EVRC以及不同无线网络上使用(或出现)的许多其它标准。图1A、1B和1C以简化的方式说明了基于CELP的话音压缩标准的这种多样性。在这种情况中,话音代码转换产生于每个网络的边缘处和任意两个网络之间。
自适应码本音调迟滞的计算在查找语音代码转换中的自适应码本中起到重要的作用。由于在多个流行的基于CELP的标准之间进行代码转换时帧尺寸或子帧尺寸可能不同,为不同子帧尺寸标准重新计算码本音调迟滞计算变得具有挑战性。例如,G.723.1中子帧尺寸是7.5ms(图1B),而在GSM-ARM(图1A)中是5ms,以及在EVRC中是6.625ms或6.75ms(图1C)。
包括级联代码转换(强力方法)和某些“智能”代码转换方法的代码转换常规方法仍重建语音信号并执行广泛的计算来通过开环或闭环查找提取音调迟滞。这样,这种方法仍在语音信号空间中而不是参数空间中进行操作。因此,常规方法是计算密集的。
在对消除语音信号空间中的音调迟滞插入的尝试中,美国No.2002/0077812 A1中体现了一种“智能”代码转换。虽然该方法执行CELP参数之间的代码转换,它仅对一般需要源和目的CELP编解码器之间的非常限制条件的特殊情况可用。例如,它一般要求使用代数CELP(ACELP)算法并要求源和目的编解码器两者具有相同的子帧尺寸,它具有很多限制并不能广泛地应用。
因此,需要一种改进了的话音代码转换,它能有效地计算自适应码本音调迟滞。
发明概述
根据本发明,提供了用于处理电信信号的技术。更特别地,本发明提供了一种方法和装置,其用于将数字语音分组从一种码激励线性预测编码(CELP)格式转化为另一种CELP格式。尤其是,它涉及一种方法和装置,其用于将由第一CELP编码器作为输入获得的自适应码本音调迟滞插入第二CELP编码器的另一个自适应码本音调迟滞。仅作为实例,本发明应用于话音代码转换,但可以理解,本发明还可以包括其它应用。
本发明是用于自适应码本音调迟滞计算的方法和装置。该装置包括(a)时基子帧检查模块,它存储等待插入或映射的源编解码器的每个子帧的自适应码本参数并计算源编解码器和目的编解码器之间重叠的子帧的比例;(b)判定模块,它计算与目的子帧重叠的所有源子帧之中自适应码本的能并查找最大能值作为选择音调迟滞的标准;以及(c)选择模块,它基于判定模块的输出从所有重叠的源子帧中选择子帧的音调迟滞作为输出。时基子帧检查模块包括缓冲器,它存储音调迟滞、音调增益和等待映射到目的子帧的源子帧的大量采样,以及鉴别器,它确定目的子帧是否由多个源子帧覆盖。
该方法包括通过源CELP编解码器参数空间计算目的子帧的音调迟滞的步骤。计算音调迟滞的步骤包括存储与目的子帧重叠的每个源子帧的自适应码本参数,确定目的子帧是否由一个源子帧或多个源子帧完全覆盖,如果目的子帧仅由一个源子帧完全覆盖则输出源子帧的音调迟滞或者如果目的子帧由多个源子帧覆盖则输出具有由判定模块使用的标准的最大值的子帧的音调迟滞。输出具有由判定模块使用的标准的最大值的子帧的音调迟滞的步骤包括通过判定进行模块查找标准的最大值,在所有重叠源子帧中具有最大值的子帧的音调迟滞,以及输出所选子帧的音调迟滞的步骤。通过判定模块查找标准的最大值的步骤包括组合重叠的源子帧的自适应码本参数,计算每个源子帧的重叠的比例,计算用作每个重叠子帧中的标准值的能作用,以及检索具有标准的最大值的子帧。
在具体实施例中,本发明提供了一种用于将自适应码本音调迟滞从一种基于CELP的标准处理为另一种基于CELP的标准的装置。该装置具有执行至少这里所述的功能的各种模块。该装置包括时基子帧检查模块,它适用于使一个或多个输入子帧与目的编解码器的输出子帧相关。该装置还具有与时基子帧检查模块耦合的判定模块。该判定模块适用于在各两个或多个输入子帧中从多个音调迟滞参数中确定所需子帧的音调迟滞。该装置具有与判定模块耦合的音调迟滞选择模块。该音调迟滞选择模块适用于选择所需的音调迟滞参数。
在可选方案的具体实施例中,本发明提供了一种用于将自适应码本参数音调迟滞从源基于CELP编解码器处理为目的CELP标准编解码器的方法。该方法包括在存储器中存储来自等待映射的源编解码器的一个或更多的各子帧的超过一个自适应码本参数。该方法还包括在一个或多个子帧等待映射时,判定目的子帧是否由一个源子帧完全覆盖。如果所述目的子帧由单个源子帧完全覆盖,则该方法输出源子帧的音调迟滞,或者如果所述目的子帧由两个或更多源子帧覆盖,则输出通过判定模块基于标准具有最大值的源子帧的音调迟滞的所需值。根据实施例,还可以有其它元件。
在进一步的实施例中,本发明提供了一种用于将自适应码本音调迟滞从一种基于CELP的标准处理为另一种基于CELP的标准的基于计算机的系统。该系统包括计算机存储器,它可以是一个或多个存储器。各种代码被提供于该一个或多个存储器上。该系统包括指向时基子帧检查模块的一个或多个代码,该时基子帧检查模块适用于使一个或多个输入子帧与目的编解码器的输出子帧相关。该系统还包括指向与时基检查模块耦合的判定模块的一个或多个代码,该判定模块适用于在各自两个或更多输入子帧中从多个音调迟滞参数中确定所需的音调迟滞参数。一个或多个代码指向与判定模块耦合的音调迟滞选择模块。该判定模块适用于选择所需的音调迟滞参数。根据实施例,计算机代码可以按软件或固件形式用于执行这里所述的功能。
根据具体实施例,可以有很多好处和/或优点。根据具体实施例,本发明的优点在于它提供在代码转换中从一种编解码器到另一种编解码器的快速音调迟滞参数计算而不牺牲音频质量。快速和准确的计算算法可以改善音频代码转换,不仅在计算性能方面,更重要的是在保持音频质量方面。根据实施例,可以实现这些优点中的一个或更多。
特别地,在所附权利要求书中阐述了被认为是新颖的本发明的目的、特点和优点。通过参考以下说明并结合附图将最佳地理解本发明(关于其操作的组织和方式)以及进一步的目的和优点。
附图概述
图1A、1B和1C是用于说明不同CELP编解码器中使用的不同子帧尺寸的示意图;
图2是根据本发明实施例的用于执行自适应码本音调迟滞插入的简化的功能框图;
图3是示出根据本发明实施例的源和目的编解码器之间不同的子帧尺寸的比较和重叠的简化图;
图4是说明根据本发明实施例的用于为不同子帧尺寸插入音调迟滞的例程的简化流程图;
图5是示出根据本发明实施例的从G.723.1代码转换为GSM-AMR的特殊实例中子帧计算的简化框图。
具体实施方式
根据本发明,提供了用于处理电信信号的技术。更特别地,本发明提供了一种方法和装置,它们用于将数字语音分组从一种码激励线性预测编码(CELP)格式转化为另一种CELP格式。更特别地,它涉及一种方法和装置,它们用于将由第一CELP编解码器作为输入获得的自适应码本音调迟滞插入第二CELP编解码器的另一个自适应码本音调迟滞中。仅作为实例,本发明应用于话音代码转换,但可以理解,本发明也可包括其它应用。
通过现存音频编解码器标准中自适应码本的仔细调查,我们发现可以在代码转换中将码本音调迟滞参数从一个编解码器插入另一个编解码器而不牺牲音频质量。快速和正确的计算算法可以改善音频代码转换,不仅在计算性能方面而且更重要的是在保持音频质量方面。
在特定实施例中,语音信号可以被分类为有声或无声信号。在有声激励序列期间,自适应码本音调迟滞参数是相当稳定的,但在无声声音期间或者在有声声音的开始时是不稳定的。无声声音一般是较弱的、随机信号,且在这种情况中,自适应码本增益很小且自适应码本音调迟滞的选择与有声信号相比不是很重要。另一方面,有声信号一般较强和稳定,且自适应码本音调迟滞的选择直接决定语音压缩的质量。
虽然不同音频编解码器中优化的自适应码本音调迟滞非常接近,在音频代码转换中智能自适应码本音调迟滞计算是必要的。这是因为源和目的编解码器之间的子帧尺寸可能不同(图3)。如图所示,源编解码器中的子帧包括第一子帧的Ns的尺寸。目的编解码器(参见标号1)具有ND的第一子帧,它的尺寸小于第一编解码器子帧。如进一步所示的,第一源编解码器和第一目的编解码器的一边缘对准。由于第一源子帧的尺寸较大并具有延伸超过第一目的子帧的空间对准,第一目的子帧由第一源子帧覆盖(即,整体覆盖)。还示出了第二目的子帧(参见标号2),它具有部分α1和部分α2,其与源编解码器的第一子帧和源编解码器的第二子帧重叠。第二目的子帧并非由单个源子帧覆盖。如同应用于处理不同尺寸的子帧,在本说明书中且特别是以下内容中提供了本发明进一步的细节。
根据特定实施例,我们提供了至少一种方法来为不同尺寸的子帧在音频代码转换中插入自适应码本音调迟滞,以及其它变化、修改和可选方案。
图2说明了根据本发明在音调迟滞插入中使用的构建块的层次。该图仅仅是实例,而不应过度地限制这里权利要求书的范围。本技术领域内的普通技术人员将理解许多变化、修改和可选方案。根据特定实施例,由于源和目的编解码器的不同子帧尺寸,时基子帧检查模块(Time-Base Subframe Inspection Module)处理源编解码器和目的编解码器之间的子帧插入,该模块处理源和目的子帧长度的所有情况(即,源子帧长度短于目的子帧长度,源子帧长度长于目的子帧长度以及源子帧长度等于目的子帧长度)。快速判定模块(Quick Decision Module)为目的编解码器计算所需音调迟滞的选择功能的标准。选择模块(Selection Module)根据快速判定模块计算的标准输出处理最终音调迟滞的计算。应注意,时基子帧检查模块可以直接连接到该输出(即,可以绕过快速判定模块和选择模块)。这样是因为时基子帧检查模块拥有将其直接映射到该输出的能力。这是基于目的子帧相对于源子帧的位置由时基检查模块及时确定的。
再次参考图3,假定源编解码器中自适应码本增益、自适应码本音调迟滞和子帧尺寸分别是gp S,LS,Ns,且目的编解码器的子帧尺寸是ND。源编解码器的子帧尺寸可以与目的编解码器的不相同。此外,源和目的帧可以不对准且它们可以重叠。根据特殊的实施例,我们在不同情况标题下描述了实施例表,它们仅提供进行说明。这些实施例并非旨在限制这里权利要求书的范围。本技术领域内的普通技术人员将理解许多变化、可选方案和修改。
情况1:如果目的子帧由来自源编解码器的一个子帧完全覆盖,用于目的的自适应码本音调迟滞是:
    LD=LS                          (等式1)
情况2:如果目的子帧由来自源的多个子帧覆盖,自适应码本音调迟滞是对于它来说自适应码本增益和重叠尺寸的函数是最大值的源子帧的音调迟滞。它可以被表示成:
其中En是源子帧中自适应增益gpS和覆盖部分α的函数:
且Emax是与目的子帧m重叠的所有子帧中最大的E。
因此,所选的自适应码本音调迟滞可以用作目的子帧的自适应码本音调迟滞,或者如果需要进一步调整也可以用作开环自适应码本音调迟滞。
图4中,说明了本发明操作流程的流程图。该图仅仅是实例,而不应限制这里权利要求书的范围。本技术领域内的普通技术人员可以认识到许多变化、修改和可选方案。自适应码本参数到达音频代码转换的插入器模块的输入。对与源子帧相对的当前目的子帧的对准进行检查。如果目的子帧由源编解码器的一个子帧完全覆盖,目的子帧处的音调迟滞等于源子帧的相应音调迟滞,如等式1所规定的。
如果目的子帧由来自源编解码器的两个或更多子帧覆盖,则音频代码转换内的选择模块在重叠的源子帧中查找最大标准,如等式2和3所规定的。
等式2和3中标准的基础是源编解码器子帧中音调迟滞的强度。在正常对话中的无声时间段中,自适应码本增益很小,这与有声时间段相对,其中音调迟滞很强。因此,根据重叠的源子帧的一部分,如等式3的因子α和音调迟滞的量值所规定的,计算等式3(En)中规定的判定标准。
随后,在目的编解码器处输出音调迟滞。应注意,计算出的音调迟滞应合适于目的编解码器的音调迟滞的允许的索引范围内。在计算出的音调迟滞不合适于目的编解码器的允许的索引范围内的情况中,根据它落于何处,可以将音调迟滞加倍或减半,不管处于最小的允许音调或处于最大的允许音调。根据实施例,我们还提供了仅用于说明的特定实例。贯穿本说明书尤其在以下部分可以发现这些实例。
G.723.1GSM-AMR代码转换实例
作为说明性实例,我们示出如何将自适应码本音调迟滞插入G.723.1到GSM-AMR代码转换(图5)。同样,该图仅仅是实例,而不应限制这里权利要求书的范围。本技术领域内的普通技术人员可以认识到许多变化、修改和可选方案。
通过图5可发现,需要三个GSM-AMR子帧来描述与两个G.723.1子帧相同的语音信号持续时间。同样,每两个G.723.1子帧需要三个GSM-AMR子帧。如果源编解码器是G.723.1而目的编解码器是GSM-AMR,则计算后的GSM-AMR自适应码本音调迟滞如下:
(1) 第m个子帧:GSM-AMR子帧是5ms而G.723.1子帧是7.5ms。GSM-AMR子帧{m}由G.723.1子帧{n}完全覆盖。根据等式(1),其自适应码本音调迟滞是
    Lm GSM-AMR=Ln G723.1
(2)第(m+1)个子帧:第(m+1)个子帧由两个源子帧{n}和{n+1}覆盖,GSM-AMR子帧{m}与G.723.1子帧{n}的重叠与{m}和{n+1}的相同。因此,通过源自适应码本增益确定计算。根据等式(2)和(3),第{m+1}个子帧自适应码本预定值可以如下获得:
其中Gp是音调增益。
(3)第(m+2)个子帧:第(m+2)个子帧仅由G723.1子帧(n+1)覆盖。因此,自适应码本音调迟滞与G723.1相同。
    Lm+2 GSM-AMR=Ln+1 G723.1
(4)可以如上地获得后续子帧的自适应码本音调迟滞。
其它CELP代码转换
根据其它具体实施例,本文档中描述的自适应码本计算的本发明对于所有基于CELP的话音编解码器是一般的,并应用于利用音调迟滞信息的现有编解码器G.723.1,GSM-AMR,EVR,G.728,G.729,G.729A,QCELP,MPEG-4 CELP,SMV和所有其它将来的基于CELP的话音编解码器之间的任何话音代码转换。
提供了之前的较佳实施例的描述以使得本技术领域内的熟练技术人员实施或使用本发明。对这些实施例的各种修改对于本技术领域内的熟练技术人员来说是显见的,且这里限定的一般原理可以应用于其它实施例中而无需创造能力。因此,本发明并非旨在限制这里示出的实施例而是根据与这里揭示的原理和创新特点一致的最宽范围。

Claims (24)

1.一种用于将自适应码本音调迟滞从一种基于CELP的标准处理为另一种基于CELP的标准的装置,其特征在于,包括:
时基子帧插入器,时基子帧检查模块适用于使一个或多个输入的子帧与目的编解码器的输出子帧相关联;
判定模块,它与所述时基检查模块耦合,该判定模块适用于在各自的两个或更多个输入子帧中从多个音调迟滞参数中确定所需的音调迟滞参数;以及
音调迟滞选择模块,它与所述判定模块耦合,该判定模块适用于选择所需的音调迟滞参数。
2.如权利要求1所述的装置,其特征在于,所述时基子帧检查模块是单个模块或多个模块。
3.如权利要求1所述的装置,其特征在于,所需的音调迟滞参数是具有与两个或更多输入子帧有关的音调迟滞选择函数的标准的最大值的输入子帧的音调迟滞。
4.如权利要求1所述的装置,其特征在于,所需的音调迟滞参数是具有与两个或更多输入子帧有关的音调迟滞选择函数的标准的加权平均值或平均值的输入子帧的音调迟滞。
5.如权利要求1所述的装置,其特征在于,所述判定模块是单个模块或多个模块。
6.如权利要求1所述的装置,其特征在于,所述音调迟滞选择模块是单个模块或多个模块。
7.如权利要求1所述的装置,其特征在于,所述的一种和另一种基于CELP的标准具有不同的子帧尺寸或者相同子帧尺寸CELP编解码器。
8.如权利要求1所述的装置,其特征在于,所述时基子帧检查模块包括:
自适应码本缓冲器,该自适应码本缓冲器适用于存储音调迟滞,以及等待映射到一个或多个目的子帧的输入子帧的一个或多个采样;
鉴别器,它与所述自适应码本缓冲器耦合,所述鉴别器适用于确定目的子帧是否由多个源子帧覆盖。
9.一种将自适应码本参数音调迟滞从源基于CELP的编解码器处理为目的CELP标准编解码器的方法,其特征在于,所述方法包括:
在存储器中存储来自源编解码器的一个或更多个各子帧的多于一个的自适应码本参数;
在一个或多个子帧等待映射时,判定目的子帧是否由一个源子帧完全覆盖;
如果所述目的子帧由单个源子帧完全覆盖,则输出源子帧的音调迟滞,或者
如果所述目的子帧由两个或更多源子帧覆盖,则输出具有基于判定模块的标准的选择函数所需值的源子帧的音调迟滞。
10.如权利要求9所述的方法,其特征在于,具有所需值的源子帧的音调迟滞的输出包括由判定模块的标准的最大值,它包括:
如果目的子帧由超过一个的源子帧覆盖,则通过判定模块查找标准的最大值;
在所有被查找的子帧中选择具有选择函数的标准的最大值的子帧的音调迟滞;以及
从源编解码器输出所选子帧的音调迟滞。
11.如权利要求9所述的方法,其特征在于,所需的音调迟滞值是具有标准的最大值的输入子帧的音调迟滞。
12.如权利要求9所述的方法,其特征在于,所需的音调迟滞值是具有标准的平均值或加权平均值的输入子帧的音调迟滞。
13.如权利要求9所述的方法,其特征在于,来自源编解码器的一个或多个子帧包括第一输入子帧,该输入子帧包括输入边缘,以及用于目的编解码器的目的子帧包括第一输出子帧,该输出子帧包括输出边缘;其中在指定时间处所述边缘与输出边缘对准。
14.如权利要求10所述的方法,其特征在于,通过判定模块查找标准的所述值,包括:
组合覆盖目的子帧的每个子帧的自适应码本参数;
计算覆盖目的子帧的每个子帧的比例;
计算每个子帧中自适应码本参数的能;
检索具有自适应码本参数的最大能的源子帧。
15.如权利要求1所述的装置,其特征在于,判定模块通过以下等式计算每个子帧中自适应码本参数的能:
  En=αn·gP 2
其中En是源子帧中自适应增益gp s和重叠部分α的函数。
16.如权利要求1所述的装置,其特征在于,所述判定模块通过以下等式查找包含标准的最大值的所需值:
Emax=max(E1,E2…En)
其中Emax是与目的子帧m重叠的所有子帧中最大的E。
17.一种用于将自适应码本音调迟滞从一种基于CELP的标准处理为另一种基于CELP的标准的基于计算机的系统,其特征在于,包括:
a.指向时基子帧检查模块的一个或多个代码,所述时基子帧检查模块适用于使一个或多个输入子帧与目的编解码器的输出子帧相关;
b.指向与时基检查模块耦合的判定模块的一个或多个代码,所述判定模块适用于在各自两个或更多输入子帧中从多个音调迟滞参数中确定所需的音调迟滞参数;以及
c.指向与判定模块耦合的音调迟滞选择模块的一个或多个代码,所述判定模块适用于选择所需的音调迟滞参数。
18.如权利要求17所述的系统,其特征在于,所述时基子帧检查模块是单个模块或多个模块。
19.如权利要求17所述的系统,其特征在于,所需的音调迟滞参数是与两个或更多输入子帧有关的最大音调迟滞。
20.如权利要求17所述的系统,其特征在于,所需音调迟滞参数是具有与两个或更多输入子帧有关的标准的加权平均值或平均值的输入子帧的音调迟滞。
21.如权利要求17所述的系统,其特征在于,所述判定模块是单个模块或多个模块。
22.如权利要求17所述的系统,其特征在于,所述音调迟滞选择模块是单个模块或多个模块。
23.如权利要求17所述的系统,其特征在于,所述一种和另一种基于CELP的标准具有不同子帧尺寸或相同子帧尺寸CELP编解码器。
24.如权利要求17所述的系统,其特征在于,所述时基子帧检查模块包括:
a.指向自适应码本缓冲器的一个或多个代码,所述自适应码本缓冲器适用于存储音调迟滞、音调增益以及等待映射到一个或更多目的子帧的输入子帧的一个或更多数量的采样;
b.指向与自适应码本缓冲器耦合的鉴别器的一个或多个代码,所述鉴别器适用于确定目的子帧是否由多个源子帧覆盖。
CN038106450A 2002-03-12 2003-03-12 用于音频代码转换中的自适应码本音调滞后计算的方法 Expired - Fee Related CN1653521B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US36440302P 2002-03-12 2002-03-12
US60/364,403 2002-03-12
PCT/US2003/007901 WO2003079330A1 (en) 2002-03-12 2003-03-12 Method for adaptive codebook pitch-lag computation in audio transcoders

Publications (2)

Publication Number Publication Date
CN1653521A true CN1653521A (zh) 2005-08-10
CN1653521B CN1653521B (zh) 2010-05-26

Family

ID=28041908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN038106450A Expired - Fee Related CN1653521B (zh) 2002-03-12 2003-03-12 用于音频代码转换中的自适应码本音调滞后计算的方法

Country Status (7)

Country Link
US (2) US7260524B2 (zh)
EP (1) EP1483758A4 (zh)
JP (1) JP2005520206A (zh)
KR (1) KR20040104508A (zh)
CN (1) CN1653521B (zh)
AU (1) AU2003214182A1 (zh)
WO (1) WO2003079330A1 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101563726A (zh) * 2006-09-20 2009-10-21 汤姆森许可贸易公司 用于对音频信号进行代码转换的方法和设备
CN102341850A (zh) * 2009-01-06 2012-02-01 斯凯普有限公司 语音编码
US8433563B2 (en) 2009-01-06 2013-04-30 Skype Predictive speech signal coding
US8452606B2 (en) 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
US8463604B2 (en) 2009-01-06 2013-06-11 Skype Speech encoding utilizing independent manipulation of signal and noise spectrum
US8655653B2 (en) 2009-01-06 2014-02-18 Skype Speech coding by quantizing with random-noise signal
US8670981B2 (en) 2009-01-06 2014-03-11 Skype Speech encoding and decoding utilizing line spectral frequency interpolation
CN104243734A (zh) * 2013-06-18 2014-12-24 深圳市共进电子股份有限公司 音频处理系统和方法
CN105408954A (zh) * 2013-06-21 2016-03-16 弗朗霍夫应用科学研究促进协会 利用改进的音调滞后估计的似acelp隐藏中的自适应码本的改进隐藏的装置及方法
CN105431903A (zh) * 2013-06-21 2016-03-23 弗朗霍夫应用科学研究促进协会 使用tcx ltp利用损毁或未接收到的帧的重建的音频解码
CN106663444A (zh) * 2014-07-28 2017-05-10 弗劳恩霍夫应用研究促进协会 用于使用谐波后置滤波器来处理音频信号的装置及方法
US10643624B2 (en) 2013-06-21 2020-05-05 Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1653521B (zh) * 2002-03-12 2010-05-26 迪里辛姆网络控股有限公司 用于音频代码转换中的自适应码本音调滞后计算的方法
KR100546758B1 (ko) * 2003-06-30 2006-01-26 한국전자통신연구원 음성의 상호부호화시 전송률 결정 장치 및 방법
US7433815B2 (en) * 2003-09-10 2008-10-07 Dilithium Networks Pty Ltd. Method and apparatus for voice transcoding between variable rate coders
US7519532B2 (en) * 2003-09-29 2009-04-14 Texas Instruments Incorporated Transcoding EVRC to G.729ab
US9058812B2 (en) * 2005-07-27 2015-06-16 Google Technology Holdings LLC Method and system for coding an information signal using pitch delay contour adjustment
US7602745B2 (en) * 2005-12-05 2009-10-13 Intel Corporation Multiple input, multiple output wireless communication system, associated methods and data structures
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
US8218529B2 (en) * 2006-07-07 2012-07-10 Avaya Canada Corp. Device for and method of terminating a VoIP call
GB2466671B (en) 2009-01-06 2013-03-27 Skype Speech encoding
US8243610B2 (en) * 2009-04-21 2012-08-14 Futurewei Technologies, Inc. System and method for precoding codebook adaptation with low feedback overhead
EP2249334A1 (en) * 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder
US8521541B2 (en) * 2010-11-02 2013-08-27 Google Inc. Adaptive audio transcoding

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08146997A (ja) * 1994-11-21 1996-06-07 Hitachi Ltd 符号変換装置および符号変換システム
KR100327969B1 (ko) * 1996-11-11 2002-04-17 모리시타 요이찌 음성재생속도변환장치및음성재생속도변환방법
US5995923A (en) * 1997-06-26 1999-11-30 Nortel Networks Corporation Method and apparatus for improving the voice quality of tandemed vocoders
US6260009B1 (en) * 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
DE69932460T2 (de) * 1999-09-14 2007-02-08 Fujitsu Ltd., Kawasaki Sprachkodierer/dekodierer
US6760698B2 (en) * 2000-09-15 2004-07-06 Mindspeed Technologies Inc. System for coding speech information using an adaptive codebook with enhanced variable resolution scheme
JP2002202799A (ja) * 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
JP2002229599A (ja) 2001-02-02 2002-08-16 Nec Corp 音声符号列の変換装置および変換方法
CN1653521B (zh) * 2002-03-12 2010-05-26 迪里辛姆网络控股有限公司 用于音频代码转换中的自适应码本音调滞后计算的方法
JP2004222009A (ja) * 2003-01-16 2004-08-05 Nec Corp 異種網接続ゲートウェイおよび異種網間通信課金システム

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101563726A (zh) * 2006-09-20 2009-10-21 汤姆森许可贸易公司 用于对音频信号进行代码转换的方法和设备
US10026411B2 (en) 2009-01-06 2018-07-17 Skype Speech encoding utilizing independent manipulation of signal and noise spectrum
CN102341850A (zh) * 2009-01-06 2012-02-01 斯凯普有限公司 语音编码
US8433563B2 (en) 2009-01-06 2013-04-30 Skype Predictive speech signal coding
US8463604B2 (en) 2009-01-06 2013-06-11 Skype Speech encoding utilizing independent manipulation of signal and noise spectrum
CN102341850B (zh) * 2009-01-06 2013-10-16 斯凯普公司 语音编码
US8639504B2 (en) 2009-01-06 2014-01-28 Skype Speech encoding utilizing independent manipulation of signal and noise spectrum
US8655653B2 (en) 2009-01-06 2014-02-18 Skype Speech coding by quantizing with random-noise signal
US8670981B2 (en) 2009-01-06 2014-03-11 Skype Speech encoding and decoding utilizing line spectral frequency interpolation
US8849658B2 (en) 2009-01-06 2014-09-30 Skype Speech encoding utilizing independent manipulation of signal and noise spectrum
US8452606B2 (en) 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
CN104243734A (zh) * 2013-06-18 2014-12-24 深圳市共进电子股份有限公司 音频处理系统和方法
CN104243734B (zh) * 2013-06-18 2019-03-01 深圳市共进电子股份有限公司 音频处理系统和方法
US10679632B2 (en) 2013-06-21 2020-06-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved signal fade out for switched audio coding systems during error concealment
CN105408954B (zh) * 2013-06-21 2020-07-17 弗朗霍夫应用科学研究促进协会 利用改进的音调滞后估计的似acelp隐藏中的自适应码本的改进隐藏的装置及方法
US11869514B2 (en) 2013-06-21 2024-01-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved signal fade out for switched audio coding systems during error concealment
US10381011B2 (en) 2013-06-21 2019-08-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for improved concealment of the adaptive codebook in a CELP-like concealment employing improved pitch lag estimation
CN105431903B (zh) * 2013-06-21 2019-08-23 弗朗霍夫应用科学研究促进协会 实现用于转换编码激发长期预测的改进概念的装置及方法
US10607614B2 (en) 2013-06-21 2020-03-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method realizing a fading of an MDCT spectrum to white noise prior to FDNS application
US10643624B2 (en) 2013-06-21 2020-05-05 Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization
US10672404B2 (en) 2013-06-21 2020-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating an adaptive spectral shape of comfort noise
CN105408954A (zh) * 2013-06-21 2016-03-16 弗朗霍夫应用科学研究促进协会 利用改进的音调滞后估计的似acelp隐藏中的自适应码本的改进隐藏的装置及方法
CN105431903A (zh) * 2013-06-21 2016-03-23 弗朗霍夫应用科学研究促进协会 使用tcx ltp利用损毁或未接收到的帧的重建的音频解码
US11776551B2 (en) 2013-06-21 2023-10-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved signal fade out in different domains during error concealment
US10854208B2 (en) 2013-06-21 2020-12-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method realizing improved concepts for TCX LTP
US10867613B2 (en) 2013-06-21 2020-12-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved signal fade out in different domains during error concealment
US11410663B2 (en) 2013-06-21 2022-08-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pitch lag estimation
US11462221B2 (en) 2013-06-21 2022-10-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating an adaptive spectral shape of comfort noise
US11501783B2 (en) 2013-06-21 2022-11-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method realizing a fading of an MDCT spectrum to white noise prior to FDNS application
CN106663444B (zh) * 2014-07-28 2020-12-01 弗劳恩霍夫应用研究促进协会 用于使用谐波后置滤波器来处理音频信号的装置及方法
CN106663444A (zh) * 2014-07-28 2017-05-10 弗劳恩霍夫应用研究促进协会 用于使用谐波后置滤波器来处理音频信号的装置及方法

Also Published As

Publication number Publication date
EP1483758A4 (en) 2007-04-11
US20040002855A1 (en) 2004-01-01
JP2005520206A (ja) 2005-07-07
EP1483758A1 (en) 2004-12-08
US7260524B2 (en) 2007-08-21
WO2003079330A1 (en) 2003-09-25
CN1653521B (zh) 2010-05-26
AU2003214182A1 (en) 2003-09-29
US20080189101A1 (en) 2008-08-07
KR20040104508A (ko) 2004-12-10
US7996217B2 (en) 2011-08-09

Similar Documents

Publication Publication Date Title
CN1653521B (zh) 用于音频代码转换中的自适应码本音调滞后计算的方法
CN1223989C (zh) 可变速率语音编码器中的帧擦除补偿法及用该方法的装置
FI118835B (fi) Koodausmallin valinta
CN1161749C (zh) 保持语言编码中目标比特率的方法和装置
CN1154086C (zh) Celp转发
CN1735927B (zh) 用于高质量语音编码转换的方法和装置
CN100350453C (zh) 强壮语音分类方法和装置
CN1819021A (zh) 可选模式编码器与可变速率编解码器间的代码转换方法
US20050261900A1 (en) Supporting a switch between audio coder modes
CN1241169C (zh) 语音中非话音部分的低数据位速率编码
CN101189662A (zh) 带多级码本和冗余编码的子带话音编解码器
CN1436347A (zh) 数字信号的编码和解码
CN102934162A (zh) 搜索随后被重放的包括基本层和至少一个增强层分层分级比特流的方法和设备
CN1290077C (zh) 用来对相位谱信息进行子抽样的方法和设备
CN1361913A (zh) 用于交织语音编码器中线状谱信息量化方法的方法和设备
CN1240050C (zh) 一种用于语音编码的固定码本快速搜索方法
CN1244905C (zh) 评估编解码参数的方法
JP3700310B2 (ja) ベクトル量子化装置及びベクトル量子化方法
JPH09120300A (ja) ベクトル量子化装置
CN114007075A (zh) 一种面向声学编码的逐步压缩方法
Shevchuk Method of converting speech codec formats between G. 723.1 and G. 729A
CN1189665A (zh) 改进的多模态编码激励线性预测编码器和方法
Tsai et al. Efficient coding translation of GSM and G. 729 speech coders across mobile and IP networks
Bagwell et al. Compression for Speech Recognition and Music Classification
Somasundaram et al. Source Codec for Multimedia Data Hiding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: ONMOBILE GLOBAL LTD.

Free format text: FORMER OWNER: DILITHIUM (ASSIGNMENT FOR THE BENEFIT OF CREDITORS) INC.

Effective date: 20130220

Owner name: DILITHIUM (ASSIGNMENT FOR THE BENEFIT OF CREDITORS

Free format text: FORMER OWNER: DILITHIUM NETWORKS INC.

Effective date: 20130220

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20130220

Address after: bangalore

Patentee after: DILITHIUM NETWORKS, Inc.

Address before: California, USA

Patentee before: Di Lee Sim (for the benefit of creditors) Ltd.

Effective date of registration: 20130220

Address after: California, USA

Patentee after: Di Lee Sim (for the benefit of creditors) Ltd.

Address before: California, USA

Patentee before: Di Lee Sim Network Inc.

Effective date of registration: 20130220

Address after: California, USA

Patentee after: Di Lee Sim Network Inc.

Address before: New South Wales

Patentee before: DILITHIUM NETWORKS Pty Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100526

Termination date: 20150312

EXPY Termination of patent right or utility model