CN101199003A - 用于增益因数衰减的系统、方法和设备 - Google Patents

用于增益因数衰减的系统、方法和设备 Download PDF

Info

Publication number
CN101199003A
CN101199003A CNA2006800215134A CN200680021513A CN101199003A CN 101199003 A CN101199003 A CN 101199003A CN A2006800215134 A CNA2006800215134 A CN A2006800215134A CN 200680021513 A CN200680021513 A CN 200680021513A CN 101199003 A CN101199003 A CN 101199003A
Authority
CN
China
Prior art keywords
signal
gain factor
factor value
envelope
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800215134A
Other languages
English (en)
Other versions
CN101199003B (zh
Inventor
科恩·贝尔纳德·福斯
阿南塔帕德马纳卜汉·A·坎达达伊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN101199003A publication Critical patent/CN101199003A/zh
Application granted granted Critical
Publication of CN101199003B publication Critical patent/CN101199003B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

根据一个实施例的一种信号处理方法包含:计算基于语音信号的低频部分的第一信号的包络;计算基于所述语音信号的高频部分的第二信号的包络;以及根据所述第一和第二信号的包络之间的时间变化关系来计算多个增益因数值。所述方法包含基于所述第一和第二信号的包络之间的关系随时间的变化来衰减所述多个增益因数值中的至少一者。在一个实例中,所述包络之间的关系随时间的所述变化由所述多个增益因数值之间的至少一个距离来指示。

Description

用于增益因数衰减的系统、方法和设备
本申请案主张2005年4月22日申请的题为“PARAMETER CODING IN AHIGH-BAND SPEECH CODER”的第60/673,965号美国临时专利申请案的权益。
技术领域
本发明涉及信号处理。
背景技术
公共交换电话网络(PSTN)上的语音通信的带宽传统上限于300-3400kHz的频率范围。用于语音通信(例如蜂窝式电话和IP语音(因特网协议,VoIP))的新的网络可能不具有相同的带宽限制,且可能需要在此类网络上发射和接收包含宽频带频率范围的语音通信。举例来说,可能需要支持向下扩展到50Hz和/或一直到7或8kHz的音频频率范围。还可能需要支持可能具有在传统PSTN限制以外的范围内的音频语音内容的其它应用,例如高质量音频或音频/视频会议。
语音编码器所支持的范围向较高频率的扩展可改进清晰度。举例来说,区分例如“s”与“f”的摩擦音的信息主要处于高频率。高频带扩展还可改进语音的其它质量,例如存在率。举例来说,甚至浊元音也可具有远远高于PSTN限制的频谱能量。
宽频带语音编码的一种方法涉及缩放窄频带语音编码技术(例如,经配置以编码0-4kHz的范围的技术)以覆盖宽频带频谱。举例来说,语音信号可以较高速率取样以包含处于高频率的分量,且窄频带编码技术可重新配置以使用更多滤波系数来表示此宽频带信号。然而,例如CELP(密码本激励线性预测)的窄频带编码技术计算量较大,而宽频带CELP编码器可能消耗过多处理循环,以至于对于许多移动和其它嵌入式应用而言不现实。使用这种技术将宽频带信号的整个频谱编码为所需质量还可能导致带宽大大增加而令人无法接受。此外,甚至在此经编码信号的窄频带部分可传输到仅支持窄频带编码的系统中和/或由所述系统解码之前,将需要对所述经编码信号进行代码转换。
宽频带语音编码的另一种方法涉及从经编码窄频带频谱包络外推高频带频谱包络。虽然这种方法可在不增加带宽且不需要代码转换的情况下实施,但通常无法从窄频带部分的频谱包络中精确地预测出语音信号的高频带部分的粗略频谱包络或共振峰结构。
可能需要实施宽频带语音编码,使得至少经编码信号的窄频带部分可通过窄频带信道(例如,PSTN信道)发送,而不进行代码转换或其它显著修改。还可能需要宽频带编码扩展有效率,以便(例如)避免在例如无线蜂窝式电话以及有线和无线信道上的广播的应用中可能接受服务的用户的数目显著减少。
发明内容
在一个实施例中,一种信号处理方法包含:计算基于语音信号的低频部分的第一信号的包络;计算基于所述语音信号的高频部分的第二信号的包络;以及根据所述第一和第二信号的包络之间的时间变化关系来计算多个增益因数值。所述方法包含基于所述第一和第二信号的包络之间的关系的随时间的变化来衰减所述多个增益因数值中的至少一者。
在另一实施例中,一种设备包含:第一包络计算器,其经配置和设置以计算基于语音信号的低频部分的第一信号的包络;以及第二包络计算器,其经配置和设置以计算基于语音信号的高频部分的第二信号的包络。所述设备包含:因数计算器,其经配置和设置以根据所述第一和第二信号的包络之间的时间变化关系来计算多个增益因数值;以及增益因数衰减器,其经配置和设置以基于所述第一和第二信号的包络之间的关系的随时间的变化来衰减所述多个增益因数值中的至少一者。
在另一实施例中,一种信号处理方法包含产生高频带激励信号。在此方法中,产生高频带激励信号包含对基于低频带激励信号的信号进行频谱扩展。所述方法包含基于高频带激励信号来合成高频带语音信号。所述方法包含根据第一多个增益因数值之间的至少一个距离来衰减所述第一多个增益因数值中的至少一者,以及基于由所述衰减得到的第二多个增益因数值来修改基于低频带激励信号的信号的时域包络。
在另一实施例中,一种设备包含:高频带激励发生器,其经配置以基于低频带激励信号来产生高频带激励信号;合成滤波器,其经配置和设置以基于高频带激励信号来产生合成高频带语音信号;以及增益因数衰减器,其经配置和设置以根据第一多个增益因数值之间的至少一个距离来衰减所述第一多个增益因数值中的至少一者。所述设备包含增益控制元件,其经配置和设置以基于包含所述至少一个经衰减的增益因数值的第二多个增益因数值来修改基于低频带激励信号的信号的时域包络。
附图说明
图1a展示根据一实施例的宽频带语音编码器A100的方块图。
图1b展示宽频带语音编码器A100的实施方案A102的方块图。
图2a展示根据一实施例的宽频带语音解码器B100的方块图。
图2b展示宽频带语音编码器B100的实施方案B102的方块图。
图3a展示滤波器组A110的实施方案A112的方块图。
图3b展示滤波器组B120的实施方案B122的方块图。
图4a展示滤波器组A110的一个实例的低和高频带的带宽覆盖。
图4b展示滤波器组A110的另一实例的低和高频带的带宽覆盖。
图4c展示滤波器组A112的实施方案A114的方块图。
图4d展示滤波器组B122的实施方案B124的方块图。
图5a展示语音信号的频率与对数幅值的曲线的实例。
图5b展示基础线性预测编码系统的方块图。
图6展示窄频带编码器A120的实施方案A122的方块图。
图7展示窄频带解码器B110的实施方案B112的方块图。
图8a展示浊语音的残留信号的频率与对数幅值的曲线的实例。
图8b展示浊语音的残留信号的时间与对数幅值的曲线的实例。
图9展示也执行长期预测的基础线性预测编码系统的方块图。
图10展示高频带编码器A200的实施方案A202的方块图。
图11展示高频带激励发生器A300的实施方案A302的方块图。
图12展示频谱扩展器A400的实施方案A402的方块图。
图12a展示频谱扩展操作的一个实例中各点处的信号频谱的曲线。
图12b展示频谱扩展操作的另一实例中各点处的信号频谱的曲线。
图13展示高频带激励发生器A302的实施方案A304的方块图。
图14展示高频带激励发生器A302的实施方案A306的方块图。
图15展示包络计算任务T100的流程图。
图16展示组合器490的实施方案492的方块图。
图17说明计算高频带信号S30的周期性的指标的方法。
图18展示高频带激励发生器A302的实施方案A312的方块图。
图19展示高频带激励发生器A302的实施方案A314的方块图。
图20展示高频带激励发生器A302的实施方案A316的方块图。
图21展示增益计算任务T200的流程图。
图22展示增益计算任务T200的实施方案T210的流程图。
图23a展示开窗函数的图。
图23b展示将如图23a所示的开窗函数应用于语音信号的子帧。
图24展示高频带解码器B200的实施方案B202的方块图。
图25展示宽频带语音编码器A100的实施方案AD10的方块图。
图26a展示延迟线D120的实施方案D122的示意图。
图26b展示延迟线D120的实施方案D124的示意图。
图27展示延迟线D120的实施方案D130的示意图。
图28展示宽频带语音编码器AD10的实施方案AD12的方块图。
图29展示根据一实施例的信号处理方法MD100的流程图。
图30展示根据一实施例的方法M100的流程图。
图31a展示根据一实施例的方法M200的流程图。
图31b展示方法M200的实施方案M210的流程图。
图32展示根据一实施例的方法M300的流程图。
图33a展示高频带增益因数计算器A230的实施方案A232的方块图。
图33b展示包含高频带增益因数计算器A232的设置的方块图。
图34展示高频带编码器A202的实施方案A203的方块图。
图35展示包含高频带增益因数计算器A232和增益因数衰减器G30的实施方案G32的设置的方块图。
图36a和36b展示从计算出的变化值到衰减因数值的映射的实例的曲线。
图37展示包含高频带增益因数计算器A232和增益因数衰减器G30的实施方案G34的设置的方块图。
图38展示高频带解码器B202的实施方案B204的方块图。
图39展示根据一实施例的方法GM10的流程图。
图40展示高频带编码器A202的实施方案A205的方块图。
图41展示增益因数平滑器G80的实施方案G82的方块图。
图42展示增益因数平滑器G80的实施方案G84的方块图。
图43a和43b展示从计算出的变化值的量值到平滑因数值的量值的映射的实例的曲线。
图44展示高频带编码器A202的实施方案A206的方块图。
图45展示高频带编码器A200的实施方案A207的方块图。
图46展示高频带增益因数计算器A235的方块图。
图47展示根据一实施例的方法FM10的流程图。
图48展示通常由标量量化器执行的一维映射的实例。
图49展示由向量量化器执行的多维映射的一个简单实例。
图50a展示一维信号的一个实例,且图50b展示此信号在量化之后的版本的实例。
图50c展示由图52所示的量化器435a量化的图50a的信号的实例。
图50d展示由图53所示的量化器435b量化的图50a的信号的实例。
图51展示高频带编码器A202的实施方案A208的方块图。
图52展示量化器435的实施方案435a的方块图。
图53展示量化器435的实施方案435b的方块图。
图54展示包含在量化器435a和量化器435b的另外的实施方案中的缩放因数计算逻辑的实例的方块图。
图55a展示根据一实施例的方法QM10的流程图。
图55b展示根据一实施例的方法QM20的流程图。
在各图以及随附的描述中,相同参考标号表示相同或类似的元件或信号。
具体实施方式
本文描述的实施例包含可经配置以向窄频带语音编码器提供扩展以支持传输和/或存储宽频带语音信号而带宽仅增加约800到1000bps(位/秒)的系统、方法和设备。此类实施方案的潜在优点包含支持与窄频带系统的兼容性的嵌入式编码、在窄频带与高频带编码信道之间相对容易地分配和再分配位、避免计算量较大的宽频带合成操作,以及维持待通过计算量较大的波形编码例行程序处理的信号的低取样速率。
除非特别受到上下文限制,否则本文使用术语“计算”来表示其普通含义的任一者,例如计算、产生和从值的列表中选择。本描述内容和权利要求书中使用术语“包括”时,不排除其它元件或操作。使用术语“A基于B”来表示其普通含义的任一者,包含以下情况:(i)“ A等于B”和(ii)“A至少基于B”。术语“因特网协议”包含如IETF(因特网工程工作小组)RFC(请求注解)791中描述的版本4和随后版本(例如,版本6)。
图1a展示根据一实施例的宽频带语音编码器A100的方块图。滤波器组A110经配置以对宽频带语音信号S10进行滤波以产生窄频带信号S20和高频带信号S30。窄频带编码器A120经配置以编码窄频带信号S20以产生窄频带(NB)滤波器参数S40和窄频带残留信号S50。如本文进一步详细描述,窄频带编码器A120通常经配置以作为密码本索引或采取另一量化形式而产生窄频带滤波器参数S40和经编码窄频带激励信号S50。高频带编码器A200经配置以根据经编码窄频带激励信号S50中的信息编码高频带信号S30以产生高频带编码参数S60。如本文进一步详细描述,高频带编码器A200通常经配置以作为密码本索引或采取另一量化形式而产生高频带编码参数S60。宽频带语音编码器A100的一个特定实例经配置以在约8.55kbps(千位/秒)的速率下编码宽频带语音信号S10,其中约7.55kbps用于窄频带滤波器参数S40和经编码窄频带激励信号S50,且约1kbps用于高频带编码参数S60。
可能需要将经编码窄频带和高频带信号组合为单一位流。举例来说,可能需要将经编码信号多路复用在一起以作为经编码宽频带语音信号用于传输(例如,在有线、光学或无线传输信道上)或用于存储。图1b展示宽频带语音编码器A100的实施方案A102的方块图,宽频带语音编码器A100包含多路复用器A130,其经配置以将窄频带滤波器参数S40、经编码窄频带激励信号S50和高频带滤波器参数S60组合为多路复用信号S70。
一种包含编码器A102的设备还可包含经配置以将多路复用信号S70传输到例如有线、光学或无线信道的传输信道中的电路。此设备还可经配置以对信号执行一个或一个以上信道编码操作,例如误差校正编码(例如,速率兼容卷积编码)和/或误差检测编码(例如,循环冗余编码),和/或一层或一层以上网络协议编码(例如,以太网、TCP/IP、cdma2000)。
可能需要多路复用器A130经配置以嵌入经编码窄频带信号(包含窄频带滤波器参数S40和经编码窄频带激励信号S50)作为可分离的多路复用信号S70支流,使得经编码窄频带信号可独立于多路复用信号S70的另一部分(例如,高频带和/或低频带信号)被恢复并解码。举例来说,多路复用信号S70可经配置使得经编码窄频带信号可通过剥除高频带滤波器参数S60而恢复。这一特征的一个潜在优点是避免在将经编码宽频带信号传递到支持窄频带信号的解码但不支持高频带部分的解码的系统之前需要对所述经编码宽频带信号进行代码转换。
图2a展示根据一实施例的宽频带语音解码器B100的方块图。窄频带解码器B110经配置以解码窄频带滤波器参数S40和经编码窄频带激励信号S50以产生窄频带信号S90。高频带解码器B200经配置以根据基于经编码窄频带激励信号S50的窄频带激励信号S80而解码高频带编码参数S60,以产生高频带信号S100。在此实例中,窄频带解码器B110经配置以将窄频带激励信号S80提供到高频带解码器B200。滤波器组B120经配置以将窄频带信号S90与高频带信号S100组合以产生宽频带语音信号S110。
图2b是宽频带语音解码器B100的实施方案B102的方块图,宽频带语音解码器B100包含多路分解器B130,其经配置以从多路复用信号S70中产生经编码信号S40、S50和S60。一种包含解码器B102的设备可包含经配置以从例如有线、光学或无线信道的传输信道接收多路复用信号S70的电路。此设备还可经配置以对信号执行一个或一个以上信道解码操作,例如误差校正解码(例如,速率兼容卷积解码)和/或误差检测解码(例如,循环冗余解码),和/或一层或一层以上网络协议解码(例如,以太网、TCP/IP、cdma2000)。
滤波器组A110经配置以根据分裂频带方案对输入信号进行滤波以产生低频率子频带和高频率子频带。视特定应用的设计标准而定,输出子频带可具有相等或不等的带宽且可能重叠或不重叠。产生两个以上子频带的滤波器组A110配置也是可能的。举例来说,此滤波器组可经配置以产生一个或一个以上低频带信号,所述低频带信号包含处于窄频带信号S20的频率范围以下的频率范围(例如50-300Hz的范围)内的分量。此滤波器组也可能经配置以产生一个或一个以上额外高频带信号,所述额外高频带信号包含处于高频带信号S30的频率范围以上的频率范围(例如14-20、16-20或16-32kHz的范围)内的分量。在此情况下,可实施宽频带语音编码器A100以单独编码此信号(一个或多个),且多路复用器A130可经配置以将额外经编码信号(一个或多个)包含在多路复用信号S70中(例如,作为可分离部分)。
图3a展示滤波器组A110的实施方案A112的方块图,滤波器组A110经配置以产生具有减小的取样速率的两个子频带信号。滤波器组A110经配置以接收具有高频率(或高频带)部分和低频率(或低频带)部分的宽频带语音信号S10。滤波器组A112包含经配置以接收宽频带语音信号S10并产生窄频带语音信号S20的低频带处理路径,和经配置以接收宽频带语音信号S10并产生高频带语音信号S30的高频带处理路径。低通滤波器110对宽频带语音信号S10进行滤波以通过选定的低频率子频带,且高通滤波器130对宽频带语音信号S10进行滤波以通过选定的高频率子频带。因为两个子频带信号的带宽比宽频带语音信号S10窄,所以其取样速率可在一定程度上减小而无信息损失。向下取样器120根据所需的抽选因数(例如,通过去除信号的样本和/或用平均值代替样本)来减小低通信号的取样速率,且向下取样器140同样地根据另一所需的抽选因数来减小高通信号的取样速率。
图3b展示滤波器组B120的相应实施方案B122的方块图。向上取样器150(例如,通过零塞入和/或通过复制样本)增加窄频带信号S90的取样速率,且低通滤波器160对向上取样信号进行滤波以仅通过低频带部分(例如,以防止混叠)。同样,向上取样器170增加高频带信号S100的取样速率,且高通滤波器180对向上取样信号进行滤波以仅通过高频带部分。接着,将两个通频信号求和以形成宽频带语音信号S110。在解码器B100的一些实施方案中,滤波器组B120经配置以根据由高频带解码器B200接收和/或计算的一个或一个以上权数来产生两个通频信号的加权总和。还预期将两个以上通频信号组合的滤波器组B120配置。
滤波器110、130、160、180的每一者可实施为有限脉冲响应(FIR)滤波器或实施为无限脉冲响应(IIR)滤波器。编码器滤波器110和130的频率响应可具有抑止频带与通频之间的对称或相异形状的转变区。同样,解码器滤波器160和180的频率响应可具有抑止频带与通频之间的对称或相异形状的转变区。可能需要(但不是严格有必要)低通滤波器110与低通滤波器160具有相同响应,且高通滤波器130与高通滤波器180具有相同响应。在一个实例中,两个滤波器对110、130和160、180是正交镜像滤波器(QMF)组,其中滤波器对110、130与滤波器对160、180具有相同系数。
在典型实例中,低通滤波器110具有包含300-3400Hz的有限PSTN范围的通频(例如,0到4kHz的频带)。图4a和4b展示两个不同实施实例中宽频带语音信号S10、窄频带信号S20和高频带信号S30的相对带宽。在这两个特定实例中,宽频带语音信号S10具有16kHz的取样速率(表示0到8kHz范围内的频率分量),且窄频带信号S20具有8kHz的取样速率(表示0到4kHz范围内的频率分量)。
在图4a的实例中,两个子频带之间不存在明显重叠。此实例中所示的高频带信号S30可通过使用具有4-8kHz的通频的高通滤波器130来获得。在此情况下,可能需要通过以2为因数向下取样经滤波信号而将取样速率减小为8kHz。可预期此操作会显著减小对信号的进一步处理操作的计算复杂性,此操作将把通频能量下移到0到4kHz范围内而无信息损失。
在图4b的替代实例中,上部和下部子频带具有明显重叠,使得两个子频带信号均描述3.5到4kHz的区域。此实例中的高频带信号S30可通过使用具有3.5-7kHz的通频的高通滤波器130来获得。在此情况下,可能需要通过以16/7为因数向下取样经滤波信号而将取样速率减小为7kHz。可预期此操作会显著减小对信号的进一步处理操作的计算复杂性,此操作将把通频能量下移到0到3.5kHz范围内而无信息损失。
在典型电话通信手机中,一个或一个以上变换器(即,麦克风和耳机或扬声器)缺乏7-8kHz的频率范围上的明显响应。在图4b的实例中,宽频带语音信号S10的处于7与8kHz之间的部分不包含在经编码信号中。高通滤波器130的其它特定实例具有3.5-7.5kHz和3.5-8kHz的通频。
在一些实施方案中,如在图4b的实例中在子频带之间提供重叠允许使用在重叠区上具有平滑衰减的低通和/或高通滤波器。此类滤波器与具有较急剧或“砖墙式(brick-wall)”响应的滤波器相比,通常较易设计,计算上不太复杂,且/或引起的延迟较少。具有急剧转变区的滤波器往往比具有平滑衰减的类似等级的滤波器具有更高的旁瓣(这可能引起混叠)。具有急剧转变区的滤波器还可能具有长脉冲响应,这可能引起振铃假象。对于具有一个或一个以上IIR滤波器的滤波器组实施方案,允许重叠区上的平滑衰减可使得能够使用极点较远离单位圆的滤波器(一个或多个),这对于确保稳定的定点实施方案可能较重要。
子频带重叠允许低频带与高频带的平滑混合,这可导致较少的可听到的假象,减少混叠,且/或使一个频带到另一频带的转变不太明显。此外,窄频带编码器A120(例如,波形编码器)的编码效率可随着频率不断增加而下降。举例来说,可能在低位速率下,尤其在存在背景噪声的情况下减小窄频带编码器的编码质量。在此类情况下,提供子频带重叠可提高重叠区中复制的频率分量的质量。
此外,子频带重叠允许低频带与高频带的平滑混合,其可能导致较少的可听到的假象,减少混叠,且/或使一个频带到另一频带的转变不太明显。此特征对于窄频带编码器A120和高频带编码器A200根据不同编码方法操作的实施方案可能尤其合乎需要。举例来说,不同编码技术可产生听起来非常不同的信号。以密码本索引形式编码频谱包络的编码器可产生具有与改为编码幅值谱的编码器不同的声音的信号。时域编码器(例如,脉冲-代码调制或PCM编码器)可产生具有与频域编码器不同的声音的信号。以频谱包络和相应残留信号的表示形式编码信号的编码器可产生具有与仅以频谱包络表示形式编码信号的编码器不同的声音的信号。将信号编码为其波形的表示形式的编码器可产生具有与来自正弦编码器的输出不同的声音的输出。在此类情况下,使用具有急剧转变区的滤波器来界定非重叠子频带可能导致合成的宽频带信号中子频带之间的转变较突然且感觉上较明显。
尽管子频带技术中通常使用具有互补重叠频率响应的QMF滤波器组,但此类滤波器不适于本文描述的宽频带编码实施方案中的至少一些实施方案。编码器处的QMF滤波器组经配置以产生较大程度的混叠,所述混叠在解码器处的相应QMF滤波器组中被消去。此配置可能不适于信号招致滤波器组之间的大量失真的应用,因为失真可减小混叠消去性质的效力。举例来说,本文描述的应用包含经配置以在非常低的位速率下操作的编码实施方案。由于位速率非常低,所以经解码信号很可能与原始信号相比呈现为明显失真,使得QMF滤波器组的使用可导致未消去的混叠。使用QMF滤波器组的应用通常具有较高位速率(例如,对于AMR超过12kbps,且对于G.722超过64kbps)。
另外,编码器可经配置以产生感觉上类似于原始信号但实际上显著不同于原始信号的合成信号。举例来说,如本文所描述从窄频带残留中导出高频带激励的编码器可产生此信号,因为经解码信号中可能完全不存在实际高频带残留。在此类应用中使用QMF滤波器组可导致由未消去的混叠引起的较大程度的失真。
如果受影响子频带较窄,那么可减小QMF混叠引起的失真量,因为混叠的影响限于与子频带宽度相等的带宽。然而,对于本文描述的其中每一子频带包含宽频带带宽的约一半的实例,由未消去的混叠引起的失真可能影响信号的大部分。信号的质量也可能受上面发生未消去的混叠的频带的位置影响。举例来说,宽频带语音信号中心附近(例如,3与4kHz之间)产生的失真可能比信号边缘附近(例如,6kHz以上)发生的失真有害得多。
虽然QMF滤波器组的滤波器的响应彼此严格相关,但滤波器组A110和B120的低频带和高频带路径可经配置以具有除两个子频带的重叠外完全不相关的频谱。我们将两个子频带的重叠定义为高频带滤波器的频率响应下降到-20dB的点至低频带滤波器的频率响应下降到-20dB的点的距离。在滤波器组A110和/或B120的各种实例中,此重叠范围为约200Hz到约1kHz。约400到约600Hz的范围可表示编码效率与感知平滑度之间的理想折衷。在上文提及的一个特定实例中,重叠在500Hz附近。
可能需要实施滤波器组A112和/或B122来在若干阶段执行图4a和4b中说明的操作。举例来说,图4c展示滤波器组A112的实施方案A114的方块图,实施方案A114使用一系列内插、再取样、抽选和其它操作来执行功能等效的高通滤波和向下取样操作。此类实施方案可较易设计且/或可允许再使用逻辑和/或代码的功能块。举例来说,可使用相同功能块来执行如图4c所示至14kHz的抽选以及至7kHz的抽选的操作。可通过将信号与函数ejnπ或序列(-1)n相乘来实施频谱反转操作,所述序列(-1)n的值在+1与-1之间交替。频谱成形操作可实施为经配置以使信号成形从而获得所需的总体滤波器响应的低通滤波器。
注意到,由于频谱反转操作的缘故,高频带信号S30的频谱反转。可相应地配置编码器和相应解码器中的后续操作。举例来说,本文描述的高频带激励发生器A300可经配置以产生同样具有频谱反转形式的高频带激励信号S120。
图4d展示滤波器组B122的实施方案B124的方块图,滤波器组B122使用一系列内插、再取样和其它操作来执行功能等效的向上取样和高通滤波操作。滤波器组B124包含高频带中的频谱反转操作,其使与例如编码器的滤波器组(例如,滤波器组A114)中执行的类似的操作反转。在此特定实例中,滤波器组B124还包含低频带和高频带中的陷波滤波器,其削弱7100Hz处的信号分量,但此类滤波器是任选的且不需要包含此类滤波器。2006年4月3日申请的代理人案号为050551的专利申请案“SYSTEMS,METHODS,AND APPARATUS FOR SPEECH SIGNAL FILTERING”包含关于滤波器组A110和B120的特定实施方案的元件的响应的额外描述和图式,且此材料在此以引用的方式并入。
窄频带编码器A120根据源-滤波器模型而实施,其将输入语音信号编码为(A)一组描述滤波器的参数和(B)驱动所描述的滤波器产生输入语音信号的合成复制物的激励信号。图5a展示语音信号的频谱包络的实例。表现此频谱包络的特征的峰值表示声域的谐振且称为共振峰。大多数语音编码器至少将此粗略谱结构编码为一组参数(例如,滤波器系数)。
图5b展示如应用于窄频带信号S20的频谱包络的编码的基础源-滤波器配置的实例。分析模块计算描述对应于一段时间(通常20毫秒)内的语音声音的滤波器的一组参数。根据那些滤波器参数配置的白化滤波器(也称为分析或预测误差滤波器)去除频谱包络以对信号进行频谱整平。所得的白化信号(也称为残留)与原始语音信号相比,具有较少能量且因此变化较小并且较易于编码。由于对残留信号编码引起的误差还可能较均匀地散布在频谱上。滤波器参数和残留通常经过量化以用于在信道上有效传输。在解码器处,根据滤波器参数配置的合成滤波器由基于残留的信号激励以产生原始语音声音的合成版本。合成滤波器通常经配置以具有转移函数,所述转移函数是白化滤波器的转移函数的反转形式。
图6展示窄频带编码器A120的基础实施方案A122的方块图。在此实例中,线性预测编码(LPC)分析模块210将窄频带信号S20的频谱包络编码为一组线性预测(LP)系数(例如,全极滤波器的系数1/A(z))。分析模块通常将输入信号处理为一系列非重叠帧,其中为每一帧计算一组新的系数。帧周期通常是可预期信号在本地静止的周期;一个常见实例为20毫秒(等效于8kHz的取样速率下160个样本)。在一个实例中,LPC分析模块210经配置以计算一组10个LP滤波器系数以描述每一20毫秒帧的共振峰结构。也可能实施分析模块以将输入信号处理为一系列重叠帧。
分析模块可经配置以直接分析每一帧的样本,或者可首先根据开窗函数(例如,汉明窗口)对样本进行加权。也可在大于帧的窗口(例如,30毫秒窗口)上执行分析。此窗口可对称(例如5-20-5,使得其包含紧接着20毫秒帧之前和之后的5毫秒)或不对称(例如10-20,使得其包含先前帧的最后10毫秒)。LPC分析模块通常经配置以使用Levinson-Durbin递归式或Leroux-Gueguen算法计算LP滤波器系数。在另一实施方案中,分析模块可经配置以计算每一帧的一组倒谱系数而不是一组LP滤波器系数。
编码器A120的输出速率可通过量化滤波器系数而显著减小,且对复制质量的影响相对较小。线性预测滤波器系数难以有效量化,且通常映射为另一表示形式,例如线谱对(LSP)或线谱频率(LSF),以用于量化和/或熵编码。在图6的实例中,LP滤波器系数-LSF变换220将所述组LP滤波器系数变换为一组相应的LSF。LP滤波器系数的其它一对一表示形式包含部分自相关系数、对数面积比值、导抗谱对(ISP)和导抗谱频率(ISF),其用于GSM(全球移动通信系统)AMR-WB(自适应多速宽频带)编译码器中。通常,一组LP滤波器系数与一组相应的LSF之间的变换是可逆的,但实施例还包含变换不可在无误差情况下可逆的编码器A120实施方案。
量化器230经配置以量化所述组窄频带LSF(或其它系数表示形式),且窄频带编码器A122经配置以输出此量化的结果作为窄频带滤波器参数S40。此量化器通常包含向量量化器,其将输入向量编码为对于表或密码本中的相应向量条目的索引。
如图6所示,窄频带编码器A122还通过使窄频带信号S20通过根据所述组滤波器系数配置的白化滤波器260(也称为分析或预测误差滤波器)来产生残留信号。在此特定实例中,白化滤波器260实施为FIR滤波器,但也可使用IIR实施方案。此残留信号通常将含有窄频带滤波器参数S40中未表示的感觉上较重要的语音帧信息,例如与音调有关的长期结构。量化器270经配置以计算此残留信号的量化表示形式以作为经编码的窄频带激励信号S50输出。此量化器通常包含向量量化器,其将输入向量编码为对于表或密码本中的相应向量条目的索引。或者,此量化器可经配置以发送一个或一个以上参数,可在解码器处从所述参数中动态地产生向量,而不是如稀疏密码本方法中一样从存储装置中检索向量。此方法用于例如代数CELP(密码本激励线性预测)的编码方案和例如3GPP2(第三代合作伙伴关系2)EVRC(增强可变速率编译码器)的编译码器中。
需要窄频带编码器A120根据将可用于相应窄频带解码器的相同滤波器参数值来产生经编码窄频带激励信号。以此方式,所得的经编码窄频带激励信号可能已在某种程度上考虑那些参数值的不理想性,例如量化误差。因此,需要使用将在解码器处可用的相同系数值来配置白化滤波器。在如图6所示的编码器A122的基础实例中,反转量化器240对窄频带编码参数S40解量化,LSF-LP滤波器系数变换250将所得值映射回一组相应的LP滤波器系数,且此组系数用于配置白化滤波器260以产生由量化器270量化的残留信号。
窄频带编码器A120的一些实施方案经配置以通过从一组密码本向量中识别出与残留信号最佳匹配的一个向量来计算经编码窄频带激励信号S50。然而,注意到,窄频带编码器A120也可经实施以计算残留信号的量化表示形式而不实际上产生残留信号。举例来说,窄频带编码器A120可经配置以使用许多密码本向量来产生相应的合成信号(例如,根据一组当前滤波器参数),并选择与感知加权域中和原始窄频带信号S20最佳匹配的所产生信号相关联的密码本向量。
图7展示窄频带解码器B110的实施方案B112的方块图。反转量化器310对窄频带滤波器参数S40解量化(在此情况下,解量化为一组LSF),且LSF-LP滤波器系数变换320将LSF变换为一组滤波器系数(例如,如上文参照窄频带编码器A122的反转量化器240和变换250所描述)。反转量化器340对窄频带残留信号S40解量化以产生窄频带激励信号S80。基于滤波器系数和窄频带激励信号S80,窄频带合成滤波器330合成窄频带信号S90。换句话说,窄频带合成滤波器330经配置以根据解量化滤波器系数对窄频带激励信号S80进行频谱成形,以产生窄频带信号S90。窄频带解码器B112还将窄频带激励信号S80提供到高频带编码器A200,高频带编码器A200使用窄频带激励信号S80来导出高频带激励信号S120,如本文所描述。在下文描述的一些实施方案中,窄频带解码器B110可经配置以将与窄频带信号有关的额外信息(例如,频谱倾斜、音调增益和滞后,以及语音模式)提供到高频带解码器B200。
窄频带编码器A122和窄频带解码器B112的系统是合成分析语音编译码器的基础实例。密码本激励线性预测(CELP)编码是合成分析编码的一个普遍系列,且此类编码器的实施方案可执行残留的波形编码,其中包含例如从固定和自适应密码本中选择条目的操作、误差最小化操作和/或感知加权操作。合成分析编码的其它实施方案包含混合激励线性预测(MELP)、代数CELP(ACELP)、松弛CELP(RCELP)、规则脉冲激励(RPE)、多脉冲CELP(MPE)和向量和激励线性预测(VSELP)编码。相关编码方法包含多频带激励(MBE)和原型波形内插(PWI)编码。标准合成分析语音编译码器的实例包含使用残留激励线性预测(RELP)的ETSI(欧洲电信标准协会)GSM全速率编译码器(GSM06.10)、GSM增强全速率编译码器(ETSI-GSM 06.60)、ITU(国际电信联盟)标准11.8kb/s G.729 Annex E编码器、IS-136的IS(临时标准)641编译码器(时分多址方案)、GSM自适应多速率(GSM-AMR)编译码器,和4GVTM(第四代VocoderTM)编译码器(加州圣地亚哥市的高通公司(QUALCOMM Incorporated,San Diego,CA))。窄频带编码器A120和相应的解码器B110可根据这些技术中的任一者或任何其它语音编码技术(已知的或待开发的)实施,所述语音编码技术将语音信号表示为(A)一组描述滤波器的参数和(B)用于驱动所描述的滤波器复制语音信号的激励信号。
即使在白化滤波器已从窄频带信号S20中去除粗略频谱包络之后,也可能保留相当大量的精细谐波结构(尤其对于浊语音来说)。图8a展示浊音信号(例如,元音)的残留信号(如可能由白化滤波器产生)的一个实例的频谱曲线。此实例中可见的周期性结构与音调有关,且同一说话者发出的不同浊音可能具有不同的共振峰结构但具有类似的音调结构。图8b展示此残留信号的实例的时域曲线,其展示音调脉冲的时间序列。
可通过使用一个或一个以上参数值编码音调结构的特性来增加编码效率和/或语音质量。音调结构的一个重要特性是第一谐波的频率(也称为基频),其通常在60到400Hz范围内。此特性通常编码为基频的反转形式,也称为音调滞后(pitch lag)。音调滞后指示一个音调周期中样本的数目,且可编码为一个或一个以上密码本索引。来自男性说话者的语音信号往往比来自女性说话者的语音信号具有更大的音调滞后。
与音调结构有关的另一信号特性是周期性,其指示谐波结构的强度,或换句话说,信号为谐波或非谐波的程度。周期性的两个典型指示符是零交叉和标准化自相关函数(NACF)。周期性也可由音调增益来指示,所述音调增益通常编码为密码本增益(例如,量化自适应密码本增益)。
窄频带编码器A120可包含经配置以编码窄频带信号S20的长期谐波结构的一个或一个以上模块。如图9所示,可使用的一个典型CELP范例包含开放式回路LPC分析模块,其编码短期特性或粗略频谱包络,之后是闭合式回路长期预测分析阶段,所述阶段编码精细音调或谐波结构。短期特性编码为滤波器系数,且长期特性编码为例如音调滞后和音调增益的参数的值。举例来说,窄频带编码器A120可经配置以便以包含一个或一个以上密码本索引(例如,固定密码本索引和自适应密码本索引)和相应增益值的形式输出经编码窄频带激励信号S50。窄频带残留信号的这种量化表示形式的计算(例如,通过量化器270)可包含选择这些索引和计算这些值。音调结构的编码还可包含内插音调原型波形,所述操作可包含计算连续音调脉冲之间的差。可针对对应于清语音(其通常类似于噪声且未系统化)的帧禁用长期结构的建模。
根据图9所示的范例的窄频带解码器B110的实施方案可经配置以在长期结构(音调或谐波结构)已恢复之后将窄频带激励信号S80输出到高频带解码器B200。举例来说,此解码器可经配置以输出窄频带激励信号S80作为经编码窄频带激励信号S50的解量化版本。当然,也可能实施窄频带解码器B110,使得高频带解码器B200执行经编码窄频带激励信号S50的解量化以获得窄频带激励信号S80。
在根据图9所示的范例的宽频带语音编码器A100的实施方案中,高频带编码器A200可经配置以接收由短期分析或白化滤波器产生的窄频带激励信号。换句话说,窄频带编码器A120可经配置以在编码长期结构之前将窄频带激励信号输出到高频带编码器A200。然而,高频带编码器A200需要从窄频带信道接收将由高频带解码器B200接收的相同编码信息,使得高频带编码器A200产生的编码参数可能已在某种程度上考虑所述信息的不理想性。因此,可能优选的是,高频带编码器A200从待由宽频带语音编码器A100输出的相同参数化和/或量化经编码窄频带激励信号S50中重建窄频带激励信号S80。此方法的一个潜在优点是较准确地计算下文描述的高频带增益因数S60b。
除了描述窄频带信号S20的短期和/或长期结构的参数外,窄频带编码器A120还可产生与窄频带信号S20的其它特性有关的参数值。这些值(其可能经适宜量化以由宽频带语音编码器A100输出)可包含在窄频带滤波器参数S40中或单独输出。高频带编码器A200也可经配置以根据这些额外参数中的一者或一者以上(例如,解量化之后)计算高频带编码参数S60。在宽频带语音解码器B100处,高频带解码器B200可经配置以经由窄频带解码器B110(例如,解量化之后)接收参数值。或者,高频带解码器B200可经配置以直接接收(且可能用于解量化)参数值。
在额外窄频带编码参数的一个实例中,窄频带编码器A120产生每一帧的频谱倾斜和语音模式参数的值。频谱倾斜与通频上频谱包络的形状有关,且通常由量化第一反射系数表示。对于大多数浊音,频谱能量随着频率的不断增加而减小,使得第一反射系数为负且可接近-1。大多数清音具有平整的频谱,从而使得第一反射系数接近零,或者在高频率下具有较多能量,从而使得第一反射系数为正且可接近+1。
语音模式(也称为发声模式)指示当前帧表示浊语音还是清语音。此参数可具有二进制值,其基于周期性的一个或一个以上指标(例如,零交叉、NACF、音调增益)和/或帧的声音活动(例如,此指标与阈值之间的关系)。在其它实施方案中,语音模式参数具有一个或一个以上其它状态以指示例如无声或背景噪声或无声与浊语音之间的转变等模式。
高频带编码器A200经配置以根据源-滤波器模型来编码高频带信号S30,其中此滤波器的激励是基于经编码窄频带激励信号。图10展示高频带编码器A200的实施方案A202的方块图,高频带编码器A200经配置以产生包含高频带滤波器参数S60a和高频带增益因数S60b的高频带编码参数S60流。高频带激励发生器A300从经编码窄频带激励信号S50中导出高频带激励信号S120。分析模块A210产生描述高频带信号S30的频谱包络的一组参数值。在此特定实例中,分析模块A210经配置以执行LPC分析以便为高频带信号S30的每一帧产生一组LP滤波器系数。线性预测滤波器系数-LSF变换410将所述组LP滤波器系数变换为一组相应的LSF。如上文参照分析模块210和变换220所述,分析模块A210和/或变换410可经配置以使用其它系数组(例如,倒谱系数)和/或系数表示形式(例如,ISP)。
量化器420经配置以量化所述组高频带LSF(或其它系数表示形式,例如ISP),且高频带编码器A202经配置以输出此量化的结果作为高频带滤波器参数S60a。此量化器通常包含向量量化器,其将输入向量编码为对于表或密码本中的相应向量条目的索引。
高频带编码器A202还包含合成滤波器A220,其经配置以根据分析模块A210产生的高频带激励信号S120和经编码频谱包络(例如,所述组LP滤波器系数)来产生合成高频带信号S130。合成滤波器A220通常实施为IIR滤波器,但也可使用FIR实施方案。在特定实例中,合成滤波器A220实施为六次线性自回归滤波器。
高频带增益因数计算器A230计算原始高频带信号S30与合成高频带信号S130的电平之间的一个或一个以上差,以指定帧的增益包络。量化器430可实施为将输入向量编码为对于表或密码本中的相应向量条目的索引的向量量化器,其量化指定增益包络的值(一或多个),且高频带编码器A202经配置以输出此量化的结果作为高频带增益因数S60b。
在如图10所示的实施方案中,合成滤波器A220经配置以从分析模块A210接收滤波器系数。高频带编码器A202的替代实施方案包含反转量化器和反转变换,其经配置以从高频带滤波器参数S60a中解码滤波器系数,且在此情况下合成滤波器A220经配置以改为接收经解码滤波器系数。此替代配置可支持由高频带增益计算器A230较准确地计算增益包络。
在一个特定实例中,分析模块A210和高频带增益计算器A230分别每帧输出一组六个LSF和一组五个增益值,使得可仅用每帧十一个额外值来实现窄频带信号S20的宽频带扩展。耳朵对于高频率下的频率误差往往较不敏感,因而低LPC级的高频带编码可产生具有可与较高LPC级的窄频带编码相比的感知质量的信号。高频带编码器A200的典型实施方案可经配置以每帧输出8到12位用于频谱包络的高质量重建,以及每帧输出另外8到12位用于时间包络的高质量重建。在另一特定实例中,分析模块A210每帧输出一组八个LSF。
高频带编码器A200的一些实施方案经配置以通过以下方式产生高频带激励信号S120:产生具有高频带频率分量的随机噪声信号,并根据窄频带信号S20、窄频带激励信号S80或高频带信号S30的时域包络对噪声信号进行幅值调制。虽然这种基于噪声的方法对于清音可产生适当结果,然而,其对于浊音可能不理想,浊音的残留通常为谐波且因此具有某种周期性结构。
高频带激励发生器A300经配置以通过将窄频带激励信号S80的频谱扩展到高频带频率范围中来产生高频带激励信号S120。图11展示高频带激励发生器A300的实施方案A302的方块图。反转量化器450经配置以解量化经编码窄频带激励信号S50以产生窄频带激励信号S80。频谱扩展器A400经配置以基于窄频带激励信号S80产生谐波扩展信号S160。组合器470经配置以将噪声发生器480产生的随机噪声信号与包络计算器460计算的时域包络组合以产生经调制噪声信号S170。组合器490经配置以将谐波扩展信号S60与经调制噪声信号S170混合以产生高频带激励信号S120。
在一个实例中,频谱扩展器A400经配置以对窄频带激励信号S80执行频谱折叠操作(也称为镜射)以产生谐波扩展信号S160。频谱折叠可由零塞入激励信号S80执行且接着应用高通滤波器来保留伪信号。在另一实例中,频谱扩展器A400经配置以通过将窄频带激励信号S80频谱转译到高频带中(例如,经由向上取样,之后与恒定频率余弦信号相乘)来产生谐波扩展信号S160。
频谱折叠和转译方法可产生谐波结构在相位和/或频率上与窄频带激励信号S80的原始谐波结构不连续的频谱扩展信号。举例来说,此类方法可产生具有通常不位于基频的倍数处的峰值的信号,这可能在重建的语音信号中引起声音微弱的假象。这些方法往往还产生具有不自然较强音调特性的高频率谐波。然而,因为PSTN信号可在8kHz下取样但带宽被限制为不大于3400Hz,所以窄频带激励信号S80的上部频谱可能含有极少或不含有能量,使得根据频谱折叠或频谱转译操作产生的扩展信号可具有3400Hz以上的频谱缺陷。
产生谐波扩展信号S160的其它方法包含识别窄频带激励信号S80的一个或一个以上基频,和根据所述信息产生谐音。举例来说,激励信号的谐波结构可由基频与幅值和相位信息一起描述。高频带激励发生器A300的另一实施方案基于基频和幅值(例如,如由音调滞后和音调增益指示)来产生谐波扩展信号S160。然而,除非谐波扩展信号与窄频带激励信号S80在相位上相干,否则所得的经解码语音的质量可能不可接受。
可使用非线性函数来产生与窄频带激励相位上相干并保持谐波结构而没有相位不连续性的高频带激励信号。非线性函数还可提供高频率谐波之间的增加的噪声电平,其往往比通过例如频谱折叠和频谱转译的方法产生的音调高频率谐波听起来更为自然。可由频谱扩展器A400的各种实施方案应用的典型无记忆非线性函数包含绝对值函数(也称为全波整流)、半波整流、平方、立方和削波。频谱扩展器A400的其它实施方案可经配置以应用具有记忆的非线性函数。
图12是频谱扩展器A400的实施方案A402的方块图,频谱扩展器A400经配置以应用非线性函数来扩展窄频带激励信号S80的频谱。向上取样器510经配置以对窄频带激励信号S80进行向上取样。可能需要对信号进行充分向上取样以使应用非线性函数时的混叠最小化。在一个特定实例中,向上取样器510以8为因数对信号进行向上取样。向上取样器510可经配置以通过对输入信号进行零塞入并对结果进行低通滤波来执行向上取样操作。非线性函数计算器520经配置以将非线性函数应用于经向上取样信号。对于频谱扩展而言,绝对值函数相对于其它非线性函数(例如,平方函数)的一个潜在优点是,不需要能量标准化。在一些实施方案中,可通过剥离或清除每一样本的符号位来有效地应用绝对值函数。非线性函数计算器520还可经配置以执行向上取样信号或频谱扩展信号的幅值偏差。
向下取样器530经配置以对应用非线性函数的频谱扩展结果进行向下取样。向下取样器530可能需要执行带通滤波操作以在减小取样速率(例如,以便减小或避免由于不必要图像引起的混叠或讹误)之前选择频谱扩展信号的所需频带。向下取样器530可能还需要在一个以上阶段减小取样速率。
图12a是展示频谱扩展操作的一个实例中各点处的信号频谱的图,其中频率标度在各曲线上相同。曲线(a)展示窄频带激励信号S80的一个实例的频谱。曲线(b)展示信号S80已被以8为因数向上取样之后的频谱。曲线(c)展示应用非线性函数之后的扩展频谱的实例。曲线(d)展示低通滤波之后的频谱。在此实例中,通频扩展到高频带信号S30的频率上限(例如,7kHz或8kHz)。
曲线(e)展示向下取样的第一阶段之后的频谱,其中使取样速率以4为因数减小以获得宽频带信号。曲线(f)展示进行高通滤波操作以选择扩展信号的高频带部分之后的频谱,且曲线(g)展示向下取样的第二阶段之后的频谱,其中使取样速率以2为因数减小。在一个特定实例中,向下取样器530通过使宽频带信号通过滤波器组A112(或具有相同响应的其它结构或例行程序)的高通滤波器130和向下取样器140来执行高通滤波和向下取样的第二阶段,以产生具有高频带信号S30的频率范围和取样速率的频谱扩展信号。
如曲线(g)中可见,曲线(f)所示的高通信号的向下取样促使其频谱反转。在此实例中,向下取样器530还经配置以对信号执行频谱翻转操作。曲线(h)展示应用频谱翻转操作的结果,所述频谱翻转操作可通过将信号与函数ejnπ或序列(-1)n相乘来执行,所述序列(-1)n的值在+1与-1之间交替。此操作等效于在频域中将信号的数字频谱移位距离π。注意到,还可通过以不同次序应用向下取样和频谱翻转操作来获得相同结果。向上取样和/或向下取样的操作还可经配置以包含再取样来获得具有高频带信号S30的取样速率(例如,7kHz)的频谱扩展信号。
如上文注意到,滤波器组A110和B120可经实施使得窄频带和高频带信号S20、S30中的一者或两者在滤波器组A110的输出处具有频谱反转形式,以频谱反转形式被编码和解码,并在宽频带语音信号S110中输出之前在滤波器组B120处再次频谱反转。当然,在此情况下,将不需要如图12a所示的频谱翻转操作,因为高频带激励信号S120将也需要具有频谱反转形式。
频谱扩展器A402执行的频谱扩展操作的向上取样和向下取样的各个任务可以许多不同方式配置和设置。举例来说,图12b是展示频谱扩展操作的另一实例中各点处的信号频谱的图,其中频率标度在各曲线上相同。曲线(a)展示窄频带激励信号S80的一个实例的频谱。曲线(b)展示信号S80已被以2为因数向上取样之后的频谱。曲线(c)展示应用非线性函数之后的扩展频谱的实例。在此情况下,接受较高频率中可能发生的混叠。
曲线(d)展示频谱反转操作之后的频谱。曲线(e)展示向下取样的单一阶段之后的频谱,其中使取样速率以2为因数减小以获得所需频谱扩展信号。在此实例中,所述信号采取频谱反转形式,且可用于处理采取此形式的高频带信号S30的高频带编码器A200的实施方案中。
非线性函数计算器520产生的频谱扩展信号很可能随着频率增加而幅值明显降低。频谱扩展器A402包含频谱整平器540,其经配置以对经向下取样信号执行白化操作。频谱整平器540可经配置以执行固定白化操作或执行自适应白化操作。在自适应白化的特定实例中,频谱整平器540包含:LPC分析模块,其经配置以依据经向下取样信号计算一组四个滤波器系数;以及四次分析滤波器,其经配置以根据那些系数对信号进行白化。频谱扩展器A400的其它实施方案包含频谱整平器540在向下取样器530之前对频谱扩展信号操作的配置。
可实施高频带激励发生器A300以输出谐波扩展信号S160作为高频带激励信号S120。然而,在一些情况下,仅使用谐波扩展信号作为高频带激励可能导致可听到的假象。语音的谐波结构在高频带中通常不如低频带中明显,且在高频带激励信号中使用过多谐波结构可能导致嗡嗡声。此假象在来自女性说话者的语音信号中可能尤其明显。
实施例包含经配置以将谐波扩展信号S160与噪声信号混合的高频带激励发生器A300的实施方案。如图11所示,高频带激励发生器A302包含噪声发生器480,其经配置以产生随机噪声信号。在一个实例中,噪声发生器480经配置以产生单位方差白色伪随机噪声信号,但在其它实施方案中,噪声信号不需要为白色的且可具有随着频率变化的功率密度。噪声发生器480可能需要经配置以输出噪声信号作为确定性函数以便可在解码器处复制其状态。举例来说,噪声发生器480可经配置以输出噪声信号作为早先在相同帧内编码的信息(例如,窄频带滤波器参数S40和/或经编码窄频带激励信号S50)的确定性函数。
在与谐波扩展信号S160混合之前,噪声发生器480产生的随机噪声信号可经幅值调制以具有近似窄频带信号S20、高频带信号S30、窄频带激励信号S80或谐波扩展信号S160的随时间能量分布的时域包络。如图11所示,高频带激励发生器A302包含组合器470,其经配置以根据包络计算器460计算的时域包络对噪声发生器480产生的噪声信号进行幅值调制。举例来说,组合器470可实施为乘法器,其经配置以根据包络计算器460计算的时域包络来缩放噪声发生器480的输出以产生经调制噪声信号S170。
如图13的方块图所示,在高频带激励发生器A302的实施方案A304中,包络计算器460经配置以计算谐波扩展信号S160的包络。如图14的方块图所示,在高频带激励发生器A302的实施方案A306中,包络计算器460经配置以计算窄频带激励信号S80的包络。高频带激励发生器A302的另外的实施方案可以其它方式配置以根据窄频带音调脉冲的位置及时向谐波扩展信号S160加上噪声。
包络计算器460可经配置以作为一项包含一系列子任务的任务而执行包络计算。图15展示此任务的实例T100的流程图。子任务T110计算包络待建模的信号(例如,窄频带激励信号S80或谐波扩展信号S160)的帧的每一样本的平方以产生平方值序列。子任务T120对平方值序列执行平滑操作。在一个实例中,子任务T120根据以下表达式向序列应用一次IIR低通滤波器:
y(n)=ax(n)+(1-a)y(n-1),    (1)
其中x是滤波器输入,y是滤波器输出,n是时域索引,且a是具有0.5与1之间的值的平滑系数。平滑系数a的值可为固定的,或者在替代实施方案中,可根据输入信号中噪声的指示而自适应,使得在无噪声的情况下a较接近1,且在存在噪声的情况下较接近0.5。子任务T130将平方根函数应用于经平滑序列的每一样本以产生时域包络。
包络计算器460的此实施方案可经配置以按照串行和/或并行方式执行任务T100的各个子任务。在任务T100的另外的实施方案中,子任务T110之前可以是带通操作,其经配置以选择包络待建模的信号的所需频率部分,例如3-4 kHz范围。
组合器490经配置以将谐波扩展信号S160与经调制噪声信号S170混合以产生高频带激励信号S120。组合器490的实施方案可经配置(例如)以将高频带激励信号S120计算为谐波扩展信号S160与经调制噪声信号S170的和。组合器490的此实施方案可经配置以通过在求和之前向谐波扩展信号S160和/或向经调制噪声信号S170应用加权因数,而将高频带激励信号S120计算为加权总和。可根据一个或一个以上标准来计算每一此类加权因数,且所述加权因数可为固定值,或者在逐帧或逐子帧基础上计算出的自适应值。
图16展示组合器490的实施方案492的方块图,所述实施方案492经配置以将高频带激励信号S120计算为谐波扩展信号S160与经调制噪声信号S170的加权总和。组合器492经配置以根据谐波加权因数S180加权谐波扩展信号S160,根据噪声加权因数S190加权经调制噪声信号S170,并输出高频带激励信号S120作为被加权信号的总和。在此实例中,组合器492包含加权因数计算器550,其经配置以计算谐波加权因数S180和噪声加权因数S190。
加权因数计算器550可经配置以根据高频带激励信号S120中谐波含量与噪声含量的所需比率来计算加权因数S180和S190。举例来说,组合器492可能需要产生高频带激励信号S120以具有与高频带信号S30的谐波能量与噪声能量比类似的谐波能量与噪声能量比。在加权因数计算器550的一些实施方案中,根据与窄频带信号S20或窄频带残留信号的周期性有关的一个或一个以上参数(例如,音调增益和/或语音模式)来计算加权因数S180、S190。加权因数计算器550的此实施方案可经配置以向谐波加权因数S180指派(例如)与音调增益成比例的值,且/或对于清语音信号比对于浊语音信号向噪声加权因数S190指派更高的值。
在其它实施方案中,加权因数计算器550经配置以根据高频带信号S30的周期性的指标来计算谐波加权因数S180和/或噪声加权因数S190的值。在一个此类实例中,加权因数计算器550将谐波加权因数S180计算为高频带信号S30的当前帧或子帧的自相关系数的最大值,其中在包含一个音调滞后的延迟且不包含零样本的延迟的搜索范围上执行自相关。图17展示以一个音调滞后延迟为中心并具有不大于一个音调滞后的宽度的长度为n个样本的此搜索范围的实例。
图17还展示加权因数计算器550在若干阶段计算高频带信号S30的周期性的指标的另一方法的实例。在第一阶段,将当前帧划分为许多子帧,且针对每一子帧单独识别自相关系数为最大时的延迟。如上文所提及,在包含一个音调滞后的延迟且不包含零样本的延迟的搜索范围上执行自相关。
在第二阶段,通过将相应识别的延迟应用于每一子帧,连接所得的子帧以建立最佳延迟帧,并将谐波加权因数S180计算为原始帧与最佳延迟帧之间的相关系数,来建立延迟帧。在另一替代实施方案中,加权因数计算器550将谐波加权因数S180计算为第一阶段中针对每一子帧获得的最大自相关系数的平均值。加权因数计算器550的实施方案还可经配置以缩放相关系数,和/或将其与另一值组合,以计算谐波加权因数S180的值。
加权因数计算器550可能需要仅在以其它方式指示帧存在周期性的情况下计算高频带信号S30的周期性的指标。举例来说,加权因数计算器550可经配置以根据当前帧的周期性的另一指示符(例如,音调增益)与阈值之间的关系来计算高频带信号S30的周期性的指标。在一个实例中,加权因数计算器550经配置以仅当帧的音调增益(例如,窄频带残留的自适应密码本增益)的值大于0.5(或者,至少0.5)时才对高频带信号S30执行自相关运算。在另一实例中,加权因数计算器550经配置以仅针对具有特定语音模式状态的帧(例如,仅针对浊音信号)对高频带信号S30执行自相关运算。在此类情况下,加权因数计算器550可经配置以针对具有其它语音模式状态和/或较小的音调增益值的帧分派默认加权因数。
实施例包含经配置以根据不同于周期性或除周期性以外的特性来计算加权因数的加权因数计算器550的另外的实施方案。举例来说,此实施方案可经配置以针对具有大音调滞后的语音信号比针对具有小音调滞后的语音信号向噪声增益因数S190分派更大的值。加权因数计算器550的另一此类实施方案经配置以根据处于基频的倍数处的信号能量相对于处于其它频率分量处的信号能量的指标,来确定宽频带语音信号S10或高频带信号S30的谐度的指标。
宽频带语音编码器A100的一些实施方案经配置以基于本文描述的音调增益和/或周期性或谐度的另一指标,来输出周期性或谐度的指示(例如,指示帧为谐波还是非谐波的1位旗标)。在一个实例中,相应的宽频带语音解码器B100使用此指示来配置例如加权因数计算的操作。在另一实例中,此指示用于编码器和/或解码器处来计算语音模式参数的值。
可能需要高频带激励发生器A302产生高频带激励信号S120,使得激励信号的能量大致不受加权因数S180和S190的特定值的影响。在此情况下,加权因数计算器550可经配置以计算谐波加权因数S180或噪声加权因数S190的值(或从存储装置或高频带编码器A200的另一元件接收此值),并根据例如以下表达式导出另一加权因数的值:
(W谐波)2+(W噪声)2=1,    (2)
其中W谐波表示谐波加权因数S180,且W噪声表示噪声加权因数S190。或者,加权因数计算器550可经配置以根据当前帧或子帧的周期性测量的值从多对加权因数S180、S190中选出相应一者,其中所述对经预先计算以满足例如表达式(2)的恒定能量比。对于遵循表达式(2)的加权因数计算器550的实施方案,谐波加权因数S180的典型值在约0.7到约1.0范围内,且噪声加权因数S190的典型值在约0.1到约0.7范围内。加权因数计算器550的其它实施方案可经配置以根据依据谐波扩展信号S160与经调制噪声信号S170之间的所需基线加权修改的表达式(2)型式来操作。
当已使用稀疏密码本(条目大部分为零值的密码本)来计算残留的量化表示形式时,合成语音信号中可能发生假象。尤其当以低位速率编码窄频带信号时,会发生密码本稀疏。密码本稀疏引起的假象通常在时间上是准周期性的,且主要在3kHz以上发生。因为人耳在较高频率下具有较好的时间分辨能力,所以这些假象在高频带中可能较明显。
实施例包含经配置以执行抗稀疏滤波的高频带激励发生器A300的实施方案。图18展示高频带激励发生器A302的实施方案A312的方块图,所述实施方案A312包含抗稀疏滤波器600,其经配置以对反转量化器450产生的经解量化窄频带激励信号进行滤波。图19展示高频带激励发生器A302的实施方案A314的方块图,所述实施方案A314包含抗稀疏滤波器600,其经配置以对频谱扩展器A400产生的频谱扩展信号进行滤波。图20展示高频带激励发生器A302的实施方案A316的方块图,所述实施方案A316包含抗稀疏滤波器600,其经配置以对组合器490的输出进行滤波以产生高频带激励信号S120。当然,预期并在此明确地揭示将实施方案A304和A306的任一者的特征与实施方案A312、A314和A316的任一者的特征组合的高频带激励发生器A300的实施方案。抗稀疏滤波器600也可配置在频谱扩展器A400内:例如在频谱扩展器A402中的元件510、520、530和540的任一者之后。特别注意到,抗稀疏滤波器600也可用于频谱扩展器A400的执行频谱折叠、频谱转译或谐波扩展的实施方案。
抗稀疏滤波器600可经配置以改变其输入信号的相位。举例来说,抗稀疏滤波器600可能需要经配置和设置,使得高频带激励信号S120的相位随着时间随机化或其它方式更为均匀地分布。可能还需要抗稀疏滤波器600的响应为频谱整平的,使得经滤波信号的幅值频谱不会有相当大的改变。在一个实例中,抗稀疏滤波器600根据以下表达式实施为具有转移函数的全通滤波器:
H ( z ) = - 0.7 + z - 4 1 - 0.7 z - 4 · 0.6 + z - 6 1 + 0.6 z - 6 · - - - ( 3 )
此滤波器的一个作用可以是将输入信号的能量散布开使得其不再仅集中于几个样本中。
密码本稀疏引起的假象通常对于其中残留包含较少音调信息的类似噪声的信号较明显,且对于背景噪声中的语音也较明显。稀疏在激励具有长期结构的情况下通常引起较少假象,且事实上相位修改可引起浊音信号中的噪声。因此,可能需要配置抗稀疏滤波器600以对清音信号进行滤波并在不作出改变的情况下使至少一些浊音信号通过。清音信号的特征在于低音调增益(例如,量化窄频带自适应密码本增益)和接近零或为正的频谱倾斜(例如,量化第一反射系数),从而指示整平或随着频率的不断增加而向上倾斜的频谱包络。抗稀疏滤波器600的典型实施方案经配置以对清音(例如,如频谱倾斜的值所指示)进行滤波,当音调增益低于阈值(或者,不大于阈值)时对浊音进行滤波,且否则在不作出改变的情况下使信号通过。
抗稀疏滤波器600的另外的实施方案包含两个或两个以上滤波器,其经配置以具有不同的最大相位修改角(例如,高达180度)。在此情况下,抗稀疏滤波器600可经配置以根据音调增益(例如,量化自适应密码本或LTP增益)的值在这些组成滤波器中进行选择,以便将较大的最大相位修改角用于具有较低音调增益值的帧。抗稀疏滤波器600的实施方案还可包含不同的组成滤波器,其经配置以在频谱的或多或少的部分上修改相位,以便将经配置以在输入信号的较宽频率范围上修改相位的滤波器用于具有较低音调增益值的帧。
为了准确地复制经编码语音信号,可能需要使合成宽频带语音信号S100的高频带与窄频带部分的电平之间的比率类似于原始宽频带语音信号S10中的所述比率。除了高频带编码参数S60a表示的频谱包络外,高频带编码器A200还可经配置以通过指定时间或增益包络来表征高频带信号S30。如图10所示,高频带编码器A202包含高频带增益因数计算器A230,其经配置和设置以根据高频带信号S30与合成高频带信号S130之间的关系(例如,所述两个信号在帧或其某一部分上的能量之间的差或比率)来计算一个或一个以上增益因数。在高频带编码器A202的其它实施方案中,高频带增益计算器A230可同样地配置但改为经设置以根据高频带信号S30与窄频带激励信号S80或高频带激励信号S120之间的这种时间变化关系来计算增益包络。
窄频带激励信号S80和高频带信号S30的时间包络很可能类似。因此,编码基于高频带信号S30与窄频带激励信号S80(或从中导出的信号,例如高频带激励信号S120或合成高频带信号S130)之间的关系的增益包络通常将比编码仅基于高频带信号S30的增益包络有效。在典型实施方案中,高频带编码器A202经配置以输出为每一帧指定5个增益因数的8到12位的量化索引。
高频带增益因数计算器A230可经配置以作为一项包含一个或一个以上系列的子任务的任务而执行增益因数计算。图21展示根据高频带信号S30与合成高频带信号S130的相对能量计算相应子帧的增益值的任务的实例T200的流程图。任务220a和220b计算各个信号的相应子帧的能量。举例来说,任务220a和220b可经配置以将能量计算为各个子帧的样本的平方的和。任务T230将子帧的增益因数计算为那些能量的比率的平方根。在此实例中,任务T230将增益因数计算为子帧上高频带信号S30的能量与合成高频带信号S130的能量的比率的平方根。
高频带增益因数计算器A230可能需要经配置以根据开窗函数来计算子帧能量。图22展示增益因数计算任务T200的此实施方案T210的流程图。任务T215a将开窗函数应用于高频带信号S30,且任务T215b将相同开窗函数应用于合成高频带信号S130。任务220a和220b的实施方案222a和222b计算各自窗口的能量,且任务T230将子帧的增益因数计算为能量的比率的平方根。
可能需要应用与邻近子帧重叠的开窗函数。举例来说,可以重叠-相加方式应用的产生增益因数的开窗函数可帮助减小或避免子帧之间的不连续性。在一个实例中,高频带增益因数计算器A230经配置以应用如图23a所示的梯形开窗函数,其中窗口与两个邻近子帧的每一者重叠一毫秒。图23b展示将此开窗函数应用于20毫秒帧的五个子帧的每一者。高频带增益因数计算器A230的其它实施方案可经配置以应用具有不同重叠周期和/或不同窗口形状(例如,矩形、汉明)(其可对称或不对称)的开窗函数。高频带增益因数计算器A230的实施方案还可能经配置以将不同开窗函数应用于帧内的不同子帧和/或包含具有不同长度的子帧的帧。
提供以下值(没有限制)作为特定实施方案的实例。针对这些情况假定一个20毫秒的帧,但可使用任何其它持续时间。对于以7kHz取样的高频带信号,每一帧具有140个样本。如果将此帧划分为具有相等长度的五个子帧,那么每一子帧将具有28个样本,且如图23a所示的窗口将为42个样本宽。对于以8kHz取样的高频带信号,每一帧具有160个样本。如果此帧划分为具有相等长度的五个子帧,那么每一子帧将具有32个样本,且如图23a所示的窗口将为48个样本宽。在其它实施方案中,可使用具有任何宽度的子帧,且甚至高频带增益计算器A230的实施方案可能经配置以针对帧的每一样本产生不同的增益因数。
图24展示高频带解码器B200的实施方案B202的方块图。高频带解码器B202包含高频带激励发生器B300,其经配置以基于窄频带激励信号S80产生高频带激励信号S120。视特定系统设计选择而定,可根据本文描述的高频带激励发生器A300的实施方案的任一者来实施高频带激励发生器B300。通常,需要将高频带激励发生器B300实施为具有与特定编码系统的高频带编码器的高频带激励发生器相同的响应。然而,因为窄频带解码器B110通常将执行经编码窄频带激励信号S50的解量化,所以在大多数情况下,高频带激励发生器B300可经实施以从窄频带解码器B110接收窄频带激励信号S80,而不需要包含经配置以对经编码窄频带激励信号S50解量化的反转量化器。窄频带解码器B110也可能经实施以包含抗稀疏滤波器600的实例,其经配置以在将经解量化的窄频带激励信号输入到例如滤波器330等窄频带合成滤波器之前对所述信号进行滤波。
反转量化器560经配置以对高频带滤波器参数S60a(在此实例中为一组LSF)解量化,且LSF-LP滤波器系数变换570经配置以将LSF变换为一组滤波器系数(例如,如上文参照窄频带编码器A122的反转量化器240和变换250所描述)。在其它实施方案中,如上文所提及,可使用不同系数组(例如,倒谱系数)和/或系数表示形式(例如,ISP)。高频带合成滤波器B200经配置以根据高频带激励信号S120和所述组滤波器系数产生合成高频带信号。对于其中高频带编码器包含合成滤波器的系统(例如,如上述编码器A202的实例中),可能需要将高频带合成滤波器B200实施为具有与所述合成滤波器相同的响应(例如,相同转移函数)。
高频带解码器B202还包含经配置以对高频带增益因数S60b解量化的反转量化器580,和经配置和设置以将经解量化的增益因数应用于合成高频带信号以产生高频带信号S100的增益控制元件590(例如,乘法器或放大器)。对于其中帧的增益包络由一个以上增益因数指定的情况,增益控制元件590可包含经配置以可能根据开窗函数将增益因数应用于各个子帧的逻辑,所述开窗函数可与由相应高频带编码器的增益计算器(例如,高频带增益计算器A230)应用的开窗函数相同或不同。在高频带解码器B202的其它实施方案中,增益控制元件590经类似地配置但经设置以改为将经解量化的增益因数应用于窄频带激励信号S80或应用于高频带激励信号S120。
如上文所提及,可能需要在高频带编码器与高频带解码器中获得相同状态(例如,通过在编码期间使用经解量化值)。因此,可能需要在根据此实施方案的编码系统中确保高频带激励发生器A300和B300中的相应噪声发生器具有相同状态。举例来说,此实施方案的高频带激励发生器A300和B300可经配置而使得噪声发生器的状态是相同帧内已编码的信息(例如,窄频带滤波器参数S40或其一部分,和/或经编码窄频带激励信号S50或其一部分)的确定性函数。
本文描述的元件的量化器中的一者或一者以上(例如,量化器230、420或430)可经配置以执行分类向量量化。举例来说,此量化器可经配置以基于窄频带信道中和/或高频带信道中的相同帧内已编码的信息从一组密码本中选出一个密码本。此技术通常以存储额外的密码本为代价提供增加的编码效率。
如上文参看例如图8和9所论述,在从窄频带语音信号S20中去除粗略频谱包络之后,相当大量的周期性结构可能保留在残留信号中。举例来说,残留信号可随时间而含有粗略周期性脉冲或尖峰信号序列。此结构(通常与音调有关)尤其有可能发生在浊音语音信号中。窄频带残留信号的量化表示形式的计算可包含根据由(例如)一个或一个以上密码本表示的长期周期性的模型来编码此音调结构。
实际残留信号的音调结构可能不与周期性模型完全匹配。举例来说,残留信号可能包含音调脉冲的位置规则性的较小抖动,使得帧中连续音调脉冲之间的距离不完全相等且所述结构并非相当规则。这些不规则性往往会降低编码效率。
窄频带编码器A120的一些实施方案经配置以通过在量化之前或期间将自适应时间偏差应用于残留,或通过以其它方式在经编码激励信号中包含自适应时间偏差,来执行音调结构的规则化。举例来说,此编码器可经配置以选择或以其它方式计算时间偏差的程度(例如,根据一个或一个以上感知加权和/或误差最小化标准),使得所得的激励信号与长期周期性的模型最佳拟和。音调结构的规则化由称为松弛代码激励线性预测(RCELP)编码器的CELP编码器子组执行。
RCELP编码器通常经配置以执行时间偏差作为自适应时移。此时移可为负几毫秒到正几毫秒范围的延迟,且其通常平滑地变化以避免可听到的不连续性。在一些实施方案中,此编码器经配置以用分段方式应用规则化,其中每一帧或子帧偏差相应的固定时移。在其它实施方案中,编码器经配置以应用规则化作为连续偏差函数,使得帧或子帧根据音调轮廓(也称为音调轨迹)而偏差。在一些情况下(例如,如第2004/0098255号美国专利申请公开案中所描述),编码器经配置以通过将偏移应用于用于计算经编码激励信号的感知加权输入信号而在经编码激励信号中包含时间偏差。
编码器计算规则化和量化的经编码激励信号,且解码器对经编码激励信号解量化以获得用于合成经解码语音信号的激励信号。经解码输出信号因此展现出与通过规则化而包含在经编码激励信号中的延迟相同的变化的延迟。通常,不将任何指定规则化量的信息传输到解码器。
规则化往往使残留信号较易编码,这改进了来自长期预测器的编码增益且因此推进了总体编码效率,而通常不会产生假象。可能需要仅对浊音帧执行规则化。举例来说,窄频带编码器A124可经配置以仅偏移那些具有长期结构(例如,浊音信号)的帧或子帧。甚至可能需要仅对包含音调脉冲能量的子帧执行规则化。第5,704,003号美国专利(Kleijn等人)和第6,879,955号美国专利(Rao)和第2004/0098255号美国专利申请公开案(Kovesi等人)中描述了RCELP编码的各种实施方案。RCELP编码器的现有实施方案包含如电信工业协会(TIA)IS-127中所描述的增强可变速率编译码器(EVRC),和第三代合作伙伴关系计划2(3GPP2)可选模式声码器(SMV)。
遗憾的是,规则化对于其中从经编码窄频带激励信号导出高频带激励的宽频带语音编码器(例如,包含宽频带语音编码器A100和宽频带语音解码器B100的系统)可能导致若干问题。由于高频带激励信号是从时间偏差信号导出的,所以高频带激励信号通常将具有与原始高频带语音信号的时间特性不同的时间特性。换句话说,高频带激励信号将不再与原始高频带语音信号同步。
偏差高频带激励信号与原始高频带语音信号之间的时间上的不对准可能引起若干问题。举例来说,偏差高频带激励信号可能不再为根据从原始高频带语音信号提取的滤波器参数配置的合成滤波器提供适宜的源激励。因此,合成高频带信号可含有减小经解码宽频带语音信号感知质量的可听假象。
时间上的不对准还可能引起增益包络编码的低效率。如上文所提及,窄频带激励信号S80与高频带信号S30的时间包络之间很可能存在相关。通过根据这两个时间包络之间的关系编码高频带信号的增益包络,与直接编码增益包络相比可实现编码效率的提高。然而,当经编码窄频带激励信号规则化时,此相关可能削弱。窄频带激励信号S80与高频带信号S30之间的时间上的不对准可导致高频带增益因数S60b中出现波动,且编码效率可能降低。
实施例包含根据相应经编码窄频带激励信号中包含的时间偏差对高频带语音信号执行时间偏差的宽频带语音编码方法。此类方法的潜在优点包含改进经解码宽频带语音信号的质量和/或改进编码高频带增益包络的效率。
图25展示宽频带语音编码器A100的实施方案AD10的方块图。编码器AD10包含窄频带编码器A120的实施方案A124,所述实施方案A124经配置以在计算经编码窄频带激励信号S50期间执行规则化。举例来说,窄频带编码器A124可根据上文论述的RCELP实施方案中的一者或一者以上配置。
窄频带编码器A124还经配置以输出指定所应用的时间偏差的程度的规则化数据信号SD10。对于窄频带编码器A124经配置以将固定时移应用于每一帧或子帧的各种情况,规则化数据信号SD10可包含一系列值,其以样本、毫秒或某一其它时间增量为单位将每一时移量指示为整数或非整数值。对于窄频带编码器A124经配置以用其它方式修改帧或其它样本序列的时间标度(例如,通过压缩一个部分并扩展另一部分)的情况,规则化信息信号SD10可包含对修改的相应描述,例如一组函数参数。在一个特定实例中,窄频带编码器A124经配置以将帧划分为三个子帧并计算每一子帧的固定时移,使得规则化数据信号SD10指示经编码窄频带信号的每一规则化帧的三个时移量。
宽频带语音编码器AD10包含延迟线D120,其经配置以根据由输入信号指示的延迟量来推进或阻滞高频带语音信号S30的若干部分,从而产生时间偏差高频带语音信号S30a。在图25所示的实例中,延迟线D120经配置以根据由规则化数据信号SD10指示的偏差来对高频带语音信号S30执行时间偏差。以此方式,经编码窄频带激励信号S50中包含的相同时间偏差量也在分析之前应用于高频带语音信号S30的相应部分。尽管此实例将延迟线D120展示为高频带编码器A200的单独元件,但在其它实施方案中,延迟线D120配置为高频带编码器的一部分。
高频带编码器A200的另外的实施方案可经配置以执行未偏差高频带语音信号S30的频谱分析(例如,LPC分析),并在计算高频带增益参数S60b之前执行高频带语音信号S30的时间偏差。此编码器可包含(例如)经配置以执行时间偏差的延迟线D120的实施方案。然而,在此类情况下,基于对未偏差信号S30的分析的高频带滤波器参数S60a可描述与高频带激励信号S120在时间上不对准的频谱包络。
延迟线D120可根据适于将所需时间偏差操作应用于高频带语音信号S30的逻辑元件与存储元件的任何组合来配置。举例来说,延迟线D120可经配置以根据所需的时移从缓冲器中读取高频带语音信号S30。图26a展示延迟线D120的此实施方案D122的示意图,所述延迟线D120包含移位寄存器SR1。移位寄存器SR1是经配置以接收和存储高频带语音信号S30的m个最新近样本的具有大约长度m的缓冲器。值m至少等于将支持的最大正(或“推进”)与负(或“阻滞”)时移的总和。值m等于高频带信号S30的帧或子帧的长度可能会较方便。
延迟线D122经配置以从移位寄存器SR1的偏移位置OL输出时间偏差高频带信号S30a。偏移位置OL的定位根据由例如规则化数据信号SD10指示的当前时移而在参考位置(零时移)附近变化。延迟线D122可经配置以支持相等的推进和阻滞限制,或者一个限制大于另一限制,使得可在一个方向上比在另一方向上执行更大偏移。图26a展示支持的正时移大于负时移的特定实例。延迟线D122可经配置以一次输出一个或一个以上样本(例如视输出总线宽度而定)。
具有大于几毫秒的量值的规则化时移可引起经解码信号中的可听到的假象。通常,由窄频带编码器A124执行的规则化时移的量值将不超过几毫秒,使得由规则化数据信号SD10指示的时移将有限。然而,在此类情况下可能需要延迟线D122经配置以对正和/或负方向上的时移强加最大限制(例如,以遵循比窄频带编码器强加的限制更为严格的限制)。
图26b展示延迟线D122的实施方案D124的示意图,延迟线D122包含移位窗口SW。在此实例中,偏移位置OL的定位受移位窗口SW限制。尽管图26b展示缓冲器长度m大于移位窗口SW的宽度的情况,但延迟线D124也可经实施使得移位窗口SW的宽度等于m。
在其它实施方案中,延迟线D120经配置以根据所需时移将高频带语音信号S30写入到缓冲器。图27展示延迟线D120的实施方案D130的示意图,所述实施方案D130包含经配置以接收和存储高频带语音信号S30的两个移位寄存器SR2和SR3。延迟线D130经配置以根据例如由规则化数据信号SD10指示的时移而将来自移位寄存器SR2的帧或子帧写入到移位寄存器SR3。移位寄存器SR3配置为FIFO缓冲器,其经配置以输出时间偏差高频带信号S30。
在图27所示的特定实例中,移位寄存器SR2包含帧缓冲器部分FB1和延迟缓冲器部分DB,且移位寄存器SR3包含帧缓冲器部分FB2、推进缓冲器部分AB和阻滞缓冲器部分RB。推进缓冲器AB和阻滞缓冲器RB的长度可相等,或者其中一者可大于另一者,使得所支持的一个方向上的偏移大于所支持的另一方向上的偏移。延迟缓冲器DB和阻滞缓冲器部分RB可经配置以具有相同长度。或者,延迟缓冲器DB可比阻滞缓冲器RB短以考虑到将样本从帧缓冲器FB1转移到移位寄存器SR3所需的时间间隔,所述转移可包含例如在存储到移位寄存器SR3之前先使样本偏差的其它处理操作。
在图27的实例中,帧缓冲器FB1经配置以具有与高频带信号S30的一个帧的长度相等的长度。在另一实例中,帧缓冲器FB1经配置以具有与高频带信号S30的一个子帧的长度相等的长度。在此情况下,延迟线D130可经配置以包含用于将相同(例如,平均)延迟应用于待偏移的帧的所有子帧的逻辑。延迟线D130还可包含用于将来自帧缓冲器FB1的值与阻滞缓冲器RB或推进缓冲器AB中待重写的值进行平均的逻辑。在另一实例中,移位寄存器SR3可经配置以仅经由帧缓冲器FB1接收高频带信号S30的值,且在此情况下,延迟线D130可包含用于在写入到移位寄存器SR3的连续帧或子帧之间的间隙上进行内插的逻辑。在其它实施方案中,延迟线D130可经配置以在将来自帧缓冲器FB1的样本写入到移位寄存器SR3之前对所述样本执行偏差操作(例如,根据由规则化数据信号SD10描述的函数)。
延迟线D120可能需要应用基于但不等同于由规则化数据信号SD10指定的偏差的时间偏差。图28展示宽频带语音编码器AD10的实施方案AD12的方块图,宽频带语音编码器AD10包含延迟值映射器D110。延迟值映射器D110经配置以将由规则化数据信号SD10指示的偏差映射为经映射延迟值SD10a。延迟线D120经配置以根据由经映射延迟值SD10a指示的偏差来产生时间偏差高频带语音信号S30a。
可预期窄频带编码器应用的时移随时间平滑地进展。因此,通常计算语音帧期间应用于子帧的平均窄频带时移并根据此平均值来偏移高频带语音信号S30的相应帧已足够。在一个此类实例中,延迟值映射器D110经配置以计算每一帧的子帧延迟值的平均值,且延迟线D120经配置以将计算出的平均值应用于高频带信号S30的相应帧。在其它实例中,可计算和应用较短周期(例如,两个子帧,或半个帧)或较长周期(例如,两个帧)内的平均值。在平均值是样本的非整数值的情况下,延迟值映射器D110可经配置以在将所述值输出到延迟线D120之前将所述值四舍五入为样本的整数数目。
窄频带编码器A124可经配置以在经编码窄频带激励信号中包含非整数数目的样本的规则化时移。在此情况下,延迟值映射器D110可能需要经配置以将窄频带时移四舍五入为样本的整数数目,且延迟线D120可能需要将经四舍五入的时移应用于高频带语音信号S30。
在宽频带语音编码器AD10的一些实施方案中,窄频带语音信号S20与高频带语音信号S30的取样速率可能不同。在此类情况下,延迟值映射器D110可经配置以调节规则化数据信号SD10中指示的时移量,以考虑窄频带语音信号S20(或窄频带激励信号S80)与高频带语音信号S30的取样速率之间的差异。举例来说,延迟值映射器D110可经配置以根据取样速率的比率缩放时移量。在上文提及的一个特定实例中,以8kHz对窄频带语音信号S20进行取样,且以7kHz对高频带语音信号S30进行取样。在此情况下,延迟值映射器D110经配置以将每一偏移量乘以7/8。延迟值映射器D110的实施方案还可经配置以执行此缩放运算以及本文描述的整数四舍五入和/或时移平均运算。
在另外的实施方案中,延迟线D120经配置以用其它方式修改帧或其它样本序列的时间标度(例如,通过压缩一个部分并扩展另一部分)。举例来说,窄频带编码器A124可经配置以根据例如音调轮廓或轨迹的函数来执行规则化。在此情况下,规则化数据信号SD10可包含对所述函数的相应描述(例如一组参数),且延迟线D120可包含经配置以根据所述函数对高频带语音信号S30的帧或子帧执行偏差的逻辑。在其它实施方案中,延迟值映射器D110经配置以在将所述函数通过延迟线D120应用于高频带语音信号S30之前对所述函数进行平均、缩放和/或四舍五入。举例来说,延迟值映射器D110可经配置以根据所述函数计算一个或一个以上延迟值,每一延迟值指示样本数目,其接着由延迟线D120应用以对高频带语音信号S30的一个或一个以上相应帧或子帧执行时间偏差。
图29展示根据相应经编码窄频带激励信号中包含的时间偏差对高频带语音信号执行时间偏差的方法MD100的流程图。任务TD100处理宽频带语音信号以获得窄频带语音信号和高频带语音信号。举例来说,任务TD100可经配置以使用具有低通滤波器和高通滤波器的滤波器组(例如滤波器组A110的实施方案)对宽频带语音信号进行滤波。任务TD200将窄频带语音信号至少编码为经编码的窄频带激励信号和多个窄频带滤波器参数。所述经编码的窄频带激励信号和/或滤波器参数可量化,且经编码的窄频带激励信号还可包含例如语音模式参数的其它参数。任务TD200还包含经编码的窄频带激励信号中的时间偏差。
任务TD300基于窄频带激励信号产生高频带激励信号。在此情况下,窄频带激励信号基于经编码的窄频带激励信号。任务TD400根据至少所述高频带激励信号,将高频带语音信号至少编码为多个高频带滤波器参数。举例来说,任务TD400可经配置以将高频带语音信号编码为多个量化LSF。任务TD500将时移应用于高频带语音信号,所述时移基于与经编码窄频带激励信号中包含的时间偏差有关的信息。
任务TD400可经配置以对高频带语音信号执行频谱分析(例如,LPC分析),且/或计算高频带语音信号的增益包络。在此类情况下,任务TD500可经配置以在所述分析和/或增益包络计算之前将时移应用于高频带语音信号。
宽频带语音编码器A100的其它实施方案经配置以将由经编码窄频带激励信号中包含的时间偏差引起的高频带激励信号S120的时间偏差反转。举例来说,高频带激励发生器A300可经实施以包含延迟线D120的实施方案,延迟线D120的所述实施方案经配置以接收规则化数据信号SD10或经映射延迟值SD10a,并将相应的反转时移应用于窄频带激励信号S80,且/或应用于基于所述窄频带激励信号S80的随后信号(例如,谐波扩展信号S160或高频带激励信号S120)。
另外的宽频带语音编码器实施方案可经配置以彼此独立地对窄频带语音信号S20和高频带语音信号S30进行编码,使得高频带语音信号S30被编码为高频带频谱包络和高频带激励信号的表示形式。此实施方案可经配置以根据与经编码窄频带激励信号中包含的时间偏差有关的信息对高频带残留信号执行时间偏差,或用其它方式将时间偏差包含在经编码高频带激励信号中。举例来说,高频带编码器可包含本文描述的经配置以将时间偏差应用于高频带残留信号的延迟线D120和/或延迟值映射器D110的实施方案。此操作的潜在优点包含对高频带残留信号的较有效编码,和合成窄频带与高频带语音信号之间的较好匹配。
如上文所提及,高频带编码器A202可包含高频带增益因数计算器A230,其经配置以根据高频带信号S30与基于窄频带信号S20的信号(例如,窄频带激励信号S80、高频带激励信号S120或合成高频带信号S130)之间的时间变化关系来计算一系列增益因数。
图33a展示高频带增益因数计算器A230的实施方案A232的方块图。高频带增益因数计算器A232包含经设置以计算第一信号的包络的包络计算器G10的实施方案G10a,和经设置以计算第二信号的包络的包络计算器G10的实施方案G10b。包络计算器G10a和G10b可能相同,或者可能是包络计算器G10的不同实施方案的实例。在一些情况下,包络计算器G10a和G10b可实施为经配置以在不同时间处理不同信号的相同结构。
包络计算器G10a和G10b每一者可经配置以计算幅值包络(例如,根据绝对值函数)或能量包络(例如,根据平方函数)。通常,每一包络计算器G10a、G10b经配置以计算相对于输入信号二次取样的包络(例如,针对输入信号的每一帧或子帧具有一个值的包络)。如上文参看(例如)图21-23b所描述,包络计算器G10a和/或G10b可经配置以根据开窗函数来计算包络,所述开窗函数可经设置以使邻近的子帧重叠。
因数计算器G20经配置以根据两个包络之间随时间的时间变化关系来计算一系列增益因数。在上文描述的一个实例中,因数计算器G20将每一增益因数计算为相应的子帧上的包络的比率的平方根。或者,因数计算器G20可经配置以基于包络之间的距离(例如,相应的子帧期间包络之间的差或带符号的平方差)来计算每一增益因数。可能需要配置因数计算器G20以按照分贝或其它对数缩放形式来输出计算出的增益因数的值。
图33b展示包含高频带增益因数计算器A232的一般化设置的方块图,其中包络计算器G10a经设置以计算基于窄频带信号S20的信号的包络,包络计算器G10b经设置以计算高频带信号S30的包络,且因数计算器G20经配置以输出高频带增益因数S60b(例如,到量化器)。在此实例中,包络计算器G10a经设置以计算从中间处理P1接收的信号的包络,所述中间处理P1可包含如本文所描述的经配置以执行窄频带激励信号S80的计算、高频带激励信号S120的产生和/或高频带信号S130的合成的结构。为了方便,以下描述假定包络计算器G10a经设置以计算合成高频带信号S130的包络,但明确地预期并在此揭示包络计算器G10a经设置以改为计算窄频带激励信号S80或高频带激励信号S120的包络的实施方案。
高频带信号S30与合成高频带信号S130之间的类似程度可指示经解码高频带信号S100将与高频带信号S30类似的程度。明确地说,高频带信号S30与合成高频带信号S130的时间包络之间的类似性可指示经解码高频带信号S100可预期具有良好的声音质量并感觉上类似于高频带信号S30。
可预期窄频带激励信号S80和高频带信号S30的包络形状将随时间类似,且因此高频带增益因数S60b之间将发生相对较少的变化。事实上,包络之间的关系的随时间的较大变化(例如,包络之间的比率或距离的较大变化)或基于包络的增益因数之间的随时间的较大变化,可被看作合成高频带信号S130与高频带信号S30有很大差异的指示。举例来说,此变化可指示高频带激励信号S120是所述时间周期内的实际高频带残留信号的不良匹配。在任何情况下,包络之间或增益因数之间的关系随时间的较大变化可指示经解码高频带信号S100与高频带信号S30的听起来的差异将达到无法接受的程度。
可能需要检测合成高频带信号S130的时间包络与高频带信号S30的时间包络之间的关系(例如,包络之间的比率或距离)随时间的显著变化,并相应地降低对应于所述周期的高频带增益因数S60b的电平。高频带编码器A202的另外的实施方案经配置以根据包络之间的关系的随时间的变化和/或增益因数之间随时间的变化来衰减高频带增益因数S60b。图34展示高频带编码器A202的实施方案A203的方块图,所述实施方案A203包含增益因数衰减器G30,其经配置以在量化之前自适应地衰减高频带增益因数S60b。
图35展示包含高频带增益因数计算器A232和增益因数衰减器G30的实施方案G32的设置的方块图。增益因数衰减器G32经配置以根据高频带信号S30的包络与合成高频带信号S130的包络之间的关系的随时间的变化(例如,包络之间的比率或距离的随时间的变化)来衰减高频带增益因数S60-1。增益因数衰减器G32包含变化计算器G40,其经配置以估计所述关系在所需时间间隔内的变化(例如,连续增益因数之间,或在当前帧内)。举例来说,变化计算器G40可经配置以计算当前帧内包络之间的连续距离的平方差的总和。
增益因数衰减器G32包含因数计算器G50,其经配置以根据计算出的变化来选择或以其它方式计算衰减因数值。增益因数衰减器G32还包含组合器(例如,乘法器或加法器),其经配置以将衰减因数施加到高频带增益因数S60-1以获得高频带增益因数S60-2,所述高频带增益因数S60-2接着可经量化以用于存储或传输。对于变化计算器G40经配置以针对每对包络值产生计算出的变化的各自值(例如,作为包络之间的当前距离与先前或随后距离之间的平方差)的情况,增益控制元件可经配置以将各自衰减因数施加到每一增益因数。对于变化计算器G40经配置以针对每一组包络值对产生计算出的变化的一个值(例如,针对当前帧的包络值对的一个计算出的变化)的情况,增益控制元件可经配置以将相同衰减因数施加到一个以上相应的增益因数,例如施加到相应帧的每一增益因数。在典型实例中,衰减因数的值可在零dB的最小量值到6dB的最大量值(或者,因数1到因数0.25)范围内,但可使用任何其它所需的范围。注意到,以dB形式表示的衰减因数值可具有正值,使得衰减运算可包含从各自增益因数中减去衰减因数值;或可具有负值,使得衰减运算可包含将衰减因数值与各自增益因数相加。
因数计算器G50可经配置以从一组离散衰减因数值中选择一个衰减因数值。举例来说,因数计算器G50可经配置以根据计算出的变化与一个或一个以上阈值之间的关系来选择相应的衰减因数值。图36a展示计算出的变化值的域根据阈值T1到T3而映射到一组离散衰减因数值V0到V3的此实例的曲线。
或者,因数计算器G50可经配置以将衰减因数值计算为计算出的变化的函数。图36b展示从计算出的变化映射到在域L1到L2内为线性的衰减因数值的此实例的曲线,其中L0是计算出的变化的最小值,L3是计算出的变化的最大值,且L0<=L1<=L2<=L3。在此实例中,小于(或者,不大于)L1的计算出的变化值映射到最小衰减因数值V0(例如,0dB),且大于(或者,不小于)L3的计算出的变化值映射到最大衰减因数值V1(例如,6dB)。L1与L2之间的计算出的变化值的域线性映射到V0与V1之间的衰减因数值范围。在其它实施方案中,因数计算器G50经配置以在域L1到L2的至少一部分上应用非线性映射(例如,S形、多项式或指数函数)。
可能需要以限制所得的增益包络的不连续性的方式来实施增益因数衰减。在一些实施方案中,因数计算器G50经配置以限制衰减因数值一次可变化(例如,从一个帧或子帧到下一帧或子帧)的程度。举例来说,对于如图36a所示的递增映射,因数计算器G50可经配置以将衰减因数值从一个衰减因数值向下一衰减因数值改变不多于最大数目的增量(例如,一个或两个)。对于如图36b所示的非递增映射,因数计算器G50可经配置以将衰减因数值从一个衰减因数值向下一衰减因数值改变不多于最大量(例如,3dB)。在另一实例中,因数计算器G50可经配置以允许衰减因数值的增加速度比减小速度快。此特征可允许高频带增益因数快速衰减以掩蔽包络失配,并允许较慢恢复以减小不连续性。
高频带信号S30的包络与合成高频带信号S130的包络之间的关系的随时间变化的程度还可由高频带增益因数S60b的值之间的波动来指示。增益因数之间随时间缺乏变化可指示信号随时间具有类似包络并具有类似电平波动。增益因数之间随时间的较大变化可指示两个信号的包络之间具有显著差异,且因此相应的经解码高频带信号S100的预期质量较差。高频带编码器A202的另外的实施方案经配置以根据增益因数之间的波动程度来衰减高频带增益因数S60b。
图37展示包含高频带增益因数计算器A232和增益因数衰减器G30的实施方案G34的设置的方块图。增益因数衰减器G34经配置以根据高频带增益因数之间的随时间的变化来衰减高频带增益因数S60-1。增益因数衰减器G34包含变化计算器G60,其经配置以估计当前子帧或帧内增益因数之间的波动。举例来说,变化计算器G60可经配置以计算当前帧内连续高频带增益因数S60-1之间的平方差的总和。
在如图23a和23b所示的一个特定实例中,针对每帧的五个子帧的每一者计算高频带增益因数S60b。在此情况下,变化计算器G60可经配置以将增益因数之间的变化计算为帧的连续增益因数之间的四个差的平方的总和。或者,所述总和还可包含所述帧的第一增益因数与先前帧的最后增益因数之间的差的平方,和/或所述帧的最后增益因数与下一帧的第一增益因数之间的差的平方。在另一实施方案(例如,增益因数未经对数缩放的实施方案)中,变化计算器G60可经配置以基于连续增益因数的比率而不是差来计算变化。
增益因数衰减器G34包含如上所述的因数计算器G50的实例,因数计算器G50经配置以根据计算出的变化来选择或以其它方式计算衰减因数。在一个实例中,因数计算器G50经配置以根据例如以下表达式来计算衰减因数值fa
fa=0.8+0.5v,
其中v是由变化计算器G60产生的计算出的变化。在此实例中,可能需要缩放或以其它方式限制v的值使其不大于0.4,使得fa的值将不超过单位一。还可能需要对fa的值进行对数缩放(例如,以获得以dB表示的值)。
增益因数衰减器G34还包含组合器(例如,乘法器或加法器),其经配置以将衰减因数施加到高频带增益因数S60-1以获得高频带增益因数S60-2,所述高频带增益因数S60-2接着可经量化以用于存储或传输。对于变化计算器G60经配置以针对每一增益因数产生计算出的变化的各自值(例如,基于所述增益因数与先前或后续增益因数之间的平方差)的情况,增益控制元件可经配置以将各自衰减因数施加到每一增益因数。对于变化计算器G60经配置以针对每一组增益因数产生计算出的变化的一个值(例如,针对当前帧的一个计算出的变化)的情况,增益控制元件可经配置以将相同衰减因数施加到一个以上相应的增益因数,例如施加到相应帧的每一增益因数。在典型实例中,衰减因数的值可在零dB的最小量值到6dB的最大量值(或者,因数1到因数0.25,或因数1到因数0)范围内,但可使用任何其它所需的范围。注意到,以dB形式表示的衰减因数值可具有正值,使得衰减运算可包含从各自增益因数中减去衰减因数值;或可具有负值,使得衰减运算可包含将衰减因数值与各自增益因数相加。
再次注意到,虽然以上描述假定包络计算器G10a经配置以计算合成高频带信号S130的包络,但在此明确地预期并揭示包络计算器G10a经配置以改为计算窄频带激励信号S80或高频带激励信号S120的包络的设置。
在其它实施方案中,高频带增益因数S60b的衰减(例如,解量化之后)由高频带解码器B200的实施方案根据如解码器处计算出的增益因数之间的变化来执行。举例来说,图38展示高频带解码器B202的实施方案B204的方块图,所述实施方案B204包含如上所述的增益因数衰减器G34的实例。在另外的实施方案中,可改为将经解量化和衰减的增益因数施加到窄频带激励信号S80或高频带激励信号S120。
图39展示根据一实施例的信号处理方法GM10的流程图。任务GT10计算(A)基于语音信号的低频部分的包络与(B)基于所述语音信号的高频部分的包络之间的关系的随时间的变化。任务GT20根据包络之间的时间变化关系来计算多个增益因数。任务GT30根据计算出的变化来衰减增益因数中的至少一者。在一个实例中,计算出的变化是所述多个增益因数中连续的增益因数之间的平方差的总和。
如上所述,增益因数的相对较大变化可指示窄频带与高频带残留信号之间的失配。然而,增益因数之间也可能由于其它原因而发生变化。举例来说,可以逐个子帧的方式而不是逐个样本的方式执行增益因数值的计算。即使在使用重叠开窗函数的情况下,增益包络的取样速率减小也可能导致邻近的子帧之间的电平在感觉上有明显的波动。估计增益因数时的其它不准确性也可能导致经解码高频带信号S100的过分的电平波动。尽管此类增益因数变化在量值上可能小于触发如上所述的增益因数衰减的变化,但其仍然可导致经解码信号的不良的有噪声且失真的质量。
可能需要对高频带增益因数S60b执行平滑。图40展示高频带编码器A202的实施方案A205的方块图,所述实施方案A205包含增益因数平滑器G80,其经设置以在量化之前对高频带增益因数S60b执行平滑。通过减小增益因数之间随时间的波动,增益因数平滑操作可有助于经解码信号的较高感知质量和/或增益因数的较有效量化。
图41展示增益因数平滑器G80的实施方案G82的方块图,所述实施方案G82包含延迟元件F20、两个加法器和一乘法器。增益因数平滑器G82经配置以根据例如以下最小延迟表达式对高频带增益因数进行滤波:
y(n)=βy(n-1)+(1-β)x(n),    (4)
其中x表示输入值,y表示输出值,n表示时间索引,且β表示平滑因数F10。如果平滑因数β的值为零,那么不发生平滑。如果平滑因数β的值为最大,那么发生最大程度的平滑。增益因数平滑器G82可经配置以使用0与1之间的平滑因数F10的任何所需值,但可能优选地改为使用0与0.5之间的值,使得被最大程度平滑的值包含来自当前和先前平滑值的相等基值。
注意到,表达式(4)可等同地表达和实施为:
y(n)=(1-λ)y(n-1)+λx(n),    (4b)
其中如果平滑因数λ的值为一,那么不发生平滑,而如果平滑因数λ的值为最小,那么发生最大程度的平滑。预期并在此揭示,此原理适用于如本文描述的增益因数平滑器G82的其它实施方案,以及适用于增益因数平滑器G80的其它IIR和/或FIR实施方案。
增益因数平滑器G82可经配置以施加具有固定值的平滑因数F10。或者,可能需要对增益因数执行自适应平滑而不是固定平滑。举例来说,可能需要保持增益因数之间的较大变化,所述变化可指示增益包络的感觉上显著的特征。对此类变化的平滑本身可导致经解码信号中的假象,例如增益包络的拖尾效应。
在另一实施方案中,增益因数平滑器G80经配置以执行根据增益因数之间计算出的变化的量值来自适应的平滑操作。举例来说,增益因数平滑器G80的此实施方案可经配置以在当前与先前估计出的增益因数之间的距离相对较大时执行较少平滑(例如,使用较低的平滑因数值)。
图42展示增益因数平滑器G82的实施方案G84的方块图,所述实施方案G84包含延迟元件F30和因数计算器F40,所述因数计算器F40经配置以根据增益因数之间的变化的量值来计算平滑因数F10的可变实施方案F12。在此实例中,因数计算器F40经配置以根据当前与先前增益因数之间的差的量值来选择或以其它方式计算平滑因数F12。在增益因数平滑器G82的其它实施方案中,因数计算器F40可经配置以根据当前与先前增益因数之间的不同的距离的量值或比率来选择或另外计算平滑因数F12。
因数计算器F40可经配置以在一组离散平滑因数值中选择一个平滑因数值。举例来说,因数计算器F40可经配置以根据计算出的变化的量值与一个或一个以上阈值之间的关系来选择相应的平滑因数值。图43a展示计算出的变化值的域根据阈值T1到T3而映射到一组离散平滑因数值V0到V3的此实例的曲线。
或者,因数计算器F40可经配置以将平滑因数值计算为计算出的变化的量值的函数。图43b展示从计算出的变化到在域L1到L2内为线性的平滑因数值的映射的此实例的曲线,其中L0是计算出的变化的量值的最小值,L3是计算出的变化的量值的最大值,且L0<=L1<=L2<=L3。在此实例中,小于(或者,不大于)L1的计算出的变化量值映射到最小平滑因数值V0(例如,0dB),且大于(或者,不小于)L3的计算出的变化量值映射到最大平滑因数值V1(例如,6dB)。L1与L2之间的计算出的变化量值的域线性映射到V0与V1之间的平滑因数值范围。在其它实施方案中,因数计算器F40经配置以在域L1到L2的至少一部分上应用非线性映射(例如,S形、多项式或指数函数)。在一个实例中,平滑因数的值在最小0到最大0.5范围内,但可使用0与0.5之间或0与1之间的任何其它所需范围。
在一个实例中,因数计算器F40经配置以根据例如以下表达式来计算平滑因数F12的值vs
v s = 0.4 1 + 1.5 d a ,
其中da的值基于当前与先前增益因数值之间的差的量值。举例来说,da的值可计算为当前与先前增益因数值的绝对值或计算为其平方。
在另一实施方案中,如上所述从输入到衰减器G30之前的增益因数值中计算出da的值,且将所得的平滑因数施加到从衰减器G30输出之后的增益因数值。举例来说,在此情况下,可使用基于帧内vs的值的平均或总和的值作为对增益因数衰减器G34中的因数计算器G50的输入,且可省略变化计算器G60。在另一设置中,da的值计算为输入到增益因数衰减器G34之前帧的邻近的增益因数值(可能包含前一和/或后续增益因数值)之间的差的绝对值或平方的平均或总和,使得vs的值每帧更新一次并也提供为对因数计算器G50的输入。注意到,至少在后一实例中,对因数计算器G50的输入的值限制为不大于0.4。
增益因数平滑器G80的其它实施方案可经配置以执行基于额外的先前平滑的增益因数值的平滑操作。此类实施方案可具有一个以上平滑因数(例如,滤波器系数),所述平滑因数可一起和/或独立地以自适应方式变化。增益因数平滑器G80甚至可经实施以执行还基于将来增益因数值的平滑操作,但此类实施方案可引起额外等待时间。
对于包含增益因数衰减和增益因数平滑操作两者的实施方案,可能需要首先执行衰减,使得平滑操作不会干扰衰减标准的确定。图44展示高频带编码器A202的此实施方案A206的方块图,所述实施方案A206包含根据如本文描述的实施方案中的任一者的增益因数衰减器G30和增益因数平滑器G80的实例。
如本文描述的自适应平滑操作也可应用于增益因数计算的其它阶段。举例来说,高频带编码器A200的另外的实施方案包含对包络中的一者或一者以上的自适应平滑,和/或对在每子帧或每帧基础上计算出的衰减因数的自适应平滑。
增益平滑在其它设置中也可具有优点。举例来说,图45展示高频带编码器A200的实施方案A207的方块图,所述实施方案A207包含高频带增益因数计算器A235,其经配置以基于合成高频带信号S130,而不是基于高频带信号S30与基于窄频带激励信号S80的信号之间的关系,来计算增益因数。图46展示高频带增益因数计算器A235的方块图,所述高频带增益因数计算器A235包含如本文描述的包络计算器G10和因数计算器G20的实例。高频带编码器A207还包含增益因数平滑器G80的实例,所述增益因数平滑器G80经配置以根据如本文描述的实施方案中的任一者对增益因数执行平滑操作。
图47展示根据一实施例的信号处理方法FM10的流程图。任务FT10计算多个增益因数之间随时间的变化。任务FT20基于计算出的变化来计算平滑因数。任务FT30根据平滑因数来平滑增益因数中的至少一者。在一个实例中,计算出的变化是所述多个增益因数中邻近的增益因数之间的差。
增益因数的量化引起随机误差,所述随机误差通常与从一个帧到下一帧无关。此误差可导致经量化的增益因数不如未经量化的增益因数那样平滑,且可能降低经解码信号的感知质量。与未经量化的增益因数(或增益因数向量)相比,增益因数(或增益因数向量)的独立量化通常会增加帧之间的频谱波动量,且这些增益波动可导致经解码信号听起来不自然。
量化器通常经配置以将输入值映射到一组离散输出值之一。可利用有限数目的输出值,以便将一定范围的输入值映射到单个输出值。量化会提高编码效率,因为指示相应输出值的索引可在比原始输入值少的位中传输。图48展示通常由标量量化器执行的一维映射的实例。
所述量化器同样可能是向量量化器,且通常使用向量量化器来量化增益因数。图49展示由向量量化器执行的多维映射的一个简单实例。在此实例中,输入空间划分为许多Voronoi区(例如,根据最近近邻标准)。量化将每一输入值映射到表示相应Voronoi区(通常为矩心)(此处展示为点)的值。在此实例中,输入空间划分为六个区,使得任何输入值均可由仅具有六个不同状态的索引来表示。
如果输入信号非常平滑,那么有时可能发生经量化输出的平滑度小得多的情况(根据量化的输出空间中的值之间的最小步距)。图50a展示仅在一个量化等级(此处仅展示一个此类等级)内变化的平滑一维信号的一个实例,且图50b展示量化之后此信号的实例。尽管图50a中的输入仅在小范围内变化,但图50b中的所得输出含有较多突然过渡且平滑度小得多。此效应可导致可听假象,且可能需要为增益因数减小这种效应。举例来说,可通过包含时间噪声成形来改进增益因数量化性能。
在根据一个实施例的方法中,在编码器中针对语音的每一帧(或其它块)计算一系列增益因数,且所述系列经向量量化以用于有效传输到解码器。量化之后,存储量化误差(定义为经量化与未经量化的参数向量之间的差异)。在量化帧N的参数向量之前,帧N-1的量化误差以加权因数减小并加上帧N的参数向量。在当前与先前估计出的增益包络之间的差相对较大时,加权因数的值可能需要较小。
在根据一个实施例的方法中,针对每一帧计算增益因数量化误差向量,并将其乘以具有小于1.0的值的加权因数b。量化之前,将先前帧的缩放量化误差加上增益因数向量(输入值V10)。此方法的量化操作可由例如以下表达式描述:
y(n)=Q(s(n)+b[y(n-1)-s(n-1)]),
其中s(n)是与帧n有关的经平滑增益因数向量,y(n)是与帧n有关的经量化增益因数向量,Q(·)是最近近邻量化操作,且b是加权因数。
量化器430的实施方案435经配置以产生输入值V10(例如,增益因数向量)的平滑值V20的量化输出值V30,其中平滑值V20基于加权因数b V40和先前输出值V30a的量化误差。可应用此量化器来减小增益波动,而不会产生额外延迟。图51展示高频带编码器A202的实施方案A208的方块图,所述实施方案A208包含量化器435。注意到,此编码器也可在不包含增益因数衰减器G30和增益因数平滑器G80的一者或两者的情况下实施。还注意到,量化器435的实施方案可用于高频带编码器A204(图38)或高频带编码器A207(图47)中的量化器430,所述高频带编码器A204或高频带编码器A207可在具有或没有增益因数衰减器G30和增益因数平滑器G80的一者或两者的情况下实施。
图52展示量化器430的一个实施方案435a的方块图,其中可能特定针对此实施方案的值由索引α指示。在此实例中,通过从由反转量化器Q20解量化的当前输出值V30a中减去平滑值V20a的当前值来计算量化误差。将误差存储到延迟元件DE10中。平滑值V20a本身是当前输入值V10与通过缩放因数V40加权(例如,相乘)的先前帧的量化误差的总和。量化器435a也可经实施从而改为在将量化误差存储到延迟元件DE10中之前施加加权因数V40。
图50c展示由量化器435a响应于图50a的输入信号而产生的输出值V30a的(经解量化)序列的实例。在此实例中,b的值固定为0.5。可以看到,图50c的信号比图50a的波动信号平滑。
可能需要使用递归函数来计算反馈量。举例来说,可相对于当前输入值而不是相对于当前平滑值来计算量化误差。此方法可由例如以下表达式描述:
y(n)=Q[s(n)],s(n)=x(n)+b[y(n-1)-s(n-1)],
其中x(n)是与帧n有关的输入增益因数向量。
图53展示量化器430的实施方案435b的方块图,其中可能特定针对此实施方案的值由索引b指示。在此实例中,通过从由反转量化器Q20解量化的当前输出值V30b中减去当前输入值V10来计算量化误差。将误差存储到延迟元件DE10中。平滑值V20b是当前输入值V10与通过缩放因数V40加权(例如,相乘)的先前帧的量化误差的总和。量化器230b也可经实施从而改为在将量化误差存储到延迟元件DE10中之前施加加权因数V40。实施方案435a中也可能使用与实施方案435b不同的加权因数V40的值。
图50d展示由量化器435b响应于图50a的输入信号而产生的输出值V30b的(经解量化)序列的实例。在此实例中,加权因数b的值固定为0.5。可以看到,图50d的信号比图50a的波动信号平滑。
注意到,本文所示的实施例可通过根据图52或53所示的设置替换或扩充现有量化器Q10来实施。举例来说,量化器Q10可实施为预测性向量量化器、多级量化器、分裂向量量化器,或根据用于增益因数量化的任何其它方案来实施。
在一个实例中,加权因数b的值固定为0与1之间的所需值。或者,可能需要配置量化器435以动态地调节加权因数b的值。举例来说,量化器435可能需要经配置以依据未经量化的增益因数或增益因数向量中已存在的波动程度来调节加权因数b的值。在当前与先前增益因数或增益因数向量之间的差较大时,加权因数b的值接近零且几乎不导致噪声成形。在当前增益因数或向量与先前增益因数或向量之间的差异较小时,加权因数b的值接近1.0。以此方式,可保持增益包络中随时间的转变(例如,通过增益因数衰减器G30的实施方案施加的衰减),从而使增益包络变化时的拖尾效应最小化,同时当增益包络从一个帧或子帧到下一帧或子帧相对恒定时可减小波动。
如图54所示,量化器435a和量化器435b的另外的实施方案包含如上文描述的延迟元件F30和因数计算器F40的实例,其经设置以计算缩放因数V40的可变实施方案V42。举例来说,因数计算器F40的此实例可经配置以基于邻近的输入值V10之间的差的量值并根据如图45a或45b所示的映射来计算缩放因数V42。
可使加权因数b的值与连续增益因数或增益因数向量之间的距离成比例,且可使用各种距离中的任一者。通常使用欧几里得范数,但可使用的其它距离包含曼哈坦距离(1范数)、切比雪夫距离(无穷大范数)、马哈拉诺比斯距离和汉明距离。
从图50a-d中可了解,如本文描述的时间噪声成形方法可在逐个帧的基础上增加量化误差。尽管量化操作的绝对均方误差可能增加,然而,潜在优点是,量化误差可移动到频谱的不同部分。举例来说,量化误差可移动到较低频率,因此变得较平滑。当输入信号也较平滑时,可获得作为输入信号与经平滑量化误差的总和的平滑器输出信号。
图55a展示根据一实施例的信号处理方法QM10的流程图。任务QT10计算第一和第二增益因数向量,其可对应于语音信号的邻近的帧。任务QT20通过量化基于第一向量的至少一部分的第三向量来产生第一经量化向量。任务QT30计算第一经量化向量的量化误差。举例来说,任务QT30可经配置以计算第一经量化向量与第三向量之间的差。任务QT40基于量化误差来计算第四向量。举例来说,任务QT40可经配置以将第四向量计算为量化误差的缩放版本与第二向量的至少一部分的总和。任务QT50量化第四向量。
图55b展示根据一实施例的信号处理方法QM20的流程图。任务QT10计算第一和第二增益因数,其可对应于语音信号的邻近的帧或子帧。任务QT20通过量化基于第一增益向量的第三值来产生第一经量化增益因数。任务QT30计算第一经量化增益因数的量化误差。举例来说,任务QT30可经配置以计算第一经量化增益因数与第三值之间的差。任务QT40基于量化误差来计算经滤波的增益因数。举例来说,任务QT40可经配置以将经滤波的增益因数计算为量化误差的缩放版本与第二增益因数的总和。任务QT50量化经滤波的增益因数。
如上文所提及,本文描述的实施例包含可用于执行嵌入式编码、支持与窄频带系统的兼容性并避免需要代码转换的实施方案。对高频带编码的支持还可用于按照成本来区分具有宽频带支持与向后兼容性的芯片、芯片组、装置和/或网络与仅具有窄频带支持的芯片、芯片组、装置和/或网络。如本文所描述的对高频带编码的支持也可与用于支持低频带编码的技术结合使用,且根据此实施例的系统、方法或设备可支持对例如约50或100Hz一直到约7或8kHz的频率分量的编码。
如上文所提及,向语音编码器添加高频带支持可改进清晰度,尤其是在摩擦音的区分方面。尽管这种区分通常可由人类收听者根据特定上下文推导出来,但高频带支持可在语音识别和其它机器解译应用(例如用于自动化语音菜单导航和/或自动呼叫处理的系统)中充当启用特征。
根据一实施例的设备可嵌入到便携式无线通信装置(例如,蜂窝式电话或个人数字助理(PDA))中。或者,此设备可包含在另一通信装置中,例如VoIP手机、经配置以支持VoIP通信的个人计算机或经配置以路由电话或VoIP通信的网络装置。举例来说,根据一实施例的设备可实施在通信装置的芯片或芯片组中。视特定应用而定,此装置还可包含例如以下特征:对语音信号的模拟-数字和/或数字-模拟转换、用于对语音信号执行放大和/或其它信号处理操作的电路,和/或用于发射和/或接收经编码语音信号的射频电路。
明确预期且揭示实施例可包含第60/673,965号美国临时专利申请案和/或第11/XXX,XXX号(代理人案号050551)美国专利申请案中揭示的其它特征中的任一者或一者以上且/或与其一起使用,本申请案主张所述专利申请案的权益。还明确预期且揭示实施例可包含第60/667,901号美国临时专利申请案和/或上文提出的相关专利申请案的任一者中揭示的其它特征中的任一者或一者以上且/或与其一起使用。此类特征包含去除发生于高频带中且在窄频带中大体上不存在的具有短持续时间的高能量突发。此类特征包含例如低频带和/或高频带LSF的系数表示形式的固定或自适应平滑(例如,通过使用图43或44所示和本文描述的结构来随时间平滑一系列LSF向量的元素中的一者或一者以上(可能全部)中的每一者)。此类特征包含与例如LSF的系数表示形式的量化相关联的噪声的固定或自适应成形。
提供对所描述实施例的以上介绍以便使所属领域的技术人员能够制造或使用本发明。可能对这些实施例作出各种修改,且本文提供的一般原理也可应用于其它实施例。举例来说,实施例可部分或整体地实施为硬连线电路,实施为制造到专用集成电路中的电路配置,或者实施为作为机器可读代码加载到非易失性存储装置中的国件程序、或从数据存储媒体加载或加载到数据存储媒体中的软件程序,所述代码为可由例如微处理器或其它数字信号处理单元的逻辑元件阵列执行的指令。数据存储媒体可为存储元件阵列,例如半导体存储器(其可包含(不限于)动态或静态RAM(随机存取存储器)、ROM(只读存储器)和/或快闪RAM),或铁电、磁阻、双向开关半导体、聚合物或相变存储器;或者例如磁盘或光盘的圆盘式媒体。术语“软件”应理解为包含源代码、汇编语言代码、机器代码、二进制代码、固件、宏代码、微码、可由逻辑元件阵列执行的任何一个或一个以上指令组或序列,以及此类实例的任何组合。
高频带激励发生器A300和B300、高频带编码器A100、高频带解码器B200、宽频带语音编码器A100和宽频带语音解码器B100的实施方案的各种元件可实施为(例如)驻存在芯片组中的同一芯片上或两个或两个以上芯片之间的电子和/或光学装置,但也预期存在没有此限制的其它配置。此设备的一个或一个以上元件可整体或部分地实施为一个或一个以上指令组,所述指令组经配置以在一个或一个以上固定或可编程逻辑元件(例如,晶体管、门)阵列上执行,所述元件例如为微处理器、内嵌式处理器、IP核心、数字信号处理器、FPGA(场可编程门阵列)、ASSP(专用标准产品)和ASIC(专用集成电路)。一个或一个以上此类元件也可能具有共同结构(例如,用于在不同时间执行对应于不同元件的代码部分的处理器、经执行以在不同时间执行对应于不同元件的任务的指令组,或者在不同时间针对不同元件执行操作的电子和/或光学装置的配置)。此外,一个或一个以上此类元件可能用于执行与设备的操作并不直接相关的任务或其它指令组,例如与内嵌有所述设备的装置或系统的另一操作相关的任务。
图30展示根据一实施例对具有窄频带部分和高频带部分的语音信号的所述高频带部分进行编码的方法M100的流程图。任务X100计算表征高频带部分的频谱包络的一组滤波器参数。任务X200通过将非线性函数应用于从窄频带部分导出的信号来计算频谱扩展信号。任务X300根据(A)所述组滤波器参数和(B)基于所述频谱扩展信号的高频带激励信号来产生合成高频带信号。任务X400基于(C)高频带部分的能量与(D)从窄频带部分导出的信号的能量之间的关系来计算增益包络。
图31a展示根据一实施例产生高频带激励信号的方法M200的流程图。任务Y100通过将非线性函数应用于从语音信号的窄频带部分导出的窄频带激励信号来计算经谐波扩展信号。任务Y200将经谐波扩展信号与经调制噪声信号混合以产生高频带激励信号。图31b展示根据包含任务Y300和Y400的另一实施例产生高频带激励信号的方法M210的流程图。任务Y300根据窄频带激励信号和经谐波扩展信号中的一者的随时间的能量来计算时域包络。任务Y400根据时域包络调制噪声信号以产生经调制噪声信号。
图32展示根据一实施例对具有窄频带部分和高频带部分的语音信号的所述高频带部分进行解码的方法M300的流程图。任务Z100接收表征所述高频带部分的频谱包络的一组滤波器参数和表征所述高频带部分的时间包络的一组增益因数。任务Z200通过将非线性函数应用于从窄频带部分导出的信号来计算频谱扩展信号。任务Z300根据(A)所述组滤波器参数和(B)基于所述频谱扩展信号的高频带激励信号来产生合成高频带信号。任务Z400基于所述组增益因数来调制所述合成高频带信号的增益包络。举例来说,任务Z400可经配置以通过将所述组增益因数应用于从窄频带部分导出的激励信号、应用于频谱扩展信号、应用于高频带激励信号,或应用于合成高频带信号,来调制所述合成高频带信号的增益包络。
实施例还包含如本文中(例如)通过对经配置以执行额外语音译码、编码和解码方法的结构实施例的描述而明确揭示的所述额外语音译码、编码和解码方法。这些方法的每一者也可确实地实施(例如,在如上文列举的一个或一个以上数据存储媒体中)为可由包含逻辑元件(例如,处理器、微处理器、微控制器或其它有限状态机)阵列的机器读取和/或执行的一个或一个以上指令组。因此,本发明不希望限于上文展示的实施例,而是应符合与本文中(包含所提交的形成原始揭示案的一部分的所附权利要求书中)以任何方式揭示的原理和新颖特征一致的最广泛范围。

Claims (41)

1.一种信号处理方法,所述方法包括:
计算基于语音信号的低频部分的第一信号的包络;
计算基于所述语音信号的高频部分的第二信号的包络;
根据所述第一和第二信号的所述包络之间的时间变化关系来计算多个增益因数值;以及
基于所述第一和第二信号的所述包络之间的关系随时间的变化来衰减所述多个增益因数值中的至少一者。
2.根据权利要求1所述的信号处理方法,其中所述计算基于语音信号的低频部分的第一信号的包络包括:计算基于从所述低频部分导出的激励信号的信号的包络。
3.根据权利要求2所述的信号处理方法,其中所述计算基于语音信号的低频部分的第一信号的包络包括:计算基于所述激励信号的频谱扩展的信号的包络。
4.根据权利要求2所述的信号处理方法,所述方法包括根据所述高频部分计算多个滤波器参数,
其中所述计算基于语音信号的低频部分的第一信号的包络包括:计算基于所述激励信号和所述多个滤波器参数的信号的包络。
5.根据权利要求4所述的信号处理方法,其中所述计算基于语音信号的低频部分的第一信号的包络包括:计算基于所述多个滤波器参数和所述激励信号的频谱扩展的信号的包络。
6.根据权利要求1所述的信号处理方法,其中所述根据时间变化关系来计算多个增益因数值包括:根据所述第一和第二包络之间的比率来计算所述多个增益因数值。
7.根据权利要求1所述的信号处理方法,其中所述衰减所述多个增益因数值中的至少一者是基于所述时间变化关系。
8.根据权利要求1所述的信号处理方法,其中所述衰减所述多个增益因数值中的至少一者是基于所述多个增益因数值之间的至少一个距离。
9.根据权利要求1所述的信号处理方法,其中所述多个增益因数值的每一者对应于不同的时间间隔,且
其中所述衰减所述多个增益因数值中的至少一者是基于对应于连续时间间隔的增益因数值之间的多个距离。
10.根据权利要求1所述的信号处理方法,其中所述多个增益因数值的每一者对应于不同的时间间隔,且
其中所述衰减所述多个增益因数值中的至少一者是基于对应于连续时间间隔的增益因数值之间的平方差的总和。
11.根据权利要求1所述的信号处理方法,其中所述衰减所述多个增益因数值中的至少一者包括:
基于所述第一和第二信号的所述包络之间的关系随时间的所述变化来计算衰减因数值;以及
以下中的至少一者:(A)将所述多个增益因数值中的至少一者乘以所述衰减因数值,和(B)将所述衰减因数值加在所述多个增益因数值中的至少一者上。
12.根据权利要求1所述的信号处理方法,其中所述多个增益因数值的每一者对应于不同的时间间隔,且其中所述衰减所述多个增益因数值中的至少一者包括:
基于对应于连续时间间隔的增益因数值之间的多个距离来计算衰减因数值;以及以下中的至少一者:(A)将所述多个增益因数值中的至少一者乘以所述衰减因数值,和(B)将所述衰减因数值加在所述多个增益因数值中的至少一者上。
13.根据权利要求1所述的信号处理方法,所述方法包括平滑由所述衰减所述多个增益因数值中的至少一者得到的第二多个增益因数值,
其中所述平滑包括基于所述第二多个增益因数值中的至少两者来计算经平滑的增益因数值。
14.根据权利要求1所述的信号处理方法,所述方法包括量化由所述衰减所述多个增益因数值中的至少一者得到的第二多个增益因数值,其中所述量化包含:
计算量化误差;以及
将所述量化误差加在待量化的值上。
15.一种具有机器可执行指令的数据存储媒体,所述机器可执行指令描述根据权利要求1所述的方法。
16.一种设备,其包括:
第一包络计算器,其经配置和设置以计算基于语音信号的低频部分的第一信号的包络;
第二包络计算器,其经配置和设置以计算基于所述语音信号的高频部分的第二信号的包络;
因数计算器,其经配置和设置以根据所述第一和第二信号的所述包络之间的时间变化关系来计算多个增益因数值;以及
增益因数衰减器,其经配置和设置以基于所述第一和第二信号的所述包络之间的关系随时间的变化来衰减所述多个增益因数值中的至少一者。
17.根据权利要求16所述的设备,其中所述第一包络计算器经设置以计算信号的基于从所述低频部分导出的激励信号的频谱扩展的包络。
18.根据权利要求16所述的设备,其中所述因数计算器经配置以根据所述第一和第二包络之间的比率来计算所述多个增益因数值。
19.根据权利要求16所述的设备,其中所述增益因数衰减器经配置和设置以基于所述多个增益因数值之间的至少一个距离来衰减所述多个增益因数值中的至少一者。
20.根据权利要求16所述的设备,其中所述多个增益因数值的每一者对应于不同的时间间隔,且
其中所述增益因数衰减器经设置以基于对应于连续时间间隔的增益因数值之间的多个距离来衰减所述多个增益因数值中的至少一者。
21.根据权利要求16所述的设备,其中所述增益因数衰减器包括:
变化计算器,其经配置和设置以计算所述多个增益因数值之间的多个差;以及
因数计算器,其经配置和设置以基于所述多个差来计算至少一个衰减因数值。
22.根据权利要求16所述的设备,其中所述增益因数衰减器经配置以基于所述多个增益因数值之间的多个距离来计算衰减因数值,且
其中所述增益因数衰减器包含组合器,所述组合器经配置以执行以下中的至少一者:(A)将所述多个增益因数值中的至少一者乘以所述衰减因数值,和(B)将所述衰减因数值加在所述多个增益因数值中的至少一者上。
23.根据权利要求16所述的设备,所述设备包括平滑器,所述平滑器经配置以平滑所述增益因数衰减器的输出,所述输出包含多个增益因数值。
24.根据权利要求16所述的设备,所述设备包含蜂窝式电话,所述蜂窝式电话经配置以传输包含所述至少一个经衰减的增益因数值的信号。
25.一种信号处理方法,所述方法包括:
产生高频带激励信号,所述产生包含对基于低频带激励信号的信号进行频谱扩展;
基于所述高频带激励信号来合成高频带语音信号;
根据第一多个增益因数值之间的至少一个距离来衰减所述第一多个增益因数值中的至少一者;以及
基于由所述衰减得到的第二多个增益因数值来修改基于所述低频带激励信号的信号的时域包络。
26.根据权利要求25所述的信号处理方法,其中所述修改基于所述低频带激励信号的信号的时域包络包括:在所述合成之前,修改基于所述高频带激励信号的信号的时域包络。
27.根据权利要求25所述的信号处理方法,其中所述修改基于所述低频带激励信号的信号的时域包络包括:修改所述合成的高频带语音信号的时域包络。
28.根据权利要求25所述的信号处理方法,其中所述合成高频带语音信号是基于多个滤波器参数。
29.根据权利要求28所述的信号处理方法,其中所述多个滤波器参数包括多个线性预测滤波器系数。
30.根据权利要求25所述的信号处理方法,其中所述第一多个增益因数值的每一者对应于不同的时间间隔,且
其中所述衰减所述第一多个增益因数值中的至少一者是基于对应于连续时间间隔的增益因数值之间的多个距离。
31.根据权利要求25所述的信号处理方法,其中所述第一多个增益因数值的每一者对应于不同的时间间隔,且
其中所述衰减所述第一多个增益因数值中的至少一者是基于对应于连续时间间隔的增益因数值之间的平方差的总和。
32.根据权利要求25所述的信号处理方法,其中所述衰减所述第一多个增益因数值中的至少一者包括:
基于所述第一多个增益因数值之间的多个距离来计算衰减因数值;以及
以下中的至少一者:(A)将所述第一多个增益因数值中的至少一者乘以所述衰减因数值,和(B)将所述衰减因数值加在所述第一多个增益因数值中的至少一者上。
33.一种具有机器可执行指令的数据存储媒体,所述机器可执行指令描述根据权利要求25所述的方法。
34.一种设备,其包括:
高频带激励发生器,其经配置以基于低频带激励信号来产生高频带激励信号;
合成滤波器,其经配置和设置以基于所述高频带激励信号来产生合成高频带语音信号;
增益因数衰减器,其经配置和设置以根据第一多个增益因数值之间的至少一个距离来衰减所述第一多个增益因数值中的至少一者;以及
增益控制元件,其经配置和设置以基于包含所述至少一个经衰减的增益因数值的第二多个增益因数值来修改基于所述低频带激励信号的信号的时域包络。
35.根据权利要求34所述的设备,其中所述增益控制元件经配置以修改基于所述高频带激励信号的信号的时域包络。
36.根据权利要求34所述的设备,其中所述增益控制元件经配置以修改所述合成的高频带语音信号的时域包络。
37.根据权利要求34所述的设备,其中所述合成滤波器经配置以基于多个线性预测滤波器系数来产生所述合成的高频带语音信号。
38.根据权利要求34所述的设备,其中所述第一多个增益因数值的每一者对应于不同的时间间隔,且
其中所述增益因数衰减器经配置以基于对应于连续时间间隔的增益因数值之间的多个距离来衰减所述第一多个增益因数值中的至少一者。
39.根据权利要求34所述的设备,其中所述第一多个增益因数值的每一者对应于不同的时间间隔,且
其中所述增益因数衰减器经配置以基于对应于连续时间间隔的增益因数值之间的平方差的总和来衰减所述第一多个增益因数值中的至少一者。
40.根据权利要求34所述的设备,其中所述增益因数衰减器经配置以基于所述第一多个增益因数值之间的多个距离来计算衰减因数值,且
其中所述增益因数衰减器包含组合器,所述组合器经配置以执行以下中的至少一者:(A)将所述第一多个增益因数值中的至少一者乘以所述衰减因数值,和(B)将所述衰减因数值加在所述第一多个增益因数值中的至少一者上。
41.根据权利要求34所述的设备,所述设备包含蜂窝式电话,所述蜂窝式电话经配置以接收包含所述至少一个经衰减的增益因数值并描述所述低频带激励信号的信号。
CN2006800215134A 2005-04-22 2006-04-21 用于增益因数衰减的系统、方法和设备 Active CN101199003B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US67396505P 2005-04-22 2005-04-22
US60/673,965 2005-04-22
PCT/US2006/014992 WO2006116024A2 (en) 2005-04-22 2006-04-21 Systems, methods, and apparatus for gain factor attenuation

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN2010105744132A Division CN102110440B (zh) 2005-04-22 2006-04-21 用于增益因数衰减的系统、方法和设备

Publications (2)

Publication Number Publication Date
CN101199003A true CN101199003A (zh) 2008-06-11
CN101199003B CN101199003B (zh) 2012-01-11

Family

ID=36741298

Family Applications (3)

Application Number Title Priority Date Filing Date
CN2006800216673A Active CN101199004B (zh) 2005-04-22 2006-04-21 用于增益因数平滑的系统、方法及设备
CN2006800215134A Active CN101199003B (zh) 2005-04-22 2006-04-21 用于增益因数衰减的系统、方法和设备
CN2010105744132A Active CN102110440B (zh) 2005-04-22 2006-04-21 用于增益因数衰减的系统、方法和设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2006800216673A Active CN101199004B (zh) 2005-04-22 2006-04-21 用于增益因数平滑的系统、方法及设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN2010105744132A Active CN102110440B (zh) 2005-04-22 2006-04-21 用于增益因数衰减的系统、方法和设备

Country Status (14)

Country Link
US (2) US9043214B2 (zh)
EP (2) EP1875464B9 (zh)
KR (2) KR100947421B1 (zh)
CN (3) CN101199004B (zh)
DK (1) DK1875463T3 (zh)
ES (1) ES2705589T3 (zh)
HU (1) HUE040628T2 (zh)
NO (1) NO20075509L (zh)
PL (1) PL1875463T3 (zh)
PT (1) PT1875463T (zh)
SI (1) SI1875463T1 (zh)
TR (1) TR201821299T4 (zh)
TW (2) TWI317933B (zh)
WO (2) WO2006116024A2 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105408954A (zh) * 2013-06-21 2016-03-16 弗朗霍夫应用科学研究促进协会 利用改进的音调滞后估计的似acelp隐藏中的自适应码本的改进隐藏的装置及方法
CN105556602A (zh) * 2013-08-29 2016-05-04 杜比国际公司 用于高频重构算法的频带表设计
CN106256000A (zh) * 2014-04-30 2016-12-21 高通股份有限公司 高频带激励信号生成
CN106663440A (zh) * 2014-06-26 2017-05-10 高通股份有限公司 基于高频带信号特征的时间增益调整
CN107437421A (zh) * 2016-05-06 2017-12-05 恩智浦有限公司 信号处理器
US10643624B2 (en) 2013-06-21 2020-05-05 Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization

Families Citing this family (102)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1818913B1 (en) * 2004-12-10 2011-08-10 Panasonic Corporation Wide-band encoding device, wide-band lsp prediction device, band scalable encoding device, wide-band encoding method
US8078474B2 (en) 2005-04-01 2011-12-13 Qualcomm Incorporated Systems, methods, and apparatus for highband time warping
PL1875463T3 (pl) * 2005-04-22 2019-03-29 Qualcomm Incorporated Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia
US7619563B2 (en) 2005-08-26 2009-11-17 Step Communications Corporation Beam former using phase difference enhancement
US7436188B2 (en) * 2005-08-26 2008-10-14 Step Communications Corporation System and method for improving time domain processed sensor signals
US20070050441A1 (en) * 2005-08-26 2007-03-01 Step Communications Corporation,A Nevada Corporati Method and apparatus for improving noise discrimination using attenuation factor
US7415372B2 (en) * 2005-08-26 2008-08-19 Step Communications Corporation Method and apparatus for improving noise discrimination in multiple sensor pairs
US7472041B2 (en) * 2005-08-26 2008-12-30 Step Communications Corporation Method and apparatus for accommodating device and/or signal mismatch in a sensor array
US20070047742A1 (en) * 2005-08-26 2007-03-01 Step Communications Corporation, A Nevada Corporation Method and system for enhancing regional sensitivity noise discrimination
US20070047743A1 (en) * 2005-08-26 2007-03-01 Step Communications Corporation, A Nevada Corporation Method and apparatus for improving noise discrimination using enhanced phase difference value
CN101371569B (zh) * 2006-01-17 2011-07-27 皇家飞利浦电子股份有限公司 使用周期平稳工具箱检测嵌入到噪声中的电视信号的存在
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8532984B2 (en) 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
JP4827661B2 (ja) * 2006-08-30 2011-11-30 富士通株式会社 信号処理方法及び装置
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR100788706B1 (ko) * 2006-11-28 2007-12-26 삼성전자주식회사 광대역 음성 신호의 부호화/복호화 방법
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
EP2118892B1 (en) * 2007-02-12 2010-07-14 Dolby Laboratories Licensing Corporation Improved ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
RU2440627C2 (ru) 2007-02-26 2012-01-20 Долби Лэборетериз Лайсенсинг Корпорейшн Повышение разборчивости речи в звукозаписи развлекательных программ
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US8788264B2 (en) * 2007-06-27 2014-07-22 Nec Corporation Audio encoding method, audio decoding method, audio encoding device, audio decoding device, program, and audio encoding/decoding system
US9082397B2 (en) 2007-11-06 2015-07-14 Nokia Technologies Oy Encoder
US20100250260A1 (en) * 2007-11-06 2010-09-30 Lasse Laaksonen Encoder
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
EP2255534B1 (en) * 2008-03-20 2017-12-20 Samsung Electronics Co., Ltd. Apparatus and method for encoding using bandwidth extension in portable terminal
EP2301015B1 (en) * 2008-06-13 2019-09-04 Nokia Technologies Oy Method and apparatus for error concealment of encoded audio data
KR101360456B1 (ko) 2008-07-11 2014-02-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 시간 워프 활성 신호의 제공 및 이를 이용한 오디오 신호의 인코딩
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
GB2466201B (en) 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
WO2011048792A1 (ja) 2009-10-21 2011-04-28 パナソニック株式会社 音響信号処理装置、音響符号化装置および音響復号装置
US20110096942A1 (en) * 2009-10-23 2011-04-28 Broadcom Corporation Noise suppression system and method
US10115386B2 (en) * 2009-11-18 2018-10-30 Qualcomm Incorporated Delay techniques in active noise cancellation circuits or other circuits that perform filtering of decimated coefficients
WO2011062538A1 (en) * 2009-11-19 2011-05-26 Telefonaktiebolaget Lm Ericsson (Publ) Bandwidth extension of a low band audio signal
GB2476043B (en) * 2009-12-08 2016-10-26 Skype Decoding speech signals
US8447617B2 (en) * 2009-12-21 2013-05-21 Mindspeed Technologies, Inc. Method and system for speech bandwidth extension
KR101423737B1 (ko) 2010-01-21 2014-07-24 한국전자통신연구원 오디오 신호의 디코딩 방법 및 장치
US9525569B2 (en) * 2010-03-03 2016-12-20 Skype Enhanced circuit-switched calls
PT2559028E (pt) * 2010-04-14 2015-11-18 Voiceage Corp Livro de códigos de inovação combinados flexível e evolutivo a utilizar num codificador e descodificador celp
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
JP4923161B1 (ja) * 2010-09-29 2012-04-25 シャープ株式会社 移動通信システム、移動局装置、基地局装置、通信方法および集積回路
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
US9059786B2 (en) * 2011-07-07 2015-06-16 Vecima Networks Inc. Ingress suppression for communication systems
ITTO20110890A1 (it) 2011-10-05 2013-04-06 Inst Rundfunktechnik Gmbh Interpolationsschaltung zum interpolieren eines ersten und zweiten mikrofonsignals.
CN103035248B (zh) * 2011-10-08 2015-01-21 华为技术有限公司 音频信号编码方法和装置
US9444452B2 (en) 2012-02-24 2016-09-13 Parade Technologies, Ltd. Frequency hopping algorithm for capacitance sensing devices
US10448161B2 (en) 2012-04-02 2019-10-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field
JP5998603B2 (ja) * 2012-04-18 2016-09-28 ソニー株式会社 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
US20140006017A1 (en) * 2012-06-29 2014-01-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal
CN103928031B (zh) 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
ES2626977T3 (es) * 2013-01-29 2017-07-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y medio informático para sintetizar una señal de audio
MX347062B (es) 2013-01-29 2017-04-10 Fraunhofer Ges Forschung Codificador de audio, decodificador de audio, método para proveer una información de audio codificada, método para proveer una información de audio decodificada, programa de computación y representación codificada utilizando una ampliación de ancho de banda adaptada por la señal.
US9741350B2 (en) 2013-02-08 2017-08-22 Qualcomm Incorporated Systems and methods of performing gain control
JP6528679B2 (ja) 2013-03-05 2019-06-12 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
US9570087B2 (en) 2013-03-15 2017-02-14 Broadcom Corporation Single channel suppression of interfering sources
CN108198564B (zh) * 2013-07-01 2021-02-26 华为技术有限公司 信号编码和解码方法以及设备
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
CN107818789B (zh) * 2013-07-16 2020-11-17 华为技术有限公司 解码方法和解码装置
CN108364657B (zh) 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
EP2830054A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
RU2639952C2 (ru) * 2013-08-28 2017-12-25 Долби Лабораторис Лайсэнзин Корпорейшн Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием
CN108172239B (zh) 2013-09-26 2021-01-12 华为技术有限公司 频带扩展的方法及装置
CN105761723B (zh) 2013-09-26 2019-01-15 华为技术有限公司 一种高频激励信号预测方法及装置
US9620134B2 (en) * 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US9564141B2 (en) * 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
CN105336336B (zh) 2014-06-12 2016-12-28 华为技术有限公司 一种音频信号的时域包络处理方法及装置、编码器
CN107424622B (zh) 2014-06-24 2020-12-25 华为技术有限公司 音频编码方法和装置
CN105225666B (zh) 2014-06-25 2016-12-28 华为技术有限公司 处理丢失帧的方法和装置
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
CN105225670B (zh) * 2014-06-27 2016-12-28 华为技术有限公司 一种音频编码方法和装置
KR101591597B1 (ko) * 2014-07-02 2016-02-19 한양대학교 산학협력단 G.722 코덱 패킷손실은닉 및 최급강하법을 이용한 적응형 뮤팅 시스템 및 방법
KR102125410B1 (ko) 2015-02-26 2020-06-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 타깃 시간 도메인 포락선을 사용하여 처리된 오디오 신호를 얻도록 오디오 신호를 처리하기 위한 장치 및 방법
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9613628B2 (en) 2015-07-01 2017-04-04 Gopro, Inc. Audio decoder for wind and microphone noise reduction in a microphone array system
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
TWI594231B (zh) * 2016-12-23 2017-08-01 瑞軒科技股份有限公司 分頻壓縮電路,音訊處理方法以及音訊處理系統
CN106856623B (zh) * 2017-02-20 2020-02-11 鲁睿 基带语音信号通讯噪声抑制方法及系统
US10553222B2 (en) * 2017-03-09 2020-02-04 Qualcomm Incorporated Inter-channel bandwidth extension spectral mapping and adjustment
US10200727B2 (en) 2017-03-29 2019-02-05 International Business Machines Corporation Video encoding and transcoding for multiple simultaneous qualities of service
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
KR102643006B1 (ko) * 2018-04-11 2024-03-05 돌비 인터네셔널 에이비 오디오 렌더링을 위한 사전 렌더링된 신호를 위한 방법, 장치 및 시스템
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
KR20230084246A (ko) * 2020-10-09 2023-06-12 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 파라미터 평활화를 사용하여, 인코딩된 오디오 장면을 프로세싱하기 위한 장치, 방법, 또는 컴퓨터 프로그램
CA3194884A1 (en) * 2020-10-09 2022-04-14 Franz REUTELHUBER Apparatus, method, or computer program for processing an encoded audio scene using a parameter conversion

Family Cites Families (131)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3158693A (en) * 1962-08-07 1964-11-24 Bell Telephone Labor Inc Speech interpolation communication system
US3855416A (en) 1972-12-01 1974-12-17 F Fuller Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment
US3855414A (en) 1973-04-24 1974-12-17 Anaconda Co Cable armor clamp
JPS59139099A (ja) * 1983-01-31 1984-08-09 株式会社東芝 音声区間検出装置
US4616659A (en) * 1985-05-06 1986-10-14 At&T Bell Laboratories Heart rate detection utilizing autoregressive analysis
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4747143A (en) * 1985-07-12 1988-05-24 Westinghouse Electric Corp. Speech enhancement system having dynamic gain control
US4862168A (en) 1987-03-19 1989-08-29 Beard Terry D Audio digital/analog encoding and decoding
US4805193A (en) 1987-06-04 1989-02-14 Motorola, Inc. Protection of energy information in sub-band coding
US4852179A (en) 1987-10-05 1989-07-25 Motorola, Inc. Variable frame rate, fixed bit rate vocoding method
JP2707564B2 (ja) * 1987-12-14 1998-01-28 株式会社日立製作所 音声符号化方式
US5285520A (en) 1988-03-02 1994-02-08 Kokusai Denshin Denwa Kabushiki Kaisha Predictive coding apparatus
JPH0639229B2 (ja) * 1988-08-29 1994-05-25 株式会社大井製作所 パワーシートスライド装置
CA1321645C (en) 1988-09-28 1993-08-24 Akira Ichikawa Method and system for voice coding based on vector quantization
US5086475A (en) 1988-11-19 1992-02-04 Sony Corporation Apparatus for generating, recording or reproducing sound source data
CA2068883C (en) 1990-09-19 2002-01-01 Jozef Maria Karel Timmermans Record carrier on which a main data file and a control file have been recorded, method of and device for recording the main data file and the control file, and device for reading the record carrier
JP2779886B2 (ja) 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JP3191457B2 (ja) 1992-10-31 2001-07-23 ソニー株式会社 高能率符号化装置、ノイズスペクトル変更装置及び方法
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US5765126A (en) 1993-06-30 1998-06-09 Sony Corporation Method and apparatus for variable length encoding of separated tone and noise characteristic components of an acoustic signal
WO1995010760A2 (en) 1993-10-08 1995-04-20 Comsat Corporation Improved low bit rate vocoders and methods of operation therefor
US5684920A (en) * 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5487087A (en) 1994-05-17 1996-01-23 Texas Instruments Incorporated Signal quantizer with reduced output fluctuation
US5797118A (en) 1994-08-09 1998-08-18 Yamaha Corporation Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns
JP2770137B2 (ja) * 1994-09-22 1998-06-25 日本プレシジョン・サーキッツ株式会社 波形データ圧縮装置
US5699477A (en) * 1994-11-09 1997-12-16 Texas Instruments Incorporated Mixed excitation linear prediction with fractional pitch
FI97182C (fi) 1994-12-05 1996-10-25 Nokia Telecommunications Oy Menetelmä vastaanotettujen huonojen puhekehysten korvaamiseksi digitaalisessa vastaanottimessa sekä digitaalisen tietoliikennejärjestelmän vastaanotin
JP3365113B2 (ja) 1994-12-22 2003-01-08 ソニー株式会社 音声レベル制御装置
EP0732687B2 (en) 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
US5706395A (en) 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
US6263307B1 (en) * 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
JP3334419B2 (ja) 1995-04-20 2002-10-15 ソニー株式会社 ノイズ低減方法及びノイズ低減装置
US5699485A (en) 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
US5704003A (en) * 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
US6097824A (en) * 1997-06-06 2000-08-01 Audiologic, Incorporated Continuous frequency dynamic range audio compressor
JP3707116B2 (ja) 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
US5737716A (en) 1995-12-26 1998-04-07 Motorola Method and apparatus for encoding speech using neural network technology for speech classification
US5689615A (en) 1996-01-22 1997-11-18 Rockwell International Corporation Usage of voice activity detection for efficient coding of speech
TW307960B (en) 1996-02-15 1997-06-11 Philips Electronics Nv Reduced complexity signal transmission system
EP0814458B1 (en) * 1996-06-19 2004-09-22 Texas Instruments Incorporated Improvements in or relating to speech coding
JP3246715B2 (ja) 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
DE69712539T2 (de) * 1996-11-07 2002-08-29 Matsushita Electric Ind Co Ltd Verfahren und Vorrichtung zur Erzeugung eines Vektorquantisierungs-Codebuchs
US6009395A (en) 1997-01-02 1999-12-28 Texas Instruments Incorporated Synthesizer and method using scaled excitation signal
US6202046B1 (en) 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
US5890126A (en) 1997-03-10 1999-03-30 Euphonics, Incorporated Audio data decompression and interpolation apparatus and method
US6041297A (en) 1997-03-10 2000-03-21 At&T Corp Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations
US6385235B1 (en) 1997-04-22 2002-05-07 Silicon Laboratories, Inc. Direct digital access arrangement circuitry and method for connecting to phone lines
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6889185B1 (en) * 1997-08-28 2005-05-03 Texas Instruments Incorporated Quantization of linear prediction coefficients using perceptual weighting
US6122384A (en) 1997-09-02 2000-09-19 Qualcomm Inc. Noise suppression system and method
US6029125A (en) 1997-09-02 2000-02-22 Telefonaktiebolaget L M Ericsson, (Publ) Reducing sparseness in coded speech signals
AU4661497A (en) 1997-09-30 1999-03-22 Qualcomm Incorporated Channel gain modification system and method for noise reduction in voice communication
JPH11205166A (ja) * 1998-01-19 1999-07-30 Mitsubishi Electric Corp ノイズ検出装置
US6301556B1 (en) * 1998-03-04 2001-10-09 Telefonaktiebolaget L M. Ericsson (Publ) Reducing sparseness in coded speech signals
ATE520122T1 (de) * 1998-06-09 2011-08-15 Panasonic Corp Sprachkodierung und sprachdekodierung
US6449590B1 (en) * 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US6385573B1 (en) 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
JP4170458B2 (ja) * 1998-08-27 2008-10-22 ローランド株式会社 波形信号の時間軸圧縮伸長装置
US6353808B1 (en) 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
KR20000047944A (ko) 1998-12-11 2000-07-25 이데이 노부유끼 수신장치 및 방법과 통신장치 및 방법
JP4354561B2 (ja) 1999-01-08 2009-10-28 パナソニック株式会社 オーディオ信号符号化装置及び復号化装置
US6223151B1 (en) * 1999-02-10 2001-04-24 Telefon Aktie Bolaget Lm Ericsson Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders
WO2000070769A1 (fr) 1999-05-14 2000-11-23 Matsushita Electric Industrial Co., Ltd. Procede et appareil d'elargissement de la bande d'un signal audio
US6604070B1 (en) 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
JP4792613B2 (ja) 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
US6715125B1 (en) 1999-10-18 2004-03-30 Agere Systems Inc. Source coding and transmission with time diversity
WO2001037263A1 (en) 1999-11-16 2001-05-25 Koninklijke Philips Electronics N.V. Wideband audio transmission system
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
US7260523B2 (en) * 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
EP1164580B1 (en) 2000-01-11 2015-10-28 Panasonic Intellectual Property Management Co., Ltd. Multi-mode voice encoding device and decoding device
US6757395B1 (en) 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6732070B1 (en) * 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching
JP3681105B2 (ja) 2000-02-24 2005-08-10 アルパイン株式会社 データ処理方式
US6523003B1 (en) * 2000-03-28 2003-02-18 Tellabs Operations, Inc. Spectrally interdependent gain adjustment techniques
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
DE60118627T2 (de) 2000-05-22 2007-01-11 Texas Instruments Inc., Dallas Vorrichtung und Verfahren zur Breitbandcodierung von Sprachsignalen
US7136810B2 (en) * 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
US7330814B2 (en) * 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
JP2002055699A (ja) * 2000-08-10 2002-02-20 Mitsubishi Electric Corp 音声符号化装置および音声符号化方法
IL149260A0 (en) 2000-08-25 2002-11-10 Koninkl Philips Electronics Nv Method and apparatus for reducing the word length of a digital input signal and method and apparatus for recovering the digital input signal
US7386444B2 (en) * 2000-09-22 2008-06-10 Texas Instruments Incorporated Hybrid speech coding and system
US6947888B1 (en) 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
JP2002202799A (ja) 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
JP3558031B2 (ja) 2000-11-06 2004-08-25 日本電気株式会社 音声復号化装置
JP2004513399A (ja) * 2000-11-09 2004-04-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 知覚品質を高める電話スピーチの広帯域拡張
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US7230931B2 (en) 2001-01-19 2007-06-12 Raze Technologies, Inc. Wireless access system using selectively adaptable beam forming in TDD frames and method of operation
EP1339040B1 (en) * 2000-11-30 2009-01-07 Panasonic Corporation Vector quantizing device for lpc parameters
GB0031461D0 (en) 2000-12-22 2001-02-07 Thales Defence Ltd Communication sets
US20040204935A1 (en) 2001-02-21 2004-10-14 Krishnasamy Anandakumar Adaptive voice playout in VOP
JP2002268698A (ja) 2001-03-08 2002-09-20 Nec Corp 音声認識装置と標準パターン作成装置及び方法並びにプログラム
US20030028386A1 (en) 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
SE522553C2 (sv) 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
US20040153313A1 (en) 2001-05-11 2004-08-05 Roland Aubauer Method for enlarging the band width of a narrow-band filtered voice signal, especially a voice signal emitted by a telecommunication appliance
EP1405303A1 (en) 2001-06-28 2004-04-07 Koninklijke Philips Electronics N.V. Wideband signal transmission system
US6879955B2 (en) 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP2003036097A (ja) 2001-07-25 2003-02-07 Sony Corp 情報検出装置及び方法、並びに情報検索装置及び方法
TW525147B (en) 2001-09-28 2003-03-21 Inventec Besta Co Ltd Method of obtaining and decoding basic cycle of voice
US6988066B2 (en) 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
TW526468B (en) 2001-10-19 2003-04-01 Chunghwa Telecom Co Ltd System and method for eliminating background noise of voice signal
JP4245288B2 (ja) * 2001-11-13 2009-03-25 パナソニック株式会社 音声符号化装置および音声復号化装置
US20030108108A1 (en) * 2001-11-15 2003-06-12 Takashi Katayama Decoder, decoding method, and program distribution medium therefor
EP1451812B1 (en) 2001-11-23 2006-06-21 Koninklijke Philips Electronics N.V. Audio signal bandwidth extension
CA2365203A1 (en) * 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US6751587B2 (en) * 2002-01-04 2004-06-15 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
JP4290917B2 (ja) 2002-02-08 2009-07-08 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法、及び、符号化方法
JP3826813B2 (ja) 2002-02-18 2006-09-27 ソニー株式会社 ディジタル信号処理装置及びディジタル信号処理方法
DE60303689T2 (de) * 2002-09-19 2006-10-19 Matsushita Electric Industrial Co., Ltd., Kadoma Audiodecodierungsvorrichtung und -verfahren
JP3756864B2 (ja) 2002-09-30 2006-03-15 株式会社東芝 音声合成方法と装置及び音声合成プログラム
KR100841096B1 (ko) * 2002-10-14 2008-06-25 리얼네트웍스아시아퍼시픽 주식회사 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법
US20040098255A1 (en) * 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
US7242763B2 (en) 2002-11-26 2007-07-10 Lucent Technologies Inc. Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems
CA2415105A1 (en) 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
KR100480341B1 (ko) * 2003-03-13 2005-03-31 한국전자통신연구원 광대역 저전송률 음성 신호의 부호화기
EP1618557B1 (en) 2003-05-01 2007-07-25 Nokia Corporation Method and device for gain quantization in variable bit rate wideband speech coding
JP4212591B2 (ja) 2003-06-30 2009-01-21 富士通株式会社 オーディオ符号化装置
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
FI118550B (fi) * 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
US7428490B2 (en) * 2003-09-30 2008-09-23 Intel Corporation Method for spectral subtraction in speech enhancement
KR100587953B1 (ko) 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
CA2454296A1 (en) 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
JP4259401B2 (ja) 2004-06-02 2009-04-30 カシオ計算機株式会社 音声処理装置及び音声符号化方法
US8000967B2 (en) 2005-03-09 2011-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
US8078474B2 (en) * 2005-04-01 2011-12-13 Qualcomm Incorporated Systems, methods, and apparatus for highband time warping
PL1875463T3 (pl) 2005-04-22 2019-03-29 Qualcomm Incorporated Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105408954A (zh) * 2013-06-21 2016-03-16 弗朗霍夫应用科学研究促进协会 利用改进的音调滞后估计的似acelp隐藏中的自适应码本的改进隐藏的装置及方法
US10643624B2 (en) 2013-06-21 2020-05-05 Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization
US11410663B2 (en) 2013-06-21 2022-08-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pitch lag estimation
CN105556602A (zh) * 2013-08-29 2016-05-04 杜比国际公司 用于高频重构算法的频带表设计
CN105556602B (zh) * 2013-08-29 2019-10-01 杜比国际公司 确定主标度因子频带表的系统和方法、高频重构单元、音频编码器和解码器
CN106256000A (zh) * 2014-04-30 2016-12-21 高通股份有限公司 高频带激励信号生成
CN106256000B (zh) * 2014-04-30 2019-12-24 高通股份有限公司 高频带激励信号生成
CN106663440A (zh) * 2014-06-26 2017-05-10 高通股份有限公司 基于高频带信号特征的时间增益调整
CN106663440B (zh) * 2014-06-26 2018-05-08 高通股份有限公司 基于高频带信号特征的时间增益调整
CN107437421A (zh) * 2016-05-06 2017-12-05 恩智浦有限公司 信号处理器

Also Published As

Publication number Publication date
KR20080002996A (ko) 2008-01-04
EP1875463A1 (en) 2008-01-09
DK1875463T3 (en) 2019-01-28
EP1875464B9 (en) 2020-10-28
CN102110440B (zh) 2012-09-26
CN101199003B (zh) 2012-01-11
TWI324336B (en) 2010-05-01
PT1875463T (pt) 2019-01-24
CN101199004A (zh) 2008-06-11
TW200710824A (en) 2007-03-16
KR100956878B1 (ko) 2010-05-11
EP1875464B1 (en) 2012-12-05
WO2006116024A3 (en) 2007-03-22
NO20075509L (no) 2007-12-27
KR20080003912A (ko) 2008-01-08
EP1875464A2 (en) 2008-01-09
ES2705589T3 (es) 2019-03-26
US20060282262A1 (en) 2006-12-14
CN101199004B (zh) 2011-11-09
TWI317933B (en) 2009-12-01
PL1875463T3 (pl) 2019-03-29
TR201821299T4 (tr) 2019-01-21
WO2006116025A1 (en) 2006-11-02
US8892448B2 (en) 2014-11-18
HUE040628T2 (hu) 2019-03-28
SI1875463T1 (sl) 2019-02-28
CN102110440A (zh) 2011-06-29
WO2006116024A2 (en) 2006-11-02
TW200707410A (en) 2007-02-16
EP1875463B1 (en) 2018-10-17
KR100947421B1 (ko) 2010-03-12
US9043214B2 (en) 2015-05-26
US20060277039A1 (en) 2006-12-07

Similar Documents

Publication Publication Date Title
CN101199003B (zh) 用于增益因数衰减的系统、方法和设备
CN101180677B (zh) 用于宽频带语音编码的系统、方法和设备
CN102411935B (zh) 用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant