CN104981869A - 在位流中用信号表示音频渲染信息 - Google Patents
在位流中用信号表示音频渲染信息 Download PDFInfo
- Publication number
- CN104981869A CN104981869A CN201480007716.2A CN201480007716A CN104981869A CN 104981869 A CN104981869 A CN 104981869A CN 201480007716 A CN201480007716 A CN 201480007716A CN 104981869 A CN104981869 A CN 104981869A
- Authority
- CN
- China
- Prior art keywords
- bit stream
- speaker feeds
- matrix
- multiple speaker
- signal value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/308—Electronic adaptation dependent on speaker or headphone connection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/301—Automatic calibration of stereophonic sound system, e.g. with test microphone
Abstract
大体来说,本发明描述用于在位流中指定音频渲染信息的技术。一种经配置以产生所述位流的装置可执行所述技术的各个方面。所述位流产生装置可包括一或多个处理器,其经配置以指定音频渲染信息,所述音频渲染信息包含识别当产生多信道音频内容时使用的音频渲染器的信号值。一种经配置以渲染来自位流的多信道音频内容的装置也可执行所述技术的各个方面。所述渲染装置可包括一或多个处理器,其经配置以:确定音频渲染信息,所述音频渲染信息包含识别当产生所述多信道音频内容时使用的音频渲染器的信号值;且基于所述音频渲染信息渲染多个扬声器馈送。
Description
本申请案主张2013年2月8日申请的第61/762,758号美国临时申请案的权益。
技术领域
本发明涉及音频译码,且更确切地说涉及指定经译码音频数据的位流。
背景技术
在音频内容的产生期间,声音工程师可使用特定渲染器渲染音频内容以试图针对用于再现音频内容的扬声器的目标配置而定制所述音频内容。换句话说,声音工程师可渲染所述音频内容且使用布置在目标配置中的扬声器重放所述经渲染音频内容。声音工程师可随后重混音频内容的各个方面,渲染所述经重混音频内容,且使用布置在目标配置中的扬声器再次重放所述经渲染经重混的音频内容。声音工程师可以此方式重复直至音频内容提供特定艺术意图为止。以此方式,声音工程师可产生提供特定艺术意图或以其它方式提供重放期间的特定声场的音频内容(例如,以伴随连同音频内容一起播放的视频内容)。
发明内容
大体来说,描述用于指定表示音频数据的位流中的音频渲染信息的技术。换句话说,所述技术可提供一种用以向重放装置用信号表示在音频内容产生期间使用的音频渲染信息的方式,所述重放装置可随后使用音频渲染信息来渲染音频内容。以此方式提供经渲染信息使重放装置能够以声音工程师所意图的方式渲染音频内容,且借此潜在地确保音频内容的适当重放使得艺术意图潜在地为收听者所理解。换句话说,渲染期间由声音工程师使用的渲染信息根据本发明中描述的技术提供,使得音频重放装置可利用所述渲染信息以声音工程师所意图的方式渲染音频内容,借此确保与并不提供此音频渲染信息的系统相比在音频内容的产生和重放两者期间的较一致的体验。
在一个方面中,一种产生表示多信道音频内容的位流的方法,所述方法包括指定音频渲染信息,所述音频渲染信息包含识别当产生多信道音频内容时使用的音频渲染器的信号值。
在另一方面中,一种经配置以产生表示多信道音频内容的位流的装置,所述装置包括一或多个处理器,所述一或多个处理器经配置以指定音频渲染信息,所述音频渲染信息包含识别当产生所述多信道音频内容时使用的音频渲染器的信号值。
在另一方面中,一种经配置以产生表示多信道音频内容的位流的装置,所述装置包括:用于指定音频渲染信息的装置,所述音频渲染信息包含识别当产生多信道音频内容时使用的音频渲染器的信号值;以及用于存储所述音频渲染信息的装置。
在另一方面中,一种具有存储于其上的指令的非暂时性计算机可读存储媒体,所述指令在执行时致使所述一或多个处理器指定音频渲染信息,所述音频渲染信息包含识别当产生多信道音频内容时使用的音频渲染器的信号值。
在另一方面中,一种渲染来自位流的多信道音频内容的方法,所述方法包括:确定音频渲染信息,所述音频渲染信息包含识别当产生多信道音频内容时使用的音频渲染器的信号值;以及基于所述音频渲染信息渲染多个扬声器馈送。
在另一方面中,一种经配置以渲染来自位流的多信道音频内容的装置,所述装置包括一或多个处理器,所述一或多个处理器经配置以:确定音频渲染信息,所述音频渲染信息包含识别当产生多信道音频内容时使用的音频渲染器的信号值;以及基于所述音频渲染信息渲染多个扬声器馈送。
在另一方面中,一种经配置以渲染来自位流的多信道音频内容的装置,所述装置包括:用于确定音频渲染信息的装置,所述音频渲染信息包含识别当产生多信道音频内容时使用的音频渲染器的信号值;以及用于基于所述音频渲染信息渲染多个扬声器馈送的装置。
在另一方面中,一种非暂时性计算机可读存储媒体具有存储于其上的指令,所述指令在执行时致使所述一或多个处理器:确定音频渲染信息,所述音频渲染信息包含识别当产生多信道音频内容时使用的音频渲染器的信号值;以及基于所述音频渲染信息渲染多个扬声器馈送。
在附图和以下描述中阐述所述技术的一或多个方面的细节。这些技术的其它特征、目标和优点将从所述描述和图式以及从权利要求书而显而易见。
附图说明
图1-3是说明具有各种阶和子阶的球面谐波基底函数的图。
图4是说明可实施本发明中描述的技术的各个方面的系统的图。
图5是说明可实施本发明中描述的技术的各个方面的系统的图。
图6是说明可执行本发明中描述的技术的各个方面的另一系统50的框图。
图7是说明可执行本发明中描述的技术的各个方面的另一系统60的框图。
图8A-8D是说明根据本发明中描述的技术形成的位流31A-31D的图。
图9是说明例如图4-8D的实例中展示的系统20、30、50和60中的一者等系统在执行本发明中描述的技术的各个方面时的实例操作的流程图。
具体实施方式
环绕声的演进现今已使得许多输出格式可用于娱乐。此类环绕声格式的实例包含流行的5.1格式(其包含以下六个信道:左前(FL)、右前(FR)、中央或前方中央、左后或环绕左、右后或环绕右以及低频效果(LFE)),发展的7.1格式和即将到来的22.2格式(例如,用于与超高清电视标准一起使用)。进一步的实例包含用于球面谐波阵列的格式。
到将来MPEG编码器的输入任选地是三种可能的格式中的一者:(i)传统的基于信道的音频,其意图经由预先指定的位置处的扬声器进行播放;(ii)基于对象的音频,其涉及具有含有其位置坐标(以及其它信息)的相关联元数据的用于单个音频对象的离散脉冲代码调制(PCM)数据;和(iii)基于场景的音频,其涉及使用球面谐波基底函数的系数(也称为“球面谐波系数”或SHC)来表示声场。
市场中存在各种‘环绕声’格式。它们的范围(例如)是从5.1家庭影院系统(其在使起居室享有立体声方面已获得最大成功)到NHK(日本广播协会或日本广播公司)所开发的22.2系统。内容创建者(例如,好莱坞工作室)将希望产生电影的音轨一次,而不花费精力来针对每一扬声器配置对其进行重混(remix)。最近,标准委员会已经考虑将编码提供到标准化位流中和对于在渲染器的位置处的扬声器几何形状及声学条件可调适且不可知的后续解码的方式。
为向内容创建者提供此种灵活性,可使用分层要素集合来表示声场。所述分层要素集合可指其中元素经排序以使得较低阶元素的基础集合提供模型化声场的完整表示的元素集合。随着所述集合经扩展以包含较高阶要素,所述表示变得更详细。
分层要素集合的一个实例为一组球面谐波系数(SHC)。以下表达式示范使用SHC对声场的描述或表示:
此表达式展示在声场的任何点{rr,θr,}处压力pi可由SHC唯一地表示。此处,c是声速(~343m/s),{rr,θr,}是参考点(或观察点),jn(·)是阶n的球面贝塞耳函数,且是阶n和子阶m的球面谐波基底函数。可认识到,方括号中的项为信号的频域表示(即,S(ω,rr,θr,)),其可通过各种时间-频率变换(例如,离散傅里叶变换(DFT)、离散余弦变换(DCT)或小波变换)来近似。分层集合的其它实例包含小波变换系数的集合和多分辨率基底函数的系数的其它集合。
图1是说明零阶球面谐波基底函数10、一阶球面谐波基底函数12A-12C以及二阶球面谐波基底函数14A-14E的图。所述阶是由表的行识别,所述行被表示为行16A-16C,其中行16A是指零阶,行16B是指一阶且行16C是指二阶。子阶由表的列识别,所述列表示为列18A-18E,其中列18A是指零子阶,列18B是指第一子阶,列18C是指负第一子阶,列18D是指第二子阶且列18E是指负第二子阶。对应于零阶球面谐波基底函数10的SHC可视为指定声场的能量,而对应于剩余的较高阶球面谐波基底函数(例如,球面谐波基底函数12A-12C和14A-14E)的SHC可指定所述能量的方向。
图2为说明从零阶(n=0)到四阶(n=4)的球面谐波基底函数的图。如可看出,对于每一阶,存在子阶m的扩展,出于易于说明的目的,在图2的实例中展示所述子阶但未明确注释。
图3为说明从零阶(n=0)到四阶(n=4)的球面谐波基底函数的另一图。在图3中,在三维坐标空间中展示球面谐波基底函数,其中展示了阶与子阶两者。
在任何情况下,可通过各种麦克风阵列配置物理地获取(例如,记录)SHC或替代地,可从声场的基于信道或基于对象的描述导出它们。前者表示到编码器的基于场景的音频输入。举例来说,可使用涉及1+24个(25,且因此为四阶)系数的四阶表示。
为说明可如何从基于对象的描述导出这些SHC,考虑以下等式。可将对应于个别音频对象的声场的系数表达为
其中i为是阶n的(第二种)球面汉克尔函数,且{rs,θs,}是对象的位置。了解源能量g(ω)作为频率的函数(例如,使用时间-频率分析技术,比如对PCM流执行快速傅里叶变换)允许我们将每一PCM对象及其位置转换为SHC此外,可展示(由于以上是线性且正交分解)针对每一对象的系数为加性的。以此方式,许多PCM对象可由系数(例如,作为个别对象的系数向量的总和)来表示。实质上,这些系数含有关于声场的信息(随3D坐标而变的压力),且以上情形表示在观测点{rr,θr,}附近的从个别对象到整体声场的表示的变换。下文在基于对象和基于SHC的音频译码的上下文中描述其余各图。
图4为说明可执行本发明中描述的技术以在表示音频数据的位流中用信号表示渲染信息的系统20的框图。如图4的实例中所展示,系统20包含内容创建者22和内容消费者24。内容创建者22可表示电影演播室或可产生多信道音频内容以供由例如内容消费者24等内容消费者消费的其它实体。常常,此内容创建者产生音频内容连同视频内容。内容消费者24表示拥有或具有对音频重放系统32的访问权的个体,所述音频重放系统32可指代能够重放多信道音频内容的任何形式的音频重放系统。在图4的实例中,内容消费者包含音频重放系统32。
内容创建者22包含音频渲染器28和音频编辑系统30。音频渲染器26可表示音频处理单元,其渲染或以其它方式产生扬声器馈送(其也可被称作“扩音器馈送”、“扬声器信号”或“扩音器信号”)。每一扬声器馈送可对应于再现针对多信道音频系统的特定信道的声音的扬声器馈送。在图4的实例中,渲染器38可渲染针对常规5.1、7.1或22.2环绕声格式的扬声器馈送,从而产生针对5.1、7.1或22.2环绕声扬声器系统中5、7或22个扬声器中的每一者的扬声器馈送。或者,渲染器28可经配置以在给定上文所论述的源球面谐波系数的性质的情况下针对具有任何数目的扬声器的任何扬声器配置从源球面谐波系数渲染扬声器馈送。渲染器28可以此方式产生若干扬声器馈送,其在图4中表示为扬声器馈送29。
内容创建者22可在编辑过程期间渲染球面谐波系数27(“SHC 27”)以产生扬声器馈送,从而收听所述扬声器馈送以试图识别并不具有高保真度或并不提供有说服力的环绕声体验的声场的方面。内容创建者22可随后编辑源球面谐波系数(常常经由操纵可以上文所描述的方式从其导出源球面谐波系数的不同对象而间接地进行)。内容创建者22可采用音频编辑系统30来编辑球面谐波系数27。音频编辑系统30表示能够编辑音频数据且输出此音频数据作为一或多个源球面谐波系数的任何系统。
当编辑过程完成时,内容创建者22可基于球面谐波系数27产生位流31。也就是说,内容创建者22包含位流产生装置36,其可表示能够产生位流31的任何装置。在一些情况下,位流产生装置36可表示编码器,其对球面谐波系数27进行带宽压缩(作为一个实例,经由熵编码)且其以所接受格式布置球面谐波系数27的经熵编码版本从而形成位流31。在其它情况下,位流产生装置36可表示音频编码器(可能利用例如MPEG环绕或其衍生物等已知音频译码标准编译的音频编码器),其使用(作为一个实例)类似于常规音频环绕声编码过程的过程编码多信道音频内容29以压缩所述多信道音频内容或其衍生物。经压缩多信道音频内容29可随后以某一其它方式经熵编码或译码以对内容29进行带宽压缩,且根据协定的格式布置从而形成位流31。不论是直接压缩从而形成位流31还是渲染且随后压缩从而形成位流31,内容创建者22都可将位流31发射到内容消费者24。
虽然图4中展示为直接发射到内容消费者24,但内容创建者22可将位流31输出到定位在内容创建者22与内容消费者24之间的中间装置。此中间装置可存储位流31以供稍后递送到可请求此位流的内容消费者24。所述中间装置可包括文件服务器、网络服务器、台式计算机、膝上型计算机、平板计算机、移动电话、智能电话,或能够存储位流31以供音频解码器稍后检索的任何其它装置。或者,内容创建者22可将位流31存储到存储媒体,例如压缩光盘、数字视频光盘、高清视频光盘或其它存储媒体,其大部分能够由计算机读取且因此可被称为计算机可读存储媒体。在此上下文中,传输信道可指代借以发射存储到这些媒体的内容的那些信道(且可包含零售商店和其它基于商店的递送机制)。在任何情况下,本发明的技术因此就此而言不应限于图4的实例。
如图4的实例中进一步展示,内容消费者24包含音频重放系统32。音频重放系统32可表示能够重放多信道音频数据的任何音频重放系统。音频重放系统32可包含若干不同渲染器34。渲染器34可各自提供不同形式的渲染,其中所述不同形式的渲染可包含执行基于向量的振幅水平移动(VBAP)的各种方式中的一或多者、执行基于距离的振幅水平移动(DBAP)的各种方式中的一或多者、执行简单水平移动的各种方式中的一或多者、执行近场补偿(NFC)滤波的各种方式中的一或多者和/或执行波场合成的各种方式中的一或多者。
音频重放系统32可进一步包含提取装置38。提取装置38可表示能够经由可大体与位流产生装置36的过程互逆的过程提取球面谐波系数27'(“SHC27'”,其可表示球面谐波系数27的经修改形式或副本)的任何装置。在任何情况下,音频重放系统32可接收球面谐波系数27'。音频重放系统32可随后选择渲染器34中的一者,其随后渲染球面谐波系数27'以产生若干扬声器馈送35(对应于电学上或可能以无线方式耦合到音频重放系统32的扩音器的数目,所述扩音器为便于说明的目的在图4的实例中未图示)。
通常,音频重放系统32可选择音频渲染器34中的任一者且可经配置以取决于从其接收位流31的源(例如,DVD播放器、蓝光播放器、智能电话、平板计算机、游戏系统和电视机,仅提供几个实例)来选择音频渲染器34中的一或多者。虽然可选择音频渲染器34中的任一者,但常常当产生内容时使用的音频渲染器归因于所述内容是由内容创建者22使用音频渲染器中的此一者(即,在图4的实例中的音频渲染器28)产生的事实而提供较好(且可能最佳)形式的渲染。选择相同或至少接近(就渲染形式而言)的音频渲染器34中的所述一者可提供声场的较好表示且可为内容消费者24产生较好环绕声体验。
根据本发明中描述的技术,位流产生装置36可产生位流31以包含音频渲染信息39(“音频渲染信息39”)。音频渲染信息39可包含识别当产生多信道音频内容时使用的音频渲染器(即,在图4的实例中的音频渲染器28)的信号值。在一些情况下,所述信号值包含用于将球面谐波系数渲染到多个扬声器馈送的矩阵。
在一些情况下,信号值包含两个或两个以上位,其界定指示位流包含用于将球面谐波系数渲染到多个扬声器馈送的矩阵的索引。在一些情况下,当使用索引时,所述信号值进一步包含界定包含于位流中的矩阵的行的数目的两个或两个以上位,以及界定包含于位流中的矩阵的列的数目的两个或两个以上位。使用此信息且假定二维矩阵的每一系数通常由32位浮点数定义,可计算就矩阵的位而言的大小作为行的数目、列的数目,以及界定矩阵的每一系数的浮点数的大小(即,在此实例中,32位)的函数。
在一些情况下,信号值指定用于将球面谐波系数渲染到多个扬声器馈送的渲染算法。所述渲染算法可包含位流产生装置36和提取装置38两者已知的矩阵。也就是说,渲染算法可包含矩阵的应用以及其它渲染步骤,例如水平移动(例如,VBAP、DBAP或简单水平移动)或NFC滤波。在一些情况下,信号值包含两个或两个以上位,其界定与用于将球面谐波系数渲染到多个扬声器馈送的多个矩阵中的一者相关联的索引。再次,位流产生装置36和提取装置38两者可经配置有指示所述多个矩阵和所述多个矩阵的次序的信息使得所述索引可唯一地识别所述多个矩阵中的特定一者。或者,位流产生装置36可指定位流31中的数据,其界定所述多个矩阵和/或所述多个矩阵的次序使得所述索引可唯一地识别所述多个矩阵中的特定一者。
在一些情况下,信号值包含两个或两个以上位,其界定与用于将球面谐波系数渲染到多个扬声器馈送的多个渲染算法中的一者相关联的索引。再次,位流产生装置36和提取装置38两者可经配置有指示所述多个渲染算法和所述多个渲染算法的次序的信息使得所述索引可唯一地识别所述多个矩阵中的特定一者。或者,位流产生装置36可指定位流31中的数据,其界定所述多个矩阵和/或所述多个矩阵的次序使得所述索引可唯一地识别所述多个矩阵中的特定一者。
在一些情况下,位流产生装置36指定位流中的以每音频帧为基础的音频渲染信息39。在其它情况下,位流产生装置36指定位流中单次的音频渲染信息39。
提取装置38可随后确定位流中指定的音频渲染信息39。基于包含于音频渲染信息39中的信号值,音频重放系统32可基于音频渲染信息39渲染多个扬声器馈送35。如上所述,信号值可在一些情况下包含用于将球面谐波系数渲染到多个扬声器馈送的矩阵。在此情况下,音频重放系统32可用所述矩阵配置音频渲染器34中的一者,从而使用音频渲染器34中的此一者基于所述矩阵渲染扬声器馈送35。
在一些情况下,信号值包含两个或两个以上位,其界定指示位流包含用于将球面谐波系数27'渲染到多个扬声器馈送35的矩阵的索引。提取装置38可响应于所述索引解析来自位流的矩阵,于是音频重放系统32可用经解析的矩阵配置音频渲染器34中的一者且调用渲染器34中的此一者来渲染扬声器馈送35。当信号值包含界定包含于位流中的矩阵的行的数目的两个或两个以上位以及界定包含于位流中的矩阵的列的数目的两个或两个以上位时,提取装置38可响应于所述索引且基于界定行的数目的所述两个或两个以上位以及界定列的数目的所述两个或两个以上位以上文所描述的方式解析来自位流的矩阵。
在一些情况下,信号值指定用于将球面谐波系数27'渲染到扬声器馈送35的渲染算法。在这些情况下音频渲染器34中的一些或全部可执行这些渲染算法。音频重放装置32可随后利用指定的渲染算法(例如,音频渲染器34中的一者)来渲染来自球面谐波系数27'的扬声器馈送35。
当信号值包含界定与用于将球面谐波系数27'渲染到扬声器馈送35的多个矩阵中的一者相关联的索引的两个或两个以上位时,音频渲染器34中的一些或全部可表示此多个矩阵。因此,音频重放系统32可使用与所述索引相关联的音频渲染器34中的所述一者渲染来自球面谐波系数27'的扬声器馈送35。
当信号值包含界定与用于将球面谐波系数27'渲染到扬声器馈送35的多个渲染算法中的一者相关联的索引的两个或两个以上位时,音频渲染器34中的一些或全部可表示这些渲染算法。因此,音频重放系统32可使用与所述索引相关联的音频渲染器34中的一者渲染来自球面谐波系数27'的扬声器馈送35。
取决于在位流中指定此音频渲染信息的频率,提取装置38可以每音频帧为基础或单次确定音频渲染信息39。
通过以此方式指定音频渲染信息39,所述技术可潜在地产生多信道音频内容35的较好再现且根据内容创建者22意图再现多信道音频内容35的方式。因此,所述技术可提供较沉浸式环绕声或多信道音频体验。
虽然描述为在位流中用信号表示(或以其它方式指定),但音频渲染信息39可指定为与位流分开的元数据,或换句话说与位流分开的旁侧信息。位流产生装置36可与位流31分开而产生此音频渲染信息39以便维持与并不支持本发明中描述的技术的那些提取装置的位流兼容性(且借此通过所述提取装置实现成功解析)。因此,虽然描述为在位流中指定,但所述技术可允许借以与位流31分开而指定音频渲染信息39的其它方式。
此外,虽然描述为在位流31中或在与位流31分开的元数据或旁侧信息中用信号表示或以其它方式指定,但所述技术可使位流产生装置36能够指定位流31中的音频渲染信息39的一部分和作为与位流31分开的元数据的音频渲染信息39的一部分。举例来说,位流产生装置36可指定识别位流31中的矩阵的索引,其中指定包含经识别矩阵的多个矩阵的表可指定为与位流分开的元数据。音频重放系统32可随后以索引的形式从位流31以及从与位流31分开指定的元数据确定音频渲染信息39。音频重放系统32可在一些情况下经配置以从经预配置或配置的服务器(最可能由音频重放系统32的制造商或标准主体代管)下载或以其它方式检索所述表和任何其它元数据。
换句话说且如上所述,高阶数立体混响(HOA)可表示借以基于空间傅里叶变换描述声场的方向信息的方式。通常,立体混响阶数N越高,空间分辨率就越高,球面谐波(SH)系数的数目(N+1)^2越大,用于发射和存储数据所需要的带宽就越大。
此描述的一潜在优点为,可能在几乎任何扬声器设置(例如,5.1、7.122.2...)上再现此声场。从声场描述到扬声器信号的转换可经由具有(N+1)2输入和M输出的静态渲染矩阵来进行。因此,每一扬声器设置可需要专门的渲染矩阵。可存在用于计算针对所要扬声器设置的渲染矩阵的若干算法,所述所要扬声器设置可针对例如Gerzon准则等特定客观或主观量度而优化。对于不规律扬声器设置,算法可归因于例如凸面优化等迭代数值优化程序而变复杂。为在无等待时间的情况下计算针对不规律扬声器布局的渲染矩阵,具有足够的计算资源可用可能是有益的。不规律扬声器设置可归因于架构约束和美学偏好在国内客厅环境中是常见的。因此,对于最佳声场再现,针对此些情形优化的渲染矩阵可能是优选的,因为其可实现更准确地再现声场。
因为音频解码器通常并不需要许多的计算资源,所以所述装置可能不能够在消费者友好时间计算不规律渲染矩阵。本发明中描述的技术的各个方面可提供基于云的计算方法的使用,如下:
1.音频解码器可经由因特网连接将扬声器坐标(以及,在一些情况下,还有利用校准麦克风获得的SPL测量值)发送到服务器。
2.基于云的服务器可计算渲染矩阵(以及可能几个不同版本,使得消费者可稍后从这些不同版本选择)。
3.服务器可随后将渲染矩阵(或所述不同版本)经由因特网连接发送回到音频解码器。
此方法可允许制造商保持音频解码器的制造成本较低(因为可不需要强大的处理器来计算这些不规律渲染矩阵),同时还促进与通常经设计用于常规扬声器配置或几何形状的渲染矩阵相比更好的音频再现。用于计算渲染矩阵的算法还可在音频解码器已运送之后经优化,从而潜在地减少用于硬件修改乃至召回的成本。在一些情况下,所述技术还可搜集关于可有益于将来产品发展的消费品的不同扬声器设置的许多信息。
图5是说明可执行本发明中描述的技术的其它方面的另一系统30的框图。虽然展示为与系统20分离的系统,但系统20和系统30两者可集成在单一系统内或以其它方式由单一系统执行。在上文描述的图4的实例中,在球面谐波系数的上下文中描述所述技术。然而,所述技术可同样相对于声场的任何表示执行,包含作为一或多个音频对象俘获所述声场的表示。音频对象的实例可包含脉冲代码调制(PCM)音频对象。因此,系统30表示与系统20类似的系统,只是所述技术可相对于音频对象41和41'而非球面谐波系数27和27'执行。
在此上下文中,音频渲染信息39可在一些情况下指定渲染算法,即在图5的实例中由音频渲染器29采用的用于将音频对象41渲染到扬声器馈送29的渲染算法。在其它情况下,音频渲染信息39包含界定与多个渲染算法中的一者相关联的索引的两个或两个以上位,所述多个渲染算法中的一者即与图5的实例中的音频渲染器28相关联的用于将音频对象41渲染到扬声器馈送29的渲染算法。
当音频渲染信息39指定用于将音频对象39'渲染到所述多个扬声器馈送的渲染算法时,音频渲染器34中的一些或全部可表示或以其它方式执行不同渲染算法。音频重放系统32可随后使用音频渲染器34中的所述一者渲染来自音频对象39'的扬声器馈送35。
在其中音频渲染信息39包含界定与用于将音频对象39渲染到扬声器馈送35的多个渲染算法中的一者相关联的索引的两个或两个以上位的例子中,音频渲染器34中的一些或全部可表示或以其它方式执行不同渲染算法。音频重放系统32可随后使用与所述索引相关联的音频渲染器34中的所述一者渲染来自音频对象39'的扬声器馈送35。
虽然上文描述为包括二维矩阵,但所述技术可相对于任何维度的矩阵实施。在一些情况下,所述矩阵可仅具有实数系数。在其它情况下,所述矩阵可包含复合系数,其中虚数分量可表示或引入额外维度。在一些上下文中中,具有复合系数的矩阵可被称为滤波器。
以下是概述以上技术的一种方式。在基于对象或较高阶数立体混响(HoA)的3D/2D声场重建的情况下,可存在所涉及的渲染器。可存在所述渲染器的两个用途。第一用途可为考虑本地条件(例如扩音器的数目和几何形状)以优化本地声学景观中的声场重建。第二用途可为,例如在内容创建时将其提供到声音艺术家使得他/她可提供内容的艺术意图。正解决的一个潜在问题是,连同音频内容一起发射关于哪一渲染器用于创建所述内容的信息。
本发明中描述的技术可提供以下各者中的一或多者:(i)渲染器的发射(在典型HoA实施例中-此为大小NxM的矩阵,其中N为扩音器的数目且M为HoA系数的数目);或(ii)索引到普遍已知的渲染器的表的发射。
再次,虽然描述为在位流中用信号表示(或以其它方式指定),但音频渲染信息39可指定为与位流分开的元数据,或换句话说与位流分开的旁侧信息。位流产生装置36可与位流31分开而产生此音频渲染信息39以便维持与并不支持本发明中描述的技术的那些提取装置的位流兼容性(且借此通过所述提取装置实现成功解析)。因此,虽然描述为在位流中指定,但所述技术可允许借以与位流31分开而指定音频渲染信息39的其它方式。
此外,虽然描述为在位流31中或在与位流31分开的元数据或旁侧信息中用信号表示或以其它方式指定,但所述技术可使位流产生装置36能够指定位流31中的音频渲染信息39的一部分和作为与位流31分开的元数据的音频渲染信息39的一部分。举例来说,位流产生装置36可指定识别位流31中的矩阵的索引,其中指定包含经识别矩阵的多个矩阵的表可指定为与位流分开的元数据。音频重放系统32可随后以索引的形式从位流31以及从与位流31分开指定的元数据确定音频渲染信息39。音频重放系统32可在一些情况下经配置以从经预配置或配置的服务器(最可能由音频重放系统32的制造商或标准主体代管)下载或以其它方式检索所述表和任何其它元数据。
图6是说明可执行本发明中描述的技术的各个方面的另一系统50的框图。虽然展示为与系统20和系统30分开的系统,但系统20、30和50的各个方面可集成在单一系统内或以其它方式由单一系统执行。系统50可类似于系统20和30,只是系统50可相对于音频内容51操作,音频内容51可表示类似于音频对象41的音频对象中的一或多者和类似于SHC 27的SHC。另外,系统50可不用信号表示如上文相对于图4和5的实例所描述的位流31中的音频渲染信息39,而是改为将此音频渲染信息39用信号表示为与位流31分开的元数据53。
图7是说明可执行本发明中描述的技术的各个方面的另一系统60的框图。虽然展示为与系统20、30和50分开的系统,但系统20、30、50和60的各个方面可集成在单一系统内或以其它方式由单一系统执行。系统60可类似于系统50,只是系统60可用信号表示如上文相对于图4和5的实例所描述的位流31中的音频渲染信息39的一部分,以及用信号表示作为与位流31分开的元数据53的此音频渲染信息39的一部分。在一些实例中,位流产生装置36可输出元数据53,其可随后上载到服务器或其它装置。音频重放系统32可随后下载或以其它方式检索此元数据53,其随后用于扩增由提取装置38从位流31提取的音频渲染信息。
图8A-8D是说明根据本发明中描述的技术形成的位流31A-31D的图。在图8A的实例中,位流31A可表示上文图4、5和8中展示的位流31的一个实例。位流31A包含包括界定信号值54的一或多个位的音频渲染信息39A。此信号值54可表示下文描述的类型的信息的任何组合。位流31A还包含音频内容58,其可表示音频内容51的一个实例。
在图8B的实例中,位流31B可类似于位流31A,其中信号值54包括索引54A、界定所用信号表示矩阵的行大小54B的一或多个位、界定所用信号表示矩阵的列大小54C的一或多个位,以及矩阵系数54D。索引54A可使用两个到五个位界定,而行大小54B和列大小54C中的每一者可使用两个到十六个位界定。
提取装置38可提取索引54A且确定所述索引是否用信号表示矩阵包含于位流31B中(其中例如0000或1111等特定索引值可用信号表示在位流31B中明确指定所述矩阵)。在图8B的实例中,位流31B包含用信号表示在位流31B中明确指定所述矩阵的索引54A。因此,提取装置38可提取行大小54B和列大小54C。提取装置38可经配置以计算表示矩阵系数的待解析的位数目作为每一矩阵系数的行大小54B、列大小54C和所用信号表示(图8A中未图示)或暗示的位大小的函数。使用这些所确定的位数目,提取装置38可提取矩阵系数54D,音频重放装置24可使用矩阵系数54D来配置如上文所描述的音频渲染器34中的一者。虽然展示为在位流31B中单次用信号表示音频渲染信息39B,但音频渲染信息39B可在位流31B中或至少部分或完全在单独带外信道(在一些情况下作为任选数据)中用信号表示多次。
在图8C的实例中,位流31C可表示上文图4、5和8中展示的位流31的一个实例。位流31C包含包括在此实例中指定算法索引54E的信号值54的音频渲染信息39C。位流31C还包含音频内容58。算法索引54E可使用两个到五个位界定(如上所述),其中此算法索引54E可识别将在渲染音频内容58时使用的渲染算法。
提取装置38可提取算法索引50E且确定算法索引54E是否用信号表示矩阵包含于位流31C中(其中例如0000或1111等特定索引值可用信号表示在位流31C中明确指定所述矩阵)。在图8C的实例中,位流31C包含用信号表示未在位流31C中明确指定所述矩阵的算法索引54E。因此,提取装置38将算法索引54E转发到音频重放装置,音频重放装置选择渲染算法中的对应一者(如果可用)(其在图4-8的实例中表示为渲染器34)。虽然展示为在位流31C中单次用信号表示音频渲染信息39C,但在图8C的实例中,音频渲染信息39C可在位流31C中或至少部分或完全在单独带外信道(在一些情况下作为任选数据)用信号表示多次。
在图8D的实例中,位流31C可表示上文图4、5和8中展示的位流31的一个实例。位流31D包含包括在此实例中指定矩阵索引54F的信号值54的音频渲染信息39D。位流31D还包含音频内容58。矩阵索引54F可使用两个到五个位界定(如上所述),其中矩阵索引54F可识别将在渲染音频内容58时使用的渲染算法。
提取装置38可提取矩阵索引50F且确定矩阵索引54F是否用信号表示矩阵包含于位流31D中(其中例如0000或1111等特定索引值可用信号表示在位流31C中明确指定所述矩阵)。在图8D的实例中,位流31D包含用信号表示未在位流31D中明确指定所述矩阵的矩阵索引54F。因此,提取装置38将矩阵索引54F转发到音频重放装置,音频重放装置选择渲染器34中的对应一者(如果可用)。虽然展示为在位流31D中单次用信号表示音频渲染信息39D,但在图8D的实例中,音频渲染信息39D可在位流31D中或至少部分或完全在单独带外信道(在一些情况下作为任选数据)用信号表示多次。
图9是说明例如图4-8D的实例中展示的系统20、30、50和60中的一者等系统在执行本发明中描述的技术的各个方面时的实例操作的流程图。尽管下文相对于系统20描述,但相对于图9论述的技术也可由系统30、50和60中的任一者实施。
如上文所论述,内容创建者22可采用音频编辑系统30创建或编辑所俘获或产生的音频内容(其在图4的实例中展示为SHC 27)。内容创建者22可随后使用音频渲染器28渲染SHC 27以产生多信道扬声器馈送29,如上文更详细论述(70)。内容创建者22可随后使用音频重放系统播放这些扬声器馈送29且确定是否需要进一步调整或编辑来俘获(作为一个实例)所要艺术意图(72)。当需要进一步调整时(“是”72),内容创建者22可重混SHC 27(74),渲染SHC 27(70),且确定进一步调整是否是必需的(72)。当不需要进一步调整时(“否”72),位流产生装置36可产生表示音频内容的位流31(76)。位流产生装置36还可产生和指定位流31中的音频渲染信息39,如上文更详细描述(78)。
内容消费者24可随后获得位流31和音频渲染信息39(80)。作为一个实例,提取装置38可随后从位流31提取音频内容(其在图4的实例中展示为SHC 27')和音频渲染信息39。音频重放装置32可随后基于音频渲染信息39以上文所描述的方式渲染SHC 27'(82)且播放所述经渲染的音频内容(84)。
本发明中描述的技术可因此实现(作为第一实例)产生表示多信道音频内容的位流以指定音频渲染信息的装置。所述装置可在此第一实例中包含用于指定音频渲染信息的装置,所述音频渲染信息包含识别当产生多信道音频内容时使用的音频渲染器的信号值。
第一实例的装置,其中信号值包含用于将球面谐波系数渲染到多个扬声器馈送的矩阵。
在第二实例中,第一实例的装置,其中信号值包含两个或两个以上位,其界定指示位流包含用于将球面谐波系数渲染到多个扬声器馈送的矩阵的索引。
第二实例的装置,其中音频渲染信息进一步包含界定包含于位流中的矩阵的行的数目的两个或两个以上位,以及界定包含于位流中的矩阵的列的数目的两个或两个以上位。
第一实例的装置,其中信号值指定用于将音频对象渲染到多个扬声器馈送的渲染算法。
第一实例的装置,其中信号值指定用于将球面谐波系数渲染到多个扬声器馈送的渲染算法。
第一实例的装置,其中信号值包含两个或两个以上位,其界定与用于将球面谐波系数渲染到多个扬声器馈送的多个矩阵中的一者相关联的索引。
第一实例的装置,其中信号值包含两个或两个以上位,其界定与用于将音频对象渲染到多个扬声器馈送的多个渲染算法中的一者相关联的索引。
第一实例的装置,其中信号值包含两个或两个以上位,其界定与用于将球面谐波系数渲染到多个扬声器馈送的多个渲染算法中的一者相关联的索引。
第一实例的装置,其中所述用于指定音频渲染信息的装置包括用于在位流中以每音频帧为基础指定音频渲染信息的装置。
第一实例的装置,其中所述用于指定音频渲染信息的装置包括用于在位流中单次指定音频渲染信息的装置。
在第三实例中,一种具有存储于其上的指令的非暂时性计算机可读存储媒体,所述指令在执行时致使一或多个处理器指定位流中的音频渲染信息,其中所述音频渲染信息识别当产生多信道音频内容时使用的音频渲染器。
在第四实例中,一种用于渲染来自位流的多信道音频内容的装置,所述装置包括:用于确定音频渲染信息的装置,所述音频渲染信息包含识别当产生多信道音频内容时使用的音频渲染器的信号值;以及用于基于位流中指定的音频渲染信息渲染多个扬声器馈送的装置。
第四实例的装置,其中所述信号值包含用于将球面谐波系数渲染到多个扬声器馈送的矩阵,且其中所述用于渲染所述多个扬声器馈送的装置包括用于基于所述矩阵渲染所述多个扬声器馈送的装置。
在第五实例中,第四实例的装置,其中所述信号值包含两个或两个以上位,其界定指示位流包含用于将球面谐波系数渲染到多个扬声器馈送的矩阵的索引,其中所述装置进一步包括用于响应于所述索引解析来自位流的矩阵的装置,且其中所述用于渲染所述多个扬声器馈送的装置包括用于基于所述经解析矩阵渲染所述多个扬声器馈送的装置。
第五实例的装置,其中所述信号值进一步包含界定包含于位流中的矩阵的行的数目的两个或两个以上位以及界定包含于位流中的矩阵的列的数目的两个或两个以上位,且其中所述用于解析来自位流的矩阵的装置包括用于响应于所述索引且基于界定行的数目的所述两个或两个以上位和界定列的数目的所述两个或两个以上位解析来自位流的矩阵的装置。
第四实例的装置,其中所述信号值指定用于将音频对象渲染到所述多个扬声器馈送的渲染算法,且其中所述用于渲染所述多个扬声器馈送的装置包括用于使用所述指定的渲染算法从音频对象渲染所述多个扬声器馈送的装置。
第四实例的装置,其中所述信号值指定用于将球面谐波系数渲染到所述多个扬声器馈送的渲染算法,且其中所述用于渲染所述多个扬声器馈送的装置包括用于使用所述指定的渲染算法从球面谐波系数渲染所述多个扬声器馈送的装置。
第四实例的装置,其中所述信号值包含两个或两个以上位,其界定与用于将球面谐波系数渲染到所述多个扬声器馈送的多个矩阵中的一者相关联的索引,且其中所述用于渲染所述多个扬声器馈送的装置包括用于使用与所述索引相关联的所述多个矩阵中的所述一者从所述球面谐波系数渲染所述多个扬声器馈送的装置。
第四实例的装置,其中所述信号值包含两个或两个以上位,其界定与用于将音频对象渲染到所述多个扬声器馈送的多个渲染算法中的一者相关联的索引,且其中所述用于渲染所述多个扬声器馈送的装置包括用于使用与所述索引相关联的所述多个渲染算法中的所述一者从音频对象渲染所述多个扬声器馈送的装置。
第四实例的装置,其中所述信号值包含两个或两个以上位,其界定与用于将球面谐波系数渲染到多个扬声器馈送的多个渲染算法中的一者相关联的索引,且其中所述用于渲染所述多个扬声器馈送的装置包括用于使用与所述索引相关联的所述多个渲染算法中的所述一者从所述球面谐波系数渲染所述多个扬声器馈送的装置。
第四实例的装置,其中所述用于确定音频渲染信息的装置包含用于从位流以每音频帧为基础确定音频渲染信息的装置。
第四实例的装置,其中所述用于确定音频渲染信息的装置包含用于从位流单次确定音频渲染信息的装置。
在第六实例中,一种具有存储于其上的指令的非暂时性计算机可读存储媒体,所述指令在执行时致使一或多个处理器:确定音频渲染信息,所述音频渲染信息包含识别当产生多信道音频内容时使用的音频渲染器的信号值;且基于位流中指定的所述音频渲染信息渲染多个扬声器馈送。
应理解,取决于实例,本文中的任何所描述的方法的某些动作或事件可以不同序列执行、可以添加、合并或全部省略(例如,实践所述方法并不需要所有的所描述动作或事件)。此外,在某些实例中,可例如经由多线程处理、中断处理或多个处理器同时而非循序执行动作或事件。此外,虽然为了清晰起见,本发明的某些方面被描述为是通过单个装置、模块或单元执行,但应理解,本发明的技术可以通过装置、单元或模块的组合执行。
在一或多个实例中,所描述的功能可实施在硬件或硬件与软件的组合(其可包含固件)中。如果用软件实施,则所述功能可作为一或多个指令或代码在非暂时性计算机可读媒体上存储或发射,且由基于硬件的处理单元来执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体,例如数据存储媒体,或包括任何促进将计算机程序从一处传送到另一处的媒体(例如,根据通信协议)的通信媒体。
以此方式,计算机可读媒体一般可对应于(1)非暂时性的有形计算机可读存储媒体或(2)例如信号或载波等通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
借助于实例而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用来存储指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。并且,任何连接被适当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源发射指令,那么同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包含于媒体的定义中。
然而,应理解,所述计算机可读存储媒体和数据存储媒体并不包含连接、载波、信号或其它暂时媒体,而是实际上针对于非暂时性有形存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。
指令可由一或多个处理器执行,所述一或多个处理器例如是一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA),或其它等效的集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。此外,在一些方面中,本文所描述的功能性可提供于经配置以用于编码和解码的专用硬件和/或软件模块内,或者并入于组合式编解码器中。而且,可将所述技术完全实施于一或多个电路或逻辑元件中。
本发明的技术可在广泛多种装置或设备中实施,包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所揭示的技术的装置的功能方面,但未必需要通过不同硬件单元实现。实际上,如上文所描述,各种单元可结合合适的软件和/或固件组合在编解码器硬件单元中,或者由互操作硬件单元的集合来提供,所述硬件单元包含如上文所描述的一或多个处理器。
已描述所述技术的各种实施例。这些和其它实施例在所附权利要求书的范围内。
Claims (30)
1.一种产生表示多信道音频内容的位流的方法,所述方法包括:
指定音频渲染信息,所述音频渲染信息包含识别当产生所述多信道音频内容时使用的音频渲染器的信号值。
2.根据权利要求1所述的方法,其中所述信号值包含用于将球面谐波系数渲染到多个扬声器馈送的矩阵。
3.根据权利要求1所述的方法,其中所述信号值包含两个或两个以上位,所述两个或两个以上位界定指示所述位流包含用于将球面谐波系数渲染到多个扬声器馈送的矩阵的索引。
4.根据权利要求3所述的方法,其中所述信号值进一步包含界定包含于所述位流中的所述矩阵的行的数目的两个或两个以上位以及界定包含于所述位流中的所述矩阵的列的数目的两个或两个以上位。
5.根据权利要求1所述的方法,其中所述信号值指定用于将音频对象或球面谐波系数渲染到多个扬声器馈送的渲染算法。
6.根据权利要求1所述的方法,其中所述信号值包含两个或两个以上位,所述两个或两个以上位界定与用于将音频对象或球面谐波系数渲染到多个扬声器馈送的多个矩阵中的一者相关联的索引。
7.根据权利要求1所述的方法,其中所述信号值包含两个或两个以上位,所述两个或两个以上位界定与用于将球面谐波系数渲染到多个扬声器馈送的多个渲染算法中的一者相关联的索引。
8.根据权利要求1所述的方法,其中指定所述音频渲染信息包含在所述位流中以每音频帧为基础、在所述位流中单次或从与所述位流分开的元数据指定所述音频渲染信息。
9.一种经配置以产生表示多信道音频内容的位流的装置,所述装置包括:
一或多个处理器,其经配置以指定音频渲染信息,所述音频渲染信息包含识别当产生所述多信道音频内容时使用的音频渲染器的信号值。
10.根据权利要求9所述的装置,其中所述信号值包含用于将球面谐波系数渲染到多个扬声器馈送的矩阵。
11.根据权利要求9所述的装置,其中所述信号值包含两个或两个以上位,所述两个或两个以上位界定指示所述位流包含用于将球面谐波系数渲染到多个扬声器馈送的矩阵的索引。
12.根据权利要求11所述的装置,其中所述信号值进一步包含界定包含于所述位流中的所述矩阵的行的数目的两个或两个以上位以及界定包含于所述位流中的所述矩阵的列的数目的两个或两个以上位。
13.根据权利要求9所述的装置,其中所述信号值指定用于将音频对象或球面谐波系数渲染到多个扬声器馈送的渲染算法。
14.根据权利要求9所述的装置,其中所述信号值包含两个或两个以上位,所述两个或两个以上位界定与用于将音频对象或球面谐波系数渲染到多个扬声器馈送的多个矩阵中的一者相关联的索引。
15.根据权利要求9所述的装置,其中所述信号值包含两个或两个以上位,所述两个或两个以上位界定与用于将球面谐波系数渲染到多个扬声器馈送的多个渲染算法中的一者相关联的索引。
16.一种渲染来自位流的多信道音频内容的方法,所述方法包括:
确定音频渲染信息,所述音频渲染信息包含识别当产生所述多信道音频内容时使用的音频渲染器的信号值;以及
基于所述音频渲染信息渲染多个扬声器馈送。
17.根据权利要求16所述的方法,
其中所述信号值包含用于将球面谐波系数渲染到多个扬声器馈送的矩阵,且
其中渲染所述多个扬声器馈送包括基于包含于所述信号值中的所述矩阵渲染所述多个扬声器馈送。
18.根据权利要求16所述的方法,
其中所述信号值包含两个或两个以上位,所述两个或两个以上位界定指示所述位流包含用于将球面谐波系数渲染到多个扬声器馈送的矩阵的索引,且
其中所述方法进一步包括响应于所述索引解析来自所述位流的所述矩阵,且
其中渲染所述多个扬声器馈送包括基于所述经解析矩阵渲染所述多个扬声器馈送。
19.根据权利要求18所述的方法,
其中所述信号值进一步包含界定包含于所述位流中的所述矩阵的行的数目的两个或两个以上位以及界定包含于所述位流中的所述矩阵的列的数目的两个或两个以上位,且
其中解析来自所述位流的所述矩阵包括响应于所述索引且基于界定行的数目的所述两个或两个以上位和界定列的数目的所述两个或两个以上位解析来自所述位流的所述矩阵。
20.根据权利要求16所述的方法,
其中所述信号值指定用于将音频对象或球面谐波系数渲染到所述多个扬声器馈送的渲染算法,且
其中渲染所述多个扬声器馈送包括使用所述指定的渲染算法从所述音频对象或所述球面谐波系数渲染所述多个扬声器馈送。
21.根据权利要求16所述的方法,
其中所述信号值包含两个或两个以上位,所述两个或两个以上位界定与用于将音频对象或球面谐波系数渲染到所述多个扬声器馈送的多个矩阵中的一者相关联的索引,且
其中渲染所述多个扬声器馈送包括使用与所述索引相关联的所述多个矩阵中的所述一者从所述音频对象或所述球面谐波系数渲染所述多个扬声器馈送。
22.根据权利要求16所述的方法,
其中所述音频渲染信息包含两个或两个以上位,所述两个或两个以上位界定与用于将球面谐波系数渲染到多个扬声器馈送的多个渲染算法中的一者相关联的索引,且
其中渲染所述多个扬声器馈送包括使用与所述索引相关联的所述多个渲染算法中的所述一者从所述球面谐波系数渲染所述多个扬声器馈送。
23.根据权利要求16所述的方法,其中确定所述音频渲染信息包含从所述位流以每音频帧为基础、从所述位流单次或从与所述位流分开的元数据确定所述音频渲染信息。
24.一种经配置以渲染来自位流的多信道音频内容的装置,所述装置包括:
一或多个处理器,其经配置以:确定音频渲染信息,所述音频渲染信息包含识别当产生所述多信道音频内容时使用的音频渲染器的信号值;且基于所述音频渲染信息渲染多个扬声器馈送。
25.根据权利要求24所述的装置,
其中所述信号值包含用于将球面谐波系数渲染到多个扬声器馈送的矩阵,且
其中所述一或多个处理器进一步经配置以当渲染所述多个扬声器馈送时基于包含于所述信号值中的所述矩阵渲染所述多个扬声器馈送。
26.根据权利要求24所述的装置,
其中所述信号值包含两个或两个以上位,所述两个或两个以上位界定指示所述位流包含用于将球面谐波系数渲染到多个扬声器馈送的矩阵的索引,
其中所述一或多个处理器进一步经配置以响应于所述索引解析来自所述位流的所述矩阵,且
其中所述一或多个处理器进一步经配置以当渲染所述多个扬声器馈送时渲染所述多个扬声器馈送包括基于所述经解析矩阵渲染所述多个扬声器馈送。
27.根据权利要求26所述的装置,
其中所述信号值进一步包含界定包含于所述位流中的所述矩阵的行的数目的两个或两个以上位以及界定包含于所述位流中的所述矩阵的列的数目的两个或两个以上位,且
其中所述一或多个处理器进一步经配置以当解析来自所述位流的所述矩阵时,响应于所述索引且基于界定行的数目的所述两个或两个以上位和界定列的数目的所述两个或两个以上位解析来自所述位流的所述矩阵。
28.根据权利要求24所述的装置,
其中所述信号值指定用于将音频对象或球面谐波系数渲染到所述多个扬声器馈送的渲染算法,且
其中所述一或多个处理器进一步经配置以当渲染所述多个扬声器馈送时渲染所述多个扬声器馈送包括使用所述指定的渲染算法从所述音频对象或所述球面谐波系数渲染所述多个扬声器馈送。
29.根据权利要求24所述的装置,
其中所述信号值包含两个或两个以上位,所述两个或两个以上位界定与用于将音频对象或球面谐波系数渲染到所述多个扬声器馈送的多个矩阵中的一者相关联的索引,且
其中所述一或多个处理器进一步经配置以当渲染所述多个扬声器馈送时渲染所述多个扬声器馈送包括使用与所述索引相关联的所述多个矩阵中的所述一者从所述音频对象或所述球面谐波系数渲染所述多个扬声器馈送。
30.根据权利要求24所述的装置,
其中所述音频渲染信息包含两个或两个以上位,所述两个或两个以上位界定与用于将球面谐波系数渲染到多个扬声器馈送的多个渲染算法中的一者相关联的索引,且
其中所述一或多个处理器进一步经配置以当渲染所述多个扬声器馈送时渲染所述多个扬声器馈送包括使用与所述索引相关联的所述多个渲染算法中的所述一者从所述球面谐波系数渲染所述多个扬声器馈送。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361762758P | 2013-02-08 | 2013-02-08 | |
US61/762,758 | 2013-02-08 | ||
US14/174,769 US10178489B2 (en) | 2013-02-08 | 2014-02-06 | Signaling audio rendering information in a bitstream |
US14/174,769 | 2014-02-06 | ||
PCT/US2014/015305 WO2014124261A1 (en) | 2013-02-08 | 2014-02-07 | Signaling audio rendering information in a bitstream |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104981869A true CN104981869A (zh) | 2015-10-14 |
CN104981869B CN104981869B (zh) | 2019-04-26 |
Family
ID=51297441
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480007716.2A Active CN104981869B (zh) | 2013-02-08 | 2014-02-07 | 在位流中用信号表示音频渲染信息 |
Country Status (15)
Country | Link |
---|---|
US (1) | US10178489B2 (zh) |
EP (2) | EP2954521B1 (zh) |
JP (2) | JP2016510435A (zh) |
KR (2) | KR102182761B1 (zh) |
CN (1) | CN104981869B (zh) |
AU (1) | AU2014214786B2 (zh) |
CA (1) | CA2896807C (zh) |
IL (1) | IL239748B (zh) |
MY (1) | MY186004A (zh) |
PH (1) | PH12015501587A1 (zh) |
RU (1) | RU2661775C2 (zh) |
SG (1) | SG11201505048YA (zh) |
UA (1) | UA118342C2 (zh) |
WO (1) | WO2014124261A1 (zh) |
ZA (1) | ZA201506576B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110892735A (zh) * | 2017-07-31 | 2020-03-17 | 华为技术有限公司 | 一种音频处理方法以及音频处理设备 |
CN111712875A (zh) * | 2018-04-11 | 2020-09-25 | 杜比国际公司 | 用于6dof音频渲染的方法、设备和系统及用于6dof音频渲染的数据表示和位流结构 |
CN114080822A (zh) * | 2019-06-20 | 2022-02-22 | 杜比实验室特许公司 | S扬声器上m声道输入(s<m)的渲染 |
Families Citing this family (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8483853B1 (en) | 2006-09-12 | 2013-07-09 | Sonos, Inc. | Controlling and manipulating groupings in a multi-zone media system |
US9202509B2 (en) | 2006-09-12 | 2015-12-01 | Sonos, Inc. | Controlling and grouping in a multi-zone media system |
US8788080B1 (en) | 2006-09-12 | 2014-07-22 | Sonos, Inc. | Multi-channel pairing in a media system |
US8923997B2 (en) | 2010-10-13 | 2014-12-30 | Sonos, Inc | Method and apparatus for adjusting a speaker system |
US11429343B2 (en) | 2011-01-25 | 2022-08-30 | Sonos, Inc. | Stereo playback configuration and control |
US11265652B2 (en) | 2011-01-25 | 2022-03-01 | Sonos, Inc. | Playback device pairing |
US8938312B2 (en) | 2011-04-18 | 2015-01-20 | Sonos, Inc. | Smart line-in processing |
US9042556B2 (en) | 2011-07-19 | 2015-05-26 | Sonos, Inc | Shaping sound responsive to speaker orientation |
US8811630B2 (en) | 2011-12-21 | 2014-08-19 | Sonos, Inc. | Systems, methods, and apparatus to filter audio |
US9084058B2 (en) | 2011-12-29 | 2015-07-14 | Sonos, Inc. | Sound field calibration using listener localization |
US9729115B2 (en) | 2012-04-27 | 2017-08-08 | Sonos, Inc. | Intelligently increasing the sound level of player |
US9524098B2 (en) | 2012-05-08 | 2016-12-20 | Sonos, Inc. | Methods and systems for subwoofer calibration |
USD721352S1 (en) | 2012-06-19 | 2015-01-20 | Sonos, Inc. | Playback device |
US9106192B2 (en) | 2012-06-28 | 2015-08-11 | Sonos, Inc. | System and method for device playback calibration |
US9690539B2 (en) | 2012-06-28 | 2017-06-27 | Sonos, Inc. | Speaker calibration user interface |
US9706323B2 (en) | 2014-09-09 | 2017-07-11 | Sonos, Inc. | Playback device calibration |
US9690271B2 (en) | 2012-06-28 | 2017-06-27 | Sonos, Inc. | Speaker calibration |
US9219460B2 (en) | 2014-03-17 | 2015-12-22 | Sonos, Inc. | Audio settings based on environment |
US9668049B2 (en) | 2012-06-28 | 2017-05-30 | Sonos, Inc. | Playback device calibration user interfaces |
US8930005B2 (en) | 2012-08-07 | 2015-01-06 | Sonos, Inc. | Acoustic signatures in a playback system |
US8965033B2 (en) | 2012-08-31 | 2015-02-24 | Sonos, Inc. | Acoustic optimization |
US9008330B2 (en) | 2012-09-28 | 2015-04-14 | Sonos, Inc. | Crossover frequency adjustments for audio speakers |
US9609452B2 (en) | 2013-02-08 | 2017-03-28 | Qualcomm Incorporated | Obtaining sparseness information for higher order ambisonic audio renderers |
US9883310B2 (en) * | 2013-02-08 | 2018-01-30 | Qualcomm Incorporated | Obtaining symmetry information for higher order ambisonic audio renderers |
USD721061S1 (en) | 2013-02-25 | 2015-01-13 | Sonos, Inc. | Playback device |
US9905231B2 (en) * | 2013-04-27 | 2018-02-27 | Intellectual Discovery Co., Ltd. | Audio signal processing method |
US9502044B2 (en) | 2013-05-29 | 2016-11-22 | Qualcomm Incorporated | Compression of decomposed representations of a sound field |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9502045B2 (en) | 2014-01-30 | 2016-11-22 | Qualcomm Incorporated | Coding independent frames of ambient higher-order ambisonic coefficients |
US9226073B2 (en) | 2014-02-06 | 2015-12-29 | Sonos, Inc. | Audio output balancing during synchronized playback |
US9226087B2 (en) | 2014-02-06 | 2015-12-29 | Sonos, Inc. | Audio output balancing during synchronized playback |
US9264839B2 (en) | 2014-03-17 | 2016-02-16 | Sonos, Inc. | Playback device configuration based on proximity detection |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9620137B2 (en) | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US9367283B2 (en) | 2014-07-22 | 2016-06-14 | Sonos, Inc. | Audio settings |
USD883956S1 (en) | 2014-08-13 | 2020-05-12 | Sonos, Inc. | Playback device |
US10127006B2 (en) | 2014-09-09 | 2018-11-13 | Sonos, Inc. | Facilitating calibration of an audio playback device |
US9891881B2 (en) | 2014-09-09 | 2018-02-13 | Sonos, Inc. | Audio processing algorithm database |
US9910634B2 (en) | 2014-09-09 | 2018-03-06 | Sonos, Inc. | Microphone calibration |
US9952825B2 (en) | 2014-09-09 | 2018-04-24 | Sonos, Inc. | Audio processing algorithms |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
US9973851B2 (en) | 2014-12-01 | 2018-05-15 | Sonos, Inc. | Multi-channel playback of audio content |
US10176813B2 (en) * | 2015-04-17 | 2019-01-08 | Dolby Laboratories Licensing Corporation | Audio encoding and rendering with discontinuity compensation |
US10664224B2 (en) | 2015-04-24 | 2020-05-26 | Sonos, Inc. | Speaker calibration user interface |
WO2016172593A1 (en) | 2015-04-24 | 2016-10-27 | Sonos, Inc. | Playback device calibration user interfaces |
USD886765S1 (en) | 2017-03-13 | 2020-06-09 | Sonos, Inc. | Media playback device |
USD920278S1 (en) | 2017-03-13 | 2021-05-25 | Sonos, Inc. | Media playback device with lights |
USD768602S1 (en) | 2015-04-25 | 2016-10-11 | Sonos, Inc. | Playback device |
USD906278S1 (en) | 2015-04-25 | 2020-12-29 | Sonos, Inc. | Media player device |
US20170085972A1 (en) | 2015-09-17 | 2017-03-23 | Sonos, Inc. | Media Player and Media Player Design |
US10248376B2 (en) | 2015-06-11 | 2019-04-02 | Sonos, Inc. | Multiple groupings in a playback system |
US9729118B2 (en) | 2015-07-24 | 2017-08-08 | Sonos, Inc. | Loudness matching |
US9538305B2 (en) | 2015-07-28 | 2017-01-03 | Sonos, Inc. | Calibration error conditions |
US9712912B2 (en) | 2015-08-21 | 2017-07-18 | Sonos, Inc. | Manipulation of playback device response using an acoustic filter |
US9736610B2 (en) | 2015-08-21 | 2017-08-15 | Sonos, Inc. | Manipulation of playback device response using signal processing |
CN108028985B (zh) | 2015-09-17 | 2020-03-13 | 搜诺思公司 | 用于计算设备的方法 |
US9693165B2 (en) | 2015-09-17 | 2017-06-27 | Sonos, Inc. | Validation of audio calibration using multi-dimensional motion check |
US10249312B2 (en) | 2015-10-08 | 2019-04-02 | Qualcomm Incorporated | Quantization of spatial vectors |
US9961467B2 (en) * | 2015-10-08 | 2018-05-01 | Qualcomm Incorporated | Conversion from channel-based audio to HOA |
US9961475B2 (en) * | 2015-10-08 | 2018-05-01 | Qualcomm Incorporated | Conversion from object-based audio to HOA |
US9743207B1 (en) | 2016-01-18 | 2017-08-22 | Sonos, Inc. | Calibration using multiple recording devices |
US10003899B2 (en) | 2016-01-25 | 2018-06-19 | Sonos, Inc. | Calibration with particular locations |
US11106423B2 (en) | 2016-01-25 | 2021-08-31 | Sonos, Inc. | Evaluating calibration of a playback device |
US9886234B2 (en) | 2016-01-28 | 2018-02-06 | Sonos, Inc. | Systems and methods of distributing audio to one or more playback devices |
US9860662B2 (en) | 2016-04-01 | 2018-01-02 | Sonos, Inc. | Updating playback device configuration information based on calibration data |
US9864574B2 (en) | 2016-04-01 | 2018-01-09 | Sonos, Inc. | Playback device calibration based on representation spectral characteristics |
US9763018B1 (en) | 2016-04-12 | 2017-09-12 | Sonos, Inc. | Calibration of audio playback devices |
US10074012B2 (en) | 2016-06-17 | 2018-09-11 | Dolby Laboratories Licensing Corporation | Sound and video object tracking |
US9860670B1 (en) | 2016-07-15 | 2018-01-02 | Sonos, Inc. | Spectral correction using spatial calibration |
US9794710B1 (en) | 2016-07-15 | 2017-10-17 | Sonos, Inc. | Spatial audio correction |
US10372406B2 (en) | 2016-07-22 | 2019-08-06 | Sonos, Inc. | Calibration interface |
US10459684B2 (en) | 2016-08-05 | 2019-10-29 | Sonos, Inc. | Calibration of a playback device based on an estimated frequency response |
US10089063B2 (en) | 2016-08-10 | 2018-10-02 | Qualcomm Incorporated | Multimedia device for processing spatialized audio based on movement |
USD827671S1 (en) | 2016-09-30 | 2018-09-04 | Sonos, Inc. | Media playback device |
USD851057S1 (en) | 2016-09-30 | 2019-06-11 | Sonos, Inc. | Speaker grill with graduated hole sizing over a transition area for a media device |
US10412473B2 (en) | 2016-09-30 | 2019-09-10 | Sonos, Inc. | Speaker grill with graduated hole sizing over a transition area for a media device |
US10712997B2 (en) | 2016-10-17 | 2020-07-14 | Sonos, Inc. | Room association based on name |
GB2572419A (en) | 2018-03-29 | 2019-10-02 | Nokia Technologies Oy | Spatial sound rendering |
US10999693B2 (en) * | 2018-06-25 | 2021-05-04 | Qualcomm Incorporated | Rendering different portions of audio data using different renderers |
EP3818524B1 (en) * | 2018-07-02 | 2023-12-13 | Dolby Laboratories Licensing Corporation | Methods and devices for generating or decoding a bitstream comprising immersive audio signals |
US10299061B1 (en) | 2018-08-28 | 2019-05-21 | Sonos, Inc. | Playback device calibration |
US11206484B2 (en) | 2018-08-28 | 2021-12-21 | Sonos, Inc. | Passive speaker authentication |
US10734965B1 (en) | 2019-08-12 | 2020-08-04 | Sonos, Inc. | Audio calibration of a portable playback device |
CN110620986B (zh) * | 2019-09-24 | 2020-12-15 | 深圳市东微智能科技股份有限公司 | 音频处理算法的调度方法、装置、音频处理器和存储介质 |
TWI750565B (zh) * | 2020-01-15 | 2021-12-21 | 原相科技股份有限公司 | 真無線多聲道揚聲裝置及其多音源發聲之方法 |
US11521623B2 (en) | 2021-01-11 | 2022-12-06 | Bank Of America Corporation | System and method for single-speaker identification in a multi-speaker environment on a low-frequency audio recording |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101548554A (zh) * | 2006-10-06 | 2009-09-30 | 彼得·G·克拉文 | 麦克风阵列 |
CN102440002A (zh) * | 2009-04-09 | 2012-05-02 | 挪威科技大学技术转让公司 | 用于传感器阵列的优化模态波束成型器 |
EP2451196A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Method and apparatus for generating and for decoding sound field data including ambisonics sound field data of an order higher than three |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
WO2013006338A2 (en) * | 2011-07-01 | 2013-01-10 | Dolby Laboratories Licensing Corporation | System and method for adaptive audio signal generation, coding and rendering |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6931370B1 (en) * | 1999-11-02 | 2005-08-16 | Digital Theater Systems, Inc. | System and method for providing interactive audio in a multi-channel audio environment |
US7996216B2 (en) * | 2005-07-11 | 2011-08-09 | Lg Electronics Inc. | Apparatus and method of encoding and decoding audio signal |
JP5133401B2 (ja) | 2007-04-26 | 2013-01-30 | ドルビー・インターナショナル・アクチボラゲット | 出力信号の合成装置及び合成方法 |
WO2010070225A1 (fr) | 2008-12-15 | 2010-06-24 | France Telecom | Codage perfectionne de signaux audionumeriques multicanaux |
KR101283783B1 (ko) * | 2009-06-23 | 2013-07-08 | 한국전자통신연구원 | 고품질 다채널 오디오 부호화 및 복호화 장치 |
WO2011039195A1 (en) | 2009-09-29 | 2011-04-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal decoder, audio signal encoder, method for providing an upmix signal representation, method for providing a downmix signal representation, computer program and bitstream using a common inter-object-correlation parameter value |
US9113281B2 (en) * | 2009-10-07 | 2015-08-18 | The University Of Sydney | Reconstruction of a recorded sound field |
MX2012006823A (es) | 2009-12-16 | 2012-07-23 | Dolby Int Ab | Mezcla descendente de parametros de corriente de bits sbr. |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
US9754595B2 (en) * | 2011-06-09 | 2017-09-05 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding 3-dimensional audio signal |
EP2541547A1 (en) * | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
US9641951B2 (en) * | 2011-08-10 | 2017-05-02 | The Johns Hopkins University | System and method for fast binaural rendering of complex acoustic scenes |
AU2013292057B2 (en) | 2012-07-16 | 2017-04-13 | Dolby International Ab | Method and device for rendering an audio soundfield representation for audio playback |
US9761229B2 (en) * | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
CN108174341B (zh) | 2013-01-16 | 2021-01-08 | 杜比国际公司 | 测量高阶高保真度立体声响复制响度级的方法及设备 |
US9883310B2 (en) | 2013-02-08 | 2018-01-30 | Qualcomm Incorporated | Obtaining symmetry information for higher order ambisonic audio renderers |
US9609452B2 (en) | 2013-02-08 | 2017-03-28 | Qualcomm Incorporated | Obtaining sparseness information for higher order ambisonic audio renderers |
US9502044B2 (en) | 2013-05-29 | 2016-11-22 | Qualcomm Incorporated | Compression of decomposed representations of a sound field |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
-
2014
- 2014-02-06 US US14/174,769 patent/US10178489B2/en active Active
- 2014-02-07 KR KR1020197029148A patent/KR102182761B1/ko active IP Right Grant
- 2014-02-07 MY MYPI2015702277A patent/MY186004A/en unknown
- 2014-02-07 RU RU2015138139A patent/RU2661775C2/ru active
- 2014-02-07 UA UAA201508659A patent/UA118342C2/uk unknown
- 2014-02-07 CA CA2896807A patent/CA2896807C/en active Active
- 2014-02-07 KR KR1020157023833A patent/KR20150115873A/ko active Application Filing
- 2014-02-07 SG SG11201505048YA patent/SG11201505048YA/en unknown
- 2014-02-07 EP EP14707032.0A patent/EP2954521B1/en active Active
- 2014-02-07 JP JP2015557122A patent/JP2016510435A/ja active Pending
- 2014-02-07 CN CN201480007716.2A patent/CN104981869B/zh active Active
- 2014-02-07 WO PCT/US2014/015305 patent/WO2014124261A1/en active Application Filing
- 2014-02-07 AU AU2014214786A patent/AU2014214786B2/en active Active
- 2014-02-07 EP EP20209067.6A patent/EP3839946A1/en active Pending
-
2015
- 2015-07-01 IL IL239748A patent/IL239748B/en active IP Right Grant
- 2015-07-20 PH PH12015501587A patent/PH12015501587A1/en unknown
- 2015-09-07 ZA ZA2015/06576A patent/ZA201506576B/en unknown
-
2019
- 2019-03-04 JP JP2019038692A patent/JP6676801B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101548554A (zh) * | 2006-10-06 | 2009-09-30 | 彼得·G·克拉文 | 麦克风阵列 |
CN102440002A (zh) * | 2009-04-09 | 2012-05-02 | 挪威科技大学技术转让公司 | 用于传感器阵列的优化模态波束成型器 |
EP2451196A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Method and apparatus for generating and for decoding sound field data including ambisonics sound field data of an order higher than three |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
WO2013006338A2 (en) * | 2011-07-01 | 2013-01-10 | Dolby Laboratories Licensing Corporation | System and method for adaptive audio signal generation, coding and rendering |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110892735A (zh) * | 2017-07-31 | 2020-03-17 | 华为技术有限公司 | 一种音频处理方法以及音频处理设备 |
CN111712875A (zh) * | 2018-04-11 | 2020-09-25 | 杜比国际公司 | 用于6dof音频渲染的方法、设备和系统及用于6dof音频渲染的数据表示和位流结构 |
CN114080822A (zh) * | 2019-06-20 | 2022-02-22 | 杜比实验室特许公司 | S扬声器上m声道输入(s<m)的渲染 |
CN114080822B (zh) * | 2019-06-20 | 2023-11-03 | 杜比实验室特许公司 | S扬声器上m声道输入的渲染 |
Also Published As
Publication number | Publication date |
---|---|
CN104981869B (zh) | 2019-04-26 |
ZA201506576B (en) | 2020-02-26 |
JP2016510435A (ja) | 2016-04-07 |
AU2014214786A1 (en) | 2015-07-23 |
IL239748A0 (en) | 2015-08-31 |
US20140226823A1 (en) | 2014-08-14 |
RU2015138139A (ru) | 2017-03-21 |
AU2014214786B2 (en) | 2019-10-10 |
RU2661775C2 (ru) | 2018-07-19 |
PH12015501587B1 (en) | 2015-10-05 |
SG11201505048YA (en) | 2015-08-28 |
UA118342C2 (uk) | 2019-01-10 |
EP3839946A1 (en) | 2021-06-23 |
US10178489B2 (en) | 2019-01-08 |
JP2019126070A (ja) | 2019-07-25 |
CA2896807A1 (en) | 2014-08-14 |
PH12015501587A1 (en) | 2015-10-05 |
WO2014124261A1 (en) | 2014-08-14 |
JP6676801B2 (ja) | 2020-04-08 |
IL239748B (en) | 2019-01-31 |
KR20190115124A (ko) | 2019-10-10 |
MY186004A (en) | 2021-06-14 |
EP2954521B1 (en) | 2020-12-02 |
KR102182761B1 (ko) | 2020-11-25 |
KR20150115873A (ko) | 2015-10-14 |
EP2954521A1 (en) | 2015-12-16 |
BR112015019049A2 (pt) | 2017-07-18 |
CA2896807C (en) | 2021-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104981869B (zh) | 在位流中用信号表示音频渲染信息 | |
CN105247612B (zh) | 相对于球面谐波系数执行空间掩蔽 | |
TWI611706B (zh) | 將虛擬揚聲器映射至實體揚聲器 | |
US9154877B2 (en) | Collaborative sound system | |
CN104429102B (zh) | 使用3d音频分层译码的扩音器位置补偿 | |
CN106104680B (zh) | 将音频信道插入到声场的描述中 | |
CN106575506A (zh) | 高阶立体混响音频数据的中间压缩 | |
WO2015138856A1 (en) | Low frequency rendering of higher-order ambisonic audio data | |
CN106797527A (zh) | Hoa内容的显示屏相关调适 | |
CN106415712B (zh) | 用于渲染高阶立体混响系数的装置和方法 | |
CN108141688A (zh) | 从以信道为基础的音频到高阶立体混响的转换 | |
CN106465029B (zh) | 用于渲染高阶立体混响系数及产生位流的装置和方法 | |
CN114915874B (zh) | 音频处理方法、装置、设备及介质 | |
CN114128312A (zh) | 用于低频效果的音频渲染 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |