CN101622874A

CN101622874A - 对象存档系统和方法

Info

Publication number: CN101622874A
Application number: CN200880006362A
Authority: CN
Inventors: C·P·佩斯
Original assignee: Euclid Discoveries LLC
Current assignee: Euclid Discoveries LLC
Priority date: 2007-01-23
Filing date: 2008-01-04
Publication date: 2010-01-06
Also published as: TW200839622A; WO2008091484A2; US20150181217A1; CA2675957C; US20100086062A1; CA2675957A1; WO2008091484A3; US9106977B2; JP2010517426A; EP2106663A2; US8553782B2; US20120163446A1

Abstract

提供用于处理和压缩视频的基于个人对象的存档系统和方法。通过分析用户特有的特征，例如与用户相关联的面部、家人和宠物属性，可以确定不变模型，以创建每个用户的个人对象模型适配器。这些个性化对象模型可以使用几何和外观建模技术来创建，并且可以存储于对象模型库中。对象模型可以复用，以处理其它视频流。对象模型可以通过端对端网络在多个用户间共享，或可以存储于服务器上的对象模型库中。在重建已压缩(已编码)视频时，可以访问和使用视频对象模型，以产生质量接近无损压缩的视频。

Description

对象存档系统和方法

相关申请

本申请要求对2007年1月23日提交的美国临时申请No.60/881,982的优先权。本申请与2007年1月23日提交、标题为“Computer Method and Apparatus for Processing Image Data”的美国临时申请No.60/881,966和2006年6月8日提交、标题为“Apparatus AndMethod For Processing Video Data”的美国临时申请No.60/811,890有关。本申请与2006年3月31日提交的美国申请No.11/396,010有关，该美国申请No.11/396,010是于2006年1月20日提交的美国申请第No.11/336,366的部分继续申请，该美国申请No.11/336,366是于2005年11月16日提交的美国申请No.11/280,625的部分继续申请，该美国申请No.11/280,625是于2005年9月20日提交的美国申请No.11/230,686的部分继续申请，该美国申请No.11/230,686是现为美国专利No.7,158,680、于2005年7月28日提交的美国申请No.11/191,562的部分继续申请。通过整体引用将各前述申请结合于此。

背景技术

随着数字视频近来的迅速普及，对视频压缩的需求已经急剧增加。视频压缩减少了存储和传输数字媒体所需的比特数。视频数据包含空间冗余性和时间冗余性，并且可以通过登记(register)帧内(空间)和帧间(时间)的差值来对这些空间和时间相似性进行编码。执行压缩的硬件或软件称为编码解码器(编码器/解码器)。编码解码器是能够对数字信号进行编码和解码的设备或软件。由于数据密集的数字视频应用已经变得无处不在，所以需要更高效的信号编码方式。因此，视频压缩现在已经成为存储和通信技术中的一个中心组成。

遗憾的是，常规视频压缩方案受困于形式上表现为低数据通信速度、大量储存要求和干扰感知效果的诸多低效性。这些阻碍可能给需要容易、高效地操控视频数据而又保持质量(对于人们所具有的对一些形式的视觉信息的先天敏感性而言，这尤为重要)的各种用户带来严重问题。

在视频压缩中通常考虑诸多关键因素，这些因素包括：视频质量和码率、编码和解码算法的计算复杂度、对数据损失和错误的抗扰性以及延时。随着数量越来越多的视频数据充斥因特网，可以明显缓解拥塞或提高质量的技术不仅对于计算机而且对于电视机、蜂窝电话和其它手持设备均代表一种重大突破。

发明内容

提供用于处理视频的系统和方法，以产生较之本领域现有技术方法而言的计算和分析优点。可以处理视频信号，以创建来自视频信号中代表的一个或多个对象的对象模型。可以将对象模型存档。可以使用存档的对象模型作为用于结构、形变、外观和照明建模的对象模型库。当处理压缩视频文件时，可以使用一个或多个已存档对象模型。可以使用一个或多个已存档对象模型以及编码解码器来重建压缩视频文件。对象模型可以用来创建视频信号中表示的一个或多个对象的隐式表示。

可以比较存档中的对象模型，以确定是否有存储于存档中的基本上等效的对象模型。可以通过消除基本上相互等效的冗余对象模型来减小存档的大小。可以组合存档中的相似对象模型。

视频编码解码器可以用来重建压缩视频文件。可以与视频编码解码器分离地存储对象模型。对象模型可以包括在视频编码解码器中或与之捆绑。可以通过将若干对象模型分组来创建定制的编码解码器。可以对定制的编码解码器进行优化，以重建压缩视频文件。

压缩视频文件可以与具有相似特征的其它压缩视频文件的群组相关联。可以对定制的编码解码器进行优化，以重建该群组中的任何压缩视频文件。可以根据关于用户的个人信息来确定压缩视频文件的群组。可以通过分析由用户提供的未压缩视频文件，来确定关于该用户的个人信息。当分析由用户提供的未压缩视频文件时，可以标识用户所提供的未压缩视频文件中描绘的反复出现的对象。反复出现的对象例如可以是用户所提供的未压缩视频文件中标识的特定人脸或动物。可以创建定制对象模型，所述模型是为重建那些反复出现的对象而训练。定制对象可以用来创建用于重建压缩视频文件的定制编码解码器。

压缩视频文件可以从一个用户计算机发送到另一用户计算机。在重建该压缩视频文件时，可以从服务器访问存档对象模型。服务器可以用来维护和挖掘针对多个用户的存档对象模型。服务器可以创建对象模型库。以此方式，可以提供一种视频处理服务，其中，该服务的会员可以在服务器上存储其对象模型，以及从服务器远程访问对象模型以重建其压缩视频文件。

可以在端对端网络中的多个用户计算机之间共享存档对象模型。可以接收来自端对端网络中一个计算机的对压缩视频文件的请求。响应于该请求，可以从端对端网络中的不同用户计算机发送存档对象模型之一。仍响应于该请求，可以从端对端网络中的又一计算机发送另一存档对象模型。进一步响应于请求，可以从端对端网络中的又一用户计算机发送另一存档对象模型或那些模型的子划分。以此方式，可以使用分布式方法来维护和分发存档对象模型。

一个或多个对象模型可以用来控制对压缩视频流的访问。对象模型可以与编码解码器一起用来重建压缩视频文件。在不使用一个或多个对象模型的情况下，不能在用户的计算机上重建和呈现视频文件。通过控制对对象模型的访问，可以控制对压缩视频文件的访问(例如回放访问)。可以使用对象模型作为用以访问视频数据的密钥。编码视频数据的回放操作可以依赖于对象模型。此方法使得在无对象模型访问权时不可读取编码视频数据。以此方式，可以使用对象模型作为一种加密和数字权利管理形式。不同质量的对象模型可以用来提供来自相同视频文件的不同质量水平的解压缩视频。这允许对共同视频文件的差异化解码(例如视频基于所用对象模型和共同视频文件的标准分辨率和高分辨率版本)。

一个或多个对象模型可以包括广告，这些广告在回放时使广告插入到重建的视频流中。例如，在已编码视频的重建(例如回放)期间，模型可以致使提供广告的帧生成到回放视频流中。

可以提供一种用于处理视频的软件系统。编码器可以处理视频信号以创建用于视频信号中代表的一个或多个对象的对象模型。对象库可以存储对象模型。解码器可以在重建编码视频文件时使用编码解码器和来自对象库中的一个或多个存档对象模型。

附图说明

根据对如附图中所示本发明示例实施例的下文更具体描述将清楚前文内容，在这些附图中相似标号在不同的图中通篇地指代相同部分。附图未必按比例绘制，而是强调图示本发明的实施例。

图1是在本发明的实施例中运用的视频压缩(通称为图像处理)系统的框图；

图2是图示了在本发明的实施例中运用的混合空间规格化压缩方法的框图；

图3是图示了优选实施例中用于将对象模型存档的过程的流程图；

图4是图示了本发明的使用客户端-服务器框架的个人视频处理服务的架构示例的示意图；

图5是图示了本发明的对象模型共享的框图；

图6是本发明的实施例可以实施于其中的计算机网络或类似数字处理环境的示意图；

图7是图6的网络的计算机的内部结构的框图。

具体实施方式

本发明的示例实施例描述如下。

创建对象模型

在视频信号数据中，视频的帧被组装成图像序列。视频的主题内容通常是投影到相机的二维成像面上的三维场景。在合成生成的视频情况，“虚拟”相机用于呈现；而在动画情况下，动画器(animator)发挥管理该参考相机帧的作用。每个帧或图像由如下像元(pel)组成，这些像元代表图像传感器对采样信号的响应。采样信号常常对应于通过相机在二维传感器阵列上的部件而采样的一些反射、折射或发射能量(例如电磁、声音等)。连续依次采样将获得时空数据流，其中每帧有两个空间维度，而时间维度对应于帧在视频序列中的顺序。这一过程通常称为“成像”过程。

本发明提供一种可以用来将视频信号数据高效地处理成一个或多个有益表示的手段。本发明对于处理视频信号中的多个经常出现的数据集是高效的。分析视频信号并且提供该数据的一个或多个简洁表示，以促进对其处理和编码。每个新的、较为简洁的数据表示允许减少对许多应用的计算处理、传输带宽和存储要求，这些应用包括但不限于视频信号的编码、压缩、传输、分析、存储和显示。将噪声和信号的其它不需要部分表示为较低优先级，从而进一步处理可以集中于分析和表示视频信号中较高优先级的部分。由此，与先前可能的情况相比，可以更简洁地表示视频信号。并且精度损失集中在视频信号中在感知上不重要的部分。

如通过引用将全部教导结合于此、于2006年1月20日提交的美国申请No.11/336,366和于2007年1月23日提交、标题为“Computer Method and Apparatus for Processing Image Data”的美国申请第()号(代理案号4060-1009-000)中所述，分析视频信号数据并且标识显著组成部分。对时空流的分析揭示了常常为特定对象(例如，面部)的显著组成部分。标识过程指明显著组成部分的存在和重要性，并且选择那些限定的显著组成部分中最重要的一个或多个显著组成部分。这并不限制在当前描述的处理之后或与之并行地对其它较不显著的组成部分进行标识和处理。然后，进一步分析前述显著组成部分，标识可变和不变子组成部分。对不变子组成的标识是这样的过程：对该组成部分的某方面进行建模，由此揭示允许将该组成部分合成至所需精度水平的模型的参数化。

在一个实施例中，将PCA/小波编码技术应用于经过预处理的视频数据，以形成所需压缩视频信号。预处理通过应用主元分析(PCA)/小波编码(压缩)的方式来降低视频信号的复杂度，使效果得以改进。在2006年1月20日提交的美国申请No.11/336,366和于2007年1月23日提交、标题为“Computer Method and Apparatus forProcessing Image Data”的美国申请第()号(代理案号4060-1009-000)中这些共同未决申请中详细地讨论了PCA/小波编码。

图1是实现本发明原理的示例图像处理系统100的框图。源视频信号101输入到预处理器102或以别的方式由预处理器102接收。预处理器102使用带宽消耗或其它标准(如脸部/对象检测器)来确定源视频信号101中的感兴趣组成部分(显著对象)。具体而言，预处理器102确定视频信号中的如下部分，这些部分相对于视频信号101的其它部分而言使用了不成比例的带宽。一种用于进行这一确定的分割器103的方法如下。

分割器103使用像元的导数(derivative)的时间和/或空间差来分析随时间和/或空间的图像梯度。出于一致性(coherence)监测的目的，跟踪和记录视频信号中跨过视频信号的顺序帧而彼此对应的部分。对与这些一致信号组成部分相关联的导数场的有限差进行积分，以产生视频信号中相对于其它部分而言使用不成比例带宽的确定部分(即确定的感兴趣组成部分)。在一个优选实施例中，如果发现一帧中的空间不连续性与后继帧中的空间不连续性相对应，则分析图像梯度的陡峭度或平滑度，以产生唯一的对应性(时间一致性)。另外，还以相同的方式使用此类对应关系的收集来唯一地表征视频帧的离散组成部分的时间一致性。对于陡峭的图像梯度，确定存在边缘。如果存在此类定义空间不连续性的两个边缘，则定义角(corner)。将这些标识的空间不连续性与梯度流相结合，这在跨过视频数据帧的对应像元之间产生运动向量。当运动向量与所标识的空间不连续性相符时，则本发明的分割器103确定：存在感兴趣组成部分(显著对象)。

其它分割技术也适于实施分割器103。

回到图1，一旦预处理器102(分割器103)已经确定了感兴趣组成部分(显著对象)或以别的方式从源视频信号101分割了感兴趣组成部分(显著对象)，规格化器105降低所确定的感兴趣组成部分的复杂度。优选地，规格化器105从确定的兴趣组成部分中去除全局运动和姿态(pose)、全局结构、局部形变、外观和照明的差异。为此，利用在此声明的有关专利申请中先前描述的规格化技术。这使得规格化器105建立了兴趣组成部分的对象模型，例如结构模型107和外观模型108。

结构对象模型107在数学上可以表示为：

SM (σ) = \underset{x, y}{Σ} [(v_{x, y} + Δ_{t}) + Z]

方程1

其中σ是显著对象(确定的感兴趣组成部分)而SM()是该对象的结构模型；

v_x，y是随时间登记的、对象σ之上的逐段线性正则化网格的2D网格顶点；

Δ_t是顶点随时间t的改变，其表示视频帧之间的对象缩放(或局部形变)、旋转和平移；并且

Z是全局运动。

根据方程1可以导出全局刚性结构模型、模型的全局运动、姿态和局部导出形变。使用根据运动来估计结构的已知技术，并将其与运动估计相结合，从而确定结构部分(视频帧随时间的感兴趣组成部分)的候选结构。这定义了显著对象在空间中的位置和定向，并由此提供结构模型107和运动模型111。

外观模型108继而表示显著对象未由结构模型107和运动模型111共同建模的特征和方面。在一个实施例中，外观模型108是随时间的结构改变的线性分解，并且是通过从结构模型107去除全局运动和局部形变来定义的。申请人在每个视频帧处、使用结构模型107来取得对象外观，并且重新投影为“规格化姿态”。“规格化姿态”还将称为一个或多个“基本(cardinal)”姿态。重新投影表示对象的规格化版本，并且产生任何外观变化。当给定的对象在视频帧之间旋转或在空间上平移时，外观定位于单个基本姿态(即，平均规格化表示)。外观模型108还考虑基本姿态的基本形变(例如睁眼/闭眼、张嘴/闭嘴等)。因此，基本姿态P_c和基本姿态P_c的基本形变Δ_c表示外观模型108AM(σ)，

AM (σ) = \underset{t}{Σ} (P_{c} + Δ_{c} P_{c})

方程2

优选地，外观模型108中的像元基于其与相机投影轴的距离和对相机投影轴的入射角来进行偏置。偏置确定个体像元对模型的最终形成所具有的贡献的相对权重。因此，优选地，可以在所有模型的所有处理中包括这一“采样偏置”。随时间对候选结构(来自结构模型107)的跟踪可以通过来自姿态、运动和形变估计的含意来形成或支持对所有像元的运动的预测。

另外，关于外观和照明建模，在变化的光照条件下跟踪对象是图像处理中持续的挑战之一。在成像处理中，对比度规格化是对像素强度值的改变进行建模的过程，其将像素强度的改变归结于光照/照明的改变，而不归结于其它因素。优选实施例对显著对象在捕获视频的照明条件下的任何改变进行估计(即，建模，在对象上入射的照明)的任意改变。这是通过将来自兰伯特反射线性子空间(LRLS)理论的原理与光学流组合来实现的。根据LRLS理论，当对象固定时——优选地仅允许照明改变——可以通过前九个球面谐波的线性组合来近似反射图像集；因此，图像落在环境“图像”向量空间中与9D线性子空间接近处。此外，用于图像像素(x，y)的反射强度可以近似如下：

I (x, y) = \underset{i = 0,1,2 j = - i,}{Σ} \underset{- i + 1 . . . i - 1, i}{Σ} l_{ij} b_{ij} (n),

使用LRLS和光学流，计算期望值以确定照明如何与对象相互作用。这些期望值用以约束可以说明光学流场改变的可能对象运动。当使用LRLS来使用照明建模来描述对象的外观时，仍然有必要允许外观模型处理可能落在照明模型预测以外的任何外观改变。

外观模型108和结构模型107的其它数学标识也是适用的，只要其从相应的原始视频信号明显降低了感兴趣组成部分的复杂度，但维持了感兴趣组成部分的显著性。回到图1，分析器110继而将PCA/小波编码应用于结构对象模型107和外观对象模型108。更一般地，分析器110运用几何数据分析来压缩(编码)与感兴趣组成部分对应的视频数据。所得压缩(编码)视频数据可用于图2的图像处理系统中。特别地，这些对象模型107、108可以存储于图2的编码侧和解码侧232、236。根据结构模型107和外观模型108，可以生成有穷状态机。常规编码232和解码236也可以实施为常规小波视频编码解码方案。

在232和236这两侧，将PCA编码应用于规格化像元数据，这在每侧232、236构建了相同的基向量集。在一个优选实施例中，在图像处理期间对基函数应用PCA/小波，以产生所需的压缩视频数据。小波技术(DWT)变换整个图像和子图像，并且线性地分解外观模型118和结构模型107，继而，经分解的模型被适度截断，以满足所需阈值目标(ala EZT或SPIHT)。由于视频数据的“规格化”特征，这支持可伸缩的视频数据处理，这与现有技术的系统/方法是不同的。

如图2中所示，利用常规视频压缩方法232的独立实例，来处理用于一个或多个对象230、250的未压缩视频流中的每个先前检测的对象实例。此外，从对象230、250的分割获得的非对象202也使用常规视频压缩232来进行压缩。这些独立压缩编码232中每一个的结果是独立的常规编码流234，其中的每一个与每个视频流单独对应。在某个点，可能在在传输之后，可以在解压缩器236处将这些中间编码流234解压缩(重建)为规格化非对象210和多个对象238、258的合成。这些合成像元可以被去规格化240为其去规格化版本222、242、262，以将像元在空间上相对于彼此正确地定位，从而使组合过程270可以将对象和非对象像元组合成全帧272的合成。

数据挖掘对象模型

通过将这些对象模型(例如形变、结构、运动、照明和外观模型)存档，可以确定和复用这些对象模型的持久形式，以处理其它视频流。例如，当从相机导入数字视频时，可以对数字视频进行转码，并且可以访问视频对象存档以确定是否存在任何对象模型匹配。虽然可以在逐帧基础上完成这一点，但是优选地，可以通过将相似项分组在一起，使用批处理来分析视频流的部分或整个视频流。可以用非顺序方式分析帧，并且可以进行统计分析，以确定哪些对象模型提供最好的编码拟合。

图3是图示了将对象模型存档的过程300的流程图。在步骤302，如上文讨论的，标识对象模型。在步骤30，4将对象模型合并到存档或对象模型库中。在步骤306，比较对象模型，并且在步骤308，标识相似的对象模型。在步骤310。可以去除冗余对象模型，并且可以合并相似模型。在步骤312，可以更新指向视频对象模型的指针/标识符。例如可以更新指向编码视频流中所用对象模型的指针，以引用库中相关的、经过更新的对象模型。

以此方式，本存档系统300可以挖掘对象库中的这些对象模型，并且分析对象模型以标识相似对象模型。一旦标识了相似对象模型，系统300可以通过创建可以反复用于处理其它实例的通用对象模型，来利用冗余性。相似性往往基于相似结构、形变、运动、照明和/或外观。

可以按照任意多的方式将对象模型用于后续视频处理。如下文更具体讨论的那样，可以在客户端/服务器框架中使用模型，可以将对象模型与视频编码解码器捆绑在封包中，以便在对编码视频文件进行解码时使用，模型可以与个人视频服务结合使用，并且可以使用分布式系统(例如，端对端网络)来分布模型并且使其可用于多个用户。而且，对模型的处理可以在分布式计算网络中进行。

个人视频处理服务

在对象模型存储于服务器上的示例中，可以提供个人视频处理服务。图4是图示了使用客户端414-服务器410这一框架的个人视频处理服务400的架构示例的框图。在这一示例中，个人视频服务的用户或会员可以使用本发明的软件，以使用基于对象的视频压缩对他们的所有视频文件418进行转码。在转码过程期间，生成对象模型416。对象模型可以作为个人视频服务的部分上传到对象模型库404。当服务的会员将已编码视频文件418发送给另一会员时，文件大小可以充分减小。在另一会员的系统上进行回放期间，可以从服务器410访问相关对象模型404，以处理和呈现编码视频流。

系统400可以分析上传自特定会员的对象模型，并且确定是否存在冗余对象模型。例如，如果成员对描绘相同主题的(诸如，相同面部、相同宠物等)数字视频连续地进行转码，则可能将反复创建相同的对象模型。系统400可以通过创建用户的个人对象模型的高速缓存(例如面部对象模型、宠物对象模型等的高速缓存)来利用这一冗余性。系统还可以通过创建对于该用户而言定制的、个人的编码解码器417来利用这一冗余性。编码解码器417可以与特定于该用户的对象模型416捆绑在一起。

通过让大量会员将他们的模型416上传到服务器410，可以分析模型以标识共同或相似模型。可以跟踪最普遍使用或生成的模型。以这一方式，系统400可以获悉和确定最可能需要什么模型416，并且可以将编码解码器设计为仅包括最重要的对象模型。

如果用户试图利用编码解码器来处理编码视频，并且特定模型尚未与该编码解码器捆绑，则系统可以访问服务器410，以从存档404获得所需模型。编码解码器也可以定期访问服务器410，以利用新的、经过更新的对象模型来更新其本身。

作为又一实施例，已编码视频可以是这样的，即在客户端节点414上可访问视频文件的原始“常规”编码。在这一情况下，处理的优点用于发送视频，而更多“常规”压缩用来将视频存储在硬盘上，以促进对视频的更多常规处理。例如，如果已视频编辑应用希望使用不同格式，则本发明的方法可以主要在视频文件的传输期间使用。

调节编码解码器

可以按照特定的编码视频数据类型来调节编码解码器417。例如，如果视频流具有某些对象的反复出现、贯穿的共同主题或特定样式，则在重建整个编码视频文件时，可以复用对象模型。类似地，可以优化编码解码器317，以处理这些反复出现的对象，例如面部。类似地，如果视频流是具有某些特征的电影，例如特定风格的影片(例如动作片)，则其贯穿该影片可以使用相似的对象模型416。即使数字视频是“黑电影(film noir)”，例如通常的特征是暗色调的黑白视觉样式，在重建电影的整个编码版本时，可以适用和使用特定照明和照明对象模型。这样，可以存在适用于已编码电影的相当大部分的共同对象模型(例如结构和照明模型)。这些模型可以捆绑在一起，以创建定制的编码解码器。

共享对象模型

还可以在任意多个用户之间共享对象模型。对象模型可以存储于服务器上或数据库中，因而在对视频文件进行解码时可以容易地访问它们。可以从一个用户计算机访问另一用户计算机的对象模型。图5是示出了对象模型共享的框图。对象模型可以从服务器504上的对象模型库502进行访问，或可以从其它客户端系统510、520进行访问。相应的对象模型管理器512、522可以管理在每个客户端510、520上处理编码视频文件所需的对象模型514、524。对象模型管理器与版本控制系统或源控制管理系统相似，其中由系统软件来管理正在进行的对象模型514、524开发。对象模型的改变可以通过递增关联编号或字母代码(例如修订本编号或修订水平)并且在历史上与该改变相关联来标识。以这一方式，可以跟踪对象模型514、524以及对象模型的任何改变。对对象模型的这一电子跟踪使系统500能够控制和管理对象模型的各种副本、版本。

除了使用客户端-服务器框架之外，可以使用端对端网络或其它框架来共享和分布对象模型。以这一方式，用户可以从端对端网络中的其它用户下载压缩视频文件和对象模型。例如，如果在从端对端网络中的一个系统下载电影哈里波特的已编码版本，为了提高效率，可以从网络中的其它系统下载相关或那些模型的分割部分。

数字权利管理

部署安全方案以保护数字视频访问权这一过程满长、棘手且昂贵。内容用户想要对数字内容进行无拘束的访问，而无需经历繁琐的认证过程。部署内容开发安全模型的最复杂方面之一是：找到成本收益分析适应所有参与者(即内容用户、内容提供商和软件开发商)的方案。这时，目前可用方案并未提供一种用以限制对数字内容的访问的用户友好的、开发商友好的并且财务上有效的解决方案。

可以使用本发明的对象模型作为一种用以控制对编码数字视频的访问的方式。例如，在没有相关对象模型的情况下，用户将不能回放视频文件。可以使用对象模型作为用以访问视频数据的密钥。对已编码视频数据的回放操作可以依赖于一则辅助信息，即对象模型。这一方式在无对象模型访问权时使编码视频数据不可读。

通过控制对对象模型的访问，可以控制内容的播放访问权。这一方案可以提供一种用以限制对视频内容的访问的用户友好、开发商友好解决方案和高效解决方案。

此外，对象模型可以渐进地对内容进行解锁。利用对象模型的某一版本，编码可以仅解码至某一水平，然后利用渐进地更为完整的对象模型，整个内容将被解锁。初始解锁可以实现对视频的缩略图解锁，从而让用户能够确定他们是否想要全视频。想要标准分辨率版本的用户将获取对象模型的下一递增版本。另外，需要高分辨率或相机质量的用户将下载对象模型的更完整版本。编码和对象模型都是以有助于渐进实现与编码大小和质量相当的视频质量这样的方式来无冗余编码的。

处理环境

图6图示了本发明可以实施于其中的计算机网络或类似数字处理环境600。一个或多个客户端计算机50和一个或多个计算机60提供执行应用程序等的的处理设备、存储设备和输入/输出设备。一个或多个客户端计算机50还可以通过通信网络70链接到包括其它客户端设备/进程50和一个或多个服务器60的其它计算设备。通信网络70可以是远程接入网络、全球网络(例如因特网)、全球计算机汇集、局域网或广域网的部分以及目前使用相应协议(TCP/IP、蓝牙等)来相互通信的网关。其它电子设备/计算机网络架构是适合的。

图7是图6的计算机系统中的计算机(例如客户端处理器/设备50或服务器计算机60)。各计算机50、60包含系统总线79，其中总线是用于计算机或处理系统的部件之间数据传送的一组硬件线路。总线79实质上是连接计算机系统(例如处理器、盘储存器、存储器、输入/输出端口、网络端口等)不同单元的共享管道，该管道实现信息在单元之间的传送。用于将各种输入和输出设备(例如键盘、鼠标、显示器、打印机、扬声器等)连接到计算机50、60的输入/输出(I/O)设备接口82附接到系统总线79。网络接口86允许计算机连接到各种附接到网络(例如图6的网络70)的其它设备。存储器90为用来实施本发明实施例计算机软件指令92和数据94(例如上文讨论的对象模型、编码解码器和对象模型库)的提供易失性存储。盘储存器95为用来实施本发明实施例的计算机软件指令92和94提供非易失性存储。中央处理器单元84还附接到系统总线79并且提供对计算机指令的执行。

在一个实施例中，处理器例程92和94是包括计算机可读介质(例如可拆卸存储介质，例如一个或多个DVD-ROM、CD-ROM、磁盘、磁带、硬驱动等)的计算机程序产品，该计算机可读介质提供用于本发明系统的软件指令的至少一部分。如本领域公知的任何适当软件安装过程可以安装计算机程序产品。在另一实施例中，也可以通过有线、通信和/或无线连接来下载软件指令的至少一部分。在其它实施例中，本发明程序是在传播介质上的传播信号(例如通过全球网络如因特网或其它一个或多个网络传播的无线电波、红外线波、激光波、声波或电波)上实施的计算机程序传播信号产品。这样的承载介质或信号提供用于本发明例程/程序92的软件指令的至少一部分。

在可选实施例中，传播信号是在传播介质上承载的模拟载波或数字信号。例如，传播信号可以是通过全球网络(例如因特网)、电信网络或其它网络传播的数字化信号。在一个实施例中，传播信号是在一段时间内通过传播介质传输的信号，例如在以毫秒、秒、分钟计或更长的时段内通过网络在分组中发送的用于软件应用的指令。在另一实施例中，计算机程序产品的计算机可读介质是如下传播介质，计算机系统可以例如通过接收该传播介质并且识别该传播介质中实施的如上文针对计算机程序传播信号产品描述的传播信号来接收和读取该传播介质。

一般而言，术语“载体介质”或瞬态载体涵盖前述瞬态信号、传播信号、传播介质、存储介质等。

尽管已经参照本发明的优选实施例具体地示出和描述本发明，但是本领域技术人员将理解可以对之进行形式和细节上的各种改变而不脱离由所附权利要求涵盖的本发明范围。

例如，可以在各种计算机架构中实施本发明。图4-7的计算机网络是为了举例说明而不是限制本发明。

本发明可以采用全硬件实施例、全软件实施例或包含硬件和软件单元的实施例的形式。在一个优选实施例，用包括但不限于固件、常驻软件、微码等的软件实施本发明。

另外，本发明可以采用可从如下计算机可用或计算机可读介质获取的计算机程序产品的形式，该介质提供用于由计算机或任何指令执行系统使用或与计算机或任何指令执行系统结合使用的程序代码。出于本说明书的目的，计算机可用或计算机可读介质可以是任何如下装置，该装置可以包含、存储、传达、传播或传送用于由指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合使用的程序。

介质可以是电、磁、光、电磁、红外线或半导体系统(或装置或设备)或传播介质。计算机可读介质的示例包括半导体或固态存储器、磁带、可拆卸计算机磁盘、随机存取存储器(RAM)、只读存储器(ROM)、刚性磁盘和光盘。光盘的一些示例包括光盘-只读存储器(CD-ROM)、光盘-读/写(CD-R/W)和DVD。

适合于存储和/或执行程序代码的数据处理系统将包括通过系统总线直接地或间接地耦合到存储器单元的至少一个处理器。存储器单元可以包括在程序代码的实际执行期间运用的本地存储器、大容量储存器和高速缓存存储器，这些高速缓存存储器提供至少一些程序代码的临时存储以便减少在执行期间从大容量储存器取回代码的次数。

输入/输出或I/O设备(包括但不限于键盘、显示器、指示设备等)可以直接地或通过居间I/O控制器耦合到系统。

网络适配器还可以耦合到系统以使数据处理系统能够变为通过居间专用或公用网络耦合到其它数据处理系统或远程打印机或存储设备。调制解调器、有线调制解调器和以太网卡仅为目前可用网络适配器类型中的少数类型。

另外，在一些实施例中可以具有以下广告特征。

使用对象模型在视频中嵌入广告

对象模型可以用来使包括广告的帧在回放期间插入到视频流中。以这一方式，广告无需修改实际编码视频内容。然而，在编码内容的重建(例如回放)期间，模型可以使提供广告的帧生成到回放视频流中。

Claims

1.一种处理视频的方法，所述方法包括由计算机实施的步骤：

处理多个视频信号，以创建用于在所述视频信号中表示的一个或多个对象的对象模型；

将所述对象模型存档；以及

在处理压缩视频文件时使用一个或多个已存档对象模型。

2.如权利要求1所述的方法，其中将所述对象模型存档还包括由计算机实施的步骤：

比较一个或多个所述已存档对象模型，以确定所述存档中是否存储有基本上等效的对象模型；以及

通过消除冗余的、基本上等效的对象模型，来减小所述存档的大小。

3.如权利要求2所述的方法，其中减小所述存档的大小包括由计算机实施的步骤：

通过将一个或多个对象模型组合为共同对象，来减小所述存档的大小；以及

使用所述共同对象来生成一个或多个减小的原始对象模型。

4.如权利要求1所述的方法，其中将所述对象模型存档还包括由计算机实施的步骤：对相似的一个或多个所述已存档对象模型进行组合。

5.如权利要求1所述的方法，其中将所述对象模型存档还包括由计算机实施的步骤：将对象模型分组，以创建对于重建所述压缩视频文件中的对象而言最优的定制编码解码器。

6.如权利要求1所述的方法，其中所述压缩视频文件与具有相似特征的其它压缩视频文件群组相关联，并且编码解码器被优化为重建所述群组中的压缩视频文件。

7.如权利要求6所述的方法，其中所述压缩视频文件群组基于关于用户的个人信息来确定。

8.如权利要求7所述的方法，其中所述关于用户的个人信息通过分析由所述用户提供的其它视频文件来确定。

9.如权利要求8所述的方法，其中分析由所述用户提供的视频文件还包括由计算机实施的步骤：标识由所述用户提供的所述视频文件中描绘的反复出现的对象，所述反复出现的对象包括由所述用户提供的所述视频文件中标识的人脸或动物。

10.如权利要求8所述的方法，其中由所述用户提供的视频文件使用常规编码过程来编码。

11.如权利要求10所述的方法，其中使用所述常规编码的视频中所包含的信息来确定如何对所述视频进行处理和编码。

12.如权利要求10所述的方法，其中对由所述用户提供的视频文件的处理施加附加约束，以允许对将要重新创建的视频文件进行所述常规编码。

13.如权利要求6所述的方法，其中所述压缩视频文件群组基于所述压缩视频文件中描绘的反复出现的对象来确定。

14.如权利要求5所述的方法，其中所述定制编码解码器用来重建所述压缩视频文件。

15.如权利要求1所述的方法，其中在处理压缩视频文件时使用一个或多个已存档对象模型还包括由计算机实施的步骤：使用所述一个或多个已存档对象模型以及编码解码器来重建所述压缩视频文件。

16.如权利要求1所述的方法，其中在处理压缩视频文件时使用一个或多个已存档对象模型还包括由计算机实施的步骤：

在用户计算机处，从另一用户计算机接收所述压缩视频文件；以及

从服务器访问一个或多个所述已存档对象模型。

17.如权利要求16所述的方法，其中所述服务器与在服务器上为用户维护所述已存档对象模型的视频处理服务结合使用，其中所述视频处理服务为其它用户维护其它已存档对象模型。

18.如权利要求1所述的方法，其中在处理压缩视频文件时使用一个或多个已存档对象模型还包括由计算机实施的步骤：在端对端网络中的多个用户计算机之间共享所述已存档对象模型。

19.如权利要求18所述的方法，其中在端对端网络中的多个用户计算机之间共享所述已存档对象模型还包括由计算机实施的步骤：

从所述端对端网络中的第一用户计算机接收所述压缩视频文件；

响应于请求，从所述端对端网络中的第二用户计算机发送所述已存档对象模型之一；以及

响应于请求，从所述端对端网络中的第三用户计算机发送所述已存档对象模型之一。

20.如权利要求1所述的方法，其中使用一个或多个所述已存档对象模型来控制对所述压缩视频文件的访问。

21.如权利要求1所述的方法，其中一个或多个所述已存档对象模型还包括广告，从而使得在使用一个或多个所述已存档对象模型来处理和重建所述压缩视频文件时，所述广告中的一个或多个被插入到重建后的视频文件中。

22.如权利要求1所述的方法，其中在处理压缩视频文件时使用一个或多个已存档对象模型还包括：基于一个或多个所述已存档对象模型，创建一个或多个对象的隐式表示。

23.如权利要求1所述的方法，其中所述对象模型包括形变模型、结构模型和外观模型。

24.一种用于处理视频的计算机系统，包括：

编码器，其处理视频信号，以创建用于在所述视频信号中表示的一个或多个对象的对象模型；

对象库，其存储所述对象模型；以及

解码器，其访问编码解码器和所述对象库，以便在重建已编码视频文件时使用一个或多个已存档对象模型。

25.一种用于处理视频的计算机系统，包括：

用于处理多个视频信号以创建用于在所述视频信号中表示的一个或多个对象的对象模型的装置；

用于将所述对象模型存档的装置；以及

用于在处理压缩视频文件时使用一个或多个已存档对象模型的装置。