CN100433049C - 图像检索装置及方法 - Google Patents

图像检索装置及方法 Download PDF

Info

Publication number
CN100433049C
CN100433049C CNB2006100020640A CN200610002064A CN100433049C CN 100433049 C CN100433049 C CN 100433049C CN B2006100020640 A CNB2006100020640 A CN B2006100020640A CN 200610002064 A CN200610002064 A CN 200610002064A CN 100433049 C CN100433049 C CN 100433049C
Authority
CN
China
Prior art keywords
frame
conversion coefficient
particular frame
quantification
quantization parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2006100020640A
Other languages
English (en)
Other versions
CN1808469A (zh
Inventor
福原隆浩
贵家仁志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1808469A publication Critical patent/CN1808469A/zh
Application granted granted Critical
Publication of CN100433049C publication Critical patent/CN100433049C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction

Abstract

不用将帧解码为其原始图像,就能从经过编码的码流中检索出与特定帧大致一致的帧。本发明提供了一种图像检索装置,用于从通过多个帧的压缩编码形成的对象编码码流中检索与特定帧大致一致的帧,该图像检索装置包括:解码器,用于对对象编码码流进行熵解码,以生成每一帧的量化系数;匹配单元,用于对特定帧的量化系数和由解码器生成并与特定帧的量化系数在采样位置上相对应的每一帧的量化系数进行匹配;以及判断单元,用于基于匹配结果判断该帧是否与特定帧大致一致。

Description

图像检索装置及方法
相关申请的交叉参考
本发明包含涉及于2005年1月21日向日本专利局提交的日本专利申请JP 2005-014750的主题,其全部内容结合于此作为参考。
技术领域
本发明涉及一种用于从通过压缩编码多个帧形成的经过编码的码流中检索与特定帧大致一致的帧的图像检索装置及方法,以及一种程序和程序记录介质。
背景技术
为了检索视频内容或者管理网络内容,例如,过去一直需要一种用于以特定帧的图像作为检索查询条件(query),从未知视频内容中检索与特定帧大致一致的帧的技术。例如,日本专利申请公开第2004-45565号提出了一种技术,用于通过从每个瞬时帧的视频内容中提取特征值来确定特征向量,并将该特征向量与参考图像的特征向量进行比较,来从视频内容中检索与特定帧大致一致的帧。
发明内容
目前,例如数码相机和便携式摄像机的成像装置已经越来越流行,并且图像数字化技术也相应地展现出快速的革新。即便例如电影、TV节目等的长时间视频内容也可以用JPEG(Joint PhotographicExperts Group,联合图像专家组)、MPEG(Moving Picture ExpertsGroup,运动图像专家组)、或者JPEG 2000中定义的图像压缩技术通过对其压缩编码而很容易地记录到硬盘等中。
因此,可以预料,将越来越需要从压缩编码的视频中检索与特定帧大致一致的帧。然而,即便采用上述日本专利申请公开第2004-45565号等公开的传统技术,由于需要在检索之前对经过编码的码流进行解码,因此整个检索过程的计算量将很大。
因此,期望通过提供一种无需将经过编码的码流解码为其原始形式就能够从经过编码的码流中检索与特定帧大致一致的帧的图像检索装置及方法、一种程序、以及一种程序记录介质来克服相关技术的上述缺点。
根据本发明,提供了一种从通过多个帧的压缩编码形成的对象编码码流(object encoded code stream)中检索与特定帧大致一致的帧的图像检索装置,该装置包括:
解码装置,用于对对象编码码流进行熵解码来生成每一帧的量化系数;
匹配装置,用于对特定帧的量化系数和由解码装置生成并与特定帧的量化系数在采样位置上相对应的每一帧的量化系数之间进行匹配;以及
判断装置,用于基于匹配结果,判断该帧是否与特定帧大致一致。
上述图像检索装置中的匹配装置对采样位置彼此对应的量化系数之间进行符号(正或负)上的顺序匹配。
根据本发明的上述图像检索装置进一步包括去量化装置,用于对由解码装置生成的每一帧的量化系数进行去量化,以提供每一帧的变换系数。在这种情况下,匹配装置对特定帧的变换系数和由去量化装置生成并与特定帧的变换系数在采样位置上相对应的每一帧的变换系数之间进行符号(正或负)上的匹配。
同样,每当出现量化系数与特定帧的量化系数在符号上不匹配的帧时,上述图像检索装置中的判断装置增加计数器的计数值,并且如果当某一帧的所有量化系数与特定帧的量化系数的匹配结束时的计数值小于预定阈值,则判定该帧与特定帧大致一致。
根据本发明,还提供了一种从通过多个帧的压缩编码形成的对象编码码流中检索大致与特定帧一致的帧的图像检索方法,该方法包括以下步骤:
对对象编码码流进行熵解码,以生成每一帧的量化系数;
对特定帧的量化系数和在解码步骤中生成并与特定帧的量化系数在采样位置上相对应的每一帧的量化系数之间进行匹配;以及
基于匹配结果,判断该帧是否与特定帧大致一致。
根据本发明,还提供了一种从通过多个帧的压缩编码形成的对象编码码流中检索与特定帧大致一致的帧的图像检索装置,该装置包括:
量化或变换系数获取装置,用于获取当生成对象编码码流时算出的每一帧的量化或变换系数以及特定帧的量化或变换系数;
匹配装置,用于对特定帧的量化或变换系数和由量化或变换系数获取装置生成并与特定帧的量化或变换系数在采样位置上相对应的的每一帧的量化或变换系数之间进行匹配;以及
判断装置,用于基于匹配结果,判断每一帧是否与特定帧大致一致。
根据本发明,还提供了一种从通过多个帧的压缩编码形成的对象编码码流中检索与特定帧大致一致的帧的图像检索方法,该方法包括以下步骤:
获取当生成对象编码码流时算出的每一帧的量化或变换系数和特定帧的量化或变换系数;
对特定帧的量化或变换系数和在量化或变换系数获取步骤中生成并与特定帧的量化或变换系数在采样位置上相对应的每一帧的量化或变换系数之间进行匹配;以及
基于匹配结果,判断每一帧是否与特定帧大致一致。
根据本发明,还提供了一种从通过多个帧的压缩编码形成的对象编码码流中检索与特定帧大致一致的帧的图像检索装置,该装置包括:
第一记录装置,用于将当对特定帧进行编码时算出的特定帧的量化或变换系数与特定帧一起记录到记录介质;
第二记录装置,用于将当检索对象编码码流时算出的每一帧的量化或变换系数与对象编码码流一起记录到记录介质;
量化或变换系数获取装置,用于从记录介质获取每一帧的量化或变换系数以及特定帧的量化或变换系数;
匹配装置,用于对特定帧的量化或变换系数和由量化或变换系数获取装置生成并与特定帧的量化或变换系数在采样位置上相对应的每一帧的量化或变换系数之间进行匹配;
判断装置,用于基于匹配结果,判断每一帧是否与特定帧大致一致;
解码装置,用于对由判断装置判定与特定帧大致一致的帧进行解码;以及
输出装置,用于将由解码装置解码的帧输出到显示装置。
根据本发明,还提供了一种从通过多个帧的压缩编码形成的对象编码码流中检索与特定帧大致一致的帧的图像检索方法,该方法包括:
第一记录步骤,将当对特定帧进行编码时算出的特定帧的量化或变换系数与特定帧一起记录到记录介质;
第二记录步骤,将当检索对象编码码流时算出的每一帧的量化或变换系数与对象编码码流一起记录到记录介质;
量化或变换系数获取步骤,从记录介质获取每一帧的量化或变换系数以及特定帧的量化或变换系数;
匹配步骤,对特定帧的量化或变换系数和在量化或变换系数获取步骤中生成并与特定帧的量化或变换系数在采样位置上相对应的每一帧的量化或变换系数之间进行匹配;
判断步骤,基于匹配结果,判断每一帧是否与特定帧大致一致;
解码步骤,对在判断步骤中判定与特定帧大致一致的帧进行解码;以及
输出步骤,将在解码步骤中解码的帧输出到显示装置。
根据本发明,还提供了一种允许计算机执行上述图像检索操作的程序、以及一种记录了该程序并可由计算机读取的记录介质。
借助于根据本发明的图像检索装置及方法、程序和程序记录介质,同通过将经过编码的码流解码为其原始形式的传统图像检索所需的计算量相比,可以显著降低整个图像检索过程所需的计算量,这是因为通过对特定帧的量化或变换系数和与特定帧的量化或变换系数在采样位置上相对应的每一帧的量化或变换系数之间在符号(正或负)上进行匹配,并基于匹配结果,判断每一帧是否与特定帧大致一致,来从通过多个帧的压缩编码形成的对象编码码流中检索与特定帧大致一致的帧。特别地,由于量化或变换系数之间的匹配仅仅在符号(正或负)上进行而不用考虑其绝对值,因此可以不依赖于对象编码码流被压缩的比率而进行检索。
附图说明
图1是作为本发明第一实施例的图像检索装置的示意性框图;
图2示出了在匹配单元中实行的匹配的例子;
图3示出了由图1中的图像检索装置执行的操作的流程;
图4是作为本发明第二实施例的图像检索装置的示意性框图;
图5是作为本发明第三实施例的图像检索装置的示意性框图,其中,匹配在某一帧的量化系数和特定帧的量化系数之间进行;
图6是作为本发明第三实施例的图像检索装置的示意性框图,其中,匹配在某一帧的变换系数和特定帧的变换系数之间进行;
图7是作为本发明第四实施例的图像检索装置的示意性框图,其中,特定帧仅仅存在于原始图像中,并且匹配在某一帧的量化系数和特定帧的量化系数之间进行;
图8是作为本发明第四实施例的图像检索装置的示意性框图,其中,特定帧仅仅存在于原始图像中,并且匹配在某一帧的变换系数和特定帧的变换系数之间进行;
图9是在作为本发明第五实施例的图像检索装置中采用的符合JPEG的图像编解码器的示意图;
图10解释了JPEG中定义的量化和去量化;
图11是在作为本发明第六实施例的图像检索装置中采用的符合JPEG 2000的图像编解码器的示意图;
图12解释了当图像经过三次小波变换后的子带;
图13解释了当测试图像经过小波变换后的子带;
图14示出了JPEG 2000中的子带、码块(code block)、和比特平面(bit plane)之间的关系;
图15示出了作为本发明第七实施例的图像检索装置中的HL-1子带中的系数之间的匹配的例子;
图16示出了当对每个子带中的系数之间进行匹配时选择子带的顺序;
图17示出了在每一子带中的某一帧的量化系数和特定帧的量化系数之间进行匹配时,由图像检索装置执行的操作的流程;
图18示出了在出现帧的即使一个量化系数与特定帧的量化系数在符号(正或负)上不一致即转移到下一对象帧时,由图像检索装置执行的操作的流程;
图19示出了在结束对所包含的预定码块的量化系数之间的匹配并且无需进一步匹配、以及在出现帧的即使一个量化系数与特定帧的相应量化系数在符号(正或负)上不一致即转移到下一帧时,由图像检索装置执行的操作的流程;
图20示出了由符合JPEG 2000的压缩编码实际形成的经过编码的码流中的第一码块的识别结果,其中,在某一帧的系数和特定帧的系数之间发现不一致。
图21示出了在对每个码块进行熵解码以及并行匹配、以及在出现帧的即使一个量化系数与特定帧的相应量化系数在符号(正或负)上不一致即转移到下一对象帧时,由作为本发明第八实施例的图像检索装置执行的操作的流程;
图22示出了在结束对所包含的预定码块的量化系数之间的匹配并且无需进一步匹配、以及在出现帧的即使一个量化系数与特定帧的相应量化系数在符号(正或负)上不一致即转移到下一对象帧时,由作为本发明第八实施例的图像检索装置执行的操作的流程;
图23是作为本发明第九实施例的图像检索装置的示意性框图;
图24是作为本发明第十实施例的图像检索装置的示意性框图,其中,已经存在特定帧的经过编码的码流和量化系数;
图25是作为第十实施例变型的图像检索装置的示意性框图,其中,既存在特定帧的经过编码的码流和量化系数,又存在对象帧的经过编码的码流和量化系数;
图26是作为本发明第十一实施例的图像检索装置的示意性框图,其中,使用了一个特定帧;以及
图27是作为第十一实施例的变型的图像检索装置的示意性框图,其中,使用了两个特定帧。
具体实施方式
下面将参考附图就本发明的实施例详细地描述本发明。
第一优选实施例
现在参照图1,作为本发明第一实施例的图像检索装置以框图的形式示意性地示出。如图1所示,作为第一实施例的图像检索装置,通常用参考数字1表示,包括熵解码器10和11、匹配单元12、和判断单元13。
在图像检索装置1中,熵解码器10根据预定算法对作为检索查询对象的特定帧的经过编码的码流D100进行熵解码,并将该特定帧的量化系数D101提供给匹配单元12。另一方面,熵解码器11根据预定算法对通过多个帧图像的压缩编码形成的经过编码的码流(每一帧的经过编码的码流的集合)中的对象帧的经过编码的码流D102进行熵解码,并将该对象帧的量化系数D103提供给匹配单元12。应当注意,在已经存在特定帧的量化系数D101的情况下,可以省略熵解码器10的操作。
匹配单元12在特定帧的量化系数D101和与特定帧采取相同采样位置的对象帧的量化系数D103之间进行符号(正或负)上的匹配,并将匹配结果D104提供给判断单元13。图2示出了每一个均包括共16个采样(每行和每列均有4个采样)的帧之间匹配的例子。在图2中,箭头ad表示绝对值彼此不同但是符号(正或负)彼此一致的采样。
判断单元13基于从匹配单元12提供的匹配结果D104,判断对象帧和特定帧是否大致彼此一致。具体来说,每次出现符号(正或负)彼此不一致的采样时,计数器的计数值加一。如果所有采样的匹配完成之后计数值为零(0),即,如果发现所有采样的量化系数在符号(正或负)上彼此一致,则可以判定对象帧和特定帧彼此大致一致,并将判断结果D105提供到外部。
图3示出了图像检索装置1的操作的流程。首先在步骤S1中,图像检索装置1对特定帧的经过编码的码流D100和对象帧的经过编码的码流D102进行熵解码,以提供特定帧的量化系数D101和对象帧的量化系数D103。
接下来在步骤S2中,图像检索装置1对采样位置彼此对应的特定帧的量化系数D101和对象帧的量化系数D103之间进行符号(正或负)上的匹配,以判断量化系数D101和D103的符号是否彼此一致。如果符号彼此一致,则图像检索装置1进入步骤S4。如果符号彼此不一致,则图像检索装置1在步骤S3中将计数器的计数值加一,然后进入到步骤S4。应当注意,如果任意一个量化系数为零(0),例如,如图2中bc所示,则图像检索装置1理想地应当跳过匹配过程。
接下来在步骤S4中,图像检索装置1判断是否对所有的采样都完成了匹配。如果判断出匹配尚未结束,则图像检索装置1在步骤S5中转移到下一采样,然后返回到步骤S2。相反地,如果判断出匹配已经结束,则图像检索装置1进入到步骤S6。
在步骤S6中,图像检索装置1判断计数值是否为0。如果计数值不为0,则图像检索装置1判定对象帧与特定帧不一致,并进入到步骤S7,向其提供下一对象帧的经过编码的码流。然后,进入步骤S8,将计数值复位到0,并从步骤S1开始重复上述过程。相反地,如果计数值为0,则对象帧与特定帧对于所有的采样来说都一致。因此,图像检索装置1进入步骤S9,判定对象帧与特定帧大致一致,并退出检索操作。
注意,尽管上面参照图3中的流程图描述了对每个帧的所有采样进行匹配,但是为了降低检索过程所需的时间,也可以在计数值大于预定阈值时判定对象帧与特定帧不一致,然后转移到下一对象帧。尤其是,在只有当对所有采样结束匹配之后计数值为0才判定对象帧与特定帧大致一致的情况下,计数值变为一(1)即转移到下一对象帧有可能会减少检索过程所需的时间。
同样,上面还描述了仅在当对所有采样结束匹配之后计数值为0时判定对象帧与特定帧大致一致。然而,图像检索装置也可以适应于当对所有采样结束匹配之后计数值小于预定阈值时判定对象帧与特定帧大致一致。在这种情况下,有可能会出现多个候选帧,但这样可以防止检索过程中的任何失败。
由于图像检索装置1通过如上述在采样位置上彼此对应的帧的量化系数之间进行匹配来检索与特定帧图像大致一致的帧图像,因此与在将帧解码为原始帧图像之后进行的传统帧检索相比,可以显著降低整个检索过程的计算量。特别地,由于量化系数之间的匹配仅在符号(正或负)上进行而不考虑其绝对值,因此即使在特定帧的经过编码的码流D100与对象帧的经过编码的码流D102的压缩比率不同的情况下,也可以进行检索。
第二实施例
图4示出了作为本发明第二实施例的图像检索装置,通常用参考数字2表示。图像检索装置2的基本结构与图1所示的图像检索装置1类似,除了其进一步包括用于对采样位置上彼此对应的某一帧和特定帧的变换系数之间在符号(正或负)上进行匹配的去量化器14和15。因此,图像检索装置2的与图1中的图像检索装置1的元件相同的元件用相同的参考数字表示,并且将不再详细描述。
在图像检索装置2中,去量化器14对特定帧的量化系数D101去量化,以提供特定帧的变换系数D106,并将变换系数D106提供给匹配单元12。另一方面,去量化器15对对象帧的量化系数D103去量化,以将所获得的对象帧的变换系数D107提供到匹配单元12。匹配单元12对采样位置彼此对应的特定帧的变换系数D106和对象帧的变换系数D107之间在符号(正或负)上进行匹配,并将匹配结果D104提供到判断单元13。应当注意,该第二实施例中采取的匹配技术与第一实施例中采用的类似。判断单元13基于从匹配单元12提供的匹配结果D104来判断对象帧是否与特定帧大致一致。
由于图像检索装置2通过如上所述对采样位置彼此对应的帧的变换系数之间进行匹配来检索与特定帧图像大致一致的帧图像,因此,同在将帧解码为原始帧图像之后进行的传统帧检索相比,可以显著减小整个检索过程的计算量。特别地,由于量化系数之间的匹配仅在符号(正或负)上进行而不用考虑其绝对值,因此即使在特定帧的经过编码的码流D100与对象帧的经过编码的码流D102的压缩比率不同的情况下,也可以进行检索。
注意,因为需要用到去量化器14和15,因此第二实施例中的整个检索过程所需的计算量比第一实施例中的长,但是如果已有特定帧的变换系数D106,则第二实施例更实用。
第三实施例
在上文中,已经描述了判断单元13的判断结果被提供到外部的第一和第二实施例。在这些实施例之后,将对第三和第四实施例进行说明和描述,在这些实施例中,为了对帧进行可视检查,特定帧的图像和判定为与特定帧大致一致的帧的图像被分别显示在显示单元上。图5是作为第三实施例的图像检索装置的示意性框图,通常用参考数字3表示,其中,匹配在采样位置彼此对应的量化系数之间进行,图6也是作为第三实施例的图像检索装置的示意性框图,通常用参考数字4表示,其中,匹配在采样位置彼此对应的变换系数之间进行。应当注意,这些图像检索装置3和4的分别与在图1和图4示出的图像检索装置1和2的元件相同的元件用相同的参考数字表示,并且将不再详细描述。
首先,将说明和解释图像检索装置3。
在图像检索装置3中,熵解码器10根据预定算法对特定帧的经过编码的码流D100进行熵解码,以提供量化系数D101,并将量化系数D101提供给匹配单元12和去量化器16。另一方面,熵解码器11根据预定算法对对象帧的经过编码的码流D102进行熵解码,以提供对象帧的量化系数D103,并将量化系数D103提供给匹配单元12和去量化器16。
匹配单元12对采样位置彼此对应的特定帧的量化系数D101和对象帧的量化系数D103之间进行符号(正或负)上的匹配,并将匹配结果D104提供给判断单元13。判断单元13基于从匹配单元12提供的匹配结果D104,来判断对象帧和特定帧是否彼此大致一致。如果判断出对象帧和特定帧彼此大致一致,即,如果判定在所有采样上,特定帧的量化系数D101在符号上与在采样位置上与特定帧的量化系数D101相对应的对象帧的量化系数D103一致,则判断结果D105被提供给去量化器16。
当从判断单元13提供对象帧和特定帧彼此大致一致的判断结果D105时,去量化器16对特定帧的量化系数D101和对象帧的量化系数D103进行去量化,以提供特定帧的变换系数D106和对象帧的变换系数D107,并将变换系数D106和D107提供给逆变换器17。逆变换器17对特定帧的变换系数D106和对象帧的变换系数D107进行逆变换,以提供特定帧的解码图像D108和对象帧的解码图像D109,并将解码图像D108和D109分别显示在显示单元18和19上。
接下来,将说明和解释图像检索装置4。
在图像检索装置4中,去量化器14对特定帧的量化系数D101进行去量化,以提供特定帧的变换系数D106,并将变换系数D106提供给匹配单元12和逆变换器17。另一方面,去量化器15对对象帧的量化系数D103进行去量化,以提供对象帧的变换系数D107,并将变换系数D107提供给匹配单元12和逆变换器17。
匹配单元12对采样位置彼此对应的特定帧的变换系数D106和对象帧的变换系数D107之间进行符号(正或负)上的匹配,并将匹配结果D104提供给判断单元13。判断单元13基于从匹配单元12提供的匹配结果D104,判断对象帧和特定帧是否彼此大致一致。如果判定对象帧和特定帧彼此大致一致,即,如果判定在所有采样上,特定帧的变换系数D106在符号上与在采样位置上与特定帧的变换系数D106相对应的对象帧的变换系数D107一致,则将判断结果D105提供给逆变换器17。逆变换器17对特定帧的变换系数D106和对象帧的变换系数D107进行逆变换,以提供特定帧的解码图像D108和对象帧的解码图像D109,并将解码图像D108和D109分别显示在显示单元18和19上。
在图像检索装置3和4中,如上所述,由于特定帧图像和判定为与特定帧图像大致一致的帧图像被分别显示在显示单元18和19上,因此实际上可以从视觉上检查特定帧和对象帧是否彼此一致。
在第三和第四实施例中,只有当对所有采样的匹配完成之后计数值为零(0)时被判定为与特定帧图像大致一致的帧图像被显示在显示单元18和19上。然而,可以改装图像检索装置3和4,使得如果不存在计数值为0的帧,则计数值为最小值的帧被显示在显示单元18和19上。
第四实施例
在前面提到的第一和第二实施例中,特定帧的经过编码的码流D100是已知的。下面将说明特定帧仅以原始图像形式存在的第四实施例。
图7是通常用参考数字5表示的图像检索装置的示意性框图,其中,与第一实施例中一样,匹配是在采样位置彼此对应的量化系数之间进行。在该图像检索装置5中,变换器20根据预定算法对特定帧图像D110进行变换以提供变换系数D111,并且将变换系数D111提供给量化器21。量化器21对特定帧的变换系数D111进行量化以提供量化系数D112,并将量化系数D112提供给匹配单元12。应当注意,后续操作与第一实施例中的操作类似,将不再解释。
图8是通常用参考数字6表示的图像检索装置的示意性框图,其中,与第二实施例中一样,匹配是在采样位置彼此对应的变换系数之间进行的。在图像检索装置6中,变换器20根据预定算法对特定帧图像D110进行变换以提供变换系数D111,并将变换系数D111提供给匹配单元12。应当注意,后续操作与第二实施例中的操作类似,将不再解释。
如上所述,即使特定帧仅以原始图像形式存在,作为第四实施例的图像检索装置5和6也可以用较小的计算量检索与特定帧图像大致一致的帧图像。
第五实施例
注意,在第一到第四实施例的上面的描述中,并未详细描述熵解码器10和11、去量化器14~16、逆变换器17、变换器20、和量化器21的算法。这里将说明和解释采用JPEG作为图像压缩技术的本发明的第五实施例。目前,JPEG是在数码相机和便携式摄像机中使用来压缩静止图像的最普遍的图像压缩技术。
图9是根据JPEG对输入图像信号进行编码和解码的、作为第五实施例的图像编解码器(编码器/解码器)的示意性框图。在本文中描述该图像编解码器作为参考。如图9所示,通常用参考数字30表示的图像编解码器包括DCT(离散余弦变换)变换器(下文中将称为“DCT变换器”)31、量化器32、熵编码器33、熵解码器34、去量化器35、以及逆DCT变换器(下文中将称为“逆DCT变换器”)36。
在图像编解码器30中,DCT变换器31被提供图像信号D200,并对输入图像信号D200进行离散余弦变换(DCT),以生成DCT系数D201。利用矩阵形的量化表,量化器32对DCT系数D201进行量化以生成量化系数D202。该量化过程(以及稍后将进一步描述的去量化)在图10中示出。根据JPEG标准,因为以8×8个像素(8个垂直像素×8个水平像素)为单位进行DCT,因此可以确定如图10所示的8×8个DCT系数(A)。之后,这些DCT系数(A)除以存储并保持在ROM(只读存储器)等(未显示)中的量化表(B)来计算量化系数(C=A/B)。熵编码器33对量化系数D202进行编码以生成经过编码的码流D203,并将经过编码的码流D203发送到信道/记录介质。这里应当注意,熵编码器33参照变长表进行变长编码,以确定对应于出现的量化系数的游和程(run and level)的编码。通常,变长表为存储在存储器中的预定表格。
熵解码器34对从信道/记录介质发送的经过编码的码流D203进行解码,以生成量化系数D204。这里应当注意,熵解码器34进行与熵编码器33的操作相反的变长解码。即,熵解码器34参考变长表确定对应于出现的编码的游和长(run and length),以生成量化系数D204。如图10所示,去量化器35借助于使用前面提到的量化表对量化系数D204进行去量化,以生成变换系数D205。如图10所示,量化系数(C)中的每个系数均乘以量化表(B)中的对应系数,以计算去量化系数(D=C×B)。逆DCT变换器36对变换系数D205进行逆DCT,以提供经过解码的图像信号D206,并将此信号提供到外部。
在使用JPEG作为图像压缩技术的情况下,则前面提到的熵解码器10和11相当于参考变长表来确定对应于出现的编码的游和程的熵解码器34。同样,去量化器14~16以及量化器21分别相当于均使用量化表的去量化器35和量化器32。同样,逆变换器17和变换器20分别相当于进行逆DCT的逆DCT变换器36和进行DCT的DCT变换器31。因此,前面提到的匹配单元12将对采样位置彼此对应的量化系数之间或者采样位置彼此对应的DCT系数之间进行匹配。
第六实施例
在上文中,已经描述了使用JPEG作为图像压缩技术的第五实施例。这里将说明和解释使用JPEG 2000作为图像压缩技术的第六实施例。JPEG 2000是由ISO/IEC/JTCl国际委员会标准化的国际标准静止图像/活动图像压缩技术,并且预计将逐渐地普及取代JPEG。
图11是根据JPEG 2000对输入图像信号进行编码和解码的图像编解码器的示意性框图。在本文中示出该图像编解码器作为参考。如图11所示,通常用参考数字40表示的图像编解码器包括DWT(离散小波变换)变换器41、标量量化器(scalar quantizer)42、EBCOT(基于优化截断的嵌入式块编码)编码器43、EBCOT解码器44、标量去量化器45、以及逆DWT变换器46。
在图像编解码器40中,DWT变换器41对输入图像信号D300进行DWT,以生成DWT系数D301。这里应当注意,DWT用由低通滤波器和高通滤波器组成的滤波器组来表现,并且,对包括二维信号的图像进行的DWT相应于图12中所示的DWT的划分步骤的数目而增加通过划分频带形成的子带的数目。图12示出了3次划分频带而形成从LL-3(最低频带分量)到HH-1(最高频带分量)的总共10个子带的例子。图13A示出了通过对测试图像进行一次DWT形成的子带,图13B示出了对测试图像进行三次DWT形成的子带。
再次参考图11进行描述。标量量化器42用JPEG 2000中定义的标量量化技术对每个子带的DWT系数D301进行量化,以生成每个子带的量化系数D302。EBCOT编码器43用JPEG 2000中定义为熵编码技术的EBCOT技术对量化系数D302进行编码,以生成经过编码的码流D303,并将经过编码的码流D303发送到信道/记录介质。详细说来,EBCOT编码器43将子带划分为如图14所示的预定尺寸的码块。码块的尺寸通常为32×32或者64×64。每个码块的量化系数D302形成为一组二进制系数位(0或1)的比特平面,并且这些系数位以比特平面为单位进行编码。
EBCOT解码器44用JPEG 2000中定义的技术对从信道/记录介质发送的经过编码的码流D303进行解码,以生成量化系数D304。标量去量化器45对量化系数D304进行去量化,以生成DWT系数D305,并且逆DWT变换器46对DWT系数D305进行逆DWT变换,以提供经过解码的图像信号D306。
在将JPEG 2000用作图像压缩技术的情况下,则前面提到的熵解码器10和11相当于EBCOT解码器44。同样,去量化器14~16以及量化器21相当于标量去量化器45和标量量化器42。同样,逆变换器17和变换器20分别相当于进行逆DWT变换的逆DWT变换器46和进行DWT变换的DWT变换器41。因此,前面提到的匹配单元12将对采样位置彼此对应的量化系数或者采样位置彼此对应的DWT系数之间进行匹配。
第七实施例
正如已经就第六实施例描述过的,JPEG 2000使得输入图像信号的频带由DWT划分为每一个都反映图像特征的多个子带。例如,一幅图像的能量大多集中在最低频带。因此,对由频带划分产生的每一个子带的量化系数或DWT系数之间进行的匹配是最有效的。图15中示出了在每个HL-1子带的系数之间的匹配的例子。在图15中,箭头a和d表示绝对值彼此不一致但符号(正或负)彼此一致的系数,箭头b和c表示其中任意一个为零(0)的系数。
由于图像在低频带子带中彼此相当接近,不同帧图像在符号(正或负)上彼此相差很大,并且出现在高频带子带中为零(0)的系数比出现在低频带子带中的要多很多,因此在许多情况下符号判断是行不通的。由于这个原因,量化系数或DWT系数之间的匹配应当优选地按照从最低频带中的子带向最高频带中的子带的顺序进行。例如,如果已经实行了三次DWT变换,则量化系数或DWT系数之间的匹配应当优选地按照图16所示的LL-3(最低频带子带)、HL-3、LH-3、HH-3、HL-2、LH-2、HH-2、HL-1、LH-1、和HH-1的顺序进行。
注意,如果所有原始图像均为正值,则DWT系数和量化系数的最低频带分量始终为正号。在这种情况下,匹配应当从紧接在最低频带分量之后的子带的系数开始。
图17示出了由图像检索装置执行的对每个子带的量化系数之间进行匹配的操作的流程。首先在步骤S11中,图像检索装置对特定帧的经过编码的码流和对象帧的经过编码的码流进行熵解码,以生成特定帧的量化系数和对象帧的量化系数。
接着在步骤S12中,图像检索装置对采样位置彼此对应的特定帧的量化系数和对象帧的量化系数之间进行符号(正或负)上的匹配,并且判断量化系数在符号上是否彼此一致。如果判定量化系数在符号上彼此一致,则图像检索装置进入到步骤S14。如果判定量化系数在符号上彼此不一致,则图像检索装置将在步骤S13中给计数器的计数值加一,然后进入到步骤S14。在步骤S14中,图像检索装置判断对同一子带中的所有采样的匹配是否已经结束。如果判定匹配没有结束,则图像检索装置在步骤S15中转移到下一采样,然后返回到步骤S12。如果判定匹配结束,则图像检索装置转到步骤S16。
接着在步骤S16中,图像检索装置判断是否存在下一子带。如果判定存在下一子带,则图像检索装置在步骤S17中转移到该子带,然后转到步骤S12。相反地,如果不存在下一子带,则图像检索装置转到步骤S18。
在步骤S18中,图像检索装置判断计数值是否为零(0)。如果计数值不为零,则图像检索装置判定对象帧与特定帧不一致,在步骤S19中其被提供下一对象帧的经过编码的码流,在步骤S20中将计数值复位为零,然后重复步骤S11以及后续步骤中的类似检索操作。相反地,计数值为零意味着对于所有采样量化系数在符号(正或负)上彼此一致。因此,图像检索装置在步骤S21中判定对象帧与特定帧大致一致,并退出检索过程。
注意,尽管在图17的流程图中是对所有采样进行的匹配,但是检索过程可以使得当计数值已经变得大于预定阈值时即判定量化系数彼此不一致,并且图像检索装置移动到下一对象帧,这样做的目的是减少检索过程所需的时间。具体来说,在仅当对所有采样的匹配结束时计数值为零(0)时判定对象帧与特定帧大致一致的情况下,通过当计数值已经变为一(1)时转移到下一对象帧可以减少检索过程所需的时间。
图18示出了当在出现即使一个量化系数在符号(正或负)上与对应的量化系数不一致即转移到下一对象帧时,由图像检索装置执行的操作的流程。首先在步骤S31中,图像检索装置对特定帧的经过编码的码流以及对象帧的经过编码的码流进行熵解码,以生成特定帧的量化系数和对象帧的量化系数。
接着在步骤S32中,图像检索装置对采样位置彼此对应的特定帧的量化系数和对象帧的量化系数之间进行符号(正或负)上的匹配,以判断量化系数在符号上是否彼此一致。如果发现量化系数在符号上彼此一致,则图像检索装置进入步骤S34。如果判定量化系数在符号上彼此不一致,则图像检索装置判定对象帧与特定帧不一致。在步骤S33中,向图像检索装置提供下一对象帧的经过编码的码流,并且重复从步骤S31开始的类似检索过程。
接着在步骤S34中,图像检索装置判断对同一码块中的所有采样的匹配是否结束。如果匹配没有结束,则图像检索装置在步骤S35中转移到下一采样然后返回到步骤S32。如果匹配结束,则图像检索装置转到判断是否存在下一码块的步骤S36。如果存在下一码块,则图像检索装置在步骤S37中转移到下一码块,然后转到步骤S32。相反地,如果不存在下一码块,则意味着对所有采样的匹配结束。因此,图像检索装置在步骤S38中判定对象帧与特定帧大致一致,并退出检索过程。
在上文中,仅当在对所有采样结束匹配之后计数值为零(0)时,图像检索装置判定对象帧与特定帧大致一致。然而,图像检索装置可以适于当在对所有采样结束匹配之后计数值小于预定阈值时判定对象帧与特定帧大致一致。在这种情况下,有可能出现多个候选帧,但是可以防止检索的任何失败。
注意,尽管上面在假设除非出现在符号上彼此不一致的任何系数,将完成对所有采样的匹配的情况下解释了本发明,但是该图像检索装置可以只匹配到所包括的预定码块或者子带,无需进一步匹配。
图19示出了在只进行到所包括的预定码块的量化系数之间的匹配且不进一步匹配,以及当即使只出现帧的一个量化系数与特定帧的相应量化系数在符号(正或负)上不一致即转移到下一对象帧时,由图像检索装置执行的操作的流程。首先在步骤S41中,图像检索装置对特定帧的经过编码的码流以及对象帧的经过编码的码流进行熵解码,以生成特定帧的量化系数和对象帧的量化系数。
接着在步骤S42中,图像检索装置对采样位置彼此对应的特定帧的量化系数和对象帧的量化系数之间进行符号(正或负)上的匹配,以判断量化系数在符号上是否彼此一致。如果发现量化系数在符号上彼此一致,则图像检索装置转到步骤S44。如果判定量化系数在符号上彼此不一致,则图像检索装置判定对象帧与特定帧不一致。在步骤S43中,向图像检索装置提供下一对象帧的经过编码的码流,并且重复从步骤S41开始的类似检索过程。
接着在步骤S44中,图像检索装置判断对相同码块中的所有采样的匹配是否结束。如果匹配没有结束,则图像检索装置在步骤S45中转移到下一采样,然后返回到步骤S42。如果匹配结束,则图像检索装置转到判断是否已经执行了预定码块的匹配的步骤S46。如果尚未执行预定码块的匹配,则图像检索装置在步骤S47中切换到下一码块,然后返回到步骤S42。相反地,如果已经执行预定码块的匹配,这意味着对所有采样的匹配结束。因此,图像检索装置在步骤S48中判定对象帧与特定帧大致一致,并退出检索过程。
图20示出了实际由符合JPEG 2000的压缩编码形成的经过编码的码流中的第一码块的识别结果,其中,在某一帧的系数和特定帧的系数之间发现了不一致。如图20所示,识别结果为,在总共300帧的292帧的第一码块、3帧的第四码块、以及57帧的第九码块中,发现帧的系数与特定帧的系数之间不一致。也就是说,在300帧的大部分(97.3%)的第一码块中发现了不一致。因此,毫无疑问,无需对第九码块进行进一步的匹配。然而,由于检索操作的完成应当具备一定的灵活性以处理各种图像,因此把相当于所有码块例如10%的码块(这种情况下,168×10%=17个码块)作为要进行匹配的对象码块是很有效的。
第八实施例
在上面的本发明第七实施例中,码块中的量化系数在对所有码块的熵解码之后进行匹配。然而,如上所述,由于在大部分帧的第一码块中发现不一致,因此即使在中途停止匹配的多种情况下也不会出现问题。这里将说明和解释本发明的第八实施例,其中,每个码块的熵解码和匹配并行地执行以减少整个检索过程的计算量。
图21示出了在对每个码块进行熵解码和并行匹配、以及即使当只出现帧的一个量化系数与特定帧的相应的量化系数在符号(正或负)上不一致即转移到下一对象帧时,由作为第八实施例的图像检索装置执行的操作的流程。首先在步骤S51中,图像检索装置对特定帧的经过编码的码流的一个码块以及对象帧的经过编码的码流的一个码块进行熵解码,以生成特定帧的每个码块的量化系数和对象帧的一个码块的量化系数。
接着在步骤S52中,图像检索装置对采样位置彼此对应的特定帧的每个码块的量化系数和对象帧的每个码块的量化系数之间进行符号(正或负)上的匹配,以判断量化系数在符号上是否彼此一致。如果发现系数在符号上彼此一致,则图像检索装置转到步骤S54。如果系数在符号上彼此不一致,则图像检索装置判定对象帧与特定帧不一致,并转到向其提供下一对象帧的经过编码的码流的步骤S53,并且重复从步骤S51开始的类似检索过程。
接着在步骤S54中,图像检索装置判断对相同码块中的所有采样的匹配是否结束。如果匹配没有结束,则图像检索装置在步骤S55中转移到下一采样,然后返回到步骤S52。如果匹配结束,则图像检索装置转到判断是否存在下一码块的步骤S56。如果存在下一码块,则图像检索装置在步骤S57中转移到下一码块,然后返回到步骤S51。相反地,如果不存在下一码块,则意味着对所有采样的匹配结束。因此,图像检索装置在步骤S58中判定对象帧与特定帧大致一致,并退出检索过程。
同样在此实施例中,与在第七实施例中一样,图像检索装置可以适于完成对所包括的预定码块的匹配,并且无需进一步匹配。
图22示出了在进行针对所包括的预定码块的量化系数之间的匹配且无需进一步匹配、以及即使当只出现帧的一个量化系数与特定帧的相应的量化系数在符号(正或负)上不一致即转移到下一对象帧时,由图像检索装置执行的操作的流程。首先在步骤S61中,图像检索装置对特定帧的一个码块以及对象帧的一个码块进行熵解码,以生成特定帧的每个码块的量化系数和对象帧的每个码块的量化系数。
接着在步骤S62中,图像检索装置对采样位置彼此对应的特定帧的每个码块的量化系数和对象帧的每个码块的量化系数之间进行符号(正或负)上的匹配,以判断量化系数在符号上是否彼此一致。如果发现系数在符号上彼此一致,则图像检索装置转到步骤S64。如果系数在符号上彼此不一致,则图像检索装置判定对象帧与特定帧不一致,并转到将向其被提供下一对象帧的经过编码的码流的步骤S63,并且重复从步骤S61开始的类似检索过程。
接着在步骤S64中,图像检索装置判断对相同码块中的所有采样的匹配是否结束。如果匹配没有结束,则图像检索装置在步骤S65中转移到下一采样,然后返回到步骤S62。如果匹配结束,则图像检索装置转到判断是否已经执行了预定码块的匹配的步骤S66。如果已经执行预定码块的匹配,则图像检索装置在步骤S67中转移到下一码块,然后返回到步骤S61。相反地,如果尚未执行预定码块的匹配,则意味着量化系数在符号上彼此一致。因此,图像检索装置在步骤S68中判定对象帧与特定帧大致一致,并且退出检索过程。
第九实施例
注意,在没有参考生成特定帧的经过编码的码流和对象帧的经过编码的码流的系统的配置的情况下说明和解释了上述的第一到第八实施例。这里将说明和解释第九实施例以及包括在图像检索装置中用于生成特定帧的经过编码的码流和对象帧的经过编码的码流的系统。
图23以框图的形式示意性地示出了作为本发明的第九实施例的图像检索装置。如图23所示,通常用参考数字50表示的作为第九实施例的图像检索装置包括成像单元51、A-D转换器52、编码器53和54、存储器55、匹配/判断单元56、解码器57和58、以及显示单元59。
在图像检索装置50中,成像单元51是,例如,CCD(电荷耦合器件)相机,它将通过对物体成像获得的图像信号D400提供给A-D(模拟-数字)转换器52,该A-D(模拟-数字)转换器将图像信号D400A-D转换为图像数据D402,并将该图像数据D402提供给编码器53。编码器53根据预定算法对图像数据D402进行压缩编码,以生成经过编码的码流D404。应当注意,经过编码的码流D404是前面提到的特定帧的经过编码的码流。编码器53将在压缩编码期间生成的量化系数D405与经过编码的码流D404一起提供给存储经过编码的码流D404和量化系数D405的存储器55。
类似地,成像单元51将通过对物体成像获得的活动图像信号D401提供给A-D转换器52,该A-D转换器对活动图像信号D401进行A-D转换以提供视频数据D403,并将该视频数据D403提供给编码器54。编码器54根据预定算法对视频数据D403进行压缩编码,以生成经过编码的码流D406。应当注意,经过编码的码流D406是前面提到的对象帧的经过编码的码流。编码器54将在压缩编码期间生成的量化系数D407与经过编码的码流D406一起提供给存储经过编码的码流D406和量化系数D407的存储器55。
匹配/判断单元56类似于前面提到的匹配单元12和判断单元13,并从经过编码的码流D406中检索与特定帧大致一致的帧。如果存在与特定帧大致一致的帧,则匹配/判断单元56将判断结果D408提供给解码器58,解码器58相应于判断结果408对与特定帧大致一致的帧进行解码以提供解码图像D410,并将解码图像D410提供给显示单元59。同样,解码器57对特定帧的经过编码的码流进行解码以提供解码图像D409,并将解码图像D409提供给显示单元59。
由于作为第九实施例的图像检索装置50将在压缩编码期间产生的量化系数D405和D407连同特定帧的经过编码的码流D404和对象帧的经过编码的码流D406一起记录到存储器55,因此能够无需对经过编码的码流D404和D406进行熵解码就可以对量化系数之间进行匹配。
注意,尽管上面已经描述了通过对与特定帧大致一致的帧进行解码获得的解码图像D410被显示在显示单元59上,但是本发明不限于该技术,而是可以将与特定帧大致一致的帧作为再生起始帧,并对再生起始帧和后续帧进行解码,以显示在显示单元59上。同样,可以将与特定帧大致一致的帧作为再生终止帧,并解码一直到该再生终止帧的帧,从而显示在显示单元59上。
上文已经描述了在压缩编码期间生成的量化系数D405和D407被记录到存储器55,从而在它们之间进行匹配。然而,本发明不限于该技术,变换系数也可以被记录到存储器55中,从而对它们之间进行匹配。
第十实施例
上面已经描述的第九实施例中,特定帧图像和对象活动图像都是未被压缩编码过的,即,特定帧的经过编码的码流和量化系数以及对象帧的经过编码的码流和量化系数都不是现有的。这里将说明和解释第十实施例,其中,至少已有特定帧的经过编码的码流和量化系数或对象帧的经过编码的码流和量化系数。
图24是作为本发明第十实施例的图像检索装置的示意性框图,其中,已存在特定帧的经过编码的码流和量化系数。该图像检索装置通常用参考数字60表示。在该图像检索装置60中,特定帧的经过编码的码流D404和量化系数D405从记录介质、外部服务器等拷贝或下载到存储器55。同样,编码器53根据预定算法对对象视频数据D403进行压缩编码以提供经过编码的码流D406,并且在压缩编码期间生成的经过编码的码流D406和量化系数D407记录到存储器55中。后续操作与图像检索装置50中的类似,因此将不再描述。
图25是作为第十实施例的变型的图像检索装置的示意性框图,其中,既存在特定帧的经过编码的码流和量化系数,也存在对象编码码流和量化系数。该图像检索装置通常用参考数字70表示。在该图像检索装置70中,特定帧的经过编码的码流D404和量化系数D405以及对象帧的经过编码的码流D406和量化系数D407从记录介质或外部服务器拷贝或下载到存储器55。后续操作与图像检索装置50中的类似,因此将不再描述。
由于图像检索装置60和70至少已存在特定帧的经过编码的码流和量化系数或者对象帧的经过编码的码流和量化系数,因此能够通过将其拷贝或者下载到存储器55很容易地用于匹配。
第十一实施例
在第九和第十实施例中,存储器55已经在其中记录了特定帧的经过编码的码流和量化系数以及对象帧的经过编码的码流和量化系数。这里将说明和解释第十一实施例,其中,当从存储器55把要检索的对象编码码流拷贝到其他记录介质时,利用了特定帧的量化系数和要检索的对象的量化系数。
图26是作为本发明第十一实施例的图像检索装置的示意性框图,其中,使用一个特定帧。该图像检索装置通常用参考数字80表示。在该图像检索装置80中,匹配/判断单元56在特定帧的量化系数D405和要检索的对象的量化系数D407之间进行比较,以从对象编码码流D406中检索与特定帧大致一致的帧。如果发现了与特定帧大致一致的这种帧,则匹配/判断单元56将判断结果D408提供给记录控制器81,该记录控制器将相应于判断结果D408来控制将对象编码码流D406记录到记录介质82。更特别地,当经过编码的码流D406被记录到记录介质82时,与特定帧大致一致的帧被标记为再生起始帧。可选地,将与特定帧大致一致的帧作为再生起始帧,并将再生起始帧之后的帧记录到记录介质82。应当注意,可以改装图像检索装置80,使得特定帧的经过编码的码流被单独地记录到记录介质82。
图27是作为第十一实施例的变型的图像检索装置的示意性框图,其中,使用了两个特定帧。该图像检索装置通常用参考数字90表示。在该图像检索装置90中,匹配/判断单元56对第一特定帧的量化系数D411和要检索的对象的量化系数D407之间进行比较,以从对象编码码流D406中检索与第一特定帧大致一致的帧。类似地,匹配/判断单元56对第二特定帧的量化系数D412和待检索的对象的量化系数D407之间进行比较,以从对象编码码流D406中检索与第二特定帧大致一致的帧。如果发现分别与第一特定帧和第二特定帧大致一致的帧,则匹配/判断单元56将判断结果D408提供给记录控制器81,该记录控制器相应于判断结果D408来控制将对象编码码流D406记录到记录介质82。更特别地,当经过编码的码流D406被记录到记录介质82时,与第一和第二特定帧大致一致的帧分别被标记为再生起始帧(IN点)和再生终止帧(OUT点)。可选地,将与第一和第二特定帧大致一致的帧分别取为再生起始帧和再生终止帧,并且,从再生起始帧到再生终止帧的帧被记录到记录介质82。应当注意,可以改装图像检索装置90,使得第一和第二特定帧的经过编码的码流被单独地记录到记录介质82。同样,可以仅改装图像检索装置90,使得经过编码的码流D406被记录到记录介质82,并且将与第一和第二特定帧大致一致的帧分别标记为再生起始帧和再生终止帧。
此外,如果使用了n个特定帧,则可以将与第一和第n特定帧大致一致的帧分别标记为再生起始帧(IN点)和再生终止帧(OUT点),同时将与第二、…、第(n-1)特定帧大致一致的帧标记为再生继续点(例如,场景改变点、章节点等)。
在上文中,已经结合优选实施例对本发明进行了说明和解释,但本发明并不限于这些实施例。
例如,尽管已经借助于将静止图像作为检索查询条件对前面提到的实施例进行了描述,但是也可以将活动图像作为检索查询条件。在这种情况下,可以按照上面所述,在将形成作为检索查询条件的活动图像的多个帧的一部分选择作为静止图像的检索查询条件的情况下进行图像检索,并且计数值大于预定值(阈值)的与检索查询条件一致的帧可以被检索作为相同的活动图像。
同样,在前面提到的实施例中执行的一系列操作可以通过软件来执行。在这种情况下,构成软件的程序可以预结合到专用硬件中,例如,计算机的ROM或者硬盘。可选地,也可以通过网络或者程序记录介质将其安装到通用个人计算机中,该计算机上具有安装于其中的各种程序,因此可以执行各种功能。
程序记录介质和前面提到的记录介质可以是封装介质,例如磁盘(包括软盘)、光盘(CD-ROM(=光盘只读存储器)和DVD(数字多功能盘))、磁-光盘(MD(=Mini-Disk(商标))、或者半导体存储器。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同更换、改进等,均应包含在本发明的保护范围之内。

Claims (22)

1.一种从通过多个帧的压缩编码形成的对象编码码流中检索与特定帧大致一致的帧的图像检索装置,所述图像检索装置包括:
解码装置,用于对所述对象编码码流进行熵解码以生成每一帧的量化系数;
匹配装置,用于对所述特定帧的量化系数和由所述解码装置生成并与所述特定帧的量化系数在采样位置上相对应的每一帧的量化系数进行匹配;以及
判断装置,用于基于匹配结果判断所述每一帧是否与所述特定帧大致一致,
其中,所述匹配装置对采样位置彼此对应的所述量化系数之间进行正或负符号上的顺序匹配。
2.根据权利要求1所述的图像检索装置,进一步包括去量化装置,用于对由所述解码装置生成的每一帧的所述量化系数进行去量化,以提供每一帧的变换系数,
所述匹配装置对所述特定帧的变换系数和由所述去量化装置生成并与所述特定帧的变换系数在采样位置上相对应的每一帧的变换系数之间进行正或负符号上的匹配。
3.根据权利要求1所述的图像检索装置,其中,每当出现量化系数与所述特定帧的量化系数在符号上不匹配的帧时,所述判断装置增加计数器的计数值,并且如果当所述每一帧的所有量化系数与所述特定帧的量化系数的匹配结束时所述计数值小于预定阈值,则判定所述计数值小于预定阈值的帧与所述特定帧大致一致。
4.根据权利要求1所述的图像检索装置,其中,当将要相互匹配的两个量化系数中的至少一个为零(0)时,所述匹配装置不进行匹配。
5.根据权利要求3所述的图像检索装置,其中,如果所述计数器的所述计数值大于预定阈值,则所述判断装置判定所述计数值大于预定阈值的帧与所述特定帧不一致,并且所述匹配装置不对所述计数值大于预定阈值的帧进行进一步的匹配。
6.根据权利要求3所述的图像检索装置,进一步包括显示装置,用于分别显示所述特定帧的图像以及由所述判断装置判定为与所述特定帧大致一致的帧的图像。
7.根据权利要求6所述的图像检索装置,其中,如果不存在由所述判断装置判定为与所述特定帧大致一致的任何帧,则所述显示装置分别显示所述特定帧的图像以及所述计数器的所述计数值为最小的帧的图像。
8.根据权利要求1所述的图像检索装置,其中,所述解码装置参照变长解码表对所述对象编码码流进行解码,以生成每一帧的量化系数,每一帧的离散余弦变换系数已经参照量化表被量化。
9.根据权利要求1所述的图像检索装置,其中,所述解码装置通过JPEG 2000中定义的EBCOT解码对所述对象编码码流进行解码,以生成每一帧的量化系数,每一帧的小波变换系数已经被标量量化。
10.根据权利要求9所述的图像检索装置,其中,所述匹配装置对通过频带划分形成的多个子带中的每个码块的量化系数之间进行匹配。
11.根据权利要求10所述的图像检索装置,其中,所述匹配装置按照从最低频带中的子带到最高频带中的子带的顺序对量化系数之间进行匹配。
12.根据权利要求10所述的图像检索装置,其中,所述匹配装置仅对到特定子带或者到特定码块为止的子带的量化系数之间进行匹配。
13.根据权利要求10所述的图像检索装置,其中,在完成对码块中的所有量化系数的匹配之后,所述解码装置生成下一码块的量化系数。
14.一种从通过多个帧的压缩编码形成的对象编码码流中检索与特定帧大致一致的帧的图像检索方法,所述图像检索方法包括以下步骤:
对所述对象编码码流进行熵解码,以生成每一帧的量化系数;
对所述特定帧的量化系数和在所述解码步骤中生成并与所述特定帧的量化系数在采样位置上相对应的每一帧的量化系数进行匹配;以及
基于匹配结果判断所述每一帧是否与所述特定帧大致一致,
其中,在所述匹配步骤中,对采样位置彼此对应的所述量化系数之间进行正或负符号上的顺序匹配。
15.一种从通过多个帧的压缩编码形成的对象编码码流中检索与特定帧大致一致的帧的图像检索装置,所述图像检索装置包括:
量化或变换系数获取装置,用于获取当生成所述对象编码码流时算出的每一帧的量化或变换系数以及所述特定帧的量化或变换系数;
匹配装置,用于对所述特定帧的量化或变换系数和由所述量化或变换系数获取装置生成并与所述特定帧的量化或变换系数在采样位置上相对应的每一帧的量化或变换系数进行匹配;以及
判断装置,用于基于匹配结果判断每一帧是否与所述特定帧大致一致;
其中,所述匹配装置对采样位置彼此对应的所述量化或变换系数之间进行正或负符号上的顺序匹配。
16.根据权利要求15所述的图像检索装置,其中,当生成所述对象编码码流时算出的每一帧的所述量化或变换系数以及所述特定帧的量化或变换系数均被记录在记录介质中。
17.根据权利要求15所述的图像检索装置,进一步包括:
解码装置,用于对由所述判断装置判定为与所述特定帧大致一致的帧进行解码;以及
输出装置,用于将由所述解码装置解码的所述与特定帧大致一致的帧的图像输出到显示装置。
18.根据权利要求15所述的图像检索装置,进一步包括:
解码装置,用于对所述对象编码码流进行解码;以及
输出装置,用于将由所述解码装置解码的所述对象编码码流输出到显示装置,其中,由所述判断装置判定为与所述特定帧大致一致的帧被取为再生起始帧或者再生终止帧。
19.根据权利要求15所述的图像检索装置,进一步包括记录控制装置,用于将所述对象编码码流记录到记录介质,其中,由所述判断装置判定为与所述特定帧大致一致的帧被作为再生起始帧或者再生终止帧。
20.一种从通过多个帧的压缩编码形成的对象编码码流中检索与特定帧大致一致的帧的图像检索方法,所述图像检索方法包括以下步骤:
获取当生成所述对象编码码流时算出的每一帧的量化或变换系数以及所述特定帧的量化或变换系数;
对所述特定帧的量化或变换系数和在所述量化或变换系数获取步骤中生成并与所述特定帧的量化或变换系数在采样位置上相对应的每一帧的量化或变换系数进行匹配;以及
基于匹配结果判断每一帧是否与所述特定帧大致一致,
其中,在所述匹配步骤中,对采样位置彼此对应的所述量化或变换系数之间进行正或负符号上的顺序匹配。
21.一种从通过多个帧的压缩编码形成的对象编码码流中检索与特定帧大致一致的帧的图像检索装置,所述图像检索装置包括:
第一记录装置,用于将当对所述特定帧进行编码时算出的所述特定帧的量化或变换系数连同所述特定帧一起记录到记录介质;
第二记录装置,用于将当检索所述对象编码码流时算出的每一帧的量化或变换系数连同所述对象编码码流一起记录到所述记录介质;
量化或变换系数获取装置,用于从所述记录介质获取每一帧的所述量化或变换系数以及所述特定帧的量化或变换系数;
匹配装置,用于对所述特定帧的量化或变换系数和由所述量化或变换系数获取装置生成并与所述特定帧的量化或变换系数在采样位置上相对应的每一帧的量化或变换系数进行匹配;
判断装置,用于基于匹配结果判断每一帧是否与所述特定帧大致一致;
解码装置,用于对由所述判断装置判定为与所述特定帧大致一致的帧进行解码;以及
输出装置,用于将由所述解码装置解码的所述与特定帧大致一致的帧输出到显示装置,
其中,所述匹配装置对采样位置彼此对应的所述量化或变换系数之间进行正或负符号上的顺序匹配。
22.一种从通过多个帧的压缩编码形成的对象编码码流中检索与特定帧大致一致的帧的图像检索方法,所述图像检索方法包括:
第一记录步骤,将当对所述特定帧进行编码时算出的所述特定帧的量化或变换系数连同所述特定帧一起记录到记录介质;
第二记录步骤,将当检索所述对象编码码流时算出的每一帧的量化或变换系数连同所述对象编码码流一起记录到所述记录介质;
量化或变换系数获取步骤,从所述记录介质获取每一帧的所述量化或变换系数以及所述特定帧的量化或变换系数;
匹配步骤,对所述特定帧的量化或变换系数和在所述量化或变换系数获取步骤中生成并与所述特定帧的量化或变换系数在采样位置上相对应的每一帧的量化或变换系数进行匹配;
判断步骤,基于匹配结果判断每一帧是否与所述特定帧大致一致;
解码步骤,对在所述判断步骤中判定为与所述特定帧大致一致的帧进行解码;以及
输出步骤,将在所述解码步骤中解码的所述与特定帧大致一致的帧输出到显示装置,
其中,在所述匹配步骤中,对采样位置彼此对应的所述量化或变换系数之间进行正或负符号上的顺序匹配。
CNB2006100020640A 2005-01-21 2006-01-20 图像检索装置及方法 Expired - Fee Related CN100433049C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005014750A JP4343120B2 (ja) 2005-01-21 2005-01-21 画像検索装置及び方法、並びにプログラム及びプログラム記録媒体
JP2005014750 2005-01-21
JP2005-014750 2005-01-21

Publications (2)

Publication Number Publication Date
CN1808469A CN1808469A (zh) 2006-07-26
CN100433049C true CN100433049C (zh) 2008-11-12

Family

ID=36756607

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100020640A Expired - Fee Related CN100433049C (zh) 2005-01-21 2006-01-20 图像检索装置及方法

Country Status (4)

Country Link
US (2) US7949042B2 (zh)
JP (1) JP4343120B2 (zh)
KR (1) KR20060085195A (zh)
CN (1) CN100433049C (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4697111B2 (ja) * 2006-09-28 2011-06-08 ソニー株式会社 画像比較装置および方法、並びに、画像検索装置および方法
US8509592B2 (en) 2007-05-21 2013-08-13 Mitsubishi Electric Corporation Image difference detection method and apparatus, scene change detection method and apparatus, and image difference value detection method and apparatus
JP4428424B2 (ja) * 2007-08-20 2010-03-10 ソニー株式会社 情報処理装置、情報処理方法、プログラムおよび記録媒体
JP4420085B2 (ja) 2007-08-20 2010-02-24 ソニー株式会社 データ処理装置、データ処理方法、プログラムおよび記録媒体
GB0721648D0 (en) * 2007-11-05 2007-12-19 Roke Manor Research Internet data processing systems
JP2010250659A (ja) * 2009-04-17 2010-11-04 Seiko Epson Corp 印刷装置、画像処理装置、画像処理方法およびコンピュータープログラム
WO2012042646A1 (ja) * 2010-09-30 2012-04-05 富士通株式会社 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム
TWI436649B (zh) * 2010-11-12 2014-05-01 Alpha Imaging Technology Corp 處理原始高解析影像資料之影像處理裝置及其影像處理晶片和方法
US9412020B2 (en) 2011-11-09 2016-08-09 Board Of Regents Of The University Of Texas System Geometric coding for billion-scale partial-duplicate image search
CN102595138B (zh) * 2012-02-29 2014-04-23 北京大学 图像压缩的方法及装置、终端
CN103955885A (zh) * 2014-05-06 2014-07-30 北京大学 一种基于图像模板的无水印图识别算法
WO2018017059A1 (en) * 2016-07-19 2018-01-25 Hewlett-Packard Development Company, L.P. Image recognition and retrieval
CN108875535B (zh) * 2018-02-06 2023-01-10 北京旷视科技有限公司 图像检测方法、装置和系统及存储介质
CN113033439B (zh) * 2021-03-31 2023-10-20 北京百度网讯科技有限公司 用于数据处理的方法、装置和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000134616A (ja) * 1998-10-26 2000-05-12 Sony Corp 近似画像探索装置及び方法
US6091777A (en) * 1997-09-18 2000-07-18 Cubic Video Technologies, Inc. Continuously adaptive digital video compression system and method for a web streamer
JP2001045485A (ja) * 1999-07-30 2001-02-16 Sony Corp 動画像符号化装置及び方法、復号装置及び方法、並びに画像記録再生装置
JP2004045565A (ja) * 2002-07-09 2004-02-12 Sony Corp 類似時系列検出方法及び装置、並びにプログラム及び記録媒体

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01114282A (ja) 1987-10-28 1989-05-02 Canon Inc ベクトル量子化におけるコードブック生成方法
JPH0883348A (ja) 1994-09-09 1996-03-26 Sony Corp 画像信号符号化方法
JP2630923B2 (ja) 1994-12-05 1997-07-16 日本アイ・ビー・エム株式会社 画像認識方法及び装置
JP4304368B2 (ja) 1999-01-06 2009-07-29 日本電気株式会社 画像検索装置、並びに画像検索方法
US6532541B1 (en) * 1999-01-22 2003-03-11 The Trustees Of Columbia University In The City Of New York Method and apparatus for image authentication
US6618507B1 (en) * 1999-01-25 2003-09-09 Mitsubishi Electric Research Laboratories, Inc Methods of feature extraction of video sequences
JP2002007432A (ja) * 2000-06-23 2002-01-11 Ntt Docomo Inc 情報検索システム
JP2004328577A (ja) 2003-04-28 2004-11-18 Seiko Epson Corp 画像出力装置およびサムネイル画像出力装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6091777A (en) * 1997-09-18 2000-07-18 Cubic Video Technologies, Inc. Continuously adaptive digital video compression system and method for a web streamer
JP2000134616A (ja) * 1998-10-26 2000-05-12 Sony Corp 近似画像探索装置及び方法
JP2001045485A (ja) * 1999-07-30 2001-02-16 Sony Corp 動画像符号化装置及び方法、復号装置及び方法、並びに画像記録再生装置
JP2004045565A (ja) * 2002-07-09 2004-02-12 Sony Corp 類似時系列検出方法及び装置、並びにプログラム及び記録媒体
US20040098225A1 (en) * 2002-07-09 2004-05-20 Mototsugu Abe Similar time series detection method and apparatus, program and recording medium

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Compressed-Domain Classfication of Texture image. B.Wilson, M.A.Bayoumi.Computer Architecture for Machine Perception,2000.Proceedings.IEEE. 2000
Compressed-Domain Classfication of Texture image. B.Wilson, M.A.Bayoumi.Computer Architecture for Machine Perception,2000.Proceedings.IEEE. 2000 *
基于压缩域的图像检索技术. 李晓华,沈兰荪.计算机学报,第26卷第9期. 2003
基于压缩域的图像检索技术. 李晓华,沈兰荪.计算机学报,第26卷第9期. 2003 *

Also Published As

Publication number Publication date
US7949042B2 (en) 2011-05-24
US8467442B2 (en) 2013-06-18
US20110182525A1 (en) 2011-07-28
KR20060085195A (ko) 2006-07-26
JP4343120B2 (ja) 2009-10-14
CN1808469A (zh) 2006-07-26
JP2006202145A (ja) 2006-08-03
US20060171599A1 (en) 2006-08-03

Similar Documents

Publication Publication Date Title
CN100433049C (zh) 图像检索装置及方法
Liu et al. Neural video coding using multiscale motion compensation and spatiotemporal context model
CN1125409C (zh) 使用可变块尺寸的分层运动估算装置和方法
CN1156167C (zh) 运动图象编码方法和运动图象编码设备
US20060222249A1 (en) Image-comparing apparatus, image-comparing method, image-retrieving apparatus and image-retrieving method
Liu et al. Three-dimensional point-cloud plus patches: Towards model-based image coding in the cloud
Fang et al. 3dac: Learning attribute compression for point clouds
Abd-Alzhra et al. Image compression using deep learning: methods and techniques
Chen et al. A new image codec paradigm for human and machine uses
Tan et al. Image compression algorithms based on super-resolution reconstruction technology
WO2023225808A1 (en) Learned image compress ion and decompression using long and short attention module
Borman et al. Image sequence processing
CN113902000A (zh) 模型训练、合成帧生成、视频识别方法和装置以及介质
Misra et al. Video feature compression for machine tasks
Zargari et al. A fast and efficient compressed domain JPEG2000 image retrieval method
JPH07152779A (ja) 動画インデックス検出処理方法及び動画インデックス検出処理機能を持つ動画処理装置
CN106791864A (zh) 一种基于hevc标准下提高视频转码速率的实现方法
Kossentini et al. Rate-distortion-constrained subband video coding
Karthikeyan et al. Deep learning-based video coding optimisation of H. 265
KR100535338B1 (ko) 고속 검색이 가능한 디지털 감시 장치 및 방법
Hashim et al. Correlated Block Quad-Tree Segmented and DCT based Scheme for Color Image Compression
Li et al. You Can Mask More For Extremely Low-Bitrate Image Compression
Jacob et al. Deep Learning Approach to Video Compression
Kaur et al. Algorithm for fuzzy based compression of gray JPEG images for big data storage
US20060176961A1 (en) Method for reducing bit rate requirements for encoding multimedia data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20081112

Termination date: 20160120

EXPY Termination of patent right or utility model