CN100512430C - 检测用演化算法的方法和设备 - Google Patents

检测用演化算法的方法和设备 Download PDF

Info

Publication number
CN100512430C
CN100512430C CNB028264592A CN02826459A CN100512430C CN 100512430 C CN100512430 C CN 100512430C CN B028264592 A CNB028264592 A CN B028264592A CN 02826459 A CN02826459 A CN 02826459A CN 100512430 C CN100512430 C CN 100512430C
Authority
CN
China
Prior art keywords
algorithm
parameter
chromosome
information
parameter group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB028264592A
Other languages
English (en)
Other versions
CN1611076A (zh
Inventor
L·阿尼霍特里
J·D·谢菲
N·迪米特罗瓦
T·F·M·麦吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pendragon wireless limited liability company
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1611076A publication Critical patent/CN1611076A/zh
Application granted granted Critical
Publication of CN100512430C publication Critical patent/CN100512430C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/432Content retrieval operation from a local storage medium, e.g. hard-disk
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/785Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using colour or luminescence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/4147PVR [Personal Video Recorder]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers

Abstract

使检测媒体信息流中预定内容的算法的执行实现最优化的方法,以及按此方法运行的程序和设备。该算法是一组参数的函数。方法包括的步骤是,至少执行一次该算法来检测媒体信息流中的预定内容,同时每次执行算法时都在算法中应用一组相关参数,并且自动地演化出算法中所用的至少一组相关参数使得该算法检测媒体信息流中预定内容的准确度最高。

Description

检测用演化算法的方法和设备
本发明一般来说涉及到使用搜索算法来检测视频信息流中的商用广告或其他预定内容,其特别涉及到使用搜索算法,例如遗传算法(genetic algorithum)演化出算法参数来准确地检测从一种类型内容到另一种类型的转变情况的方法,设备和程序。
个人电视接收机/录像机以及修改和/或记录广播电视内容的装置正在变得越来越普及。一个实例是个人用录像机,其按用户的选择在硬盘上自动地记录下节目。这种系统正在研究的特性之一是内容检测。例如,能够检测商用广告节目的系统可以允许替换广告插入视频流(“商用广告交换”)或在商用广告结尾暂停视频信号以防止商用广告期间注意力分散的用户错过任何主要节目的内容。内容检测还可以使对插在录制电视节目中商用广告或促销内容不感兴趣的用户用手动的方法或使用用来完成自动跳转的装置(例如,参见U.S.Pat.否.5,151,788)来跳过这些商用广告。
有许多已知的方法用于检测商用广告节目。一种方法是检测暂存相邻帧之间没有逐渐转换或运动转换的场景中的高切割率或突然变化。切割可能包括逐渐转换,故切割不一定是硬切割。更强的准则可能是高转换率。另一种指示是伴随静音的黑色帧(或单一色彩/单色帧)的存在,其可以指示商用广告间歇的开始。在独立商业广告节目段之前和之后通常立即发现有一个或多个黑色帧。商用广告节目的另一种已知指示是高“活动性”,它是两组不同帧之间亮度水平的变化率。在商用广告节目中,事物和场景通常比非商业性视频段中的事物和场景移动更快变化更频繁,因此商用广告节目通常充满“活动性”。在检测到的活动量低时,认为商用广告已经结束,接下来可能是记录的恢复。
另一种已知技术是测量黑帧序列间的暂存距离,根据所测得的暂存距离是超过还是小于预定阈来确定商用广告的存在。还有另一种技术,其根据图象匹配来标识商用广告,其中利用图象内容质量上的差别作为一种指示。
标识黑帧的另一种技术,如由Bonner等在U.S.Pat.否.4,314,285所分开的技术,其是检测在阈值以下输入信号电压水平的降落。还有另一种技术,如由Iggulden等在U.S.Pat.否.5,333,091所公开的技术,它是记录包括任何商用广告的整个节目。每当播出黑帧时都做出记号。记录后,处理器确定出黑帧之间的时段是商用广告还是节目。这件工作是通过简单的公式完成的。如果时段小于五分钟的阈,就认为是有商用广告。重放期间,装置使磁带快进通过被确定为是商用广告的区域。遗憾的是,彼此在五分钟内的两个黑帧的存在不一定就代表有商用广告,因为在照明暗淡或昏暗场景时可能出现这种情况。
虽然上面提到的所有技术都表现出看好的结果并且其可能非常适合于它们的预期用途,但至少在某些情况下在检测诸如商用广告等内容时这些技术可能缺少可靠性和准确度。可能成为这个问题原因之一的一个重要因素是在这些技术中使用了不适当的或非优化的算法参数,如阈值等。由于可能很难预先选择用在内容检测技术中最适合的参数数值,特别是参数选择是由人工完成时,不可能保证所选的数值会最适合于使该项技术能产生出高度准确的结果。另外,即使在使用优化参数值的情况下,商用广告节目制作人也能够改变各种商用广告的特点来提供那些过时的数据,并由此阻止商用广告检测算法对商用广告内容进行成功的检测。因此,需要提供一种技术,它依据把该算法应用于所选的视频流,通过自动地掌握在视频内容检测算法中要使用的优化参数值来克服这些问题,因而它也能够对包括在视频流中的预定内容进行准确而可靠的检测。
本发明的一个目的是提供自动掌握优化参数数值的方法,设备和程序,使作为这些参数之函数的媒体内容检测算法能够检测媒体信息流中的预定内容。
本发明的另一目的是提供一种方法,设备和程序,它们执行一种算法对视频或其他媒体信息流进行评估来确定预定内容,如商用广告内容的存在,并且它们自动地改变算法的参数,直至所确定的数值使算法能够以最高的准确度检测出预定内容。
本发明的其他目的和优点依据附图和其后的说明会变得显而易见。
本发明的上述目的通过使算法执行优化的方法以及按照该方法运行的程序和设备来实现,算法用于检测媒体信息流(例如,分成为多个帧的视频信息和/或音频信息,等)中的预定内容,诸如一个或多个商用广告节目。算法是一组参数的函数,其中每一组参数在这里也称之为染色体,而每一个参数最好是代表某一条件的阈值,这一条件,视其是否得到满足而定,有助于指出媒体信息流中是否存在预定内容(例如,商用广告或其他内容)。
按照本发明的一个实施方案,方法包括的步骤为:执行算法至少一次来检测媒体信息流中的预定内容,同时每次执行算法时都在算法中使用一组相关参数,并且自动地演化出算法中所用的至少一组相关参数使得算法检测的媒体信息流中预定内容的准确度最高。
按照本发明的一个特点,算法根据检测多帧间的黑帧/单色帧,平均切割帧距离,平均切割帧距离方位,品牌名称,切割黑帧,平均强度色彩柱状图,音频静音,音量变化,帧相似性,字符检测,静态图象或可以表示视频或其它类型媒体信息流中存在预定内容的任何其他感兴趣特性等的至少其中之一来检测预定内容,预定内容可以是想要的或不想要的内容。
按照本发明的另一特点,自动演化的步骤包括执行搜索算法,最好是遗传算法来演化出该至少一组相关参数。
按照本发明的一个实施方案,推断演化包括的步骤为:确定在每次执行算法时算法检测媒体信息流中预定内容的准确度,根据确定准确度这一步骤的结果选择至少一组相关参数,以及根据选择步骤中选定的该至少一组相关参数产生出至少一组后代参数。确定为产生最准确结果的后代组参数和/或原始组参数然后再在算法另外的各次执行中使用,而且再次地产生出一个或多个进一步的后代组参数,如果需要,直至确定出基本上使算法执行的准确度达到最高的一组参数。
在标识出这样一组高性能(也称之为“优化”)参数后,这组参数可以以相应的算法用在任何装置中,使得对媒体信息流中的预定内容能够进行成功而准确的检测。算法能够保存在服务器和/或本地信息装置中,而该组参数和/或算法本身也能够从服务器下载到本地信息装置,反过来亦是如此。
从与下图结合在一起的优选实施方案的详细说明更加容易了解本发明。
图1为适合于实践本发明的硬件系统1的方框图,其中系统1包括服务器2和至少一个用户信息装置,它们按照本发明构建和操作,而且它们通过接口6双向连接在一起。
图2是多个染色体Cr1-Crn的一个实例,它们可以存储在图1中服务器2的存储器15和/或用户信息装置4的存储器18,其中染色体Cr1-Crn每个都包括适合于在检测视频或其他媒体信息流中诸如商用广告等预定内容的算法内使用的参数值或阈值。
图3是按照本发明方法的逻辑流程图,其用来评估视频信息流中预定内容的存在,并且自动地改变算法的参数使算法能够以最高的准确度检测预定内容。
图4a和4b为逻辑流程图,其表示出图3步骤112中所执行的详细分步骤。
图5a和5b示出可在图3方法中使用的染色体实例,其中图5a表示跨接点的图示,图5b表示染色体的基因变异实例。
在不同图中出现的相同标记的元件是指同样的元件,但不一定在所有图的说明中都提到。
图1是适合于实践本发明的硬件系统1的方框图。在图示说明的实施方案中,系统1包括服务器2和至少一个用户信息装置4。服务器2和信息装置4通过接口6彼此双向连接。接口6可包括把服务器2与信息装置4连接起来的各种不同类型的互连设备和接口,例如像一个或多个导线,电源,开关,路由器,光纤,无线接口,和/或一个或多个网络(例如,因特网和/或其他专用网),调制解调器,以及/或其他适合类型的通信设备/接口,这要视可应用的系统结构和操作准则而定,不过为方便起见,图1中未示出这样的设备。
单独的信息装置4可以包括例如,PC,个人视频记录器(PVR),盒式录像机(VCR),数字视频记录器(DVR),个人电视接收机(PTR),DVD播放机,等等,不过其他适合类型的用户信息装置也可以使用。虽然图1中只示出一个单个的服务器2和一个用户信息装置4,但是如同与各用户信息装置通信的服务器2的数量可变化很大一样,可与服务器2通信的用户信息装置的数量和种类也可以变化很大,这要看例如用户的需要和地理位置,可应用的系统结构和操作准则等而定。应当指出,本发明的讲授内容不能理解成为限于与任何具体类型的服务器计算机或信息装置一起使用。一般来说,本发明的讲授内容可以与能够处理如视频信息,音频信息,和/或组合的视频/音频信息等媒体信息的任何适合类型的装置一起使用。
服务器2为一台计算机或计算机场(farm of computers),其便于不同点之间信息的传输,存储,以及接收。服务器2最好包括控制器10(如一个或多个微处理器和/或逻辑电路阵列)(CPU),用来完成执行程序所需的数学和/或逻辑运算。控制器10执行计算机可读代码,即所存储的应用程序,如以下说明的那些程序。服务器2还包括至少一个通信接口8,它把控制器10与外部接口如接口6以及可以与服务器2相连接的任何其他接口(未示出)双向连拉起来,使得服务器2能够向外部源和与这些接口相连接的目的地装置(例如信息装置4)收发信息,不过为方便起见,只示出了接口6和装置4。该信息可能包括按照所用的可应用外部接口标准的信令信息,视频数据,音频数据以及其他数据。
服务器2最好还包括各自都与控制器10相连接的一个或多个输入用户接口11,以及也与控制器10相连接的至少一个输出用户接口13。输入用户接口11可包括例如键盘,鼠标,轨迹球,触摸屏,和/或任何其他合适类型的用户可操作装置,而输出用户接口13可以包括例如视频显示器,液晶显示器或其他平板显示器,扬声器,打印机,和/或能使用户感知所输出信息的任何其他合适类型的输出装置。
服务器2最好还包括与控制器10双向连接的一个或多个相关存储器15(例如,磁盘驱动器,CD-ROM驱动器,只读存储器,和/或随机存取存储器)。存储器15存储暂存数据和指令,还存储控制器10用来控制服务器2整个操作的各种不同应用程序,例行程序以及操作程序。例如,诸如UNIX或Windows NT等操作系统17最好存储在存储器15,而许多应用程序,例如像视频编码器19,视频解码器21,帧接收器23,以及切割检测器24也可以存储在存储器15,不过,其他类型的操作系统和应用软件也可以使用,和/或一个或多个应用程序,如应用程序19,21和23可以体现为服务器2里独立的硬件部件,而不是应用软件。在控制器10认为必要时,由控制器10使用视频编码器19以常规方式对视频信息进行编码,在控制器10认为必要时,由控制器10使用视频解码器21以常规方式对压缩的视频数据进行解码。帧接收器23包括有软件,控制器10使用此软件从视频信息源中捕捉一些单帧,使得所捕捉的单帧能够随后被处理。切割检测器24以已知方式检测,例如是否场景中发生了变化。
按照本发明的一种实施方案,存储器15还存储各种计数器和变量,例如像Actual#CommFrame变量,CommercialProbability变量,TotalIdentified计数器,LastUnicolor变量,以及#CorrIdentified计数器,将以下面说明的方式使用它们。最好是,存储器15还存储例行程序,这些例行程序用来执行按照本发明的方法,其使用作为多个参数(例如,阈值)函数的预定内容检测算法来检测视频信息流中的预定内容,例如像商用广告或其他内容,同时例行程序还用来自动地掌握优化参数的数值使得内容检测算法至少能够以预定水平的准确度对预定内容进行检测。参照图3,4a及4b,将在下面对该方法予以说明。
按照本发明的一个特点,存储器15最好还存储执行本发明之例行程序中使用的多个染色体。每个染色体最好包括一个或多个参数,参数的类型适合于在上面提到的预定内容检测算法中使用。按照本发明的一个特点,至少部分内容检测算法使用,例如像平均切割帧距离检测技术,平均切割帧距离方法检测技术,品牌名称检测技术,黑帧检测技术,切割黑帧检测技术,帧相似性检测技术,字符检测技术,平均强度色彩柱状图技术,静态图象检测技术等等技术,或任何现有或后来开发的可用来检测媒体信息流中预定内容的技术。为了说明这些技术中的至少几项技术,可以参考(1)2000年8月8日发表的U.S.Patent否.6,100,941,,由Nevenka Dimitrova,Thomas McGee,Herman Elenbaas,Eugene Leyvi,Carolys Ramsey,及DavidBerkowitz所写的,题目为“视频数据流内分布的商用广告的定位设备和方法”,(以下简称“U.S.Patent 6,100,941”),(2)99年10月13日提交的U.S.Patent Application否.09/417,288,,Nevenka Dimitrova,Thomas Mcgee,及Lalitha Agnihotri所写,题目为“商用广告节目和其他视频内容的自动特征识别,掌握和授权”(以下称U.S.Patent Application否.09/417,288),以及(3)2001年5月14日提交的U.S.Patent Application否.09/854,511,题目为“影响数据压缩结构的视频内容检测方法和系统”,如同完全是在此处提出似的,每个文献都在此全部引入作为参考。
参看图2,其表示出存储在存储器15的多个染色体实例,其中在本实例中,染色体被标记为Cr1-Crn,其适合于在根据黑帧/单色帧检测技术对视频信息流中商用广告内容进行检测的算法中使用。各染色体Cr1-Crn包括多个参数,即阈值,而算法是这些参数的函数。这些阈代表一些条件,依这些条件是否得到满足而定,其指示出商用广告节目内容的存在或不存在。最好是,这些阈用有预定位长(例如,9位)的位串来代表,不过在其他实施方案中,也可以使用其他适合类型的数值来代替位串,这要视可应用的操作准则而定。下面是使用在检测视频信息流中商用广告内容的算法之中的实例阈,不过应当指出,代替和/或除了下面定义的那些阈以外,还可以使用那些阈以外的其他阈,这要看例如正在使用的内容检测算法的类型而定。
SeparationThreshold(图2中表示成“SeparationThld”)-该阈代表可以预期存在于两个商用广告之间的预定最小暂存距离,它能检测出视频信息流中商用广告段可能开始帧(即,包括商用广告内容的帧)之前的帧是由黑色/单色帧构成。如下面将予以说明的那样,如果开始帧与黑色/单色帧(黑色/单色帧先前曾作为紧接着最后所检测的一个商用广告段而检测)之间的暂存距离大于SeparationThreshold的数值(如这里使用的,术语“商用广告段”是指包括商用广告内容并形成单个商用广告的一批连续帧),黑色/单色帧就可以预先地标识为商用广告段的前帧。
UnicolorIn Succ Threshole(图2中表示成“UnicolorInSuccThld”)-该阈代表预期把商用广告段或商用广告与非商用节目段分开的黑色/单色帧的最小数量。如下面将予说明的那样,如果依次检测到的黑色/单色帧的数量(在商用广告段之后)大于UnicolorInSuccThreshold,就能够识别出可能的商用广告结束的出现。
MinCommercialThreshold(图2中表示成“MinCommercialThld”)-该阈代表一单独商用广告段预定的预期最短时间,并且其用来确定,是否不应确认可能商用广告开始以及可能商用广告结束的确定。如果确定,将它们分开的暂存距离小于MinCommercialThreshold的数值,对可能的商用广告开始和结束就不予确认。
MaxCommercialThreshold(图2中表示成“MaxCommercialThld”)-该阈代表一单独商用广告段预定的预期最长时间,其还用来确定,是否不应确认可能商用广告开始以及可能商用广告结束的确定。如果确定,将它们分开的暂存距离大于Max CommercialThreshold的数值,对可能的商用广告开始和结束就不予确认。
RestartThreshold(图2中表示成“RestartThld”)-该阈代表合理地预期为包括在商用广告段内(一旦商用广告段已开始时)的预定帧数。如果当前帧与最后检测的商业广告间的暂存距离在使用下面说明的方法时超过此阈,那么对可能商业广告段确实是商业广告就不予确认。
DistForSucc Threshold(图2中表示成“DistFor SuccThld”)-该阈对应于最长的预期商用广告持续时间,其代表把连续检测到的商用广告分开的两个连续黑色/单色帧之间预定的预期最长暂存距离。如下面将进一步详细说明的那样,使用此阈(1)确定所检测的黑色/单色帧是否紧接着先前检测到的帧(如果帧是被小于DistForSuccThreshold的数值所暂时分开,所检测到的黑色/单色帧就认为是与那些帧中先前检测到的帧相邻接),(2)检测紧接着商有广告结束帧的第一个黑色/单色帧(如果两个连续检测到的黑色帧之间的暂存距离大于2*DistForSuccThreshold的积,就出现这种情况),及(3)确定是否应对可能商用广告开始或结束的确定予在确认。
本发明典型实施方案中上述各种染色体阈值的使用方式将在下面予以详细说明。
再次参看图1,现将说明服务器2的其他组成部分。从诸如信息装置4或某个其他装置(例如,电视摄象机,等)(未示出)等源装置产生的视频信息可以提供给服务器2并通过至少一个通信接口8输入到服务器中。输入的视频信息可以是数字或模拟信息,且可以是在压缩或非压缩形式,这要视,例如,所用的源装置及相关外部接口的类型而定。A/D转换器9a和D/A转换器9b最好也包括在服务器2之内,或是作为控制器10的一部分或是作为独立的部件。用控制器10可以对A/D转换器9a编程使得从外部接口如接口6接收到的模拟信息能够转换成数字形式的信息。在将数字信息输出到外部接口6之前,通过控制器10可以使用D/A转换器9b把该信息转换成相应的模拟信息,不过,数字信息在传送给接口6之前也不一定需要做如此转换,这要视所用的接口类型而定。
如上面指出的那样,控制器10还可以依据可应用的实施准则使用视频解码器21对输入其中的压缩视频信息解码,以及可以依据可应用的实施准则在视频信息通过通信接口8传输之前,使用视频编码器19对其编码。
说明了服务器2之后,现将说明用户信息装置4。用户信息装置4最好包括至少一个通信接口14以及与该接口双向连接的控制器16(CPU)。接口14将装置4与诸如接口6以及可以与信息装置4相连接的任何其他外部接口(未示出)等之一个或多个外部通信接口双向连接起来。接口14使装置4能移向可以与其连接的外部源和目的地装置(例如,服务器2)收发信息,不过为方便起见,只示出了服务器2和一个外部接口6。信息可以包括按照所用的可应用外部接口标准的信令信息,视频数据,音频数据以及其他数据。
用户信息装置4的用户接口包括输出用户接口,如显示器36,以及输入用户装置,通常为键矩阵20,它们都与控制器16相连接,不过在其他实施方案中还可以使用其他适合类型的输出和输入用户接口。键矩阵20包括启动用户信息装置4某些操作所使用的各种用户接口链,例如像PLAY,FAST FORWARD,STOP,REWIND和PAUSE键,各种菜单滚动键,等。标记商用广告内容的MARK键也可以包括在键矩阵20内。
用户信息装置4还包括各种存储器,如RAM和ROM,总的表示成存储器18。存储器18可以存储暂存数据和指令,各种计数器和其他变量,最好还存储各种应用程序,例行程序,以及操作程序27。例如,按照信息装置4的一种实施方案,存储器18可以存储视频编码器33,视频解码器35,切割检测器29,以及帧接收器31,不过可以使用其他类型的操作系统和应用软件来代替和/或一个或多个应用软件,如应用软件33,35和31,可以体现为装置4内的独立的硬件部件,而不是应用软件。至于对存储在服务器2的视频编码器19和解码器21,存储在信息装置4的视频编码器33,控制器16可以使用它们对视频信息编码,而控制器16可以使用视频解码器35以常规方式对压缩视频数据解码。帧接收器31包括控制器16所使用的软件,从视频信号流中捕捉单帧使所捕捉的帧能够在随后被处理。切割检测器29以已知的方式检测例如场景中是否发生变化。按照本发明的一种实施方案,至少一些存储在存储器18的例行程序实施按照本发明的方法,在下面将参照图3,4a和4b予以说明。此外,在本发明的一个实施方案中,存储器18还存储上述有关服务器2的至少某些不同的计数器,变量,和/或染色体,不过为方便起见,将不对它们作进一步的说明。
从源装置如服务器2或某种其他源装置(例如,电视摄象机,等)(未示出)产生的输入视频信息可以通过该至少一个通信接口14在装置4内接收。像输入到服务器2的信息一样,输入到信息装置4的视频信息可以是数字或模拟形式,压缩或非压缩的,这要依例如所用源装置和相关外部接口的类型而定。另外,像服务器2一样,A/D转换器11a和D/A转换器11b也可以包括在信息装置4内,或作为控制器16的一部分或作为单独的部件。A/D转换器11a可以由控制器16编程使得装置4从外部接口如接口6接收到的模拟信息能够在提供给控制器16之前转换成数字形式。在数字信息输出至外部接口6之前可以使用D/A转换器11b将其转换成相应的模拟信息,不过,视所用接口6的类型而定,数字信息在被传送至接口6之前也不一定需要作如此转换。
说明了系统1的各种不同组成部分之后,现将参照图3中的流程图说明本发明的一个特征。按照本发明的这一特征,用户能够把采样视频剪辑所选的各单独帧或其他段标记为包括预定内容如商用广告内容,或标记为不包括这样的预定内容。其后,使用预定内容检测算法对采样视频剪辑自动地进行了评价以确定这种预定内容的存在,该检测算法是若干参数如上述染色体阈值的函数。然后推断出这些阈值中选定的阈值,如果需要,以算法的连续重复(通过使用超级算法,如遗传算法,会出现推断结果)来提高检测的准确度,直至认为阈值是优化阈值。优化数值使得算法在全部所用的数值之中能够以最高的准确度检测出预定内容。虽然本发明是对商用广告内容的视频剪辑采样进行评价来确定商用广告内容存在的实例情况下进行下述说明的,但是本发明并不想只用在检测商用广告内容的应用当中。例如,在其他实施方案中,可以使用本发明方法用于检测其他类型感兴趣的信息内容,例如像直白型,暴力型,或其他内容类型,依感兴趣的应用而定。
现在参看图3,方法在步骤100开始,并假定,服务器2配备有至少一个存储在存储器15的采样视频剪辑,而采样视频剪辑则包括至少一个商用广告段(如上面指出的且如此处所用的,术语“商用广告段”是指有商用广告内容并形成单个商用广告的一个或多个连续的视频帧)和商用广告段的边界(习惯上,会使用大量的含各种商用广告的采样视频剪辑来保证确定出强健的算法染色体)。仅以举例而言,如此处所述,这些边界可以包括黑色/单色帧,其中这些帧中的一个或多个在每个商用广告段之前立即出现(暂时地),而其他帧则在每个商用广告段后立即出现,不过可以使用其他合适类型的边界来代替,这要视所用内容检测算法的类型而定。另外还假定,采样视频剪辑存储在存储器15与内容标识符信息相结合,标识符信息规定(1)剪辑的哪些具体帧包括和/或不包括商用广告内容,(2)标识这些帧的帧数,以及(3)代表含商用广告内容的帧的总数的变量Actual#CommFrames。例如,采样视频剪辑和内容标识符信息可以通过接口8从任何外部源下载,在此情况下将视频剪辑和内容标识符信息传送至控制器10,然后由控制器10将其存储到存储器15。视频剪辑可以是,例如,从接口6下载的一部分电视信号或因特网文件广播,从用户信息装置4上装的视频剪辑,从特定网址下载的视频剪辑,或从可与服务器2连接的任何其他源(未示出)产生的视频信号。作为另一实例,在采样视频剪辑已经存储到存储器15以后,内容标识符信息可以存储到存储器15。例如,在显示器13上看到采样视频剪辑各帧的同时,用户通过输入用户接口11可以把规定是否各单独帧包括商用广告内容的内容标识符信息输入到服务器存储器15,然后存储该信息与帧信息相结合。在步骤100中还进一步假定,把各个染色体Cr1-Crn的阈初始化到按用户规定的或按存储器15中存储的例行程序所规定的一些预定数值(例如,用位串所代表的数值),从而提供了染色体的初始个体总数P(t),这里,对本发明而言,“t”是代表个体总数水平的变量。
其后,在步骤110中假定,例如用户运用输入用户接口11把命令信息输入到控制器10,规定对采样视频剪辑进行检验以确定预定内容,即本实例中的商用广告内容的存在。根据步骤110中输入到控制器10中的命令信息,控制器10执行图3中标记为步骤112的预定内容检测算法。对这一典型实施方案来说,用图4a和4b所示的方法步骤更详细的表示出此算法,并且执行此算法,根据在每个染色体个体总数P(t)之内的阈值来评价采样视频剪辑以确定商用广告内容的存在。在本发明的优选实施方案中,分别对每个染色体个体总数P(t)执行此算法,故出现算法多次使用的情况,彼此或是并行或是串行的,因此对每个染色体,算法至少执行一次。为方便起见,将在只对染色体中的一个染色体执行内容检测算法的情况下进行如下说明,不过,应当理解到对每个染色体是分别地执行此算法。
在图4a的步骤200中,输入内容检测算法,并且假定,使用已知的帧检测技术,帧接收器23检测出采样视频剪辑中的第一视频帧(步骤200中的“是”)。其后,控制转到步骤202,在此步骤中,根据所检测帧内容与所检测紧随前帧内容的比较结果,切割检测器24确定是否发生切割(即,场景变化或内容变化),如有切割,则使用已知的切割检测技术。如果在步骤202中来检测到切割(步骤202中的“否”),那么控制转到步骤206,在此步骤,方法以下述的方式继续。相反,如果在步骤202检测到切割,控制则转到步骤204,在此步骤,控制器10将CommercialProbability变量设定在等于数值“1”。然后控制转到步骤206。应当指出,帧检测步骤200和切割检测步骤202可以分别使用任何适合的已知帧检测和切割检测技术,例如像U.S.Patent6,100,941所说明的那些技术来执行,如上面指出的那样,U.S.Patent6,100,941在此引入作为参考。
在步骤206,控制器10使用已知的黑色帧/单色帧检测技术(例如像U.S.Patent否.6,100,941或U.S.Patent Applieation否.09/417,288中所述的黑色帧/单色帧检测技术,或任何其他合适的黑色帧/单色帧检测技术)来确定步骤200中检测到的帧是否是黑色帧或单色帧。如果执行步骤206的结果确定,步骤200中所检测的帧不是黑色帧或单色帧(步骤206中的“否”),控制则通过连接器A转到图4b的步骤220,在此步骤,方法再以下面将说明的方式继续。如果执行步骤206的结果确定,步骤200中所检测的帧是黑色帧或单色帧(步骤206中的“是”),那么控制就转到步骤208,在此步骤,控制器10把存储在存储器15的计数器UniColorInSuccession(在步骤112中最初输入算法时,其原来初始化为“0”)的数值增加了“1”,并且还更新了变量LastUniColor的数值使其代表当前帧的数量。其后,执行若干步骤来确定在视频剪辑中所检测的黑色/单色帧附近是否存在可能的商用广告开始或结束。
在步骤210,控制器10要确定,新近检测的黑色或单色帧与最后检测的黑色/单色帧(如果有的话)之间的暂存距离是否超过DistForSuccThreshold的数值。例如,通过首先从最后检测的黑色/单色帧(如果有的话)的数目减去新近检测的黑色/单色帧(标识为,例如LastUniColor)的数目,然后再把相减的结果乘以可应用预定帧速率的倒数(例如,或是25帧/秒,30帧/秒的倒数,或是24帧/秒的倒数)使相减结果转换成时间单位,就可以计算出暂存距离。相乘的乘积代表所讨论的暂存距离,并且将其与DistForSuccThreshold的数值进行比较来确定暂存距离是否超过该阈值。如果执行步骤210的结果确定为“否”,其表示当前帧很可能不是处在包括商用广告内容帧的紧前面,那么控制转到步骤214,以下面将说明的方式执行此步骤。如果执行步骤210的结果确定为“是”,那么控制转到步骤212,在此步骤,控制器10要确定,最后检测的商用广告(如果有的话)与新近检测的黑色/单色帧之间的暂存距离是否超过SeparationThreshold的数值,或否是否在采样视频剪辑中先前没有检测到商用广告段(例如,可能存在第一商用广告段)。例如,通过首先从最后检测的商用广告段(如果根据先前执行图4b中步骤228而确定有的话)最后帧(先前商用广告的最后黑色帧)的数目减去新近检测的黑色/单色帧的数目,然后把相减的结果乘以可应用预定帧速率的倒数,就可以计算出暂存距离。相乘的乘积代表新近检测的黑色/单色帧与最后检测的商用广告结束帧之间的暂存距离,并且将其与SeparationThreshold的数值进行比较来确定暂存距离是否超过该阈值。
如果执行步骤212的结果确定为“是”,那么控制转到步骤216,在此步骤,控制器10识别出步骤200中所检测到的帧可能邻接商用广告段的下一个开始帧。如果执行步骤212的结果确定为“否”,其表示当前帧很可能不是处在与商用广告下一个开始帧相邻接的位置,那么控制转到步骤214,现将对此步骤予以说明。
在步骤214,控制器10要确定,自算法在步骤112(图3)启用以来已经检测到的黑色/单色帧(例如,UniColor In Succession)的数目是否超过Unicolor In Succ Threshold。如果执行步骤214的结果确定为“是”,那么控制转到步骤218,在此步骤,控制器10识别出步骤200中所检测到的帧可能是跟随在商用广告段结束(即,识别出的商用广告段的可能结束)之后的一系列黑色/单色帧的其中之一。如果执行步骤214的结果确定为“否”,那么控制通过连接器A转到图4b的步骤220。
参看图4b,在步骤220,要确定先前曾确定可能存在的商用广告段是否存在,然后根据确定的结果,控制或转到步骤232(以下将说明)或步骤222。例如,如果在步骤206中的确定是“否”之后,曾直接进入步骤220,那么执行步骤220的结果是将控制转到步骤232。如果在步骤216曾识别出商用广告段可能开始之后或在步骤218曾识别出商用广告段可能结束之后曾直接进入步骤220,那么执行步骤220的结果是将控制转到步骤222,现将对其予以说明。
在步骤222,控制器10要确定可能商用广告段的估计持续时间是否在预定时间段之内。例如,由控制器10来确定,把被确定为可能是商用广告段结束后的黑色/单色帧的最后帧(在最后执行步骤218时)与被确定为可能处在邻接商业广告段下一个开始帧的较前帧(在较前执行步骤216时)分开的暂存距离是否是大于MinCommercialThreshold的数值而小于MaxCommercialThreshold的数值。如果执行步骤222的结果确定为“否”,那么控制则转到步骤232。相反,如果执行步骤222的结果确定为“是”,那么控制转到步骤224,在此步骤,控制器10检测CommercialProbability变量的数值来确定其是否等于“1”。如果在步骤224中确定CommercialProbability变量的数值等于“1‘,那么控制转到步骤230,在此步骤,控制器10在存储器15中存储一个记录,此记录确认在步骤200中检测的帧是处在暂时邻接商用广告段下一个开始帧的黑色帧或单色帧。如果在步骤224中确定CommercialProbability变量的数值不等于“1”,那么控制转到步骤226,在此步骤,控制器10要确定,当前黑色或单色帧(在步骤206中检测的)与最后检测的黑色/单色帧(如果有的话)之间的暂存距离是否超过乘积2*DistForSuccThreshold。如果执行步骤226的结果确定为“是”,其确认当前黑色/单色帧是商用广告段最后帧(它包括商用广告内容)之后紧接着出现的第一黑色/单色帧,那么控制转到步骤228,在此步骤,控制器10在存储器15中存储一个记录,该记录指出并确认已经检测到商用广告段结束的存在。如果执行步骤226的结果确定为“否”,那么控制转到步骤232,现将对其予以说明。
在步骤232,控制器10要确定是否(1)步骤228或230中确认的帧(如果有的话)与在较前执行步骤228或230中最后确认的较前帧(如果有的话)之间的暂存距离超过RestartThreshold的数值,或(2)当前黑色/单色帧与最后检测的黑色/单色帧(如果有的话)之间的暂存距离超过DistForSuccThreshold的数值,其中暂存距离可以以上述方式确定并与相应的阈值进行比较。如果执行步骤232的结果确定为“是”,那么控制转到步骤234,在此步骤,控制器10将CommercialProbability变量的数值设置在“0”,表示在先前说明的方法步骤中未曾检测到商用广告段。其后,控制则通过连接器B转回到图4a的步骤200。
另一方面,如果执行步骤232的结果确定为“否”,那么控制就转到步骤233,在此步骤,如果所执行的最后确认步骤曾是步骤228(步骤233中的“是”),控制则转到步骤233’,在步骤233’,控制器10将信息存储到存储器15,该信息规定,暂时出现在步骤228中确认的黑色/单色帧(如紧接着商用广告段最后帧之后的帧)与在较前步骤230中最后确认的黑色/单色帧(如就在商用广告段第一帧紧前的帧)之间的帧(用相应的帧号标识)包括商用广告内容,而且共同地代表商用广告段。其后,在步骤236,控制器10把存储在存储器15的TotalIdentified计数器的数值(在进入步骤112时,最初被初始化在“0”)增加在步骤233’中标识为包括商用广告内容的帧数,然后控制通过连接器B转回到图4a的步骤200。另一方面,如果步骤230曾是所执行的最后确认步骤(步骤233中的“否”),控制则直接通过连接器B转回到图4a的步骤200。
在控制从步骤233,234或是236通过连接器B转回到步骤200以后,以上述方式执行步骤200。如果执行步骤200的结果是检测到采样视频剪辑的下一个视频帧(步骤200中的“是”),那么控制则转到步骤202,在此步骤,方法以上述方式继续。如果没有检测到其他帧(步骤200中的“否”),那么控制则转到图3的步骤114,在此步骤,方法以下述方式继续。
对存储在存储器15中染色体组中个体总数为P(t)的每个染色体执行步骤112的算法之后,进入图3的步骤114。例如,对个体总数为P(t)的各初始染色体Cr1-Crn执行步骤112的结果是,在存储器15中存储有代表采样视频剪辑中帧(如果有的话)总数的每个染色体相关TotalIdentified计数器的数值,这些帧是通过使用步骤112中该染色体(请见,例如图4b的步骤236)的商用广告检测算法标识为包括商用广告内容的,存储器15中还存储有规定这些帧帧号的信息(见,例如步骤233’)。在步骤114,控制器10对个体总数为P(t)的每个单独染色体,要通过把所标识的帧与在图3步骤100原来存储在存储器15中的相应内容标识符信息(其规定帧是否包括商用广告内容)相互连系,来确定在对该染色体执行步骤112时在步骤233’中所标识的帧(如果有的话)是否曾被正确地标识为包括商用广告内容。例如,假定在对一特定染色体较前执行步骤112算法时一特定帧曾被标识为包括商用广告内容,同时假定,存储在存储器15的内容标识符信息规定同样的帧确实包括商用广告内容,那么在步骤114就确定该帧已经被正确标识为包括商用广告内容。在步骤114,对在较前步骤233’中每个染色体所标识的各帧作出类似的确定。然后控制转到步骤115,在此步骤,控制器10对与存储在存储器15中个体总数为P(t)的各原有染色体Cr1-Crn有关的#CorrIdentified的数值进行更新,使得对每个染色体来说,所更新的数值都规定出帧数,这些帧在步骤114中被确定为对该染色体已经正确标识的帧(在执行步骤112时被标识为包括商用广告内容)。因而,为每个染色体提供了一个单独数值的#CorrIdentified(表示使用该染色体执行算法时正确标识的帧数)。执行步骤115之后,控制转到步骤116,在此步骤,控制器10利用与各染色体相关的计数器数值#CorrIdentified(步骤115中更新的)和TotalIdentified(在步骤112中更新的),分别使用公式F1和F2来确定该染色体的Recall和Precision:
Recall=#CorrIdentified/Actual#CommFrames      (F1)
Precision=#CorrIdentified/TotalIdentified     (F2)。
例如,假定对初始个体总数为P(t)的各染色体C1-Cn较前执行步骤112和115的结果确定为下面表I中所示出的这些染色体的计数器数值#CorrIdentified和TotalIdentified,并且对各染色体的Actua1 # Comm Frames数值为90,那么在步骤116中执行公式F1和F2的结果就是对相应染色体Cr1-Crn算出的示于表I中的Recall和Precision数值。这些数值由控制器10存储到存储器15。
表I
                         Actual#Comm-
Cr#     #CorrIdentified               TotalIdentified    Recall    Precision
                         Frames
Cr1     80               90           100                0.888     0.8
Cr2     90               90           90                 1.0       1.0
Crn     75               90           95                 0.833     0.789
在执行步骤116之后,控制转到步骤117,在此步骤,按照本发明的一种实施方案,控制器10通过使用基于步骤116中确定的Recall和Precision数值的预定选择策略来选出一些染色体。在步骤117可以使用任何合适类型的选择策略,例如像随机选择方法,选择概率与合理性成正比的随机方法,使选出的染色体产生的Recall和Precision数值最高为步骤116所确定之Recall和Precision数值的50%的策略,使选出的染色体产生的Recall和Precision数值等于或超过预定数值的策略,或任何其他适合的合理性选择策略,等等,这要看预定的操作准则而定。在这方面,可以参考题目为“遗传算法和演化编程”的刊物,人工智能:Stuart Russell等的现代方法,1995,20.8章,619-621页(以下称“遗传算法刊物”),“CHC适配搜索算法:进行非传统遗传重组时如何获得安全搜索”,Larry Eshelman的遗传算法基础,1991,265-283页(以下称“Eshelman刊物”),这些都是说明可以用在步骤117的合理性选择策略的一些实例,不过也可以使用其他合适的策略来代替,而为执行这些策略对控制器10进行编程的方式由于本说明也很易于被相关领域的熟练技术人员所理解。还可以参考说明使用CHC算法确定“抓放”机部件近似优化配置的、Larry Eshelman和James D.Schaffer在1995.2.14发表的“抓放机的优化方法”,U.S.Patent 5,390,283。这项美国专利在此全部引入作为参考。
在本典型实施方案中,对本说明来说,通过使用下述公式(F3)确定各染色体的合理性(F),及通过选择产生最高为50%全部计算出的合理性数值(F)的染色体来执行步骤117:
(F)=(2*(Precision)(Recall))/(Precision+Recall)     (F3)
在执行步骤117之后,控制转到步骤118,在此步骤,按照本发明的一种实施方案,步骤117中所选的各单个染色体与所选染色体中的另一染色体进行随机配对,如果配对的染色体确定为是非近亲交配的,则其与另一所选染色体交配。例如,在一种实施方案中,染色体在步骤118中配对到一起之后(图5a表示出两个随机配对染色体Cr1和Crn的实例),对每一对来说,通过检验该对染色体的数值(例如,按说明距离测得的数值)是否彼此相差至少一个近亲交配阈值,如预定位串长度或某一其他合适数值来确定配对的染色体是否是近亲交配。作为实例,图5a中染色体对的六个相应位彼此不同,因此在近亲交配阈值为位串长度1/4的情况下,执行这部分步骤118的结果确定为这些染色体不是近亲交配的。其后,按照本发明的一种实施方案,被确定为是非近亲交配的染色体通过随机选择的跨接点300进行交配,然后在跨接点后将该对的位进行交换以便产生出后代染色体(或者其可以使用HUX完成;见Eshelman刊物)。图5b示出由图5a父母代染色体所产生的这些后代染色体Crk1和Crk2的实例。跨接操作可以以本领域中任何适合的方式,如上面提到的Eshelamn刊物相关部分所说明的方式来执行。
按照本发明的另一实施方案,对以本领域已知方式随机地(用独立概率)翻转各染色体预定的部分位(例如,35%)而得到的各染色体数值进行随机的变异,可以完成步骤118中的后代生产。图5c表示出图5a的一个父母代染色体Cr1和由该父母代染色体的变异而产生的后代染色体Crk1的实例。在本发明的又一实施方案中,步骤118期间完成的变异可以通过随机地选定跨接点并以上述方式进行位交换,以及以上述方式对得到的位串(独立位)随机地进行变异来完成,反之亦然。
执行步骤118的结果是提供了多个后代染色体Crk1-Crki(以下也统称为后代个体总数K(t))(假定,在性繁殖情况下,在此步骤至少一个父母代染色体对曾被确定为是非近亲交配的,其中对此实施方案来说,各对后代染色体都是从相应的父母代染色体对产生的)。执行步骤118之后,控制转到步骤120,在此步骤,在关于步骤112的上述内容检测算法中,使用各染色体Crk1-Crki来代替初始个体总数为P(t)的父母代染色体Cr1-Crn,然后在对各染色体Crk1-Crki执行该算法后,对各染色体Crk1-Crki执行与步骤113-116同样的步骤。亦即,以与上述步骤112-116相同的方式执行步骤120,只是在这些步骤中使用后代染色体Crk1-Crki代替了初始个体总数为P(t)的父母代染色体Cr1-Crn。由于步骤112-116在上面已经作了说明,为方便起见,这里将不对这些步骤进行更详细的说明。但是由于本说明,相关领域的熟练技术人员应当很清楚如何使用后代染色体Crk1-Crki来执行这些步骤。执行步骤120的结果是确定了以上述同样方式所产生的各后代染色体Crk1-Crki的合理数值(F)(如步骤116中的情况)。
其后,控制转到步骤122,在此步骤,按照本发明的一种实施方案,做出染色体的另一种选择,不过这次的选择是使用上述关于步骤117同样的染色体合理性选择策略,或任何其他适合的现有或后来发展的选择策略,在具有先前染色体个体总数P(t)的所有染色体(例如,Cr1-Crn)和具有后代个体总数K(t)的所有染色体(例如,Crk1-Crki)中间进行的,从而产生出新的个体总数P(t=t+1)。其后,在步骤124,通过确定是否是(a)近亲交配阈值等于“0”,及(b)步骤122中所选定的各染色体的合理性(F)相同,来进行收钦确定。如果或(a)或是(b)不成立,那么要就是否在步骤122中没有从个体总数K(t)中选出染色体(即,没有染色体存活)作出确定。如果在该步骤中未选出,那么近亲交配阈值减少“1”(步骤124中的“N”),而控制则转回到步骤118,在此步骤,方法以上述方式从此继续进行,但使具有新产生个体总数的染色体交配。另一方面,如果(a)和(b)都在步骤124中被确定是成立的(步骤124中的“Y”),那么控制转到步骤126。
在步骤126,要对是否应当终止本方法作出确定。根据本发明的一种实施方案,通过确定是否是(i)自方法在步骤100首次开始启用以来已经在步骤120评估了后代个体总数为K(t)的染色体预定数目,或(ii)自方法在步骤100开始以来,重启步骤130(如下所述)已经执行了预定的次数,来执行此步骤。在本发明的其他实施方案中,可以执行步骤12b来确定是否两个条件(i)和(ii)已经得到满足,或者,在另外的实施方案中可以只就条件(i)和(ii)中的一个进行确定,不过,应当指出,除了这里说明的这些确定以外还可以使用其他适合类型的确定来代替,这要依可应用的操作准则而定。
如果执行步骤126的结果确定为“是”(步骤126中的“Y”),控制则转到步骤128,此步骤以下将予以说明。相反,如果步骤126的结果确定为“否”(步骤126中的“N”),控制则转到步骤130,在此步骤,执行软重启程序。在本发明的优选实施方案中,步骤130的软重启程序通过复制染色体(其个体总数为P(t=t+1))来执行,该染色体在先前执行步骤116所评估的个体总数为P(t)的所有染色体和在先前执行步骤120所评估的后代个体总数K(t)中间产生出最高的合理性(F)数值(在具有新近产生的个体总数P(t=t+1)的所有染色体中间)从而提供出该染色体(此处也称为所有这些染色体中的当前最优染色体)的多个(例如,五十个)复制染色体。最好是,通过随机地翻转复制染色体位的预定比例(例如,35%)而不进行替换,使得到的各复制染色体除一个外都产生变异。通过步骤130,提供了产生最高合理性(F)数值染色体的一个无变异复制染色体,以及该复制染色体的多个变异型式的复制染色体。这些染色体(包括无变异的和变异的复制染色体)共同形成了一个新的染色体个体总数P(t)。其后,控制从步骤130转回到步骤112,其中方法以上述的方式继续,但对算法的各种不同阈要使用这个新的染色体个体总数P(t)。
现将说明图3的步骤128。在步骤128,控制器10把信息存储到存储器15,信息规定,在步骤124和126连续的结果确定为“是”之后留驻在个体总数P(t=t+1)中的当前最优染色体的阈值要用到检测视频流中存在商用广告内容的未来运算之中。这些阈值,在本实例中它们是ST2,UIST2,MinCT2,MaxCT2,RT2,及DFST2(图2),分别被认为是所有染色体阈值UIST1-UISTn,MinCT1-MinCTn,MaxCT1-MaxCTn,RT1-RTn,DFST1-DFSTn(图2)中最好的(例如“优化”或高性能),因为它们能够使图4a和4b中所表示的内容检测算法以最高的准确度检测视频信息流中的商用广告内容。
其后,假定,服务器2的用户运用输入用户接口11将信息输入到服务器2,信息规定对所选的视频流,如步骤100中在存储器15最初提供的视频剪辑或提供给服务器2的另一视频信息信号(例如,下载或上装的视频剪辑,接收到的广播视频信息流,或一个或多个用其他办法提供的视频剪辑或其他视频段,等等),要进行评估来确定例如商用广告内容的存在。因此,控制器10通过检索在步骤128所标识出的优化染色体阈值ST2,UIST2,MinCT2,MaxCT2,RT2,及DFST2作出应答,然后再分别使用对图4a和4b所示内容检测算法中利用的相应阈SeparationThreshold,UniColorInSuceThreshold,MinCommercialThreshold,MaxCommercialThreshold,RestartThreshold,及DistForSuccThreshold所检索的数值来执行内容检测算法。照此,依据这些阈,对视频信息进行评估来确定商用广告内容的存在。这些优化阈值的使用使得内容检测算法能够以最高的准确度来检测视频信息中的商用广告内容。其后,可以根据需要来使用视频信息流的评估结果(例如,从信号中删除或取代商用广告内容,等等)。
步骤128中标识出的优化阈值还可以提供给其他装置,如用户信息装置4,使得这些阈值能够在这些装置的内容检测算法中使用。例如,代替或除了在服务器2的内容检测算法中使用优化染色体阈值以外,还可以把这些阈值下载到或用别的办法提供给用户信息装置4,以便存储到装置4的存储器18。其后,用控制器10可以对这些阈值进行检索,用来执行(图4a和4b的)内容检测方法,以便以上述关于服务器2的类似方式对装置4中所提供的选定视频流进行评估来确定商业广告内容的存在。在其他实施方案中,代表内容检测算法例如像图4a和4b所示商用广告检测算法的软件可以与优化染色体阈值一起或分别地从服务器2下载到或用别的办法提供给用户信息装置4,然后这些数值就可以用在信息装置的算法中来检测信息流中的预定内容。代表图3整个方法的软件还可以从服务器2下载到或用别的办法提供给信息装置4或预存到这些装置4中,使得能够在这些装置中执行该方法来确定优化染色体阈值,然后这些阈值可以上装到或用别的办法回供给服务器2,如要需要,或用到装置4的适合的内容检测算法中。
应当指出,虽然是在执行步骤117(以及部分步骤120)、依据作为Recall和Precision值函数而产生的染色体合理性来选择染色体的情况下对本发明进行的说明,但是在其他实施方案中,根据对染色体的产生的只Recall值或只Precision值的评估,或根据任何其他适合的准确度量度可以进行这些选择,这些度量可以是标量或向量型的。
还应当指出,虽然是在执行内容检测算法、依据黑色帧或单色帧检测技术来标识商用广告存在的情况下对本发明进行的说明,但是本发明并不限于只与该技术一起使用或只检测商用广告内容。使用任何其他适合类型的现有技术或后来发展的技术也在本发明范围以内,这些技术可以用来检测在模拟或数字视频信号或视频信息(上面至少讨论了涉及视频信息的一些其他技术实例)之外任何其他类型媒体信息(例如,音频信息)中的任何类型的预定内容,而且在压缩或非压缩域中可以摘取的任何类型低水平,中等水平,高水平(例如,连续多个黑帧的存在)特征都可以在这些技术中使用。如根据本说明本领域熟练技术人员所能够理解的那样,在使用除上述说明中提到的黑色/单色帧检测技术外的其他类技术的情况下,各技术都会使用适合于用作为各相关技术中之参数的适当类型的染色体。因此应当理解到,本发明的方法可以用来优化包括在任何类型媒体信息中的任何类型所要求或非所要求内容的检测,而且并不限于只与检测视频信息中商用广告内容一起使用。此外,如此处所用,短语“信息流”不是要把本发明限制在在线应用。的确,在任何适合类型的环境内,无论是在线的还是脱机的,评估任何可应用类型的媒体信息,例如像视频信息,音频信息,组合视频/音频信息,等等,都在本发明的范围之内,并且信息流可以包括一种或多种类型的信息,这要看感兴趣的应用程序和预定的操作准则而定。
此外,在本发明的一种实施方案中,每个染色体可以包括多组参数,具中每组都可以在相应的技术中使用。例如,除了图2中所示的各种阈值以外(这些阈值可以在上述步骤112的算法中使用),各染色体Cr1-Crn(和后代染色体)还可以包括用在其他类型技术中的适当的参数数值,诸如平均切割帧距离检测技术,平均切割帧距离方位检测技术,品牌名称检测技术,其他类型的黑色帧检测技术,等等,而每项技术使用对该技术适当的参数数值都可以单独地运用于各染色体。在一种实施方案中,用户可以选择(在初始步骤100)希望使用哪项技术,然后将除适合于在所选技术中使用的数值以外的所有各染色体参数数值(例如,在选定如图4a和4b所示算法的情况下,除图2所示数值以外的所有数值)都初始化为“0”,因此从非选定的技术没有得到结果。在其他实施方案中,这些参数数值不一定设置为□0’,每一技术都可以作为独立的内容检测算法执行来产生独立的结果。按照本发明还可以使用包括规定除阈以外其他类型信息的基因的染色体。例如,基因可以规定色彩柱状图应当由算法A,B,C,或D(未示出)计算。其他基因可以规定把选定特征组合成关于内容分类之最终确定的备用方式。另外,染色体数值不一定以位串形式表示,而可以以任何其他适合的方式表示。因此应当很清楚,如此处所说明的那样,本发明并不限于只与包括由位串所表示之阈值的染色体一起使用。
还应当指出,虽然本发明是在由服务器2所确定的高性能染色体阈值的情况下进行说明的,但是从广义的解释,本发明并不是受如此限制的。例如,如上所述,在其他适合的装置内,如用户信息装置4,执行图3,4a和4b所描绘的方法也在本发明范围之内。在这些实施方案中,通过以上述方式评估装置(例如,装置4)内的采样视频剪辑可以执行本方法,而装置中的采样视频剪辑可以从任何源,如服务器2来提供。另外,在其他实施方案中,在服务器2内的算法中使用的阈值可以从外部源,如信息装置4提供给服务器2。
虽然上述说明是在使用软件指令来执行本发明方法的情况下进行的,但是在其他实施方案中,可以使用硬件电路来代替这些指令执行本发明的方法。鉴于本说明,所用电路的具体类型会很容易为本领域的普通技术人员所理解。另外,尽管本发明是在使用上述遗传算法来推断内容检测算法中所用染色体数值的情况下进行说明的,但在其他实施方案中,可以使用其他适合类型的遗传算法或其他类型的搜索算法来代替,这要依感兴趣的应用程序而定。可以得到按照本发明可以使用的多种演化算法,而用在本发明的演化算法的具体选择是可任选的。因此,应当理解到,本发明并不限于只与这里说明的遗传算法一起使用,在本公开内容的情况下,使用其他类型的演化算法对本领域的普通技术人员来说也是显而易见的。
应当进一步指出,虽然本发明是在本方法根据图3步骤117中染色体的合理性来选择染色体的情况下进行说明的,但在本发明的另一实施方案中,无需执行这种选择,染色体的选择只发生在步骤122,执行此步骤在当前组的父母代和后代染色体中间进行选择。如根据本说明可以理解到的那样,在此实施方案中,执行步骤118使来自正在评估的现有个体总数的染色体进行交配。
如上述说明中所述,本发明提供了一种新方法,其自动地演化出参数数值直到这些数值基本上使作为这些参数之函数的媒体内容检测算法的准确度达到最高为止。因此,阈使得算法能够以最高的准确度检测媒体信息流中的预定内容。这种方法的优点在于,它自动地提高了这些内容检测算法的准确度,并从而减轻了用户不得不用人工选择合适阈值的负担。此外,通过自动地确定优化阈值,本发明的方法能够阻止商用广告制片人通过修改其广播商用广告节目来防止商用广告成功检测而作的努力。
尽管本发明是就其优选实施方案而展示和说明的,本领域的熟练技术人员会理解到,发明中可以做出形式和细节上的改变而又不偏离本发明的范围与构思。

Claims (18)

1.优化算法(112)的参数以检测媒体信息流中预定内容的方法,所述算法(112)是所述参数的函数,一组参数被称为染色体,其中所述方法包括的步骤为:
-提供了染色体的初始个体总数,并配备有至少一个与内容标识符信息相结合的采样视频剪辑;
-对初始个体总数中的每个染色体,至少一次地执行算法(112)来检测所述至少一个采样视频剪辑中的预定内容;
-为每个染色体确定(114-116)所述算法(112)检测预定内容时的准确度;
-根据确定准确度步骤的结果,选择(117)所述染色体中至少的一个;以及
-根据选择步骤中选定的所述至少一个染色体,产生(118)至少一个后代染色体。
2.按权利要求1中提出的方法,其中媒体信息流包括视频和音频信息的至少其中之一,而预定内容则包括想要的或不想要的内容。
3.按权利要求1中提出的方法,其中算法(112)根据检测从媒体信息流导出的至少一个预定特征来检测预定内容。
4.按权利要求1中提出的方法,其中媒体信息流包括分成为多个帧的视频信息流,预定内容包括至少一个商业广告,而算法(112)包括的步骤为:
-检测视频信息流中的多个黑色或单色帧;
-根据检测的多个黑色或单色帧的至少其中之一来标识商业广告开始部分的存在;及
-根据检测的多个黑色或单色帧的至少其中之另一个来标识商业广告结束部分的存在。
5.按权利要求1中提出的方法,还包括的步骤为:
-进一步执行算法(112)至少一次来检测媒体信息流中预定内容的存在,同时在每进一步执行算法(112)时使用在产生步骤中产生的一个相关后代染色体;
-确定算法(112)在每进一步执行算法(112)时检测媒体信息流中预定内容的准确度;及
-根据该确定步骤的结果,进一步选择在选择步骤中选定的至少一组相关参数的一组或多组,以及在产生步骤中产生的至少另一后代染色体。
6.按权利要求5中提出的方法,其中自动演化步骤进一步包括的步骤为:
-确定在进一步选择步骤之后留下的所有参数组是否存在收敛;及
-如果存在收敛,将进一步选择步骤中选定的这些参数组至少其中之一的记录存储起来。
7.按权利要求1中提出的方法,其中产生步骤包括:
-将选择步骤中选定的参数组中随机选出的一些参数组配对;
-确定在配对步骤中配对的参数组是否是近亲交配;以及
-对确定为非近亲交配的各配对参数组,将这些组参数的一个或多个参数数值彼此相互交换。
8.按权利要求7中提出的方法,其中确定在配对步骤中配对的参数组是否近亲交配的步骤包括:
-确定各配对参数组的多个相应参数值,如果有的话,这些参数值彼此不同;及
-确定是否是被确定为彼此不同的相应参数值的数目小于预定的近亲交配阈值。
9.按权利要求5中提出的方法,进一步包括的步骤为:
-确定在进一步选择步骤之后留下的所有参数组是否存在收敛;及
-如果不存在收敛,
-将进一步选择步骤之后留下的所有参数组中最优化参数组的至少一个数值进行变异来产生多个变异形式的最优化参数组;及
-再次执行本方法的至少一些步骤,从执行算法(112)开始,但要多次,来检测媒体信息流中预定内容的存在,同时在各次执行算法(112)时使用最优化参数组及所述变异形式的最优化参数组。
10.按权利要求9中提出的方法,其中变异步骤包括:
-产生多个复制的最优化参数组;及
-改变多个复制最优化参数组中每个参数组的至少一个参数数值。
11.按权利要求6中提出的方法,其中产生步骤包括:
-将选择步骤中选定的参数组中随机选出的多个参数组配对;
-确定配对步骤中配对的参数组是否是近亲交配要通过:
-确定各配对参数组的多个相应的参数数值,如果有的话,这些参数数值彼此不同,及
-确定是否被确定为彼此不同的相应参数数值的数目小于预定的近亲交配阈值;及
-对被确定为非近亲交配的各配对参数组,至少把这些参数组的相应参数数值互相交换,
-其中确定是否存在收敛的步骤包括至少下述其中之一:
-确定是否预定近亲交配阈值等于预定值;及
-确定在执行使用进一步选择步骤之后留下的参数组的算法(112)时,是否是每次执行都以基本上相同的准确度检测了预定内容。
12.按权利要求11中提出的方法,其进一步包括:
-确定在执行进一步选择步骤之后是否仍存留有任何后代参数组;及
-如果没有存留后代参数组,则将预定近亲交配阈值降低一个预定缩小值。
13.按权利要求6中提出的方法,其中如果进一步选择步骤之后留下的所有参数组都存在收敛,则执行下述至少其中之一:
-确定本方法是否已被执行了预定次数;及
-确定是否已经产生了预定数目的后代参数组,及
-其中如果这两个确定步骤中任何一个步骤的结果是肯定的确定,那么执行存储步骤。
14.评估媒体信息流的方法,其包括的步骤为:执行一个或多个算法(112)、各算法检测媒体信息流中预定内容的存在,其中,被优化的参数被用于所述算法(112)中至少的一个算法,所述参数根据权利要求1所述的方法来优化。
15.优化算法(112)的参数以检测媒体信息流中预定内容的设备(2;4),算法(112)是所述参数的函数,一组参数被称为染色体,所述设备(2;4)包括:
-用于存储染色体的初始个体总数,以及至少一个与内容标识符信息相结合的采样视频剪辑的装置(15;18);
-用于对初始个体总数中的每个染色体,至少一次地执行算法(112)来检测所述至少一个采样视频剪辑中预定内容的装置(10;16);
-用于为每个染色体确定(114-116)所述算法(112)检测预定内容时的准确度的装置(10;6);
-用于根据所述准确度选择(117)所述染色体中至少一个的装置(10;6);以及
-用于根据所述至少一个选定的染色体而产生(118)至少一个后代染色体的装置(10;6)。
16.信息交换系统(1),其包括:
-至少一个第一信息设备(2;4);及
-至少一个第二信息设备(4;2),其包括:
-接口(14;8),其通过外部通信接口(6)与所述第一信息设备(2;4)相连接,
-存储器(18;15),其存储至少一个程序,及
-控制器(16;10),其与所述存储器(18;15)和所述接口(14;8)相连接,所述控制器(16;10)在存储在所述存储器(18;15)中的程序的控制之下进行操作,用于执行权利要求1所述的方法,及(c)将代表算法(112)和该优化参数至少其中之一的信息通过接口(14;8)和外部通信接口(6)传送至该至少一个第一信息设备(2;4)。
17.按权利要求16中提出的系统(1),其中第一信息设备(2;4)包括:
-另外的接口(8;14),其通过外部通信接口(6)与所述第二信息设备(4;2)的所述接口(14;8)相连接;及
-另外的控制器(10;16),其与所述另外的接口(8;14)相连接,所述另外的控制器(10;16)对所述另外接口(8;14)从所述第二信息设备(4;2)接收该信息作出应答,就用于将信息存储到相关的另外存储器(15;18),以及用于同时执行算法(112)并在算法(112)中使用该优化组参数来检测所提供信息流中的预定内容这两种做法至少之一。
18.按权利要求16中提出的系统(1),其中可操作第一信息设备(2;4),通过所述接口(14;8)和所述外部通信接口(6)将信息流提供给所述控制器(16;10),而其中所述控制器(16;10)在接收到那样提供的信息流后就执行该方法。
CNB028264592A 2001-12-31 2002-12-23 检测用演化算法的方法和设备 Expired - Fee Related CN100512430C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/029,916 US7337455B2 (en) 2001-12-31 2001-12-31 Method, apparatus, and program for evolving algorithms for detecting content in information streams
US10/029,916 2001-12-31

Publications (2)

Publication Number Publication Date
CN1611076A CN1611076A (zh) 2005-04-27
CN100512430C true CN100512430C (zh) 2009-07-08

Family

ID=21851556

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028264592A Expired - Fee Related CN100512430C (zh) 2001-12-31 2002-12-23 检测用演化算法的方法和设备

Country Status (9)

Country Link
US (1) US7337455B2 (zh)
EP (1) EP1464178B1 (zh)
JP (1) JP4347056B2 (zh)
KR (1) KR20040070290A (zh)
CN (1) CN100512430C (zh)
AT (1) ATE359672T1 (zh)
AU (1) AU2002367237A1 (zh)
DE (1) DE60219523D1 (zh)
WO (1) WO2003056832A1 (zh)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8875198B1 (en) 2001-08-19 2014-10-28 The Directv Group, Inc. Network video unit
US9602862B2 (en) 2000-04-16 2017-03-21 The Directv Group, Inc. Accessing programs using networked digital video recording devices
US7917008B1 (en) 2001-08-19 2011-03-29 The Directv Group, Inc. Interface for resolving recording conflicts with network devices
US10390074B2 (en) 2000-08-08 2019-08-20 The Directv Group, Inc. One click web records
TW545059B (en) 2000-08-08 2003-08-01 Replaytv Inc Method and system for remote television replay control
US9171851B2 (en) * 2000-08-08 2015-10-27 The Directv Group, Inc. One click web records
MXPA03003493A (es) * 2000-10-24 2005-01-25 Thomson Licensing Sa Metodo para reunir datos utilizando una pagina de reproduccion de medios embebida.
US20060107301A1 (en) * 2002-09-23 2006-05-18 Koninklijke Philips Electronics, N.V. Video recorder unit and method of operation therefor
US7735104B2 (en) * 2003-03-20 2010-06-08 The Directv Group, Inc. System and method for navigation of indexed video content
US8752115B2 (en) * 2003-03-24 2014-06-10 The Directv Group, Inc. System and method for aggregating commercial navigation information
EP1562120A1 (en) * 2004-02-09 2005-08-10 Sap Ag Data processing system with display of test data
US20050193426A1 (en) * 2004-02-27 2005-09-01 Raja Neogi System and method to control fingerprint processing in a media network
TWI275300B (en) * 2004-04-02 2007-03-01 Mstar Semiconductor Inc Method of processing fields of images
CN1934650A (zh) * 2004-06-18 2007-03-21 松下电器产业株式会社 Av内容处理设备、av内容处理方法、av内容处理程序及av处理设备中使用的集成电路
CA2574998C (en) * 2004-07-23 2011-03-15 Nielsen Media Research, Inc. Methods and apparatus for monitoring the insertion of local media content into a program stream
JP2007228343A (ja) * 2006-02-24 2007-09-06 Orion Denki Kk デジタル放送受信装置
US8671346B2 (en) * 2007-02-09 2014-03-11 Microsoft Corporation Smart video thumbnail
US20090158157A1 (en) * 2007-12-14 2009-06-18 Microsoft Corporation Previewing recorded programs using thumbnails
US9286616B2 (en) 2008-03-10 2016-03-15 Hulu, LLC Method and apparatus for providing directed advertising based on user preferences
US20090320060A1 (en) * 2008-06-23 2009-12-24 Microsoft Corporation Advertisement signature tracking
US8209713B1 (en) 2008-07-11 2012-06-26 The Directv Group, Inc. Television advertisement monitoring system
US8055749B1 (en) 2008-09-30 2011-11-08 Amazon Technologies, Inc. Optimizing media distribution using metrics
WO2010070799A1 (ja) * 2008-12-16 2010-06-24 パナソニック株式会社 薬剤投与装置
US10116902B2 (en) * 2010-02-26 2018-10-30 Comcast Cable Communications, Llc Program segmentation of linear transmission
US9258175B1 (en) 2010-05-28 2016-02-09 The Directv Group, Inc. Method and system for sharing playlists for content stored within a network
EP2622501B1 (en) * 2010-09-27 2019-07-17 Hulu, LLC Method and apparatus for interrupting an advertisement and the substitution of alternate advertisement
US8489526B2 (en) * 2010-11-24 2013-07-16 International Business Machines Corporation Controlling quarantining and biasing in cataclysms for optimization simulations
US9563844B2 (en) 2011-06-30 2017-02-07 International Business Machines Corporation Speculative asynchronous sub-population evolutionary computing utilizing a termination speculation threshold
US8577814B1 (en) * 2011-07-28 2013-11-05 Amazon Technologies, Inc. System and method for genetic creation of a rule set for duplicate detection
US8966520B2 (en) 2011-10-03 2015-02-24 Hulu, LLC Video ad swapping in a video streaming system
US9165247B2 (en) 2012-01-04 2015-10-20 International Business Machines Corporation Using global and local catastrophes across sub-populations in parallel evolutionary computing
US9066159B2 (en) 2012-10-23 2015-06-23 Hulu, LLC User control of ad selection for subsequent ad break of a video
US9064149B1 (en) 2013-03-15 2015-06-23 A9.Com, Inc. Visual search utilizing color descriptors
US9299009B1 (en) 2013-05-13 2016-03-29 A9.Com, Inc. Utilizing color descriptors to determine color content of images
US9305257B2 (en) 2013-05-20 2016-04-05 International Business Machines Corporation Adaptive cataclysms in genetic algorithms
CN104063313B (zh) * 2014-04-15 2017-05-17 深圳英飞拓科技股份有限公司 一种智能分析算法的测试系统及方法
US9369780B2 (en) * 2014-07-31 2016-06-14 Verizon Patent And Licensing Inc. Methods and systems for detecting one or more advertisement breaks in a media content stream
EP3284046A4 (en) * 2014-11-12 2018-05-02 Analytics Media Group, LLC Media planning system
US10027995B2 (en) * 2016-01-21 2018-07-17 Treepodia Ltd. System and method for generating media content in evolutionary manner
US9872049B1 (en) * 2016-06-30 2018-01-16 SnifferCat, Inc. Systems and methods for dynamic stitching of advertisements
US10083369B2 (en) 2016-07-01 2018-09-25 Ricoh Company, Ltd. Active view planning by deep learning
US10129586B2 (en) * 2016-12-19 2018-11-13 Google Llc Detecting and isolating television program content from recordings of television airings
CN107623863B (zh) * 2017-09-21 2020-11-06 广州华多网络科技有限公司 算法测试方法、装置及服务器

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4314285A (en) * 1979-05-11 1982-02-02 Bonner Edgar L Editing system for video apparatus
AU2884189A (en) * 1988-01-26 1989-07-27 Integrated Circuit Technologies Ltd. Method and apparatus for identifying and eliminating specific material from video signals
US5086479A (en) * 1989-06-30 1992-02-04 Hitachi, Ltd. Information processing system using neural network learning function
US5436653A (en) * 1992-04-30 1995-07-25 The Arbitron Company Method and system for recognition of broadcast segments
US5390283A (en) * 1992-10-23 1995-02-14 North American Philips Corporation Method for optimizing the configuration of a pick and place machine
US5333091B2 (en) * 1993-01-08 1996-12-17 Arthur D Little Enterprises Method and apparatus for controlling a videotape player to automatically scan past recorded commercial messages
DE69637514D1 (de) 1995-03-30 2008-06-19 Thomson Licensing Verfahren und Anordnung zur Klassifizierung von Videosignalen
US6100941A (en) * 1998-07-28 2000-08-08 U.S. Philips Corporation Apparatus and method for locating a commercial disposed within a video data stream
US6366296B1 (en) * 1998-09-11 2002-04-02 Xerox Corporation Media browser using multimodal analysis
US6577346B1 (en) * 2000-01-24 2003-06-10 Webtv Networks, Inc. Recognizing a pattern in a video segment to identify the video segment
US6957200B2 (en) * 2001-04-06 2005-10-18 Honeywell International, Inc. Genotic algorithm optimization method and network

Also Published As

Publication number Publication date
CN1611076A (zh) 2005-04-27
JP2005513967A (ja) 2005-05-12
AU2002367237A1 (en) 2003-07-15
DE60219523D1 (de) 2007-05-24
ATE359672T1 (de) 2007-05-15
JP4347056B2 (ja) 2009-10-21
KR20040070290A (ko) 2004-08-06
US20030126598A1 (en) 2003-07-03
WO2003056832A1 (en) 2003-07-10
EP1464178A1 (en) 2004-10-06
EP1464178B1 (en) 2007-04-11
US7337455B2 (en) 2008-02-26

Similar Documents

Publication Publication Date Title
CN100512430C (zh) 检测用演化算法的方法和设备
US20180013983A1 (en) Identifying popular network video segments
US6928233B1 (en) Signal processing method and video signal processor for detecting and analyzing a pattern reflecting the semantics of the content of a signal
CN100426861C (zh) 对嵌于媒介流中的重复对象提供用户控制的系统和方法
CN110364146B (zh) 语音识别方法、装置、语音识别设备及存储介质
US7873259B2 (en) Synching a recording time of a program to the actual program broadcast time for the program
EP2172010B1 (en) Digital video recorder collaboration and similar media segment determination
US20030225696A1 (en) Customized multimedia content method, apparatus, media and signals
CN101129064A (zh) 动态生成过程建模
US20090097822A1 (en) Method for optimizing the reading by a user equipment of mcch (mbms point-to-multipoint control channel) information
CN110730387B (zh) 视频播放控制方法和装置、存储介质及电子装置
US11074458B2 (en) System and method for searching video
CN107533850B (zh) 音频内容识别方法和装置
TW200402654A (en) A system and method for providing user control over repeating objects embedded in a stream
US8705798B2 (en) Systems and methods for multi-pass adaptive people counting utilizing trajectories
US7149365B2 (en) Image information summary apparatus, image information summary method and image information summary processing program
CN111242110A (zh) 一种新闻自动拆条的自适应条件随机场算法的训练方法
US7734096B2 (en) Method and device for discriminating obscene video using time-based feature value
US20080240674A1 (en) Recording apparatus
JP2003032631A (ja) 信号処理装置及び方法、記録媒体、並びにプログラム
US11714594B2 (en) Cuepoint determination system
CN114580790A (zh) 生命周期阶段预测和模型训练方法、装置、介质及设备
CN107809666A (zh) 音频数据合并方法、装置存储介质及处理器
CN115665371A (zh) 一种监控数据处理方法、装置、电子设备及存储介质
KR20220094796A (ko) 머신러닝 성능 향상을 위한 객체 관리 서버 및 그 제어방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: IPG ELECTRONICS 503 CO., LTD.

Free format text: FORMER OWNER: KONINKLIJKE PHILIPS ELECTRONICS N.V.

Effective date: 20090828

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20090828

Address after: British Channel Islands

Patentee after: Koninkl Philips Electronics NV

Address before: Holland Ian Deho Finn

Patentee before: Koninklijke Philips Electronics N.V.

ASS Succession or assignment of patent right

Owner name: PENDRAGON WIRELESS CO., LTD.

Free format text: FORMER OWNER: IPG ELECTRONICS 503 LTD.

Effective date: 20130121

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20130121

Address after: Washington State

Patentee after: Pendragon wireless limited liability company

Address before: British Channel Islands

Patentee before: Koninkl Philips Electronics NV

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090708

Termination date: 20141223

EXPY Termination of patent right or utility model