CN1879107A - 基于历史数据的信息检索 - Google Patents
基于历史数据的信息检索 Download PDFInfo
- Publication number
- CN1879107A CN1879107A CNA2004800332548A CN200480033254A CN1879107A CN 1879107 A CN1879107 A CN 1879107A CN A2004800332548 A CNA2004800332548 A CN A2004800332548A CN 200480033254 A CN200480033254 A CN 200480033254A CN 1879107 A CN1879107 A CN 1879107A
- Authority
- CN
- China
- Prior art keywords
- document
- relevant
- described document
- link
- scoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
- G06Q30/0246—Traffic
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
Abstract
系统(125)识别文档并获得与所述文档有关的一种或多种历史数据。系统(125)可以至少部分基于一种或多种历史数据,来生成用于所述文档的分值。
Description
技术领域
本发明通常涉及信息检索系统,以及更具体地说,涉及用于至少部分基于与相关文档有关的历史数据,来生成搜索结果的系统和方法。
背景技术
万维网(“网页”)包含大量信息。搜索引擎帮助用户通过编目录网页文档,来定位该信息的所需部分。通常,响应用户的请求,搜索引擎返回到与该请求有关的文档的链接。
搜索引擎可以将用户兴趣的确定基于由用户提供的搜索项(被称为搜索查询)。搜索引擎的目标是基于搜索查询,来识别到高质量相关结果的链接。典型地,搜索引擎通过匹配搜索查询中的术语与预存储的网页文档的资料库来实现此目标。包含用户搜索项的网页文档被视为“命中”并返回给用户。
理想地,搜索引擎将响应指定用户搜索查询,为用户提供最相关结果。一种搜索引擎基于比较搜索查询术语与包含在文档中的词来识别相关文档。另一种搜索引擎使用除文档中存在搜索查询术语之外的因素来识别相关文档。一个这种搜索引擎使用与到或来自文档的链接有关的信息来确定文档的相对重要性。
这两种搜索引擎力求提供高质量的搜索查询结果。存在会影响由搜索引擎生成的结果质量的几种因素。例如,一些网站生产商使用垃圾邮件技术来人为地抬高他们的等级。同时,可以使“过期”文档(即长时间未更新的那些文档,从而包含过期数据)等级高于“较新”文档(即最近更新的那些文档,从而包含更新的数据)。在一些特定环境下,较高等级的过期文档降低了搜索结果。
因此,仍然需要提高由搜索引擎生成的结果的质量。
发明内容
与本发明的原理相符的系统和方法可以至少部分基于与文档有关的历史数据来给文档计分。该计分可以用来提高连同搜索查询生成的搜索结果。
根据与本发明的原理相符的一个方面,提供一种用于计分文档的方法。该方法可以包括识别文档并获得与所述文档有关的一种或多种历史数据。该方法可以进一步包括至少部分基于一种或多种历史数据,来生成用于所述文档的得分。
根据另一方面,提供一种用于计分文档的方法。该方法可以包括确定与所链接的文档有关的连接数据的寿命,以及基于该连接数据的寿命的衰减函数,来分级所链接的文档。
附图说明
包含并构成本说明书的一部分的附图示例性本发明的实施例,以及结合说明书,解释本发明。在图中:
图1是可以实现与本发明的原理相符的系统和方法的示例性网络图;
图2是根据与本发明的原理相符的实现,图1的客户机和/或服务器的示例图;
图3是根据与本发明的原理相符的实现,图1的搜索引擎的示例性功能框图;以及
图4是根据与本发明的原理相符的实现,用于计分文档的示例性处理的流程图。
具体实施方式
本发明的下述详细描述参考附图。不同图中的相同参考数字可以识别相同或类似的元件。同时,下述详细描述不限制本发明。
与本发明的原理相符的系统和方法可以使用例如与所述文档有关的历史数据来计分文档。系统和方法可以使用这些得分来提供高质量搜索结果。
“文档”如在此所使用的,广泛解释成包括任何机器可读和机器可存储的作品。文档可以包括电子邮件、网站、文件、文件组合、具有与其他文件的嵌入链接的一个或多个文件、新闻组布告、博客、网页广告等等。在因特网的情况下,公用文档是网页。网页通常包括文本信息并可以包括嵌入的信息(诸如元信息、图像、超级链接等等)和/或嵌入的指令(诸如Java脚本等等)。网页可以对应于文档或部分文档。因此,单词“网页”或“文档”在某些情况下可以互换使用。在其他情况下,网页可以指部分文档,诸如子文档。网页对应于不止单个文档也是可能的。
在下述描述中,可以将文档描述为具有到其他文档的链接和/或来自其他文档的链接。例如,当文档包括到另一文档的链接时,链接可以被称为“前向链接”。当文档包括来自另一文档的链接时,该链接可以被称为“后向链接”。当使用术语“链接”时,可以指后向链接或前向链接。
网络结构的例子
图1是网络100的示例性图,其中,可以实现与本发明的原理相符的系统和方法。网络100可以包括经网络150连接到多个服务器120-140的多个客户机110。网络150可以包括局域网(LAN)、广域网(WAN)、电话网,诸如公用交换电话网(PSTN)、内联网、互联网、存储器设备、另一类型的网络或网络组合。为简化起见,两个客户机110和三个服务器120-140示例为连接到网络150。实际上,可以有更多或更少的客户机和服务器。同时,在一些实例中,客户机可以执行服务器的功能,以及服务器可以执行客户机的功能。
客户机110可以包括客户实体。实体可以被定义为设备,诸如无线电话、个人计算机、个人数字助理(PDA)、膝上型电脑或另一计算或通信设备、在这些设备的一个上运行的线程或过程和/或能由这些设备的一个执行的对象。服务器120-140可以包括以与本发明的原理相符的方式,收集、处理、搜索和/或维护文档的服务器实体。客户机110和服务器120-140可以经有线、无线和/或光学连接而与网络150相连。
在与本发明的原理相符的实现中,服务器120可以包括可由客户机110使用的搜索引擎125。服务器120可以扒(crawl)文档的资料库(例如网页)、索引文档以及存储与所扒的文档库中的文档有关的信息。服务器130和140可以存储或维护可以由服务器120扒的文档。尽管服务器120-140被示为单独实体,但也可以服务器120-140的一个或多个执行服务器120-140的另一个或多个的功能的一个或多个。例如,两个或多个服务器120-140实现为单个服务器是可能的。也可以将服务器120-140的单个实现为两个或多个独立(以及可以分布式)设备。
示例性客户机/服务器体系结构
图2是根据与本发明的原理相符的实现,客户机或服务器实体(在下文中称为“客户机/服务器实体”)的示例性图,可以对应于一个或多个客户机110和服务器120-140。客户机/服务器实体可以包括总线210、处理器220、主存储器230、只读存储器(ROM)240、存储设备250、一个或多个输入设备260、一个或多个输出设备270以及通信接口280。总线210可以包括一个或多个导线,允许客户机/服务器实体的部件间的通信。
处理器220可以包括解释和执行指令的一个或多个传统处理器或微处理器。主存储器230可以包括随机存取存储器(RAM)或另一种动态存储设备,存储信息和指令以便由处理器220执行。ROM240可以包括传统ROM设备或另一种静态存储设备,存储用于由处理器220使用的静态信息和指令。存储设备250可以包括磁性和/或光学记录介质及其相应驱动。
输入设备260可以包括一个或多个传统的机构,允许操作者将信息输入客户机/服务器实体,诸如键盘、鼠标、笔、语音识别和/或生物机构等等。输出设备270可以包括一个或多个传统的机构,向操作者输出信息,包括显示器、打印机、扬声器等等。通信接口280可以包括收发信机类机构,允许客户机/服务器实体与其他设备和/或系统通信。例如,通信接口280可以包括用于经网络,诸如网络150与另一设备或系统通信的机构。
如下文详细所述,与本发明的原理相符,客户机/服务器实体执行某些搜索相关操作。客户机/服务器实体可以响应执行包含在计算机可读介质,诸如存储器230中的软件指令的处理器220,而执行这些操作。计算机可读介质可以被定义为一个或多个物理或逻辑存储设备和/或载波。
软件指令可以从另一计算机可读介质,诸如数据存储设备250,或经通信接口280,从另一设备读入存储器230中。包含在存储器230中的软件指令可以使处理器220执行将在下文所述的过程。另外,可以使用硬布线电路来代替或结合软件指令来实现与本发明的原理相符的过程。因此,与本发明的原理相符的实现可以不限于硬布线电路和软件的任何特定组合。
示例性搜索引擎
图3是根据与本发明的原理相符的实现,搜索引擎125的示例性功能框图。搜索引擎125可以包括文档定位器310、历史部件320和等级部件330。如图3所示,文档定位器310和历史部件320的一个或多个可以连接到文档资料库340。文档资料库340可以包括与例如在由搜索引擎125可访问的数据库中先前扒、索引和存储的文档有关的信息。历史数据,如在下文中更详细地描述,可以与文档资料库340中的每一个文档相关联。历史数据可以存储在文档资料库340或其他地方中。
文档定位器310可以识别其内容与用户搜索查询匹配的文档集。文档定位器310可以通过将用户搜索查询中的术语与资料库中的文档进行比较,初始地从文档资料库340定位文档。通常,用于索引文档并搜索索引集合以返回包含搜索项的文档集的过程在本领域非常公知。因此,在此不再描述文档定位器310的该功能。
历史部件320可以收集与文档资料库340中的文档有关的历史数据。在与本发明的原理相符的实现中,历史数据可以包括与下列有关的数据:文档初始日期;文档内容更新/改变;查询分析;基于链接的标准;锚文本(例如嵌入超级链接的文本,通常在文档中被加下划线或者高亮);通信量;用户行为;域相关信息;等级历史;用户维护/产生的数据(例如书签);锚文本中的唯一字、二元语法和短语;独立对等的连接和/或文档主题。在下文中另外详细地描述这些不同类型的历史数据。在其他实现中,历史数据可以包括另外或不同类型的数据。
等级部件330可以向文档资料库340中的一个或多个文档分配等级得分(在此也简单地称为“计分”)。等级部件330可以在搜索查询前、与搜索查询无关或结合搜索查询,来分配等级得分。当文档与搜索查询相关时(例如识别为与搜索查询有关),搜索引擎125可以基于等级得分来排序文档并将排序后的文档集返回给提交搜索查询的客户机。与本发明的原理相符,等级得分是试图量化文档质量的值。在与本发明的原理相符的实现中,得分至少部分基于来自历史部件320的历史数据。
示例性历史数据
文档初始日期
根据与本发明的原理相符的实现,文档初始日期可以用来生成(或修改)与那个文档有关的得分。术语“日期”在此广泛使用并可以由此包括时间和日期度量。如下所述,存在能用来确定文档初始日期的几种技术。这些技术中的一些在它们会受期望提高与文档有关的得分的第三方影响的意义方面是“有偏差”。其他技术无偏差。这些技术中的任何一种、这些技术的组合或其他技术可以用来确定文档的初始日期。
根据一种实现,可以由搜索引擎125首次获悉或索引文档的日期,来确定文档的初始日期。搜索引擎125可以通过扒、从“外部”源向搜索引擎125提交文档(或其表示/概述)、扒或基于提交的索引技术的组合,或以其他方式,来发现所述文档。另外,可以由搜索引擎125首次发现到所述文档的链接的日期,来确定文档的初始日期。
根据另一实现,通过域注册文档的日期可以被用作文档的初始日期的表示。根据另一实现,可以使用在另一文档,诸如新闻文章、新闻组、电子邮件列表或一个或多个这些文档的组合中第一次参考文档的时间来推断文档的初始日期。根据另一实现,文档至少包括阈值数目页的日期可以被用作文档的初始日期的表示。根据另一实现,可以使文档的初始日期等于服务器寄存文档的与所述文档有关的时间戳。其他技术,在此未具体提及的,或技术组合也能用来确定或推断文档的初始日期。
搜索引擎125可以将文档的初始日期用于计分文档。例如,可以假定具有相当近的初始日期的文档将不具有来自其他文档的多个链接(即后向链接)。对基于到/来自文档的链接数的现有的基于链接的计分技术,该新文档可能得分低于具有更多链接(例如向后链接)的较早文档。当考虑文档的初始日期时,然而,可以基于文档的初始日期,来(正或负地)修改文档的得分。
假定由10个后向链接参考的具有初始日期为昨天的文档的例子。所述文档可以由搜索引擎125计分高于由100个后向链接参考的具有初始日期为10年前的文档,因为前者的链接增长率相对高于后者。尽管后向链接数的增长的尖峰速率(spiky rate)可以是由搜索引擎125用来计分文档的因素,但也可能是发尝试信号来向搜索引擎125发送垃圾邮件。因此,在这种情况下,搜索引擎125实际上可以降低文档的分值来降低发送垃圾邮件的影响。
因此,根据与本发明的原理相符的实现,搜索引擎125可以使用文档的初始日期来确定创建到所述文档的链接的速率(例如作为基于从初始日期以来或在那个周期中的一些窗口创建的链接数的每单位时间的平均值)。然后,能使用该速率来计分所述文档,例如向更常生成链接的文档提供更大权重。
在一个实现中,搜索引擎125可以修改文档的基于链接的分值如下:
H=L/log(F+2)
其中,H指历史调整的链接分值,L可以指为所述文档提供的链接分值,其可以使用基于到/来文档的链接而为文档分配分值的任何已知链接计分技术(例如在U.S.专利No.6,285,999中所描述的计分技术)来导出,以及F可以指从与所述文档有关的初始日期(或该周期内的窗口)测量的逝去时间。
对于一些查询,较早文档比新的更有利。因此,可以基于与结果集的平均寿命的差值(寿命方面),来调整文档的分值。换句话说,搜索引擎125可以确定结果集中每个文档的寿命(例如使用它们的初始日期),确定文档的平均寿命,以及基于文档的寿命和平均寿命之间的差值,来(正或负)地修改文档的分值。
总的来说,搜索引擎125可以至少部分基于与文档的初始日期有关的信息,来生成(或修改)与文档有关的分值。
内容更新/改变
根据与本发明的原理相符的实现,与文档内容随时间改变的方式有关的信息可以被用来生成(或修改)与那个文档有关的分值。例如,其内容经常被编辑的文档得分不同于其内容随时间保持不变的文档。同时,相对多内容随时间更新的文档的计分可以不同于随时间更新相对少量内容的文档。
在一个实现中,搜索引擎125可以生成内容更新得分(U)如下:
U=f(UF,UA)
其中,f可以指函数,诸如求和或加权和,UF可以指表示多久更新文档(或网页)的更新频率得分,以及UA可以指表示文档(或网页)随时间改变多少的更新量得分。UF可以以多个方式来确定,包括更新之间的平均时间、在指定时限内的更新次数等等。
UA也可以确定为一个或多个因素的函数,诸如在一个时间周期内与文档有关的“新”或唯一页的数量。另一因素可以包括一个时间周期内与文档有关的新或唯一页的数量和与那个文档有关的总页数的比率。另一因素可以包括在一个或多个时间周期内更新文档的数量(例如文档的可见内容的n%可以随周期t改变(例如最近m个月)),其可以是平均值。另一因素可以包括在一个或多个时间周期内(例如在最近x天内),文档(或网页)改变的数量。
根据一个示例性实现,UA可以确定为文档内容的不同加权部分的函数。例如,当确定UA时,认为如果更新/改变不重要的内容,诸如Java脚本、注释、广告、导航要素、样板资料或日期/时间标签,则给予相对小的权重或甚至完全忽略。另一方面,当确定UA时,认为如果(例如经常、更近、更广泛等等)更新/改变很重要的内容,诸如与前向链接有关的标题或锚文本,则给予比其他内容改变更高的权重。
UF和UA可以用其他方式来影响分配给文档的分值。例如,能将当前时间周期中的改变率与在另一(例如在前)时间周期中的改变率进行比较,来确定存在加速还是减速趋势。改变率增加的文档可以比改变率稳定的那些文档计分更高,即使那一改变率相当高。改变量也可以是该计分中的因素。例如,当改变量大于一些阈值时,改变率增加的文档可以计分高于改变率稳定或改变量小于阈值的那些文档。
在一些情况下,当监视文档的内容改变时,数据存储资源可能不足以存储那些文档。在这种情况下,搜索引擎125可以存储文档的表示并监视这些表示的变化。例如,搜索引擎125可以存储文档的“签名”,代替(整个)文档本身以检测文档内容的改变。在这种情况下,搜索引擎125可以存储用于文档(或网页)的术语矢量并监视其相对大的改变。根据另一实现,搜索引擎125可以存储和监视确定为重要或最频繁发生(除“停止字”外)的文档的相对小部分(例如几个术语)。
根据另一实现,搜索引擎125可以存储文档的概述或其他表示并监视该信息的变化。根据另一实现,搜索引擎125可以生成用于所述文档的相似度散列(可以用来检测文档的较近复制)并监视其变化。相似度散列的变化可以被视为表示其相关文档中的相对大变化。在其他实现中,可以使用其他技术来监视文档的变化。在存在足够数据存储资源的情况下,可以存储和使用整个文档来确定变化,而不是文档的一些表示。
对一些查询,具有最近未改变的内容的文档可以比具有最近改变过的内容的文档更有利。因此,可以基于与结果集的平均改变日期的差值来调整文档的分值可能是有利的。换句话说,搜索引擎125可以确定结果集中每一个文档的内容最后一次改变的日期,确定所述文档的平均改变日期,并基于文档的改变日期和平均改变日期之间的差值,来修改文档的分值(正或负)。
总的来说,搜索引擎125可以至少部分基于与文档的内容随时间改变的方式有关的信息,来生成(或修改)与文档有关的分值。对于包括属于多个个人或公司的内容的非常大的文档,分值可以对应于每一个子文档(即,属于单个人或公司或由其更新的内容)。
查询分析
根据与本发明的原理相符的实现,可以使用一个或多个基于查询的因素来生成(或改变)与文档有关的分值。例如,当文档包括在搜索结果集中时,一个基于查询的因素涉及随时间选择该文档的程度。在这种情况下,搜索引擎125可以使用户相对经常/日益增加选择的文档的得分高于其他文档。
另一基于查询的因素可以涉及在查询中出现的某些搜索项随时间的出现。特定搜索项集可以随时间周期递增地出现在查询中。例如,与正变得/已经变为流行的“热门”标题或分裂新闻事件有关的术语将可能在时间周期上频繁地出现。在这种情况下,搜索引擎125可以使与这些搜索项(或查询)相关的文档的得分高于不与这些术语有关的文档。
另一基于查询的因素可以涉及通过类似查询生成的搜索结果数目随时间的改变。由类似查询生成的搜索结果数的显著增加例如可以表示热门标题或分裂新闻,并使搜索引擎125增加与这些查询有关的文档的得分。
另一基于查询的因素可以涉及随时间保持相对恒定但会导致随时间改变的结果的查询。例如,与“世界职业棒球锦标赛”有关的查询导致随时间改变的搜索结果(例如与特定队有关的文档控制在特定年或年度内的搜索结果)。该改变能被监视并用来相应地计分文档。
另一基于查询的因素可以涉及作为搜索结果返回的文档的“过期”。文档过期可以基于以下因素,诸如文档创建日期、锚增长、通信量、内容变化、前向/后向链接增长等等。对于一些查询,最近文档非常重要(例如如果搜索常问问题(FAQ)文件,则将非常希望最近版本)。搜索引擎125可以通过分析用户选择搜索结果中的哪些文档,来学习哪些查询最近变化最重要。更具体地说,搜索引擎125可以考虑用户有多经常喜欢等级低于搜索结果中的较早文档的最新文档。另外,如果随时间流逝,特定文档被包括在最关注的查询(例如“世界职业棒球大赛”)对更特定的查询(例如“纽约美国人”)中,那么,该基于查询的因素-通过自身或通过在此提到的其他-可以用来降低似乎过期的文档的分值。
在一些情况下,可以比更新文档更优先考虑过期文档。因此,当生成用于所述文档的分值时,搜索引擎125可以考虑随时间选择该文档的程度。例如,如果对指定查询,用户随时间倾向于选择比更高等级的更新文档更低等级、相对过期的文档,则这由搜索引擎125用作调整过期文档的分值的指示。
另一基于查询的因素可以涉及文档出现在不同查询结果中的程度。换句话说,可以监视用于一个或多个文档的查询熵,并用作用于计分的基础。例如,如果特定文档作为用于不一致查询集的命中而出现,这可以(尽管不一定)看作所述文档是垃圾邮件的信号,在这种情况下,搜索引擎125可以相对更低地计分所述文档。
总的来说,搜索引擎125可以至少部分基于一个或多个基于查询的因素,来生成(或修改)与文档有关的分值。
基于链接的标准
根据与本发明的原理相符的实现,可使用一个或多个基于链接的因素来生成(或修改)与文档有关的分值。在一种实现中,基于链接的因素可以涉及新链接出现于文档以及现有链接消失的日期。链接的出现日期可以是搜索引擎125找到链接的第一日期或文档包含链接的日期(例如,通过链接找到文档的日期或最近更新它的日期)。链接的消失日期可以是包含该链接的文档删除该链接或本身消失的第一日期。
这些日期可以由搜索引擎125在扒或索引更新操作期间确定。将该日期作为参考,然后,搜索引擎125可以监视到文档的链接的时间变化行为,诸如当链接出现或消失时,链接随时间出现或消失的速率、在指定时间周期期间多少链接出现或消失、存在倾向出现新链接还是文档的现有链接消失等等。
使用到和/或来自文档的链接的时间变化行为,搜索引擎125可以相应地计分文档。例如,随时间新链接数量或速率下降趋势(例如基于最近时间周期对较早时间周期中新链接的数量或速率的比较)能信号告知搜索引擎125文档是过期的,在这种情况下,搜索引擎125可以减少文档的分值。相反地,根据特定情况和实现,向上趋势会信号告知可以被视为更相关的“最新”文档(例如最新创建或更新其内容的文档)。
通过分析文档(或页面)的后向链接随时间增加/减少的数量或速率的变化,搜索引擎125可以导出文档有多新的重要信号。例如,如果这种分析用逐渐下滑的曲线反映,这可以发信号告知文档是过期的(例如不再更新、重要性降低、由另一文档代替等等)。
根据一种实现,分析可以取决于文档的新链接的数量。例如,搜索引擎125可以监视自首次找到文档以来新链接的数量相比于最近n天中文档的新链接的数量。另外,搜索引擎125可以确定与找到的第一链接的寿命相比,最新y%链接的最早寿命。
为示例目的,假定y=10和100天前首次发现两个文档(在该例子中为网站)。对于第一网站,发现10%的链接少于10天前,而对于第二网站,发现0%的链接少于10天前(换句话说,更早地发现它们)。在这种情况下,量度导致对网站A为0.1以及对网站B为0。可以适当地放大度量。在另一示例性实现中,可以通过执行链接日期分布的相对更详细的分析来修改度量。例如,可以构建模型,预测特定分布是否表示特定类型的网站(例如不再更新、流行增加或减少、取代等等的网站)。
根据另一实现,分析可以取决于分配给链接的权重。在这种情况下,每个链接可以由随链接的新鲜度而增加的函数来加权。可以由链接的出现/改变的日期、与该链接有关的锚文本的出现/改变的日期、包含该链接的文档的出现/改变日期来确定链接的新鲜度。基于如果链接仍然相关且良好,则当文档更新时良好链接不变的理论,包含链接的文档的出现/改变日期可以是链接的新鲜度的更好指示。为了不由文档的细微不相关部分的微小编辑而更新每个链接的新鲜度,可以测试每个更新文档的显著变化(例如文档的更大部分的变化或文档的许多不同部分的改变),并相应地更新(或不更新)链接的新鲜度。
可以用其他方式来加权链接。例如,可以基于有多信任包含链接的文档(例如政府文档可以给予较高信任)来加权链接。链接也可以基于包含链接的文档有多少权威性(例如以类似于在U.S.专利No.6,285,999中所述的方式来确定权威文档)来加权。链接也可以使用确定新鲜度的一些其他特征,基于包含该链接的文档的新鲜度来加权(例如频繁更新的文档(例如Yahoo主页)突然删除到文档的链接)。
搜索引擎125可以提高或降低存在到其的链接的文档的分值作为指向文档的链接的加权和的函数。该技术可以递归采用。例如,假定文档S有2年。如果到S的链接的n%是新的或如果包含到S的前向链接的文档被视为新的,则将文档S视为新。可以通过使用文档的创建日期并递归地应用该技术来校验后者。
根据另一技术,分析可以取决于与指向文档的链接有关的寿命分布。换句话说,可以确定创建到文档的链接的日期并输入到确定寿命分布的函数中。可以假定过期文档的寿命分布将非常不同于新文档的寿命分布。因此,搜索引擎125可以部分基于与文档有关的寿命分布来计分文档。
链接出现的日期也可以被用来检测“垃圾邮件”,其中,文档的所有者或他们的同僚为提高由搜索引擎分配的分值的目的而创建到他们自己的文档的链接。典型的“合理”文档缓慢地吸引后向链接。后向链接数量的大峰值会信号告知关注现象(例如CDC网站在爆发诸如SARS后,会迅速地发展许多链接),或通过交换链接、购买链接或获得来自文档的链接,而没有有关生成链接的编辑判断,信号尝试向搜索引擎发送垃圾邮件(以便获得较高等级,从而获得搜索结果中的更好位置)。提供链接而没有编辑判断的文档的例子包括访客薄、参考日志和允许任何人增加文档链接的“免费”页。
根据另一实现,分析可以取决于链接消失的日期。许多链接消失能表示这些链接所指向的文档过期(例如不再更新或已经由另一文档替代)。例如,搜索引擎125可以监视到文档的一个或多个链接消失的日期、在指定时间窗口中消失的链接数,或到文档的链接数(或到包含这些链接的文档的链接/更新)的一些其他时间变化减少,来识别可被视为过期的文档。一旦已经确定文档过期,当确定由链接指向的文档的分值时,包含在那个文档中的链接可以由搜索引擎125忽视或忽略。
根据另一实现,分析可以不仅取决于文档的链接的寿命,而且可以取决于链接的动态化。如此,搜索引擎125可以加权除具有非常新的链接外,每天具有不同于(例如降低)始终更新并始终链接到指定目标文档的文档的不同特征链接的文档。在一个示例性实现中,搜索引擎125可以基于在时间窗内,对于所有版本文档,具有到一个文档的链接的各文档的分值,来生成用于该文档的分值。该另一版本可以基于文档的主要更新时间,将减少/衰减因子包含在集成中。
总的来说,搜索引擎125可以部分基于一个或多个基于链接的因素,来生成(或修改)与文档有关的分值。
锚文本
根据与本发明的原理相符的实现,与锚文本随时间改变的方式有关的信息可以用来生成(或修改)与文档有关的分值。例如,可以将与到文档的链接有关的锚文本随时间的改变用作文档中已经有更新或甚至焦点改变的表示。
另外,如果文档的内容改变,使得它显著地不同于与其后向链接有关的锚文本,那么与文档有关的域可以显著地(完全)从前身改变。当域届满和不同方购买该域时这会发生。因为锚文本通常被视为是其相关链接所指向的文档的一部分,域可以在用于查询的搜索结果中不再在标题上显现。这是不期望的结果。
解决该问题的一个方法是估计域改变其焦点的日期。这可以通过确定文档的文本显著改变或锚文本的文本显著改变的日期来完成。然后可以忽略或忽视在那一日期前的所有链接和/或锚文本。
锚文本的新鲜度也可以被用作计分文档的因素。可以通过例如锚文本的出现/改变日期、与锚文本有关的链接的出现/改变日期和/或相关链接所指向的文档的出现/改变日期,来确定锚文本的新鲜度。基于如果锚文本仍然相关且良好,则当文档更新时良好锚文本不变的理论,由链接指向的文档的出现/改变日期可以是锚文本的新鲜度的良好指示符。为了不由文档的细微不相关部分的细微编辑而更新锚文本的新鲜度,可以测试每个更新文档的显著变化(例如文档的大部分改变或文档的许多不同部分的改变)并相应地更新(或不更新)锚文本的新鲜度。
总的来说,搜索引擎125可以至少部分基于与锚文本随时间改变的方式有关的信息,来生成(或修改)与文档有关的分值。
通信量
根据与本发明的原理相符的实现,有关与文档有关的通信量随时间的信息可以用来生成(或修改)与文档有关的分值。例如,搜索引擎125可以监视一个或多个用户到文档的通信量或其他“用途”的时间变化特性。通信量的大的降低可以表示文档为过期(例如不再更新或可能由另一文档替代)。
在一种实现中,搜索引擎125可以比较最近j天(例如其中j=30)文档的平均通信量与文档接收最多通信量,可选地,按季节变化调整的月期间,或最近k天(例如k=365)期间的平均通信量。可选地,搜索引擎125可以识别重复通信量模式或通信量模式随时间的变化。可以发现存在文档或多或少流行(例如具有或多或少通信量)的周期,诸如在夏季月期间,周末或在一些其他季节时间周期期间。通过识别重复通信量模式或通信量模式的变化,搜索引擎125可以适当地调整在这些周期期间或之外文档的得分。
另外,或者,搜索引擎125可以监视与用于特定文档的“广告通信量”有关的时间变化特性。例如,搜索引擎125可以监视下述因素的一个或多个组合:(1)随时间,由指定文档呈现或更新广告的程度或频率;(2)广告商的质量(例如其广告参考/链接到搜索引擎125知道随时间具有相对高通信量和信任的文档,诸如amazon.com的文档可以被提供比其广告指向低通信量/不可靠文档的那些文档,诸如色情网站相对更高的权重);以及(3)广告生成到它们所涉及的文档的用户通信量的程度(例如它们的点击率)。搜索引擎125可以使用与广告通信量有关的这些时间变化特性来计分文档。
总的来说,搜索引擎125可以至少部分基于有关与文档有关的通信量随时间的信息,来生成(或修改)与文档有关的分值。
用户行为
根据与本发明的原理相符的实现,可以使用对应于随时间与文档有关的个人或集体用户行为的信息,来生成(或修改)与文档有关的分值。例如搜索引擎125可以监视从搜索结果集中选择一个文档的次数和/或一个或多个用户访问所述文档所花费的时间量。然后,搜索引擎125可以至少部分基于该信息来计分所述文档。
如果对某一查询返回文档,以及给定相同或类似查询,随时间或在指定时间窗口内,用户在该文档上平均花费或多或少的时间,那么这可以分别被用作该文档新或旧的表示。例如假定查询“Riverview游泳计划”返回具有标题“Riverview游泳计划”的文档。进一步假定用户以前花费30秒访问它,但现在选择所述文档的每个用户仅花费几秒来访问它。搜索引擎125可以使用该信息来确定所述文档为旧(即包含过时游泳计划)并相应地计分所述文档。
总的来说,搜索引擎125可以至少部分基于与随时间与文档有关的个人或集体用户行为相应的信息,来生成(或修改)与文档有关的分值。
域相关信息
根据与本发明的原理相符的实现,涉及与文档有关的域的信息可以用来生成(或修改)与所述文档有关的分值。例如,搜索引擎125可以监视与在计算机网络(例如互联网、内联网或其他网络或文档数据库)内如何寄存文档有关的信息,并使用该信息来计分文档。
尝试欺骗(发送垃圾邮件)搜索引擎的个人通常使用用完即扔或“门口(doorway)”域,并尝试在被抓住前获得尽可能多的通信量。当计分与这些域有关的文档时,关于域的合法性的信息可以由搜索引擎125使用。
可以使用某些信号来区分非法域和合法域。例如域可以续达10年的周期。有用(合法)域通常预先支付几年,而门口(非法)域仅使用1年多。因此,当未来域届满时的日期能被用作预测域的合法性,从而预测与之有关的文档的合法性的因素。
同样,或者,用于域的域名服务器(DNS)记录可以被监视以预测域是否合法。DNS记录包含谁注册了域、行政和技术地址以及名称服务器(即将域名解析为IP地址的服务器)的地址的详情。通过分析用于域的随时间的该数据,可以识别非法域。例如,搜索引擎125可以监视在时间周期上,物理正确的地址信息是否存在,域的联系信息是否相对频繁地改变,在不同名称服务器和寄主公司之间是否存在相当大量的变化等等。在一个实现中,可以识别、存储已知不良联系信息、名称服务器和/或IP地址的清单,并用于预测域的合法性,从而预测与之相关的文档的合法性。
同样,另外,关于与域有关的名称服务器的寿命或其他信息可以用来预测域的合法性。“良好”名称服务器可以具有来自不同注册器的不同域的混合并具有寄主这些域的历史,而“不良”名称服务器会主要寄主色情或门口域、具有商业词汇的域(垃圾邮件的通用指示符)或主要来自单个注册器的零散域或可能是全新的。名称服务器的新鲜度可以非自动地为确定相关域的合法性的消极因素,而可以结合其他因素,诸如在此所述的。
总的来说,搜索引擎125可以至少部分基于有关与文档有关的域的合法性的信息,来生成(或修改)与文档有关的分值。
等级历史
根据与本发明的原理相符的实现,可以使用与文档的先前等级有关的信息来生成(或修改)与文档有关的分值。例如,搜索引擎125可以响应提供给搜索引擎125的搜索查询,监视文档的时间变化等级。搜索引擎125可以确定在许多查询上等级跳跃的文档可能是主题文档,或它可能是发信号试图向搜索引擎125发送垃圾邮件。
因此,可以使用在时间周期上文档在等级方面移动的数量或速率来影响分配给那个文档的未来分值。在一种实现中,对于搜索结果的每个集合,可以根据它在前N个搜索结果中的位置来加权文档。对N=30,一个示例函数可以是[((N+1)-SLOT/N)]4。在这种情况下,第一结果可得到1.0的分值,对第N个结果,下降到接近0的分值。
可以重复查询集(例如商业查询),以及可以标记获得等级多于M%的文档,或等级的百分比增长被用作确定用于所述文档的分值的信号。例如,如果前面结果的平均(中等)分值相对高以及前面结果逐月存在相当大的变化,则搜索引擎125可以确定查询很可能是商业的。搜索引擎125也可以监视流入流出(churn)作为商业查询的指示。对商业查询,垃圾邮件的可能性较高,因此,搜索引擎125可以相应地处理与之有关的文档。
除用于指定查询的文档的位置(或等级)的历史外,搜索引擎125可以监视(在页面、主机、文档和/或域基础上)一个或多个其他因素,诸如随时间将文档选择为搜求结果的查询数以及速率(增加/减少)、季节性、突发性和随时间文档被选择为搜索结果的其他模式和/或对于URL查询对,分值随时间的变化。
另外,或者,搜索引擎125可以监视随时间,与基于查询的标准无关的文档(例如URL)数量。例如,搜索引擎125可以监视响应于指定查询或查询集而生成的顶端结果集中的平均分值,并调整响应于指定查询或查询集而生成的结果集和/或其他结果的分值。此外,搜索引擎125可以监视随时间,为特定查询或查询集生成的结果数。如果搜索引擎125确定结果数增加或增长率有变化(例如这种增加可以是“热门主题”或其他现象的表示),搜索引擎125可以使那些结果在未来计分更高。
另外,或者,搜索引擎125可以监视随时间的文档等级来检测文档等级中的突然峰值。峰值可以表示主题现象(例如热门主题)或试图通过例如交易或购买链接而向搜索引擎125发送垃圾邮件。搜索引擎125可以通过利用滞后来允许以某一速率增长等级,采用防止垃圾邮件尝试的措施。在另一实现中,指定文档的等级可以被允许在预定时间窗上增长的某一最大阈值。作为将与主题现象有关的文档与垃圾邮件文档区分的进一步措施,搜索引擎125可以基于例如在新闻中将不会提到垃圾邮件文档的理论,考虑在新闻文章、论述组等等中文档的记载。可以使用这些技术的任何一个或组合来减少垃圾邮件尝试。
搜索引擎125也可以把在一些方面中被确定为权威的文档,诸如政府文档、web目录(例如Yahoo)以及随时间已经显示出相对稳定和高等级的文档作为例外。例如,如果到权威文档的链接的数量或增加率中出现不寻常峰值,那么搜索引擎125可以认为所述文档不是垃圾邮件,从而允许相当高或甚至(随时间)对其等级(增长)无阈值。
另外,或者,搜索引擎125可以将文档等级的显著下降视为这些文档“不受喜欢”或过期的指示。例如,如果文档的等级随时间显著地下降,那么搜索引擎125可以将所述文档视为过期并相应地计分所述文档。
总的来说,搜索引擎125可以至少部分基于与文档的先前等级有关的信息,来生成(或修改)与文档有关的分值。
用户维护/生成的数据
根据与本发明的原理相符的实现,可以使用用户维护或生成的数据来生成(或修改)与文档有关的分值。例如,搜索引擎125可以监视由用户维护或生成的数据,诸如“书签”、“喜好”或可以提供用户喜欢或感兴趣的文档的一些指示的其他类型的数据。搜索引擎125可以直接(例如经浏览器辅助)或间接(例如经浏览器)获得该数据。然后,搜索引擎125随时间分析文档与之有关的多个书签/喜好来确定文档的重要性。
搜索引擎125还可以分析从书签/喜好列表增加或移出文档(或更具体地说,文档的路径),增加到书签/喜好列表或从其移出文档的速率和/或是否增加、删除或通过书签/喜好列表访问文档的向上和向下趋势。如果多个用户正将特定文档增加到他们的书签/喜好列表中,或通常随时间通过这些列表访问该文档,这可以被视为该文档相对重要的指示。另一方面,如果多个用户正减少访问在他们的书签/喜好列表中指示的文档,或正从他们的列表日益删除/替代到所述文档的路径,这可以被看作该文档过时、不流行等等的指示。因此,搜索引擎125可以相应地计分所述文档。
在另一实现中,可以表示用户随时间对特定文档的兴趣增加或减少的其他类型的用户数据可以由搜索引擎125使用来计分文档。例如,与用户有关的“临时”或缓冲文件能由搜索引擎125监视,以识别随时间添加的文档增加还是减少。类似地,与特定文档有关的cookie数据块也可以由搜索引擎125监视来确定对文档的兴趣存在向上还是向下趋势。
总的来说,搜索引擎125可以至少部分基于用户维护或生成的数据,来生成(或修改)与文档有关的分值。
锚文本中的唯一字、二元语法(bigram)、短语
根据与本发明的原理相符的实现,可以使用关于锚文本中的唯一字、二元语法、短语的信息来生成(或修改)与文档有关的分值。例如搜索引擎125可以监视随时间的网站(或链接)图以及它们的行为,并将该信息用于计分、垃圾邮件检测或其他目的。自然开发的网站图通常包含独立的判断。通常表示垃圾邮件意图的合成生成的网站图是基于协调判断,引起锚字/二元语法/短语的增长图可能相对尖。
这种尖峰的一种原因可以是增加了来自许多文档的大量相同锚。另一可能性是增加了来自多个文档的故意不同的锚。搜索引擎125可以监视锚并将它们作为计分它们的相关链接所指向的文档的因素。例如,搜索引擎125可以改进可疑锚对相关文档分值的影响。另外,搜索引擎125可以使用合成生成的似然度的连续换算并导出乘法因子来换算用于所述文档的分值。
总的来说,搜索引擎125可以至少部分基于关于与指向文档的一个或多个链接有关的锚文本中的唯一字、二元语法和短语的信息,来生成(或修改)与文档有关的分值。
独立对等体(peer)的连接
根据与本发明的原理相符的实现,可以使用关于独立对等体(例如无关文档)的连接的信息来生成(或修改)与文档有关的分值。
具有到各文档的大量链接的明显独立对等体-输入和/或输出数量的突然增长可以表示潜在虚假网站图,其是试图发送垃圾邮件的指示符。如果增长对应于通常相干或不一致的锚文本,则可以增强该指示。当与基于链接的计分技术一起使用时,能使用该信息来降级这些链接的影响,作为二进制判断项(例如将分值降级固定量)或乘法因子。
总的来说,搜索引擎125可以至少部分基于关于独立对等体的连接的信息,来生成(或修改)与文档有关的分值。
文档主题
根据与本发明的原理相符的实现,可以使用有关文档主题的信息来生成(或修改)与文档有关的分值。例如,搜索引擎125可以执行主题提取(例如通过分目录、URL分析、内容分析、群集、概括、唯一低频字集或一些其他类型的主题提取)。然后,搜索引擎125可以监视随时间文档的主题并将该信息用于计分目的。
与文档有关的主题集随时间的显著变化可以表示文档已经改变所有者和先前文档指示符,诸如分值、锚文本等等不再可靠。类似地,主题数目中的峰值能表示垃圾邮件。例如,如果特定文档与可以视为“稳定的”时间周期上的一个或多个主题集有关,然后与所述文档有关的主题数目中出现(突然)峰值,则这可以是文档已经被取代为“门口”文档的指示。另一指示可以包括与文档有关的初始主题的消失。如果检测到一个或多个这些情形,那么,搜索引擎125可以降低这些文档和/或链接、锚文本或与所述文档有关的其他数据的相对分值。
总的来说,搜索引擎125可以至少部分基于与所述文档有关的一个或多个主题的变化,来生成(或修改)与文档有关的分值。
示例性处理
图4是根据与本发明的原理相符的实现,用于计分文档的示例性处理的流程图。处理可以从服务器120识别文档(动作410)开始。文档可以包括例如与搜索查询有关的一个或多个文档,诸如识别为与搜索查询有关的文档。另外,文档可以包括与任何搜索查询无关的文档资料库或库中的一个或多个文档(例如通过扒网络而识别并存储在库中的文档)。
搜索引擎125可以获得与所识别的文档有关的历史数据(动作420)。如上所述,历史数据可以采用不同形式。例如,历史数据可以包括与文档初始日期有关的数据;文档内容更新/改变;查询分析;基于链接的标准;锚文本;通信量;用户行为;域相关信息;等级历史;用户维护/生成的数据(例如书签和/或喜好);锚文本中的唯一字、二元语法和短语;独立对等体的连接和/或文档主题。搜索引擎125可以获得这些类型的历史数据中的一个或组合。
然后,搜索引擎125可以至少部分基于历史数据来计分所识别的文档(动作430)。当所识别的文档与搜索查询有关时,搜索引擎125可以例如基于它们与搜索查询有多相关,来生成用于所述文档的相关分值。然后,搜索引擎125可以将历史分值与相关分值组合来获得用于所述文档的总分值。代替组合分值,搜索引擎125可以基于历史数据来修改用于所述文档的相关分值,从而提高或降低分值,或在一些情况下,使分值相同。另外,搜索引擎125可以基于历史数据来计分文档,而不生成相关分值。在任一情况下,搜索引擎125可以使用历史数据类型的一个或组合来计分文档。
当所识别的文档与搜索查询有关时,搜索引擎125也可以由计分文档来形成搜索结果。例如,搜索引擎125可以基于它们的分值来排序文档。然后,搜索引擎125可以形成对这些文档的参考,其中,参考可以包括文档的标题(可以包含当选择时,将用户引导到该真正文档的超级链接)以及来自文档的片断(例如文本摘录)。在其他实现中,可以不同地形成参考。搜索引擎125可以将对应于多个高计分文档的参考(例如预定多个文档,具有超出阈值分值的文档,所有文档等等)呈现给提交搜索查询的用户。
结论
与本发明的原理相符的系统和方法可以使用历史数据来计分文档并形成高质量搜索结果。
本发明的优选实施例的上述描述提供示例和描述,但不打算排除或将本发明限制到所公开的具体形式。鉴于上述进行教导,修改和改进是可能的,或可以从实施本发明获得。例如,尽管参考图4描述了一系列动作,但在与本发明的原理相符的其他实现中,可以修改动作顺序。同时,可以并行执行不相关动作。
另外,通常描述服务器120来执行参考图4的处理描述的大部分动作,如果不是全部的话。在与本发明的原理相符的另一实现中,可以由另一实体,诸如另一服务器130和/或140或客户机110来执行一个或多个或所有动作。
对本领域的普通技术人员来说,如上所述的本发明的方面可以以在图中所示的实现中的软件、固件和硬件的许多不同形式实现是显而易见的。用来实现与本发明的原理相符的方面的真正软件代码或专用控制硬件不是本发明的限制。因此,在不参考特定软件代码的情况下,描述这些方面的操作和行为,应理解到本领域的一个普通技术将能基于在此的说明,设计实现这些方面的软件和控制硬件。
Claims (63)
1.一种计分文档的方法,包括:
识别文档;
获得与所述文档有关的一种或多种历史数据;以及
基于一种或多种历史数据,生成用于所述文档的分值。
2.如权利要求1所述的方法,其中,一种或多种历史数据包括和初始日期有关的信息;以及
其中,生成分值包括:
确定对应于所述文档的初始日期;以及
至少部分基于对应于所述文档的初始日期,来计分所述文档。
3.如权利要求2所述的方法,其中,所述文档包括多个文档;以及
其中,计分文档包括:
基于对应于文档的初始日期,确定每一个文档的寿命,
基于文档的寿命,确定文档的平均寿命;以及
至少部分基于文档的寿命和平均寿命之间的差值,来计分文档。
4.如权利要求2所述的方法,其中,生成用于所述文档的分值包括:至少部分基于从对应于所述文档的初始日期测定的逝去时间,来计分文档。
5.如权利要求2所述的方法,其中,对应于所述文档的初始日期是基于下列中的至少一个:搜索引擎首次发现所述文档的日期、搜索引擎首次发现到所述文档的链接的日期以及所述文档至少包括预定数目页的日期。
6.如权利要求1所述的方法,其中,一种或多种历史数据包括和文档内容随时间改变的方式有关的信息;以及
其中,生成分值包括:
确定所述文档的内容随时间改变的频率;以及
至少部分基于所述文档的内容随时间改变的频率,来计分所述文档。
7.如权利要求6所述的方法,其中,所述文档内容的变化频率是基于下列中的至少一个:变化之间的平均时间、一个时间周期中的变化次数、以及当前时间周期中的变化率与先前时间周期中的变化率的比较。
8.如权利要求6所述的方法,其中,生成分值进一步包括:
确定所述文档的内容随时间的变化量;以及
至少部分基于所述文档的内容随时间变化的频率和数量,来计分所述文档。
9.如权利要求8所述的方法,其中,所述文档内容的变化量是基于下列中的至少一个:在一个时间周期内与所述文档有关的新页数、与所述文档有关的新页数和与所述文档有关的总页数的比率、以及在一个时间周期期间已经改变的文档内容的百分比。
10.如权利要求8所述的方法,其中,确定所述文档内容的变化量包括:
基于感知的各部分的重要性,不同地加权所述文档内容的不同部分;以及
将所述文档内容的变化量确定为所述内容的不同加权部分的函数。
11.如权利要求6所述的方法,其中,所述文档包括多个文档;以及
其中,计分所述文档包括:
确定每一个文档的内容最近改变的日期;
基于所确定的文档内容最近改变的日期,来确定改变的平均日期;以及
至少部分基于文档内容最近改变的日期和改变的平均日期之间的差值,来计分文档。
12.如权利要求1所述的方法,其中,一种或多种历史数据包括与文档内容随时间改变的方式有关的信息;以及
其中,生成分值包括:
确定所述文档内容随时间的变化量;以及
至少部分基于所述文档内容随时间的变化量,来计分所述文档。
13.如权利要求12所述的方法,其中,所述文档内容的变化量是基于下列中的至少一个:在一个时间周期内与所述文档有关的新页数、与所述文档有关的新页数和与所述文档有关的总页数的比率、以及在一个时间周期期间已经改变的文档内容的百分比。
14.如权利要求12所述的方法,其中,确定所述文档内容的变化量包括:
基于感知的各部分的重要性,不同地加权所述文档内容的不同部分;以及
将所述文档内容的变化量确定为所述内容的不同加权部分的函数。
15.如权利要求1所述的方法,其中,一种或多种历史数据包括与当所述文档被包括在一个搜索结果集中时选择所述文档的频度有关的信息;以及
其中,生成分值包括:
当所述文档被包括在一个搜索结果集中时,确定随时间所述文档被选择的程度;以及
至少部分基于当所述文档被包括在所述搜索结果集中时随时间所述文档被选择的程度,来计分所述文档。
16.如权利要求15所述的方法,其中,计分所述文档包括:当在一个时间周期上相比于所述搜索结果集中的其他文档所述文档被更经常选择时,向所述文档分配更高分值。
17.如权利要求1所述的方法,其中,一种或多种历史数据包括与随时间越来越多地出现在搜索查询中的搜索项有关的信息;以及
其中,生成分值包括:
确定所述文档是否与搜索项有关;以及
至少部分基于所述文档是否与搜索项有关,来计分所述文档。
18.如权利要求1所述的方法,其中,一种或多种历史数据包括与随时间近似保持恒定但导致随时间改变的结果的查询有关的信息;以及
其中,生成分值包括:
确定所述文档是否与导致随时间改变的结果的查询有关;以及
至少部分基于所述文档是否与导致随时间改变的结果的查询有关,来计分所述文档。
19.如权利要求1所述的方法,其中,一种或多种历史数据包括与文档的过期有关的信息;以及
其中,生成分值包括:
确定所述文档是否过期;以及
至少部分基于所述文档是否过期,来计分所述文档。
20.如权利要求19所述的方法,其中,计分所述文档包括:
当确定所述文档过期时,确定是否认为该过期文档有利于搜索查询;以及
至少部分基于当确定所述文档过期时是否认为该过期文档有利于搜索查询,来计分所述文档。
21.如权利要求20所述的方法,其中,确定是否认为过期文档有利于搜索查询至少部分基于在用于搜索查询的时间上,在最近文档上多常选择过期文档。
22.如权利要求1所述的方法,其中,一种或多种历史数据包括与随时间的链接行为有关的信息;以及
其中,生成分值包括:
确定与所述文档有关的链接行为;以及
至少部分基于与所述文档有关的链接行为,来计分所述文档。
23.如权利要求22所述的方法,其中,链接行为与指向所述文档的一个或多个链接的出现和消失的至少一个有关。
24.如权利要求23所述的方法,其中,一个或多个链接的出现与下列中的至少一个有关:出现到所述文档的新链接的日期、一个或多个链接随时间出现的速率、以及在一个时间周期期间出现的一个或多个链接的数量,以及一个或多个链接的消失与到所述文档的现有链接消失的日期、一个或多个链接随时间消失的速率、以及在一个时间周期期间消失的一个或多个链接的数量的至少一个有关。
25.如权利要求22所述的方法,其中,确定与所述文档有关的链接的行为包括监视下列中的至少一个:与所述文档有关的链接的时间变化行为、在一个时间周期期间出现或消失多少与所述文档有关的链接、以及与所述文档有关的现有链接的消失相比是否存在倾向出现与所述文档有关的新链接。
26.如权利要求1所述的方法,其中,一种或多种历史数据包括与链接的新鲜度有关的信息;
其中,生成分值包括:
确定与所述文档有关的链接的新鲜度;
基于所确定的新鲜度,向链接分配权重;以及
至少部分基于分配给与所述文档有关的链接的权重,来计分所述文档。
27.如权利要求26所述的方法,其中,与所述文档有关的链接的新鲜度是基于下列中的至少一个:链接出现的日期、链接变化的日期、与该链接有关的锚文本的出现日期、与该链接有关的锚文本变化的日期、包含该链接的链接文档出现的日期以及包含该链接的链接文档变化的日期。
28.如权利要求26所述的方法,其中,分配给链接的权重是基于下列中的至少一个:包含该链接的文档被信任多少、包含该链接的文档有多权威、以及包含该链接的文档的新鲜度。
29.如权利要求26所述的方法,其中,计分文档包括:
确定指向所述文档的每个链接的寿命;
基于链接的寿命,来确定与链接有关的寿命分布;以及
至少部分基于与链接有关的寿命分布,来计分文档。
30.如权利要求1所述的方法,其中,一种或多种历史数据包括与锚文本随时间改变的方式有关的信息;以及
其中,生成分值包括:
识别与到所述文档的链接有关的锚文本的变化;以及
至少部分基于与到所述文档的链接有关的锚文本的变化,计分所述文档。
31.如权利要求1所述的方法,其中,一种或多种历史数据包括与文档和与到所述文档的链接有关的锚文本中的差异有关的信息;以及
其中,生成分值包括:
确定文档内容是否改变使得所述内容不同于与到所述文档的一个或多个链接有关的锚文本;以及
至少部分基于所述文档的内容是否改变使得所述内容不同于与到所述文档的一个或多个链接有关的锚文本,来计分所述文档。
32.如权利要求1所述的方法,其中,一种或多种历史数据包括与锚文本的新鲜度有关的信息;以及
其中,生成分值包括:
确定与到所述文档的一个或多个链接有关的锚文本的新鲜度;以及
至少部分基于与到所述文档的一个或多个链接有关的锚文本的新鲜度,来计分所述文档。
33.如权利要求32所述的方法,其中,与到所述文档的链接有关的锚文本的新鲜度是基于下列中的至少一个:锚文本的出现日期、锚文本的改变日期、与锚文本有关的链接的出现日期、与锚文本有关的链接的改变日期、所述文档的出现日期和所述文档的改变日期。
34.如权利要求1所述的方法,其中,一种或多种历史数据包括和与文档有关的通信量有关的信息;以及
其中,生成分值包括:
确定与文档有关的通信量的特性;以及
至少部分基于与所述文档有关的通信量的特性,来计分所述文档。
35.如权利要求34所述的方法,其中,确定与所述文档有关的通信量的特性包括:分析与所述文档有关的通信量模式以便识别通信量模式随时间的变化。
36.如权利要求1所述的方法,其中,一种或多种历史数据包括和与文档有关的用户行为有关的信息;以及
其中,生成分值包括:
确定与文档有关的用户行为;以及
至少部分基于与文档有关的用户行为,来计分所述文档。
37.如权利要求36所述的方法,其中,用户行为与在搜索结果集内文档被选择的次数以及一个或多个用户访问所述文档所花费的时间量中的至少一个有关。
38.如权利要求1所述的方法,其中,一种或多种历史数据包括对应于与文档有关的域的域相关信息;以及
其中,生成分值包括:
分析对应于与文档有关的域随时间的域相关信息;以及
至少部分基于分析结果,来计分所述文档。
39.如权利要求38所述的方法,其中,计分所述文档包括:
确定与所述文档有关的域是否合法;以及
至少部分基于与所述文档有关的域是否合法,来计分所述文档。
40.如权利要求38所述的方法,其中,域相关信息与下列中的至少一个有关:域的届满日期、与域有关的域名服务器记录、以及与域有关的名称服务器。
41.如权利要求1所述的方法,其中,一种或多种历史数据包括与文档的先前等级历史有关的信息;以及
其中,生成分值包括:
确定所述文档的先前等级历史;以及
至少部分基于所述文档的先前等级历史,来计分所述文档。
42.如权利要求41所述的方法,其中,计分所述文档包括:
确定在一个时间周期上所述文档在等级方面移动的数量或速率;以及
至少部分基于所述文档在等级方面移动的数量或速率,来计分所述文档。
43.如权利要求41所述的方法,其中,先前等级历史是基于下列中的至少一个:随时间所述文档被选择为搜索结果的查询数量、随时间所述文档被选择为搜索结果的速率、季节性、突发性以及对URL查询对,分值随时间的变化。
44.如权利要求41所述的方法,其中,确定文档的先前等级历史包括监视随时间文档等级的等级峰值。
45.如权利要求1所述的方法,其中,一种或多种历史数据包括与用户维护或生成的数据有关的信息;以及
其中,生成分值包括:
确定用户维护或生成的数据是否表示用户对所述文档感兴趣;以及
至少部分基于用户维护或生成的数据是否表示用户对所述文档感兴趣,来计分所述文档。
46.如权利要求45所述的方法,其中,用户维护或生成的数据与下列中的至少一个有关:与一个或多个用户有关的喜好列表、书签、临时文件和缓冲文件。
47.如权利要求45所述的方法,其中,计分所述文档包括:
分析随时间用户维护或生成的数据,来识别下列中的至少一个:增加或移出文档的趋势、所述文档增加到用户维护或生成的数据或从中移出的速率、以及所述文档是增加到用户维护或生成的数据、从用户维护或生成的数据删除还是通过用户维护或生成数据被访问;以及
至少部分基于分析结果,来计分所述文档。
48.如权利要求1所述的方法,其中,一种或多种历史数据包括与锚文本的增长图有关的信息;以及
其中,生成分值包括:
确定与到所述文档的一个或多个链接有关的锚文本的增长图;以及
至少部分基于与到所述文档的一个或多个链接有关的锚文本的增长图,来计分所述文档。
49.如权利要求1所述的方法,其中,一种或多种历史数据包括与独立对等体的连接有关的信息;以及
其中,生成分值包括:
确定包括所述文档的独立对等体的数量增长;以及
至少部分基于独立对等体的数量,来计分所述文档。
50.如权利要求1所述的方法,其中,一种或多种历史数据包括与文档主题有关的信息;以及
其中,生成分值包括:
执行与所述文档有关的主题提取;
监视文档主题随时间的变化;以及
至少部分基于文档主题的变化,来计分所述文档。
51.如权利要求1所述的方法,进一步包括:
获得搜索查询,其中,将所识别的文档识别为与该搜索查询有关;以及
基于所述文档与搜索查询有多相关,生成用于所述文档的相关分值;以及
其中,生成用于所述文档的分值至少部分基于一种或多种历史数据和相关分值。
52.一种用于计分文档的系统,包括:
用于识别文档的装置;
用于获得与所述文档有关的多种历史数据的装置;以及
用于至少部分基于多种历史数据,来生成用于所述文档的分值的装置。
53.一种用于计分文档的系统,包括:
历史部件,配置成获得与文档有关的一种或多种历史数据;以及
等级部件,配置成:
至少部分基于一种或多种历史数据,来生成用于所述文档的分值。
54.一种用于分级所链接的文档的方法,包括:
获得与所链接的文档有关的连接数据的寿命;以及
基于连接数据的寿命的衰减函数,来分级链接的文档。
55.如权利要求54所述的方法,其中,连接数据包括至少一个链接。
56.如权利要求54所述的方法,其中,连接数据包括锚文本。
57.如权利要求54所述的方法,其中,连接数据包括至少部分基于由一个或多个链接文档提供的与所链接的文档有关的链接和锚文本的等级。
58.如权利要求57所述的方法,进一步包括:
确定连接数据的寿命;
导出用于提供该连接数据的链接文档的内容更新的表示;以及
基于连接数据的寿命和用于该链接文档的内容更新的表示,来调整所链接的文档的等级。
59.如权利要求58所述的方法,其中,调整等级包括:如果寿命表示该连接数据的短寿命,则降低所述等级,以及如果寿命表示该连接数据的长寿命,则提高所述等级。
60.如权利要求59所述的方法,其中,调整等级进一步包括:如果认为来自链接文档的至少部分内容在一个时间周期上过期,则降低所述等级,以及如果认为来自链接文档的部分内容在所述时间周期上被更新,则提高所述等级。
61.如权利要求54所述的方法,进一步包括:
确定用于提供连接数据的链接文档的链接流入流出的表示;以及
基于该链接流失,来调整所链接的文档的等级。
62.如权利要求61所述的方法,其中,链接流入流出的表示被计算为由链接文档提供的一个或多个链接随时间改变的程度的函数。
63.如权利要求62所述的方法,其中,调整等级包括:如果链接流入流出高于阈值,则降低所述等级。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US50761703P | 2003-09-30 | 2003-09-30 | |
US60/507,617 | 2003-09-30 | ||
US10/748,664 | 2003-12-31 | ||
US10/748,664 US7346839B2 (en) | 2003-09-30 | 2003-12-31 | Information retrieval based on historical data |
PCT/US2004/030000 WO2005033978A1 (en) | 2003-09-30 | 2004-09-15 | Information retrieval based on historical data |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1879107A true CN1879107A (zh) | 2006-12-13 |
CN1879107B CN1879107B (zh) | 2014-10-15 |
Family
ID=34381362
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200480033254.8A Active CN1879107B (zh) | 2003-09-30 | 2004-09-15 | 基于历史数据的信息检索 |
Country Status (8)
Country | Link |
---|---|
US (19) | US7346839B2 (zh) |
EP (5) | EP2416263A3 (zh) |
JP (3) | JP2007507798A (zh) |
CN (1) | CN1879107B (zh) |
AU (1) | AU2004277678C1 (zh) |
CA (2) | CA2540573C (zh) |
DE (2) | DE202004021885U1 (zh) |
WO (1) | WO2005033978A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100514337C (zh) * | 2007-09-10 | 2009-07-15 | 腾讯科技(深圳)有限公司 | 关键词的联想信息生成系统和生成方法 |
CN104778202A (zh) * | 2015-02-05 | 2015-07-15 | 北京航空航天大学 | 基于关键词的事件演化过程的分析方法及系统 |
CN105247481A (zh) * | 2013-05-29 | 2016-01-13 | 惠普发展公司,有限责任合伙企业 | 网页输出选择 |
CN107622090A (zh) * | 2017-08-22 | 2018-01-23 | 上海艾融软件股份有限公司 | 对象的获取方法、装置及系统 |
CN112783837A (zh) * | 2021-01-12 | 2021-05-11 | 北京首汽智行科技有限公司 | 一种api文档查找方法 |
Families Citing this family (534)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7398271B1 (en) * | 2001-04-16 | 2008-07-08 | Yahoo! Inc. | Using network traffic logs for search enhancement |
US7124353B2 (en) | 2002-01-14 | 2006-10-17 | International Business Machines Corporation | System and method for calculating a user affinity |
US8590013B2 (en) | 2002-02-25 | 2013-11-19 | C. S. Lee Crawford | Method of managing and communicating data pertaining to software applications for processor-based devices comprising wireless communication circuitry |
US7693830B2 (en) | 2005-08-10 | 2010-04-06 | Google Inc. | Programmable search engine |
US7743045B2 (en) * | 2005-08-10 | 2010-06-22 | Google Inc. | Detecting spam related and biased contexts for programmable search engines |
US7716199B2 (en) | 2005-08-10 | 2010-05-11 | Google Inc. | Aggregating context data for programmable search engines |
US20070038614A1 (en) * | 2005-08-10 | 2007-02-15 | Guha Ramanathan V | Generating and presenting advertisements based on context data for programmable search engines |
US7130844B2 (en) * | 2002-10-31 | 2006-10-31 | International Business Machines Corporation | System and method for examining, calculating the age of an document collection as a measure of time since creation, visualizing, identifying selectively reference those document collections representing current activity |
US8042112B1 (en) | 2003-07-03 | 2011-10-18 | Google Inc. | Scheduler for search engine crawler |
US7725452B1 (en) | 2003-07-03 | 2010-05-25 | Google Inc. | Scheduler for search engine crawler |
US8548995B1 (en) * | 2003-09-10 | 2013-10-01 | Google Inc. | Ranking of documents based on analysis of related documents |
US7505964B2 (en) | 2003-09-12 | 2009-03-17 | Google Inc. | Methods and systems for improving a search ranking using related queries |
US7797316B2 (en) | 2003-09-30 | 2010-09-14 | Google Inc. | Systems and methods for determining document freshness |
US7346839B2 (en) | 2003-09-30 | 2008-03-18 | Google Inc. | Information retrieval based on historical data |
US7693827B2 (en) * | 2003-09-30 | 2010-04-06 | Google Inc. | Personalization of placed content ordering in search results |
US7231399B1 (en) | 2003-11-14 | 2007-06-12 | Google Inc. | Ranking documents based on large data sets |
US8521725B1 (en) | 2003-12-03 | 2013-08-27 | Google Inc. | Systems and methods for improved searching |
US8676790B1 (en) | 2003-12-05 | 2014-03-18 | Google Inc. | Methods and systems for improving search rankings using advertising data |
US7302645B1 (en) | 2003-12-10 | 2007-11-27 | Google Inc. | Methods and systems for identifying manipulated articles |
US7548968B1 (en) | 2003-12-10 | 2009-06-16 | Markmonitor Inc. | Policing internet domains |
US8655727B2 (en) | 2003-12-30 | 2014-02-18 | Amazon Technologies, Inc. | Method and system for generating and placing keyword-targeted advertisements |
US20050149388A1 (en) * | 2003-12-30 | 2005-07-07 | Scholl Nathaniel B. | Method and system for placing advertisements based on selection of links that are not prominently displayed |
US7676553B1 (en) * | 2003-12-31 | 2010-03-09 | Microsoft Corporation | Incremental web crawler using chunks |
US7461089B2 (en) * | 2004-01-08 | 2008-12-02 | International Business Machines Corporation | Method and system for creating profiling indices |
US8010459B2 (en) * | 2004-01-21 | 2011-08-30 | Google Inc. | Methods and systems for rating associated members in a social network |
US8577893B1 (en) * | 2004-03-15 | 2013-11-05 | Google Inc. | Ranking based on reference contexts |
US9104689B2 (en) * | 2004-03-17 | 2015-08-11 | International Business Machines Corporation | Method for synchronizing documents for disconnected operation |
US7584221B2 (en) * | 2004-03-18 | 2009-09-01 | Microsoft Corporation | Field weighting in text searching |
US7536382B2 (en) * | 2004-03-31 | 2009-05-19 | Google Inc. | Query rewriting with entity detection |
US7539674B2 (en) * | 2004-04-08 | 2009-05-26 | Yahoo! Inc. | Systems and methods for adaptive scheduling of references to documents |
US20050234877A1 (en) * | 2004-04-08 | 2005-10-20 | Yu Philip S | System and method for searching using a temporal dimension |
US20050246391A1 (en) * | 2004-04-29 | 2005-11-03 | Gross John N | System & method for monitoring web pages |
US20050246358A1 (en) * | 2004-04-29 | 2005-11-03 | Gross John N | System & method of identifying and predicting innovation dissemination |
US20060010029A1 (en) * | 2004-04-29 | 2006-01-12 | Gross John N | System & method for online advertising |
US20050256848A1 (en) * | 2004-05-13 | 2005-11-17 | International Business Machines Corporation | System and method for user rank search |
US7260573B1 (en) * | 2004-05-17 | 2007-08-21 | Google Inc. | Personalizing anchor text scores in a search engine |
US8019875B1 (en) | 2004-06-04 | 2011-09-13 | Google Inc. | Systems and methods for indicating a user state in a social network |
JP4254623B2 (ja) * | 2004-06-09 | 2009-04-15 | 日本電気株式会社 | トピック分析方法及びその装置並びにプログラム |
US7716225B1 (en) | 2004-06-17 | 2010-05-11 | Google Inc. | Ranking documents based on user behavior and/or feature data |
US7565445B2 (en) | 2004-06-18 | 2009-07-21 | Fortinet, Inc. | Systems and methods for categorizing network traffic content |
US8832132B1 (en) | 2004-06-22 | 2014-09-09 | Google Inc. | Personalizing search queries based on user membership in social network communities |
US7783639B1 (en) | 2004-06-30 | 2010-08-24 | Google Inc. | Determining quality of linked documents |
US8621215B1 (en) | 2004-06-30 | 2013-12-31 | Google Inc. | Methods and systems for creating monetary accounts for members in a social network |
US8078607B2 (en) * | 2006-03-30 | 2011-12-13 | Google Inc. | Generating website profiles based on queries from webistes and user activities on the search results |
US8620915B1 (en) | 2007-03-13 | 2013-12-31 | Google Inc. | Systems and methods for promoting personalized search results based on personal information |
US20060020583A1 (en) * | 2004-07-23 | 2006-01-26 | Baranov Alexey V | System and method for searching and retrieving documents by their descriptions |
US7567959B2 (en) | 2004-07-26 | 2009-07-28 | Google Inc. | Multiple index based information retrieval system |
US7702618B1 (en) | 2004-07-26 | 2010-04-20 | Google Inc. | Information retrieval system for archiving multiple document versions |
US7580921B2 (en) | 2004-07-26 | 2009-08-25 | Google Inc. | Phrase identification in an information retrieval system |
US7711679B2 (en) | 2004-07-26 | 2010-05-04 | Google Inc. | Phrase-based detection of duplicate documents in an information retrieval system |
US8015019B1 (en) | 2004-08-03 | 2011-09-06 | Google Inc. | Methods and systems for providing a document |
US7752200B2 (en) | 2004-08-09 | 2010-07-06 | Amazon Technologies, Inc. | Method and system for identifying keywords for use in placing keyword-targeted advertisements |
JP2006065395A (ja) * | 2004-08-24 | 2006-03-09 | Fujitsu Ltd | ハイパーリンク生成装置、ハイパーリンク生成方法及びハイパーリンク生成プログラム |
US7987172B1 (en) | 2004-08-30 | 2011-07-26 | Google Inc. | Minimizing visibility of stale content in web searching including revising web crawl intervals of documents |
US7606793B2 (en) * | 2004-09-27 | 2009-10-20 | Microsoft Corporation | System and method for scoping searches using index keys |
US8065296B1 (en) * | 2004-09-29 | 2011-11-22 | Google Inc. | Systems and methods for determining a quality of provided items |
US7761448B2 (en) * | 2004-09-30 | 2010-07-20 | Microsoft Corporation | System and method for ranking search results using click distance |
US20060069675A1 (en) * | 2004-09-30 | 2006-03-30 | Ogilvie John W | Search tools and techniques |
US8056128B1 (en) | 2004-09-30 | 2011-11-08 | Google Inc. | Systems and methods for detecting potential communications fraud |
US7739277B2 (en) * | 2004-09-30 | 2010-06-15 | Microsoft Corporation | System and method for incorporating anchor text into ranking search results |
US7827181B2 (en) * | 2004-09-30 | 2010-11-02 | Microsoft Corporation | Click distance determination |
US11283885B2 (en) | 2004-10-19 | 2022-03-22 | Verizon Patent And Licensing Inc. | System and method for location based matching and promotion |
JP2006146873A (ja) * | 2004-10-22 | 2006-06-08 | Canon Inc | データ検索方法、装置及びプログラム |
US20060095841A1 (en) * | 2004-10-28 | 2006-05-04 | Microsoft Corporation | Methods and apparatus for document management |
US7533092B2 (en) * | 2004-10-28 | 2009-05-12 | Yahoo! Inc. | Link-based spam detection |
US20080028443A1 (en) * | 2004-10-29 | 2008-01-31 | The Go Daddy Group, Inc. | Domain name related reputation and secure certificates |
US7797413B2 (en) * | 2004-10-29 | 2010-09-14 | The Go Daddy Group, Inc. | Digital identity registration |
US8904040B2 (en) * | 2004-10-29 | 2014-12-02 | Go Daddy Operating Company, LLC | Digital identity validation |
US20060200487A1 (en) * | 2004-10-29 | 2006-09-07 | The Go Daddy Group, Inc. | Domain name related reputation and secure certificates |
US9015263B2 (en) | 2004-10-29 | 2015-04-21 | Go Daddy Operating Company, LLC | Domain name searching with reputation rating |
US7970858B2 (en) * | 2004-10-29 | 2011-06-28 | The Go Daddy Group, Inc. | Presenting search engine results based on domain name related reputation |
US20060095404A1 (en) * | 2004-10-29 | 2006-05-04 | The Go Daddy Group, Inc | Presenting search engine results based on domain name related reputation |
US20080028100A1 (en) * | 2004-10-29 | 2008-01-31 | The Go Daddy Group, Inc. | Tracking domain name related reputation |
US20080022013A1 (en) * | 2004-10-29 | 2008-01-24 | The Go Daddy Group, Inc. | Publishing domain name related reputation in whois records |
US8117339B2 (en) * | 2004-10-29 | 2012-02-14 | Go Daddy Operating Company, LLC | Tracking domain name related reputation |
US20060095459A1 (en) * | 2004-10-29 | 2006-05-04 | Warren Adelman | Publishing domain name related reputation in whois records |
US7716206B2 (en) * | 2004-11-01 | 2010-05-11 | At&T Intellectual Property I, L.P. | Communication networks and methods and computer program products for performing searches thereon while maintaining user privacy |
US7584194B2 (en) * | 2004-11-22 | 2009-09-01 | Truveo, Inc. | Method and apparatus for an application crawler |
CN101443751A (zh) | 2004-11-22 | 2009-05-27 | 特鲁维奥公司 | 用于应用爬取器的方法和装置 |
WO2006055983A2 (en) * | 2004-11-22 | 2006-05-26 | Truveo, Inc. | Method and apparatus for a ranking engine |
US20060112089A1 (en) * | 2004-11-22 | 2006-05-25 | International Business Machines Corporation | Methods and apparatus for assessing web page decay |
US8874570B1 (en) | 2004-11-30 | 2014-10-28 | Google Inc. | Search boost vector based on co-visitation information |
US7801723B2 (en) * | 2004-11-30 | 2010-09-21 | Palo Alto Research Center Incorporated | Systems and methods for user-interest sensitive condensation |
US7827029B2 (en) * | 2004-11-30 | 2010-11-02 | Palo Alto Research Center Incorporated | Systems and methods for user-interest sensitive note-taking |
US20060122957A1 (en) * | 2004-12-03 | 2006-06-08 | Johnny Chen | Method and system to detect e-mail spam using concept categorization of linked content |
US7401077B2 (en) * | 2004-12-21 | 2008-07-15 | Palo Alto Research Center Incorporated | Systems and methods for using and constructing user-interest sensitive indicators of search results |
US7716198B2 (en) * | 2004-12-21 | 2010-05-11 | Microsoft Corporation | Ranking search results using feature extraction |
JP4344339B2 (ja) * | 2004-12-24 | 2009-10-14 | 日本電信電話株式会社 | 情報評価装置、コンテンツ検索装置、情報評価方法、コンテンツ検索方法、それらのプログラム及び記録媒体 |
US8538970B1 (en) | 2004-12-30 | 2013-09-17 | Google Inc. | Personalizing search results |
US20060149710A1 (en) * | 2004-12-30 | 2006-07-06 | Ross Koningstein | Associating features with entities, such as categories of web page documents, and/or weighting such features |
US10402457B1 (en) | 2004-12-31 | 2019-09-03 | Google Llc | Methods and systems for correlating connections between users and links between articles |
US8060405B1 (en) | 2004-12-31 | 2011-11-15 | Google Inc. | Methods and systems for correlating connections between users and links between articles |
US8230422B2 (en) * | 2005-01-13 | 2012-07-24 | International Business Machines Corporation | Assist thread for injecting cache memory in a microprocessor |
US20060161520A1 (en) * | 2005-01-14 | 2006-07-20 | Microsoft Corporation | System and method for generating alternative search terms |
US20050125451A1 (en) * | 2005-02-10 | 2005-06-09 | The Go Daddy Group, Inc. | Search engine and domain name search integration |
US7792833B2 (en) * | 2005-03-03 | 2010-09-07 | Microsoft Corporation | Ranking search results using language types |
US20060200460A1 (en) * | 2005-03-03 | 2006-09-07 | Microsoft Corporation | System and method for ranking search results using file types |
US7657520B2 (en) * | 2005-03-03 | 2010-02-02 | Google, Inc. | Providing history and transaction volume information of a content source to users |
US8538810B2 (en) * | 2005-03-29 | 2013-09-17 | Google Inc. | Methods and systems for member-created advertisement in a member network |
US8412780B2 (en) * | 2005-03-30 | 2013-04-02 | Google Inc. | Methods and systems for providing current email addresses and contact information for members within a social network |
US20060224583A1 (en) * | 2005-03-31 | 2006-10-05 | Google, Inc. | Systems and methods for analyzing a user's web history |
US20060224608A1 (en) * | 2005-03-31 | 2006-10-05 | Google, Inc. | Systems and methods for combining sets of favorites |
US9256685B2 (en) * | 2005-03-31 | 2016-02-09 | Google Inc. | Systems and methods for modifying search results based on a user's history |
US20060235842A1 (en) * | 2005-04-14 | 2006-10-19 | International Business Machines Corporation | Web page ranking for page query across public and private |
WO2006113644A2 (en) * | 2005-04-18 | 2006-10-26 | Collage Analytics Llc | System and method for efficiently tracking and dating content in very large dynamic document spaces |
US8732175B2 (en) | 2005-04-21 | 2014-05-20 | Yahoo! Inc. | Interestingness ranking of media objects |
US7660792B2 (en) * | 2005-04-29 | 2010-02-09 | Microsoft Corporation | System and method for spam identification |
US7403767B2 (en) * | 2005-04-29 | 2008-07-22 | Siemens Aktiengesellschaft | Cellular telephone network with record keeping for missed calls |
US8438499B2 (en) | 2005-05-03 | 2013-05-07 | Mcafee, Inc. | Indicating website reputations during user interactions |
US7765481B2 (en) | 2005-05-03 | 2010-07-27 | Mcafee, Inc. | Indicating website reputations during an electronic commerce transaction |
US9384345B2 (en) | 2005-05-03 | 2016-07-05 | Mcafee, Inc. | Providing alternative web content based on website reputation assessment |
US7562304B2 (en) | 2005-05-03 | 2009-07-14 | Mcafee, Inc. | Indicating website reputations during website manipulation of user information |
US8566726B2 (en) | 2005-05-03 | 2013-10-22 | Mcafee, Inc. | Indicating website reputations based on website handling of personal information |
US7822620B2 (en) | 2005-05-03 | 2010-10-26 | Mcafee, Inc. | Determining website reputations using automatic testing |
US20060253423A1 (en) * | 2005-05-07 | 2006-11-09 | Mclane Mark | Information retrieval system and method |
US7630976B2 (en) * | 2005-05-10 | 2009-12-08 | Microsoft Corporation | Method and system for adapting search results to personal information needs |
US7962462B1 (en) * | 2005-05-31 | 2011-06-14 | Google Inc. | Deriving and using document and site quality signals from search query streams |
JP2006350954A (ja) * | 2005-06-20 | 2006-12-28 | Chugoku Electric Power Co Inc:The | 電柱管理システム |
US7788132B2 (en) * | 2005-06-29 | 2010-08-31 | Google, Inc. | Reviewing the suitability of Websites for participation in an advertising network |
US8244722B1 (en) * | 2005-06-30 | 2012-08-14 | Google Inc. | Ranking documents |
US8195654B1 (en) | 2005-07-13 | 2012-06-05 | Google Inc. | Prediction of human ratings or rankings of information retrieval quality |
US20070022385A1 (en) * | 2005-07-20 | 2007-01-25 | Mikhail Denissov | Software module, method and system for managing information items by bookmarking information items through activation of said items |
US7599917B2 (en) * | 2005-08-15 | 2009-10-06 | Microsoft Corporation | Ranking search results using biased click distance |
US7831582B1 (en) * | 2005-08-23 | 2010-11-09 | Amazon Technologies, Inc. | Method and system for associating keywords with online content sources |
KR100644159B1 (ko) | 2005-09-05 | 2006-11-10 | 엔에이치엔(주) | 검색 컨트롤러 제어 방법 및 그 장치 |
US8099674B2 (en) | 2005-09-09 | 2012-01-17 | Tableau Software Llc | Computer systems and methods for automatically viewing multidimensional databases |
US8244720B2 (en) * | 2005-09-13 | 2012-08-14 | Google Inc. | Ranking blog documents |
US8615719B2 (en) | 2005-09-14 | 2013-12-24 | Jumptap, Inc. | Managing sponsored content for delivery to mobile communication facilities |
US8229914B2 (en) | 2005-09-14 | 2012-07-24 | Jumptap, Inc. | Mobile content spidering and compatibility determination |
US8433297B2 (en) | 2005-11-05 | 2013-04-30 | Jumptag, Inc. | System for targeting advertising content to a plurality of mobile communication facilities |
US20070073718A1 (en) * | 2005-09-14 | 2007-03-29 | Jorey Ramer | Mobile search service instant activation |
US20080214152A1 (en) * | 2005-09-14 | 2008-09-04 | Jorey Ramer | Methods and systems of mobile dynamic content presentation |
US8195133B2 (en) | 2005-09-14 | 2012-06-05 | Jumptap, Inc. | Mobile dynamic advertisement creation and placement |
US20070100805A1 (en) * | 2005-09-14 | 2007-05-03 | Jorey Ramer | Mobile content cross-inventory yield optimization |
US20070060114A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Predictive text completion for a mobile communication facility |
US10592930B2 (en) | 2005-09-14 | 2020-03-17 | Millenial Media, LLC | Syndication of a behavioral profile using a monetization platform |
US20070061242A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Implicit searching for mobile content |
US20070100653A1 (en) * | 2005-11-01 | 2007-05-03 | Jorey Ramer | Mobile website analyzer |
US7603360B2 (en) * | 2005-09-14 | 2009-10-13 | Jumptap, Inc. | Location influenced search results |
US9076175B2 (en) | 2005-09-14 | 2015-07-07 | Millennial Media, Inc. | Mobile comparison shopping |
US8027879B2 (en) * | 2005-11-05 | 2011-09-27 | Jumptap, Inc. | Exclusivity bidding for mobile sponsored content |
US9058406B2 (en) | 2005-09-14 | 2015-06-16 | Millennial Media, Inc. | Management of multiple advertising inventories using a monetization platform |
US8311888B2 (en) | 2005-09-14 | 2012-11-13 | Jumptap, Inc. | Revenue models associated with syndication of a behavioral profile using a monetization platform |
US20080270220A1 (en) * | 2005-11-05 | 2008-10-30 | Jorey Ramer | Embedding a nonsponsored mobile content within a sponsored mobile content |
US20070100651A1 (en) * | 2005-11-01 | 2007-05-03 | Jorey Ramer | Mobile payment facilitation |
US20070061246A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Mobile campaign creation |
US9471925B2 (en) * | 2005-09-14 | 2016-10-18 | Millennial Media Llc | Increasing mobile interactivity |
US20070100652A1 (en) * | 2005-11-01 | 2007-05-03 | Jorey Ramer | Mobile pay per call |
US20070192318A1 (en) * | 2005-09-14 | 2007-08-16 | Jorey Ramer | Creation of a mobile search suggestion dictionary |
US8156128B2 (en) | 2005-09-14 | 2012-04-10 | Jumptap, Inc. | Contextual mobile content placement on a mobile communication facility |
US20110313853A1 (en) | 2005-09-14 | 2011-12-22 | Jorey Ramer | System for targeting advertising content to a plurality of mobile communication facilities |
US7912458B2 (en) | 2005-09-14 | 2011-03-22 | Jumptap, Inc. | Interaction analysis and prioritization of mobile content |
US8103545B2 (en) | 2005-09-14 | 2012-01-24 | Jumptap, Inc. | Managing payment for sponsored content presented to mobile communication facilities |
US7769764B2 (en) * | 2005-09-14 | 2010-08-03 | Jumptap, Inc. | Mobile advertisement syndication |
US20080214155A1 (en) * | 2005-11-01 | 2008-09-04 | Jorey Ramer | Integrating subscription content into mobile search results |
US8832100B2 (en) * | 2005-09-14 | 2014-09-09 | Millennial Media, Inc. | User transaction history influenced search results |
US10911894B2 (en) | 2005-09-14 | 2021-02-02 | Verizon Media Inc. | Use of dynamic content generation parameters based on previous performance of those parameters |
US10038756B2 (en) | 2005-09-14 | 2018-07-31 | Millenial Media LLC | Managing sponsored content based on device characteristics |
US20070100806A1 (en) * | 2005-11-01 | 2007-05-03 | Jorey Ramer | Client libraries for mobile content |
US20070073722A1 (en) * | 2005-09-14 | 2007-03-29 | Jorey Ramer | Calculation and presentation of mobile content expected value |
US8302030B2 (en) | 2005-09-14 | 2012-10-30 | Jumptap, Inc. | Management of multiple advertising inventories using a monetization platform |
US20070061245A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Location based presentation of mobile content |
US20070060109A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Managing sponsored content based on user characteristics |
US8660891B2 (en) | 2005-11-01 | 2014-02-25 | Millennial Media | Interactive mobile advertisement banners |
US20080214204A1 (en) * | 2005-11-01 | 2008-09-04 | Jorey Ramer | Similarity based location mapping of mobile comm facility users |
US20070168354A1 (en) * | 2005-11-01 | 2007-07-19 | Jorey Ramer | Combined algorithmic and editorial-reviewed mobile content search results |
US8805339B2 (en) | 2005-09-14 | 2014-08-12 | Millennial Media, Inc. | Categorization of a mobile user profile based on browse and viewing behavior |
US20070061247A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Expected value and prioritization of mobile content |
US8812526B2 (en) | 2005-09-14 | 2014-08-19 | Millennial Media, Inc. | Mobile content cross-inventory yield optimization |
US20070073717A1 (en) * | 2005-09-14 | 2007-03-29 | Jorey Ramer | Mobile comparison shopping |
US7860871B2 (en) | 2005-09-14 | 2010-12-28 | Jumptap, Inc. | User history influenced search results |
US20070100650A1 (en) * | 2005-09-14 | 2007-05-03 | Jorey Ramer | Action functionality for mobile content search results |
US20080215623A1 (en) * | 2005-09-14 | 2008-09-04 | Jorey Ramer | Mobile communication facility usage and social network creation |
US9703892B2 (en) | 2005-09-14 | 2017-07-11 | Millennial Media Llc | Predictive text completion for a mobile communication facility |
US7577665B2 (en) | 2005-09-14 | 2009-08-18 | Jumptap, Inc. | User characteristic influenced search results |
US20080214154A1 (en) * | 2005-11-01 | 2008-09-04 | Jorey Ramer | Associating mobile and non mobile web content |
US8364521B2 (en) * | 2005-09-14 | 2013-01-29 | Jumptap, Inc. | Rendering targeted advertisement on mobile communication facilities |
US8209344B2 (en) | 2005-09-14 | 2012-06-26 | Jumptap, Inc. | Embedding sponsored content in mobile applications |
US8666376B2 (en) * | 2005-09-14 | 2014-03-04 | Millennial Media | Location based mobile shopping affinity program |
US8819659B2 (en) | 2005-09-14 | 2014-08-26 | Millennial Media, Inc. | Mobile search service instant activation |
US20070288427A1 (en) * | 2005-09-14 | 2007-12-13 | Jorey Ramer | Mobile pay-per-call campaign creation |
US20080214153A1 (en) * | 2005-09-14 | 2008-09-04 | Jorey Ramer | Mobile User Profile Creation based on User Browse Behaviors |
US8503995B2 (en) | 2005-09-14 | 2013-08-06 | Jumptap, Inc. | Mobile dynamic advertisement creation and placement |
US9201979B2 (en) | 2005-09-14 | 2015-12-01 | Millennial Media, Inc. | Syndication of a behavioral profile associated with an availability condition using a monetization platform |
US7660581B2 (en) | 2005-09-14 | 2010-02-09 | Jumptap, Inc. | Managing sponsored content based on usage history |
US8131271B2 (en) | 2005-11-05 | 2012-03-06 | Jumptap, Inc. | Categorization of a mobile user profile based on browse behavior |
US8688671B2 (en) | 2005-09-14 | 2014-04-01 | Millennial Media | Managing sponsored content based on geographic region |
US20070073719A1 (en) * | 2005-09-14 | 2007-03-29 | Jorey Ramer | Physical navigation of a mobile search application |
US20070060173A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Managing sponsored content based on transaction history |
US7676394B2 (en) | 2005-09-14 | 2010-03-09 | Jumptap, Inc. | Dynamic bidding and expected value |
US8989718B2 (en) | 2005-09-14 | 2015-03-24 | Millennial Media, Inc. | Idle screen advertising |
US20080214151A1 (en) * | 2005-09-14 | 2008-09-04 | Jorey Ramer | Methods and systems for mobile coupon placement |
US20070239724A1 (en) * | 2005-09-14 | 2007-10-11 | Jorey Ramer | Mobile search services related to direct identifiers |
US7752209B2 (en) | 2005-09-14 | 2010-07-06 | Jumptap, Inc. | Presenting sponsored content on a mobile communication facility |
US8364540B2 (en) | 2005-09-14 | 2013-01-29 | Jumptap, Inc. | Contextual targeting of content using a monetization platform |
US8290810B2 (en) * | 2005-09-14 | 2012-10-16 | Jumptap, Inc. | Realtime surveying within mobile sponsored content |
US8238888B2 (en) * | 2006-09-13 | 2012-08-07 | Jumptap, Inc. | Methods and systems for mobile coupon placement |
US20090029687A1 (en) * | 2005-09-14 | 2009-01-29 | Jorey Ramer | Combining mobile and transcoded content in a mobile search result |
US7702318B2 (en) | 2005-09-14 | 2010-04-20 | Jumptap, Inc. | Presentation of sponsored content based on mobile transaction event |
US7925786B2 (en) * | 2005-09-16 | 2011-04-12 | Microsoft Corp. | Hosting of network-based services |
US7987251B2 (en) * | 2005-09-16 | 2011-07-26 | Microsoft Corporation | Validation of domain name control |
US7499919B2 (en) | 2005-09-21 | 2009-03-03 | Microsoft Corporation | Ranking functions using document usage statistics |
WO2007038389A2 (en) * | 2005-09-26 | 2007-04-05 | Technorati, Inc. | Method and apparatus for identifying and classifying network documents as spam |
JP4241705B2 (ja) * | 2005-09-30 | 2009-03-18 | ブラザー工業株式会社 | 情報管理装置、及び、プログラム |
US7933897B2 (en) * | 2005-10-12 | 2011-04-26 | Google Inc. | Entity display priority in a distributed geographic information system |
US8095419B1 (en) * | 2005-10-17 | 2012-01-10 | Yahoo! Inc. | Search score for the determination of search quality |
US7613690B2 (en) * | 2005-10-21 | 2009-11-03 | Aol Llc | Real time query trends with multi-document summarization |
US8266162B2 (en) * | 2005-10-31 | 2012-09-11 | Lycos, Inc. | Automatic identification of related search keywords |
US7783632B2 (en) * | 2005-11-03 | 2010-08-24 | Microsoft Corporation | Using popularity data for ranking |
US8175585B2 (en) * | 2005-11-05 | 2012-05-08 | Jumptap, Inc. | System for targeting advertising content to a plurality of mobile communication facilities |
US10324899B2 (en) * | 2005-11-07 | 2019-06-18 | Nokia Technologies Oy | Methods for characterizing content item groups |
US20100285818A1 (en) * | 2009-05-08 | 2010-11-11 | Crawford C S Lee | Location based service for directing ads to subscribers |
US8571999B2 (en) | 2005-11-14 | 2013-10-29 | C. S. Lee Crawford | Method of conducting operations for a social network application including activity list generation |
US8645376B2 (en) | 2008-05-02 | 2014-02-04 | Salesforce.Com, Inc. | Method and system for managing recent data in a mobile device linked to an on-demand service |
US9135304B2 (en) * | 2005-12-02 | 2015-09-15 | Salesforce.Com, Inc. | Methods and systems for optimizing text searches over structured data in a multi-tenant environment |
US8095565B2 (en) * | 2005-12-05 | 2012-01-10 | Microsoft Corporation | Metadata driven user interface |
IL172551A0 (en) * | 2005-12-13 | 2006-04-10 | Grois Dan | Method for assigning one or more categorized scores to each document over a data network |
US7971137B2 (en) * | 2005-12-14 | 2011-06-28 | Google Inc. | Detecting and rejecting annoying documents |
US20080010252A1 (en) * | 2006-01-09 | 2008-01-10 | Google, Inc. | Bookmarks and ranking |
US8266130B2 (en) | 2006-01-23 | 2012-09-11 | Chacha Search, Inc. | Search tool providing optional use of human search guides |
US7962466B2 (en) * | 2006-01-23 | 2011-06-14 | Chacha Search, Inc | Automated tool for human assisted mining and capturing of precise results |
US8117196B2 (en) * | 2006-01-23 | 2012-02-14 | Chacha Search, Inc. | Search tool providing optional use of human search guides |
US8065286B2 (en) | 2006-01-23 | 2011-11-22 | Chacha Search, Inc. | Scalable search system using human searchers |
US20070174258A1 (en) * | 2006-01-23 | 2007-07-26 | Jones Scott A | Targeted mobile device advertisements |
US7814099B2 (en) * | 2006-01-31 | 2010-10-12 | Louis S. Wang | Method for ranking and sorting electronic documents in a search result list based on relevance |
US7584183B2 (en) * | 2006-02-01 | 2009-09-01 | Yahoo! Inc. | Method for node classification and scoring by combining parallel iterative scoring calculation |
US8429177B2 (en) * | 2006-02-08 | 2013-04-23 | Yahoo! Inc. | Using exceptional changes in webgraph snapshots over time for internet entity marking |
US7844603B2 (en) * | 2006-02-17 | 2010-11-30 | Google Inc. | Sharing user distributed search results |
KR100804671B1 (ko) * | 2006-02-27 | 2008-02-20 | 엔에이치엔(주) | 응답 지연 제거를 위한 로컬 단말기 검색 시스템 및 방법 |
US7493403B2 (en) * | 2006-03-13 | 2009-02-17 | Markmonitor Inc. | Domain name ownership validation |
US8117195B1 (en) | 2006-03-22 | 2012-02-14 | Google Inc. | Providing blog posts relevant to search results |
US9135238B2 (en) * | 2006-03-31 | 2015-09-15 | Google Inc. | Disambiguation of named entities |
US7933890B2 (en) | 2006-03-31 | 2011-04-26 | Google Inc. | Propagating useful information among related web pages, such as web pages of a website |
US7647314B2 (en) * | 2006-04-28 | 2010-01-12 | Yahoo! Inc. | System and method for indexing web content using click-through features |
US7624104B2 (en) * | 2006-06-22 | 2009-11-24 | Yahoo! Inc. | User-sensitive pagerank |
CN100524307C (zh) * | 2006-06-27 | 2009-08-05 | 国际商业机器公司 | 一种建立文档间关联关系的方法和装置 |
US7716236B2 (en) * | 2006-07-06 | 2010-05-11 | Aol Inc. | Temporal search query personalization |
WO2008010847A2 (en) * | 2006-07-14 | 2008-01-24 | Bea Systems, Inc. | Improved enterprise search system |
US20080016053A1 (en) * | 2006-07-14 | 2008-01-17 | Bea Systems, Inc. | Administration Console to Select Rank Factors |
US7873641B2 (en) * | 2006-07-14 | 2011-01-18 | Bea Systems, Inc. | Using tags in an enterprise search system |
US20080016052A1 (en) * | 2006-07-14 | 2008-01-17 | Bea Systems, Inc. | Using Connections Between Users and Documents to Rank Documents in an Enterprise Search System |
US20080016071A1 (en) * | 2006-07-14 | 2008-01-17 | Bea Systems, Inc. | Using Connections Between Users, Tags and Documents to Rank Documents in an Enterprise Search System |
US20080016072A1 (en) * | 2006-07-14 | 2008-01-17 | Bea Systems, Inc. | Enterprise-Based Tag System |
US20080016061A1 (en) * | 2006-07-14 | 2008-01-17 | Bea Systems, Inc. | Using a Core Data Structure to Calculate Document Ranks |
WO2008010729A1 (en) * | 2006-07-17 | 2008-01-24 | Eurekster, Inc | A method of determining reputation for community search engines |
US8965874B1 (en) * | 2006-08-04 | 2015-02-24 | Google Inc. | Dynamic aggregation of users |
US8606834B2 (en) * | 2006-08-16 | 2013-12-10 | Apple Inc. | Managing supplied data |
US7831472B2 (en) | 2006-08-22 | 2010-11-09 | Yufik Yan M | Methods and system for search engine revenue maximization in internet advertising |
US20080126331A1 (en) * | 2006-08-25 | 2008-05-29 | Xerox Corporation | System and method for ranking reference documents |
US20080071797A1 (en) * | 2006-09-15 | 2008-03-20 | Thornton Nathaniel L | System and method to calculate average link growth on search engines for a keyword |
US9037581B1 (en) | 2006-09-29 | 2015-05-19 | Google Inc. | Personalized search result ranking |
US8548991B1 (en) * | 2006-09-29 | 2013-10-01 | Google Inc. | Personalized browsing activity displays |
US7577643B2 (en) * | 2006-09-29 | 2009-08-18 | Microsoft Corporation | Key phrase extraction from query logs |
US9740778B2 (en) * | 2006-10-10 | 2017-08-22 | Microsoft Technology Licensing, Llc | Ranking domains using domain maturity |
US8745183B2 (en) * | 2006-10-26 | 2014-06-03 | Yahoo! Inc. | System and method for adaptively refreshing a web page |
JP2010508592A (ja) * | 2006-10-27 | 2010-03-18 | ジャンプタップ,インコーポレイテッド | アルゴリズム上の再検討及び編集上の再検討の組み合わせによるモバイルコンテンツの検索結果 |
US7937403B2 (en) * | 2006-10-30 | 2011-05-03 | Yahoo! Inc. | Time-based analysis of related keyword searching |
US8661029B1 (en) | 2006-11-02 | 2014-02-25 | Google Inc. | Modifying search result ranking based on implicit user feedback |
US9110975B1 (en) * | 2006-11-02 | 2015-08-18 | Google Inc. | Search result inputs using variant generalized queries |
US20080126430A1 (en) * | 2006-11-28 | 2008-05-29 | Garrett Andrew J | Intermediary document for critical change control |
US8983970B1 (en) | 2006-12-07 | 2015-03-17 | Google Inc. | Ranking content using content and content authors |
US8577866B1 (en) * | 2006-12-07 | 2013-11-05 | Googe Inc. | Classifying content |
JP5137397B2 (ja) * | 2006-12-28 | 2013-02-06 | キヤノン株式会社 | データ管理装置、データ処理方法、及びコンピュータプログラム |
US8280871B2 (en) * | 2006-12-29 | 2012-10-02 | Yahoo! Inc. | Identifying offensive content using user click data |
US8046358B2 (en) * | 2007-02-16 | 2011-10-25 | Ge Healthcare | Context-based information retrieval |
US8938463B1 (en) | 2007-03-12 | 2015-01-20 | Google Inc. | Modifying search result ranking based on implicit user feedback and a model of presentation bias |
US8694374B1 (en) | 2007-03-14 | 2014-04-08 | Google Inc. | Detecting click spam |
JP4861865B2 (ja) * | 2007-03-15 | 2012-01-25 | 富士通株式会社 | アクセス結果フィードバックプログラム、記録媒体、アクセス結果フィードバック方法、アクセス結果フィードバック装置、および端末装置 |
WO2008126184A1 (ja) * | 2007-03-16 | 2008-10-23 | Fujitsu Limited | 文書重要度算出プログラム |
JP4894580B2 (ja) * | 2007-03-20 | 2012-03-14 | 日本電気株式会社 | 旬度解析システム、旬度解析方法、及び旬度解析プログラム |
US8176055B1 (en) * | 2007-03-27 | 2012-05-08 | Google Inc. | Content entity management |
US8788320B1 (en) | 2007-03-28 | 2014-07-22 | Amazon Technologies, Inc. | Release advertisement system |
US8086594B1 (en) | 2007-03-30 | 2011-12-27 | Google Inc. | Bifurcated document relevance scoring |
US20080244428A1 (en) * | 2007-03-30 | 2008-10-02 | Yahoo! Inc. | Visually Emphasizing Query Results Based on Relevance Feedback |
US8166021B1 (en) | 2007-03-30 | 2012-04-24 | Google Inc. | Query phrasification |
US7693813B1 (en) | 2007-03-30 | 2010-04-06 | Google Inc. | Index server architecture using tiered and sharded phrase posting lists |
US7702614B1 (en) | 2007-03-30 | 2010-04-20 | Google Inc. | Index updating using segment swapping |
US8166045B1 (en) | 2007-03-30 | 2012-04-24 | Google Inc. | Phrase extraction using subphrase scoring |
US7925655B1 (en) | 2007-03-30 | 2011-04-12 | Google Inc. | Query scheduling using hierarchical tiers of index servers |
US7672937B2 (en) * | 2007-04-11 | 2010-03-02 | Yahoo, Inc. | Temporal targeting of advertisements |
US7676520B2 (en) * | 2007-04-12 | 2010-03-09 | Microsoft Corporation | Calculating importance of documents factoring historical importance |
IL182518A0 (en) * | 2007-04-12 | 2007-09-20 | Grois Dan | Pay per relevance (ppr) advertising method and system |
US9092510B1 (en) * | 2007-04-30 | 2015-07-28 | Google Inc. | Modifying search result ranking based on a temporal element of user feedback |
US20080275846A1 (en) * | 2007-05-04 | 2008-11-06 | Sony Ericsson Mobile Communications Ab | Filtering search results using contact lists |
US8706696B2 (en) | 2007-05-04 | 2014-04-22 | Salesforce.Com, Inc. | Method and system for on-demand communities |
US20080275877A1 (en) * | 2007-05-04 | 2008-11-06 | International Business Machines Corporation | Method and system for variable keyword processing based on content dates on a web page |
US7788254B2 (en) * | 2007-05-04 | 2010-08-31 | Microsoft Corporation | Web page analysis using multiple graphs |
US20090271428A1 (en) * | 2007-05-09 | 2009-10-29 | The Go Daddy Group, Inc. | Tracking digital identity related reputation data |
US8359309B1 (en) | 2007-05-23 | 2013-01-22 | Google Inc. | Modifying search result ranking based on corpus search statistics |
US7814107B1 (en) | 2007-05-25 | 2010-10-12 | Amazon Technologies, Inc. | Generating similarity scores for matching non-identical data strings |
US7908279B1 (en) | 2007-05-25 | 2011-03-15 | Amazon Technologies, Inc. | Filtering invalid tokens from a document using high IDF token filtering |
US8046372B1 (en) | 2007-05-25 | 2011-10-25 | Amazon Technologies, Inc. | Duplicate entry detection system and method |
US7644075B2 (en) * | 2007-06-01 | 2010-01-05 | Microsoft Corporation | Keyword usage score based on frequency impulse and frequency weight |
US8244737B2 (en) * | 2007-06-18 | 2012-08-14 | Microsoft Corporation | Ranking documents based on a series of document graphs |
US20090006358A1 (en) * | 2007-06-27 | 2009-01-01 | Microsoft Corporation | Search results |
US8290986B2 (en) * | 2007-06-27 | 2012-10-16 | Yahoo! Inc. | Determining quality measures for web objects based on searcher behavior |
US20090006341A1 (en) * | 2007-06-28 | 2009-01-01 | Bruce Chapman | Method of website ranking promotion using creation of mass blog posting links |
US20090013068A1 (en) * | 2007-07-02 | 2009-01-08 | Eaglestone Robert J | Systems and processes for evaluating webpages |
US20090013033A1 (en) * | 2007-07-06 | 2009-01-08 | Yahoo! Inc. | Identifying excessively reciprocal links among web entities |
US7991790B2 (en) * | 2007-07-20 | 2011-08-02 | Salesforce.Com, Inc. | System and method for storing documents accessed by multiple users in an on-demand service |
US7966341B2 (en) * | 2007-08-06 | 2011-06-21 | Yahoo! Inc. | Estimating the date relevance of a query from query logs |
BRPI0721937A2 (pt) * | 2007-08-17 | 2014-03-18 | Google Inc | Métodos de criação de comunidade online dentro de rede social online e produto de programa de computador |
US8572094B2 (en) * | 2007-08-17 | 2013-10-29 | Google Inc. | Ranking social network objects |
US20110010384A1 (en) * | 2007-08-17 | 2011-01-13 | Google Inc. | Multi-community content sharing in online social networks |
US8694511B1 (en) | 2007-08-20 | 2014-04-08 | Google Inc. | Modifying search result ranking based on populations |
EP2193457A1 (de) * | 2007-09-03 | 2010-06-09 | IQser IP AG | Erfassung von zusammenhängen zwischen informationen repräsentierenden daten |
US8117223B2 (en) * | 2007-09-07 | 2012-02-14 | Google Inc. | Integrating external related phrase information into a phrase-based indexing information retrieval system |
JP2009070156A (ja) * | 2007-09-13 | 2009-04-02 | Ntt Docomo Inc | 情報検索システム及び情報検索方法 |
KR20090030966A (ko) * | 2007-09-21 | 2009-03-25 | 삼성전자주식회사 | 휴대용 단말기에서 메뉴 리스트 순위 구성 방법 및 장치 |
US20090089311A1 (en) * | 2007-09-28 | 2009-04-02 | Yahoo! Inc. | System and method for inclusion of history in a search results page |
US8909655B1 (en) | 2007-10-11 | 2014-12-09 | Google Inc. | Time based ranking |
US9348912B2 (en) * | 2007-10-18 | 2016-05-24 | Microsoft Technology Licensing, Llc | Document length as a static relevance feature for ranking search results |
US20090106221A1 (en) * | 2007-10-18 | 2009-04-23 | Microsoft Corporation | Ranking and Providing Search Results Based In Part On A Number Of Click-Through Features |
US7840569B2 (en) * | 2007-10-18 | 2010-11-23 | Microsoft Corporation | Enterprise relevancy ranking using a neural network |
US8078613B2 (en) * | 2007-11-28 | 2011-12-13 | Red Hat, Inc. | Method for removing network effects from search engine results |
US9946722B2 (en) * | 2007-11-30 | 2018-04-17 | Red Hat, Inc. | Generating file usage information |
US7895225B1 (en) * | 2007-12-06 | 2011-02-22 | Amazon Technologies, Inc. | Identifying potential duplicates of a document in a document corpus |
JP2009145953A (ja) * | 2007-12-11 | 2009-07-02 | Sharp Corp | データ検索装置、データ検索方法、コンピュータプログラム、及び記録媒体 |
US8176017B2 (en) * | 2007-12-14 | 2012-05-08 | Microsoft Corporation | Live volume access |
US9239882B2 (en) * | 2007-12-17 | 2016-01-19 | Iac Search & Media, Inc. | System and method for categorizing answers such as URLs |
US9501453B2 (en) | 2007-12-23 | 2016-11-22 | Salesforce.Com Inc. | Method and system for a flexible-data column user interface |
JP2009157422A (ja) * | 2007-12-25 | 2009-07-16 | Fuji Xerox Co Ltd | 操作制限情報管理システムおよびプログラム |
US8578260B2 (en) * | 2007-12-28 | 2013-11-05 | Business Objects Software Limited | Apparatus and method for reformatting a report for access by a user in a network appliance |
US20090182614A1 (en) * | 2008-01-11 | 2009-07-16 | Yahoo! Inc. | System And Method For Serving Advertisements According To Network Traffic |
US8752184B1 (en) * | 2008-01-17 | 2014-06-10 | Google Inc. | Spam detection for user-generated multimedia items based on keyword stuffing |
US8745056B1 (en) * | 2008-03-31 | 2014-06-03 | Google Inc. | Spam detection for user-generated multimedia items based on concept clustering |
US7653577B2 (en) | 2008-02-19 | 2010-01-26 | The Go Daddy Group, Inc. | Validating e-commerce transactions |
US7860755B2 (en) * | 2008-02-19 | 2010-12-28 | The Go Daddy Group, Inc. | Rating e-commerce transactions |
US8881040B2 (en) | 2008-08-28 | 2014-11-04 | Georgetown University | System and method for detecting, collecting, analyzing, and communicating event-related information |
US9529974B2 (en) | 2008-02-25 | 2016-12-27 | Georgetown University | System and method for detecting, collecting, analyzing, and communicating event-related information |
US9489495B2 (en) | 2008-02-25 | 2016-11-08 | Georgetown University | System and method for detecting, collecting, analyzing, and communicating event-related information |
US9746985B1 (en) | 2008-02-25 | 2017-08-29 | Georgetown University | System and method for detecting, collecting, analyzing, and communicating event-related information |
US8224832B2 (en) * | 2008-02-29 | 2012-07-17 | Kemp Richard Douglas | Computerized document examination for changes |
US8171020B1 (en) | 2008-03-31 | 2012-05-01 | Google Inc. | Spam detection for user-generated multimedia items based on appearance in popular queries |
US8812493B2 (en) * | 2008-04-11 | 2014-08-19 | Microsoft Corporation | Search results ranking using editing distance and document information |
US8346791B1 (en) | 2008-05-16 | 2013-01-01 | Google Inc. | Search augmentation |
WO2009155375A2 (en) * | 2008-06-19 | 2009-12-23 | Wize, Inc. | System and method for aggregating and summarizing product/topic sentiment |
US20100010982A1 (en) * | 2008-07-09 | 2010-01-14 | Broder Andrei Z | Web content characterization based on semantic folksonomies associated with user generated content |
US8538942B2 (en) * | 2008-09-12 | 2013-09-17 | Salesforce.Com, Inc. | Method and system for sharing documents between on-demand services |
US8370329B2 (en) * | 2008-09-22 | 2013-02-05 | Microsoft Corporation | Automatic search query suggestions with search result suggestions from user history |
US20100082649A1 (en) * | 2008-09-22 | 2010-04-01 | Microsoft Corporation | Automatic search suggestions from server-side user history |
KR101086530B1 (ko) * | 2008-10-02 | 2011-11-23 | 엔에이치엔(주) | 웹 문서 원본 판별 방법 및 시스템, 이를 위한 웹 문서 이력 정보 제공 방법 및 시스템 |
US20100169492A1 (en) * | 2008-12-04 | 2010-07-01 | The Go Daddy Group, Inc. | Generating domain names relevant to social website trending topics |
US8396865B1 (en) | 2008-12-10 | 2013-03-12 | Google Inc. | Sharing search engine relevance data between corpora |
US9152300B2 (en) | 2008-12-31 | 2015-10-06 | Tivo Inc. | Methods and techniques for adaptive search |
US10158823B2 (en) * | 2008-12-31 | 2018-12-18 | Tivo Solutions Inc. | Methods and techniques for adaptive search |
US8239397B2 (en) * | 2009-01-27 | 2012-08-07 | Palo Alto Research Center Incorporated | System and method for managing user attention by detecting hot and cold topics in social indexes |
JP2010176354A (ja) * | 2009-01-29 | 2010-08-12 | Fuji Xerox Co Ltd | 情報処理装置及び情報処理プログラム |
US8001462B1 (en) | 2009-01-30 | 2011-08-16 | Google Inc. | Updating search engine document index based on calculated age of changed portions in a document |
US9836538B2 (en) * | 2009-03-03 | 2017-12-05 | Microsoft Technology Licensing, Llc | Domain-based ranking in document search |
CN101499098B (zh) * | 2009-03-04 | 2012-07-11 | 阿里巴巴集团控股有限公司 | 一种网页评估值的确定及运用的方法、系统 |
US8224839B2 (en) * | 2009-04-07 | 2012-07-17 | Microsoft Corporation | Search query extension |
US9009146B1 (en) | 2009-04-08 | 2015-04-14 | Google Inc. | Ranking search results based on similar queries |
CN101887437B (zh) * | 2009-05-12 | 2016-03-30 | 阿里巴巴集团控股有限公司 | 一种搜索结果生成方法及信息搜索系统 |
US8719298B2 (en) * | 2009-05-21 | 2014-05-06 | Microsoft Corporation | Click-through prediction for news queries |
US10353967B2 (en) * | 2009-06-22 | 2019-07-16 | Microsoft Technology Licensing, Llc | Assigning relevance weights based on temporal dynamics |
US20100332531A1 (en) * | 2009-06-26 | 2010-12-30 | Microsoft Corporation | Batched Transfer of Arbitrarily Distributed Data |
US20100332550A1 (en) * | 2009-06-26 | 2010-12-30 | Microsoft Corporation | Platform For Configurable Logging Instrumentation |
US20150261858A1 (en) * | 2009-06-29 | 2015-09-17 | Google Inc. | System and method of providing information based on street address |
US9870572B2 (en) * | 2009-06-29 | 2018-01-16 | Google Llc | System and method of providing information based on street address |
US8447760B1 (en) | 2009-07-20 | 2013-05-21 | Google Inc. | Generating a related set of documents for an initial set of documents |
AU2009350126A1 (en) * | 2009-07-22 | 2012-02-23 | Foundationip, Llc | Method, system, and apparatus for delivering query results from an electronic document collection |
US8082247B2 (en) * | 2009-07-30 | 2011-12-20 | Microsoft Corporation | Best-bet recommendations |
US20110029516A1 (en) * | 2009-07-30 | 2011-02-03 | Microsoft Corporation | Web-Used Pattern Insight Platform |
GB2472250A (en) * | 2009-07-31 | 2011-02-02 | Stephen Timothy Morris | Method for determining document relevance |
JP5014386B2 (ja) * | 2009-08-12 | 2012-08-29 | ヤフー株式会社 | コンテンツ検索装置 |
US8498974B1 (en) | 2009-08-31 | 2013-07-30 | Google Inc. | Refining search results |
JP5002631B2 (ja) * | 2009-09-04 | 2012-08-15 | ヤフー株式会社 | 単語情報収集装置、単語情報収集方法および単語情報収集プログラム |
US8595194B2 (en) * | 2009-09-15 | 2013-11-26 | At&T Intellectual Property I, L.P. | Forward decay temporal data analysis |
US20110078017A1 (en) * | 2009-09-29 | 2011-03-31 | Selina Lam | Systems and methods for rating an originator of an online publication |
US8972391B1 (en) * | 2009-10-02 | 2015-03-03 | Google Inc. | Recent interest based relevance scoring |
US8874555B1 (en) | 2009-11-20 | 2014-10-28 | Google Inc. | Modifying scoring data based on historical changes |
US8515975B1 (en) | 2009-12-07 | 2013-08-20 | Google Inc. | Search entity transition matrix and applications of the transition matrix |
US9043319B1 (en) * | 2009-12-07 | 2015-05-26 | Google Inc. | Generating real-time search results |
US20110145822A1 (en) * | 2009-12-10 | 2011-06-16 | The Go Daddy Group, Inc. | Generating and recommending task solutions |
US20110145823A1 (en) * | 2009-12-10 | 2011-06-16 | The Go Daddy Group, Inc. | Task management engine |
US8311792B1 (en) * | 2009-12-23 | 2012-11-13 | Intuit Inc. | System and method for ranking a posting |
EP2495668B1 (en) * | 2009-12-28 | 2021-06-30 | Rakuten, Inc. | Information search device, number-of-items determination method, information search program, information search system and recording medium |
US20110178868A1 (en) * | 2010-01-21 | 2011-07-21 | Priyank Shanker Garg | Enhancing search result pages using content licensed from content providers |
US8615514B1 (en) | 2010-02-03 | 2013-12-24 | Google Inc. | Evaluating website properties by partitioning user feedback |
EP2533163A4 (en) * | 2010-02-04 | 2015-04-15 | Ebay Inc | VISUALIZATION OF LISTS BASED ON LIST ACTIVITY |
US8924379B1 (en) | 2010-03-05 | 2014-12-30 | Google Inc. | Temporal-based score adjustments |
US8959093B1 (en) | 2010-03-15 | 2015-02-17 | Google Inc. | Ranking search results based on anchors |
US8700642B2 (en) * | 2010-03-22 | 2014-04-15 | Microsoft Corporation | Software agent for monitoring content relevance |
US8650195B2 (en) * | 2010-03-26 | 2014-02-11 | Palle M Pedersen | Region based information retrieval system |
US8260789B2 (en) * | 2010-04-01 | 2012-09-04 | Microsoft Corporation | System and method for authority value obtained by defining ranking functions related to weight and confidence value |
CN101883180A (zh) * | 2010-05-11 | 2010-11-10 | 中兴通讯股份有限公司 | 屏蔽移动终端访问无线网络信息的方法、移动终端和系统 |
US9116990B2 (en) * | 2010-05-27 | 2015-08-25 | Microsoft Technology Licensing, Llc | Enhancing freshness of search results |
US8738635B2 (en) | 2010-06-01 | 2014-05-27 | Microsoft Corporation | Detection of junk in search result ranking |
US8738377B2 (en) | 2010-06-07 | 2014-05-27 | Google Inc. | Predicting and learning carrier phrases for speech input |
US8595207B2 (en) * | 2010-06-14 | 2013-11-26 | Salesforce.Com | Methods and systems for dynamically suggesting answers to questions submitted to a portal of an online service |
US9623119B1 (en) | 2010-06-29 | 2017-04-18 | Google Inc. | Accentuating search results |
AU2010202901B2 (en) * | 2010-07-08 | 2016-04-14 | Patent Analytics Holding Pty Ltd | A system, method and computer program for preparing data for analysis |
US8832083B1 (en) | 2010-07-23 | 2014-09-09 | Google Inc. | Combining user feedback |
US9020922B2 (en) | 2010-08-10 | 2015-04-28 | Brightedge Technologies, Inc. | Search engine optimization at scale |
US20120047044A1 (en) * | 2010-08-19 | 2012-02-23 | Stephen James Lazuka | Method to Develop Search Engine Optimized Content Through a Web-Based Software Platform |
US8332408B1 (en) | 2010-08-23 | 2012-12-11 | Google Inc. | Date-based web page annotation |
US8762326B1 (en) | 2010-09-23 | 2014-06-24 | Google Inc. | Personalized hot topics |
US8346792B1 (en) | 2010-11-09 | 2013-01-01 | Google Inc. | Query generation using structural similarity between documents |
US8861896B2 (en) * | 2010-11-29 | 2014-10-14 | Sap Se | Method and system for image-based identification |
US8688706B2 (en) | 2010-12-01 | 2014-04-01 | Google Inc. | Topic based user profiles |
US9348925B2 (en) * | 2010-12-01 | 2016-05-24 | Google Inc. | Locally significant search queries |
JP5673051B2 (ja) * | 2010-12-09 | 2015-02-18 | 日本電気株式会社 | 文書特徴量算出装置、文書特徴量算出方法、及び、文書特徴量算出プログラム |
US8793706B2 (en) | 2010-12-16 | 2014-07-29 | Microsoft Corporation | Metadata-based eventing supporting operations on data |
US9002867B1 (en) | 2010-12-30 | 2015-04-07 | Google Inc. | Modifying ranking data based on document changes |
US8972412B1 (en) | 2011-01-31 | 2015-03-03 | Go Daddy Operating Company, LLC | Predicting improvement in website search engine rankings based upon website linking relationships |
US8370365B1 (en) | 2011-01-31 | 2013-02-05 | Go Daddy Operating Company, LLC | Tools for predicting improvement in website search engine rankings based upon website linking relationships |
US9646110B2 (en) | 2011-02-28 | 2017-05-09 | International Business Machines Corporation | Managing information assets using feedback re-enforced search and navigation |
US10162892B2 (en) * | 2011-02-28 | 2018-12-25 | International Business Machines Corporation | Identifying information assets within an enterprise using a semantic graph created using feedback re-enforced search and navigation |
WO2012129102A2 (en) * | 2011-03-22 | 2012-09-27 | Brightedge Technologies, Inc. | Detection and analysis of backlink activity |
US8732151B2 (en) | 2011-04-01 | 2014-05-20 | Microsoft Corporation | Enhanced query rewriting through statistical machine translation |
WO2012142751A1 (en) * | 2011-04-19 | 2012-10-26 | Nokia Corporation | Method and apparatus for flexible diversification of recommendation results |
US8775431B2 (en) * | 2011-04-25 | 2014-07-08 | Disney Enterprises, Inc. | Systems and methods for hot topic identification and metadata |
US8819000B1 (en) * | 2011-05-03 | 2014-08-26 | Google Inc. | Query modification |
US20120304072A1 (en) * | 2011-05-23 | 2012-11-29 | Microsoft Corporation | Sentiment-based content aggregation and presentation |
US10068022B2 (en) * | 2011-06-03 | 2018-09-04 | Google Llc | Identifying topical entities |
US10223451B2 (en) * | 2011-06-14 | 2019-03-05 | International Business Machines Corporation | Ranking search results based upon content creation trends |
CA2832911C (en) * | 2011-06-22 | 2016-12-13 | Rogers Communications Inc. | System and method for filtering documents |
US9286334B2 (en) | 2011-07-15 | 2016-03-15 | International Business Machines Corporation | Versioning of metadata, including presentation of provenance and lineage for versioned metadata |
US9384193B2 (en) | 2011-07-15 | 2016-07-05 | International Business Machines Corporation | Use and enforcement of provenance and lineage constraints |
US8510285B1 (en) * | 2011-08-18 | 2013-08-13 | Google Inc. | Using pre-search triggers |
JP5506104B2 (ja) * | 2011-09-30 | 2014-05-28 | 楽天株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
KR101510647B1 (ko) * | 2011-10-07 | 2015-04-10 | 한국전자통신연구원 | 이슈 템플릿 추출 기반의 웹 동향 분석 방법 및 장치 |
US10776431B2 (en) * | 2011-10-26 | 2020-09-15 | Oath Inc. | System and method for recommending content based on search history and trending topics |
US8694507B2 (en) * | 2011-11-02 | 2014-04-08 | Microsoft Corporation | Tenantization of search result ranking |
WO2013070977A1 (en) * | 2011-11-10 | 2013-05-16 | Room 77, Inc. | Metasearch infrastructure with incremental updates |
US9436758B1 (en) | 2011-12-27 | 2016-09-06 | Google Inc. | Methods and systems for partitioning documents having customer feedback and support content |
US8868536B1 (en) * | 2012-01-04 | 2014-10-21 | Google Inc. | Real time map spam detection |
US9201964B2 (en) | 2012-01-23 | 2015-12-01 | Microsoft Technology Licensing, Llc | Identifying related entities |
US9418065B2 (en) | 2012-01-26 | 2016-08-16 | International Business Machines Corporation | Tracking changes related to a collection of documents |
US9495462B2 (en) | 2012-01-27 | 2016-11-15 | Microsoft Technology Licensing, Llc | Re-ranking search results |
JP5929356B2 (ja) * | 2012-03-15 | 2016-06-01 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
US9189526B1 (en) * | 2012-03-21 | 2015-11-17 | Google Inc. | Freshness based ranking |
CN103049511B (zh) * | 2012-03-28 | 2016-02-03 | 温州大学 | 一种微博关注列表、微博内容的显示方法及其客户端 |
US9081831B2 (en) | 2012-03-30 | 2015-07-14 | Google Inc. | Methods and systems for presenting document-specific snippets |
CN103377191B (zh) * | 2012-04-12 | 2017-04-12 | 阿里巴巴集团控股有限公司 | 一种提供图片的相关信息的方法及装置 |
US20130282707A1 (en) * | 2012-04-24 | 2013-10-24 | Discovery Engine Corporation | Two-step combiner for search result scores |
US9916396B2 (en) | 2012-05-11 | 2018-03-13 | Google Llc | Methods and systems for content-based search |
US8924375B1 (en) * | 2012-05-31 | 2014-12-30 | Symantec Corporation | Item attention tracking system and method |
US8954438B1 (en) | 2012-05-31 | 2015-02-10 | Google Inc. | Structured metadata extraction |
US8984012B2 (en) * | 2012-06-20 | 2015-03-17 | Microsoft Technology Licensing, Llc | Self-tuning alterations framework |
US9471606B1 (en) | 2012-06-25 | 2016-10-18 | Google Inc. | Obtaining information to provide to users |
US9195717B2 (en) * | 2012-06-26 | 2015-11-24 | Google Inc. | Image result provisioning based on document classification |
US9436687B2 (en) * | 2012-07-09 | 2016-09-06 | Facebook, Inc. | Acquiring structured user data using composer interface having input fields corresponding to acquired structured data |
US9110852B1 (en) | 2012-07-20 | 2015-08-18 | Google Inc. | Methods and systems for extracting information from text |
US8793258B2 (en) * | 2012-07-31 | 2014-07-29 | Hewlett-Packard Development Company, L.P. | Predicting sharing on a social network |
US9390174B2 (en) | 2012-08-08 | 2016-07-12 | Google Inc. | Search result ranking and presentation |
US8938438B2 (en) | 2012-10-11 | 2015-01-20 | Go Daddy Operating Company, LLC | Optimizing search engine ranking by recommending content including frequently searched questions |
US8898113B2 (en) | 2012-11-21 | 2014-11-25 | International Business Machines Corporation | Managing replicated data |
US9558233B1 (en) | 2012-11-30 | 2017-01-31 | Google Inc. | Determining a quality measure for a resource |
US9256682B1 (en) | 2012-12-05 | 2016-02-09 | Google Inc. | Providing search results based on sorted properties |
US8949228B2 (en) * | 2013-01-15 | 2015-02-03 | Google Inc. | Identification of new sources for topics |
US20140236964A1 (en) * | 2013-02-19 | 2014-08-21 | Lexisnexis, A Division Of Reed Elsevier Inc. | Systems And Methods For Ranking A Plurality Of Documents Based On User Activity |
US9218819B1 (en) | 2013-03-01 | 2015-12-22 | Google Inc. | Customizing actions based on contextual data and voice-based inputs |
US11429651B2 (en) * | 2013-03-14 | 2022-08-30 | International Business Machines Corporation | Document provenance scoring based on changes between document versions |
US10055462B2 (en) | 2013-03-15 | 2018-08-21 | Google Llc | Providing search results using augmented search queries |
US9477759B2 (en) | 2013-03-15 | 2016-10-25 | Google Inc. | Question answering using entity references in unstructured data |
US10108700B2 (en) | 2013-03-15 | 2018-10-23 | Google Llc | Question answering to populate knowledge base |
US9501506B1 (en) | 2013-03-15 | 2016-11-22 | Google Inc. | Indexing system |
ES2518015B1 (es) * | 2013-04-01 | 2015-08-12 | Crambo, S.A. | Método, dispositivo móvil, sistema y producto informático para la detección y medición del nivel de atención de un usuario |
US9183499B1 (en) | 2013-04-19 | 2015-11-10 | Google Inc. | Evaluating quality based on neighbor features |
US9251146B2 (en) | 2013-05-10 | 2016-02-02 | International Business Machines Corporation | Altering relevancy of a document and/or a search query |
US9483568B1 (en) | 2013-06-05 | 2016-11-01 | Google Inc. | Indexing system |
RU2592390C2 (ru) * | 2013-07-15 | 2016-07-20 | Общество С Ограниченной Ответственностью "Яндекс" | Система, способ и устройство для оценки сеансов просмотра |
US20150046219A1 (en) * | 2013-08-08 | 2015-02-12 | Mark J. Shavlik | Avatar-based automated lead scoring system |
US9946804B2 (en) | 2013-08-19 | 2018-04-17 | Business Objects Software Ltd | Displaying historical data associated with data values within business intelligence reports |
US20150058073A1 (en) * | 2013-08-20 | 2015-02-26 | Dmitrii Gorbunov | Crowdsourced innovation exchange |
US9723053B1 (en) * | 2013-08-30 | 2017-08-01 | Amazon Technologies, Inc. | Pre-fetching a cacheable network resource based on a time-to-live value |
US10079737B2 (en) * | 2013-09-13 | 2018-09-18 | Clicktale Ltd. | Method and system for generating comparable visual maps for browsing activity analysis |
US10902004B2 (en) * | 2013-10-16 | 2021-01-26 | Salesforce.Com, Inc. | Processing user-submitted updates based on user reliability scores |
US11017426B1 (en) * | 2013-12-20 | 2021-05-25 | BloomReach Inc. | Content performance analytics |
US20150186463A1 (en) * | 2013-12-31 | 2015-07-02 | International Business Machines Corporation | Identifying changes to query results system and method |
CN104753805B (zh) * | 2013-12-31 | 2018-07-24 | 腾讯科技(深圳)有限公司 | 分布式流量控制方法、服务器和系统 |
US9984165B2 (en) * | 2014-02-13 | 2018-05-29 | Amadeus S.A.S. | Increasing search result validity |
US9582536B2 (en) | 2014-02-19 | 2017-02-28 | Amadeus S.A.S. | Long-term validity of pre-computed request results |
US9471689B2 (en) | 2014-05-29 | 2016-10-18 | International Business Machines Corporation | Managing documents in question answering systems |
US9875242B2 (en) * | 2014-06-03 | 2018-01-23 | Google Llc | Dynamic current results for second device |
US9692804B2 (en) | 2014-07-04 | 2017-06-27 | Yandex Europe Ag | Method of and system for determining creation time of a web resource |
US9934319B2 (en) | 2014-07-04 | 2018-04-03 | Yandex Europe Ag | Method of and system for determining creation time of a web resource |
US10592539B1 (en) * | 2014-07-11 | 2020-03-17 | Twitter, Inc. | Trends in a messaging platform |
US20170128448A1 (en) * | 2014-07-11 | 2017-05-11 | Celgene Corporation | Combination therapy for cancer |
US10601749B1 (en) | 2014-07-11 | 2020-03-24 | Twitter, Inc. | Trends in a messaging platform |
WO2016020466A1 (en) * | 2014-08-05 | 2016-02-11 | Piksel, Inc | Content source driven recommendation for given context of content delivery and display system |
US9703840B2 (en) | 2014-08-13 | 2017-07-11 | International Business Machines Corporation | Handling information source ingestion in a question answering system |
US11216843B1 (en) | 2014-08-15 | 2022-01-04 | Groupon, Inc. | Ranked relevance results using multi-feature scoring returned from a universal relevance service framework |
US10459927B1 (en) | 2014-08-15 | 2019-10-29 | Groupon, Inc. | Enforcing diversity in ranked relevance results returned from a universal relevance service framework |
US10572925B1 (en) | 2014-08-15 | 2020-02-25 | Groupon, Inc. | Universal relevance service framework |
US10210214B2 (en) * | 2014-08-27 | 2019-02-19 | International Business Machines Corporation | Scalable trend detection in a personalized search context |
US9767172B2 (en) * | 2014-10-03 | 2017-09-19 | Palantir Technologies Inc. | Data aggregation and analysis system |
US9501851B2 (en) | 2014-10-03 | 2016-11-22 | Palantir Technologies Inc. | Time-series analysis system |
US9690862B2 (en) * | 2014-10-18 | 2017-06-27 | International Business Machines Corporation | Realtime ingestion via multi-corpus knowledge base with weighting |
US10042514B2 (en) * | 2014-10-30 | 2018-08-07 | Microsoft Technology Licensing, Llc | Typeahead features |
RU2610280C2 (ru) | 2014-10-31 | 2017-02-08 | Общество С Ограниченной Ответственностью "Яндекс" | Способ авторизации пользователя в сети и сервер, используемый в нем |
US9922117B2 (en) | 2014-10-31 | 2018-03-20 | Bank Of America Corporation | Contextual search input from advisors |
US9940409B2 (en) * | 2014-10-31 | 2018-04-10 | Bank Of America Corporation | Contextual search tool |
RU2580432C1 (ru) | 2014-10-31 | 2016-04-10 | Общество С Ограниченной Ответственностью "Яндекс" | Способ для обработки запроса от потенциального несанкционированного пользователя на доступ к ресурсу и серверу, используемый в нем |
US9785304B2 (en) | 2014-10-31 | 2017-10-10 | Bank Of America Corporation | Linking customer profiles with household profiles |
US9160680B1 (en) | 2014-11-18 | 2015-10-13 | Kaspersky Lab Zao | System and method for dynamic network resource categorization re-assignment |
US9836435B2 (en) | 2015-03-19 | 2017-12-05 | International Business Machines Corporation | Embedded content suitability scoring |
CN104731914A (zh) * | 2015-03-24 | 2015-06-24 | 浪潮集团有限公司 | 一种基于行为相似度的用户异常行为检测方法 |
US9984330B2 (en) | 2015-04-10 | 2018-05-29 | Microsoft Technology Licensing, Llc. | Predictive trending of digital entities |
US11803918B2 (en) | 2015-07-07 | 2023-10-31 | Oracle International Corporation | System and method for identifying experts on arbitrary topics in an enterprise social network |
RU2632131C2 (ru) * | 2015-08-28 | 2017-10-02 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и устройство для создания рекомендуемого списка содержимого |
RU2629638C2 (ru) | 2015-09-28 | 2017-08-30 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и сервер создания рекомендуемого набора элементов для пользователя |
RU2632100C2 (ru) * | 2015-09-28 | 2017-10-02 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и сервер создания рекомендованного набора элементов |
US11442945B1 (en) * | 2015-12-31 | 2022-09-13 | Groupon, Inc. | Dynamic freshness for relevance rankings |
US11409899B2 (en) | 2016-02-08 | 2022-08-09 | Liveramp, Inc. | Change fingerprinting for database tables, text files, and data feeds |
RU2632144C1 (ru) | 2016-05-12 | 2017-10-02 | Общество С Ограниченной Ответственностью "Яндекс" | Компьютерный способ создания интерфейса рекомендации контента |
RU2632132C1 (ru) | 2016-07-07 | 2017-10-02 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и устройство для создания рекомендаций содержимого в системе рекомендаций |
RU2636702C1 (ru) | 2016-07-07 | 2017-11-27 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и устройство для выбора сетевого ресурса в качестве источника содержимого для системы рекомендаций |
US10769156B2 (en) * | 2016-08-26 | 2020-09-08 | Microsoft Technology Licensing, Llc | Rank query results for relevance utilizing external context |
USD882600S1 (en) | 2017-01-13 | 2020-04-28 | Yandex Europe Ag | Display screen with graphical user interface |
US10853375B1 (en) | 2017-08-25 | 2020-12-01 | Roblox Corporation | Leveraging historical data to improve the relevancy of search results |
CN109446402B (zh) * | 2017-08-29 | 2022-04-01 | 阿里巴巴集团控股有限公司 | 一种搜索方法及装置 |
US11163759B2 (en) * | 2017-12-21 | 2021-11-02 | Salesforce.Com, Inc. | Predicting entities for database query results |
CN110569335B (zh) | 2018-03-23 | 2022-05-27 | 百度在线网络技术(北京)有限公司 | 基于人工智能的三元组校验方法、装置及存储介质 |
US11514095B2 (en) | 2018-05-04 | 2022-11-29 | International Business Machines Corporation | Tiered retrieval of secured documents |
US10796022B2 (en) | 2018-05-16 | 2020-10-06 | Ebay Inc. | Weighted source data secured on blockchains |
US10671371B2 (en) | 2018-06-12 | 2020-06-02 | International Business Machines Corporation | Alerting an offline user of a predicted computer file update |
US11017221B2 (en) | 2018-07-01 | 2021-05-25 | International Business Machines Corporation | Classifying digital documents in multi-document transactions based on embedded dates |
US10885081B2 (en) | 2018-07-02 | 2021-01-05 | Optum Technology, Inc. | Systems and methods for contextual ranking of search results |
RU2720952C2 (ru) | 2018-09-14 | 2020-05-15 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система для создания рекомендации цифрового содержимого |
RU2720899C2 (ru) | 2018-09-14 | 2020-05-14 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система для определения зависящих от пользователя пропорций содержимого для рекомендации |
RU2714594C1 (ru) | 2018-09-14 | 2020-02-18 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система определения параметра релевантность для элементов содержимого |
US11294974B1 (en) * | 2018-10-04 | 2022-04-05 | Apple Inc. | Golden embeddings |
RU2725659C2 (ru) | 2018-10-08 | 2020-07-03 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система для оценивания данных о взаимодействиях пользователь-элемент |
RU2731335C2 (ru) | 2018-10-09 | 2020-09-01 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система для формирования рекомендаций цифрового контента |
US11003889B2 (en) | 2018-10-22 | 2021-05-11 | International Business Machines Corporation | Classifying digital documents in multi-document transactions based on signatory role analysis |
US11677703B2 (en) | 2019-08-15 | 2023-06-13 | Rovi Guides, Inc. | Systems and methods for automatically identifying spam in social media comments based on context |
US11258741B2 (en) * | 2019-08-15 | 2022-02-22 | Rovi Guides, Inc. | Systems and methods for automatically identifying spam in social media comments |
RU2757406C1 (ru) | 2019-09-09 | 2021-10-15 | Общество С Ограниченной Ответственностью «Яндекс» | Способ и система для обеспечения уровня сервиса при рекламе элемента контента |
KR102426056B1 (ko) * | 2019-10-30 | 2022-07-27 | 네이버 주식회사 | 문서 선별을 위해 멀티모달 어뷰징 패턴을 감지하는 방법, 시스템, 및 컴퓨터 프로그램 |
JP2021077256A (ja) * | 2019-11-13 | 2021-05-20 | 株式会社Fronteo | 文書処理装置、文書レビューシステム、文書処理装置の制御方法、文書レビューサービスを提供する方法、および制御プログラム |
US11914906B2 (en) * | 2022-05-17 | 2024-02-27 | Kyocera Document Solutions Inc. | Pre-processing print jobs |
Family Cites Families (145)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5594897A (en) * | 1993-09-01 | 1997-01-14 | Gwg Associates | Method for retrieving high relevance, high quality objects from an overall source |
US5465353A (en) * | 1994-04-01 | 1995-11-07 | Ricoh Company, Ltd. | Image matching and retrieval by multi-access redundant hashing |
GB9408894D0 (en) * | 1994-05-05 | 1994-06-22 | Secr Defence | Electronic circuit |
US5758257A (en) * | 1994-11-29 | 1998-05-26 | Herz; Frederick | System and method for scheduling broadcast of and access to video programs and other data using customer profiles |
JP2914226B2 (ja) | 1995-06-16 | 1999-06-28 | 日本電気株式会社 | 可逆変換を可能にするディジタル信号の変換符号化方式 |
US5742816A (en) * | 1995-09-15 | 1998-04-21 | Infonautics Corporation | Method and apparatus for identifying textual documents and multi-mediafiles corresponding to a search topic |
US5873076A (en) * | 1995-09-15 | 1999-02-16 | Infonautics Corporation | Architecture for processing search queries, retrieving documents identified thereby, and method for using same |
AU1566597A (en) * | 1995-12-27 | 1997-08-11 | Gary B. Robinson | Automated collaborative filtering in world wide web advertising |
US6457004B1 (en) * | 1997-07-03 | 2002-09-24 | Hitachi, Ltd. | Document retrieval assisting method, system and service using closely displayed areas for titles and topics |
US6092091A (en) * | 1996-09-13 | 2000-07-18 | Kabushiki Kaisha Toshiba | Device and method for filtering information, device and method for monitoring updated document information and information storage medium used in same devices |
US6285999B1 (en) | 1997-01-10 | 2001-09-04 | The Board Of Trustees Of The Leland Stanford Junior University | Method for node ranking in a linked database |
JPH10247201A (ja) * | 1997-03-05 | 1998-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 情報評価値付き情報案内システム |
US7636732B1 (en) * | 1997-05-30 | 2009-12-22 | Sun Microsystems, Inc. | Adaptive meta-tagging of websites |
US5893111A (en) * | 1997-06-13 | 1999-04-06 | Sharon, Jr.; Paul A. | Ad taking pagination information system |
US6078916A (en) * | 1997-08-01 | 2000-06-20 | Culliss; Gary | Method for organizing information |
US6182068B1 (en) * | 1997-08-01 | 2001-01-30 | Ask Jeeves, Inc. | Personalized search methods |
US6014665A (en) * | 1997-08-01 | 2000-01-11 | Culliss; Gary | Method for organizing information |
US5956722A (en) * | 1997-09-23 | 1999-09-21 | At&T Corp. | Method for effective indexing of partially dynamic documents |
US6389436B1 (en) * | 1997-12-15 | 2002-05-14 | International Business Machines Corporation | Enhanced hypertext categorization using hyperlinks |
US6067565A (en) * | 1998-01-15 | 2000-05-23 | Microsoft Corporation | Technique for prefetching a web page of potential future interest in lieu of continuing a current information download |
US6182133B1 (en) * | 1998-02-06 | 2001-01-30 | Microsoft Corporation | Method and apparatus for display of information prefetching and cache status having variable visual indication based on a period of time since prefetching |
US6163778A (en) * | 1998-02-06 | 2000-12-19 | Sun Microsystems, Inc. | Probabilistic web link viability marker and web page ratings |
EP1062602B8 (en) * | 1998-02-13 | 2018-06-13 | Oath Inc. | Search engine using sales and revenue to weight search results |
US6185558B1 (en) * | 1998-03-03 | 2001-02-06 | Amazon.Com, Inc. | Identifying the items most relevant to a current query based on items selected in connection with similar queries |
US6421675B1 (en) * | 1998-03-16 | 2002-07-16 | S. L. I. Systems, Inc. | Search engine |
US6457028B1 (en) * | 1998-03-18 | 2002-09-24 | Xerox Corporation | Method and apparatus for finding related collections of linked documents using co-citation analysis |
US6990437B1 (en) * | 1999-07-02 | 2006-01-24 | Abu El Ata Nabil A | Systems and method for determining performance metrics for constructing information systems |
US6638314B1 (en) * | 1998-06-26 | 2003-10-28 | Microsoft Corporation | Method of web crawling utilizing crawl numbers |
US6421375B1 (en) * | 1998-07-28 | 2002-07-16 | Conexant Systems, Inc | Method and apparatus for transmitting control signals in a data communication system having a fully digital communication channel |
US7765179B2 (en) * | 1998-12-01 | 2010-07-27 | Alcatel-Lucent Usa Inc. | Method and apparatus for resolving domain names of persistent web resources |
US6615242B1 (en) * | 1998-12-28 | 2003-09-02 | At&T Corp. | Automatic uniform resource locator-based message filter |
US6598054B2 (en) * | 1999-01-26 | 2003-07-22 | Xerox Corporation | System and method for clustering data objects in a collection |
JP3347088B2 (ja) * | 1999-02-12 | 2002-11-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 関連情報検索方法およびシステム |
US6510406B1 (en) * | 1999-03-23 | 2003-01-21 | Mathsoft, Inc. | Inverse inference engine for high performance web search |
US6907566B1 (en) * | 1999-04-02 | 2005-06-14 | Overture Services, Inc. | Method and system for optimum placement of advertisements on a webpage |
US7752251B1 (en) * | 2000-04-14 | 2010-07-06 | Brian Mark Shuster | Method, apparatus and system for hosting information exchange groups on a wide area network |
WO2000068757A2 (en) * | 1999-05-07 | 2000-11-16 | Carlos Cardona | System and method for database retrieval, indexing and statistical analysis |
US6350271B1 (en) | 1999-05-17 | 2002-02-26 | Micrus Corporation | Clot retrieval device |
JP2000339316A (ja) | 1999-05-25 | 2000-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 検索連動型情報収集方法、装置及びその方法を記憶した記録媒体 |
US6269361B1 (en) | 1999-05-28 | 2001-07-31 | Goto.Com | System and method for influencing a position on a search result list generated by a computer network search engine |
US7110993B2 (en) * | 1999-05-28 | 2006-09-19 | Overture Services, Inc. | System and method for influencing a position on a search result list generated by a computer network search engine |
JP2001005705A (ja) * | 1999-06-22 | 2001-01-12 | Hitachi Ltd | 文書情報管理システム |
US6665665B1 (en) * | 1999-07-30 | 2003-12-16 | Verizon Laboratories Inc. | Compressed document surrogates |
US6321228B1 (en) * | 1999-08-31 | 2001-11-20 | Powercast Media, Inc. | Internet search system for retrieving selected results from a previous search |
US6839680B1 (en) * | 1999-09-30 | 2005-01-04 | Fujitsu Limited | Internet profiling |
AU1797401A (en) * | 1999-11-22 | 2001-06-04 | Avenue, A, Inc. | Targeting electronic advertising placement in accordance with an analysis of user inclination and affinity |
US6751612B1 (en) * | 1999-11-29 | 2004-06-15 | Xerox Corporation | User query generate search results that rank set of servers where ranking is based on comparing content on each server with user query, frequency at which content on each server is altered using web crawler in a search engine |
EP1107128A1 (en) * | 1999-12-03 | 2001-06-13 | Hyundai Electronics Industries Co., Ltd. | Apparatus and method for checking the validity of links in a computer network |
AUPQ475799A0 (en) * | 1999-12-20 | 2000-01-20 | Youramigo Pty Ltd | An internet indexing system and method |
JP5072160B2 (ja) * | 2000-01-12 | 2012-11-14 | ネットレイティングス・インコーポレーティッド | ワールドワイドウェブのディジタルコンテントの普及を見積もるシステム及び方法 |
US6546388B1 (en) * | 2000-01-14 | 2003-04-08 | International Business Machines Corporation | Metadata search results ranking system |
US6883135B1 (en) * | 2000-01-28 | 2005-04-19 | Microsoft Corporation | Proxy server using a statistical model |
US7117199B2 (en) | 2000-02-22 | 2006-10-03 | Metacarta, Inc. | Spatially coding and displaying information |
US7567958B1 (en) * | 2000-04-04 | 2009-07-28 | Aol, Llc | Filtering system for providing personalized information in the absence of negative data |
US20010030773A1 (en) * | 2000-04-17 | 2001-10-18 | Satoshi Matsuura | Digital photograph system |
JP3562572B2 (ja) * | 2000-05-02 | 2004-09-08 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データベースのドキュメントにおける新規な事項・新規クラスの検出及び追跡 |
US6789076B1 (en) * | 2000-05-11 | 2004-09-07 | International Business Machines Corp. | System, method and program for augmenting information retrieval in a client/server network using client-side searching |
JP2001326635A (ja) * | 2000-05-16 | 2001-11-22 | Matsushita Electric Ind Co Ltd | インターネットの課金システム |
WO2001090921A2 (en) * | 2000-05-25 | 2001-11-29 | Kanisa, Inc. | System and method for automatically classifying text |
JP2002007801A (ja) | 2000-06-21 | 2002-01-11 | Nec Corp | オンラインショッピングシステム、信用情報提供サーバー、提供方法および提供プログラムを記録した記録媒体 |
US20020022999A1 (en) * | 2000-06-23 | 2002-02-21 | Shuster Brian Mark | Method and apparatus for providing audio advertisements in a computer network |
US7003513B2 (en) | 2000-07-04 | 2006-02-21 | International Business Machines Corporation | Method and system of weighted context feedback for result improvement in information retrieval |
JP2002024065A (ja) | 2000-07-07 | 2002-01-25 | Ricoh Co Ltd | 文書管理システム、文書管理方法およびその方法を実施するためのプログラムを記録した記録媒体 |
US7080073B1 (en) * | 2000-08-18 | 2006-07-18 | Firstrain, Inc. | Method and apparatus for focused crawling |
US7146416B1 (en) * | 2000-09-01 | 2006-12-05 | Yahoo! Inc. | Web site activity monitoring system with tracking by categories and terms |
NO313399B1 (no) * | 2000-09-14 | 2002-09-23 | Fast Search & Transfer Asa | Fremgangsmate til soking og analyse av informasjon i datanettverk |
AUPR033800A0 (en) * | 2000-09-25 | 2000-10-19 | Telstra R & D Management Pty Ltd | A document categorisation system |
US6684205B1 (en) * | 2000-10-18 | 2004-01-27 | International Business Machines Corporation | Clustering hypertext with applications to web searching |
JP3934325B2 (ja) * | 2000-10-31 | 2007-06-20 | 株式会社日立製作所 | 文書検索方法、文書検索装置及び文書検索プログラムの記憶媒体 |
FR2816734B1 (fr) * | 2000-11-15 | 2003-03-14 | Linkkit | Procede de recherche, de selection et de representation cartographique de pages web |
US8862656B2 (en) * | 2000-11-21 | 2014-10-14 | Chironet, Llc | Performance outcomes benchmarking |
US7130889B2 (en) | 2000-11-29 | 2006-10-31 | Ncr Corporation | Method of printing information by a network kiosk |
US20020078045A1 (en) * | 2000-12-14 | 2002-06-20 | Rabindranath Dutta | System, method, and program for ranking search results using user category weighting |
JP2002183216A (ja) * | 2000-12-18 | 2002-06-28 | Fuji Electric Co Ltd | 時系列情報蓄積・再生装置 |
US7356530B2 (en) * | 2001-01-10 | 2008-04-08 | Looksmart, Ltd. | Systems and methods of retrieving relevant information |
US7359944B2 (en) * | 2001-02-07 | 2008-04-15 | Lg Electronics Inc. | Method of providing digital electronic book |
JP2002245070A (ja) * | 2001-02-20 | 2002-08-30 | Hitachi Ltd | データ表示方法及び装置並びにその処理プログラムを記憶した媒体 |
US8001118B2 (en) | 2001-03-02 | 2011-08-16 | Google Inc. | Methods and apparatus for employing usage statistics in document retrieval |
US20030018659A1 (en) * | 2001-03-14 | 2003-01-23 | Lingomotors, Inc. | Category-based selections in an information access environment |
US20020188635A1 (en) * | 2001-03-20 | 2002-12-12 | Larson Stephen C. | System and method for incorporation of print-ready advertisement in digital newspaper editions |
US20020161838A1 (en) * | 2001-04-27 | 2002-10-31 | Pickover Cilfford A. | Method and apparatus for targeting information |
US7194483B1 (en) * | 2001-05-07 | 2007-03-20 | Intelligenxia, Inc. | Method, system, and computer program product for concept-based multi-dimensional analysis of unstructured information |
US7299219B2 (en) * | 2001-05-08 | 2007-11-20 | The Johns Hopkins University | High refresh-rate retrieval of freshly published content using distributed crawling |
JP4489994B2 (ja) * | 2001-05-11 | 2010-06-23 | 富士通株式会社 | 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体 |
JP4025517B2 (ja) * | 2001-05-31 | 2007-12-19 | 株式会社日立製作所 | 文書検索システムおよびサーバ |
US7035772B2 (en) * | 2001-05-31 | 2006-04-25 | International Business Machines Corporation | Method and apparatus for calculating data integrity metrics for web server activity log analysis |
US7058624B2 (en) * | 2001-06-20 | 2006-06-06 | Hewlett-Packard Development Company, L.P. | System and method for optimizing search results |
US7299270B2 (en) * | 2001-07-10 | 2007-11-20 | Lycos, Inc. | Inferring relations between internet objects that are not connected directly |
US7146409B1 (en) * | 2001-07-24 | 2006-12-05 | Brightplanet Corporation | System and method for efficient control and capture of dynamic database content |
JP2003046764A (ja) | 2001-08-03 | 2003-02-14 | Matsushita Graphic Communication Systems Inc | 紙面伝送システム及び紙面伝送方法 |
US7076483B2 (en) * | 2001-08-27 | 2006-07-11 | Xyleme Sa | Ranking nodes in a graph |
US20040205454A1 (en) * | 2001-08-28 | 2004-10-14 | Simon Gansky | System, method and computer program product for creating a description for a document of a remote network data source for later identification of the document and identifying the document utilizing a description |
US20030046098A1 (en) * | 2001-09-06 | 2003-03-06 | Seong-Gon Kim | Apparatus and method that modifies the ranking of the search results by the number of votes cast by end-users and advertisers |
JP4283466B2 (ja) * | 2001-10-12 | 2009-06-24 | 富士通株式会社 | リンク関係に基づく文書整理方法 |
JP2003122699A (ja) | 2001-10-15 | 2003-04-25 | Toshiba Corp | 情報処理システムとその周辺機器 |
US6944609B2 (en) * | 2001-10-18 | 2005-09-13 | Lycos, Inc. | Search results using editor feedback |
US20030101126A1 (en) * | 2001-11-13 | 2003-05-29 | Cheung Dominic Dough-Ming | Position bidding in a pay for placement database search system |
US20030101166A1 (en) * | 2001-11-26 | 2003-05-29 | Fujitsu Limited | Information analyzing method and system |
US6763362B2 (en) * | 2001-11-30 | 2004-07-13 | Micron Technology, Inc. | Method and system for updating a search engine |
US7124353B2 (en) * | 2002-01-14 | 2006-10-17 | International Business Machines Corporation | System and method for calculating a user affinity |
US7565367B2 (en) * | 2002-01-15 | 2009-07-21 | Iac Search & Media, Inc. | Enhanced popularity ranking |
US20030135460A1 (en) * | 2002-01-16 | 2003-07-17 | Galip Talegon | Methods for valuing and placing advertising |
US20110066510A1 (en) * | 2002-01-16 | 2011-03-17 | Galip Talegon | Methods for valuing and placing advertising |
JP4003468B2 (ja) * | 2002-02-05 | 2007-11-07 | 株式会社日立製作所 | 適合性フィードバックによる類似データ検索方法および装置 |
US20040205569A1 (en) * | 2002-02-06 | 2004-10-14 | Mccarty Jon S. | Method and system to manage outdated web page links in a computing system |
US7343365B2 (en) * | 2002-02-20 | 2008-03-11 | Microsoft Corporation | Computer system architecture for automatic context associations |
US7188107B2 (en) * | 2002-03-06 | 2007-03-06 | Infoglide Software Corporation | System and method for classification of documents |
US7203909B1 (en) * | 2002-04-04 | 2007-04-10 | Microsoft Corporation | System and methods for constructing personalized context-sensitive portal pages or views by analyzing patterns of users' information access activities |
US7085832B2 (en) * | 2002-04-30 | 2006-08-01 | International Business Machines Corporation | Method and apparatus for enabling an internet web server to keep an accurate count of page hits |
US6993586B2 (en) | 2002-05-09 | 2006-01-31 | Microsoft Corporation | User intention modeling for web navigation |
US7599911B2 (en) * | 2002-08-05 | 2009-10-06 | Yahoo! Inc. | Method and apparatus for search ranking using human input and automated ranking |
US8375286B2 (en) * | 2002-09-19 | 2013-02-12 | Ancestry.com Operations, Inc. | Systems and methods for displaying statistical information on a web page |
US7568148B1 (en) * | 2002-09-20 | 2009-07-28 | Google Inc. | Methods and apparatus for clustering news content |
US20040059625A1 (en) * | 2002-09-20 | 2004-03-25 | Ncr Corporation | Method for providing feedback to advertising on interactive channels |
US7158983B2 (en) * | 2002-09-23 | 2007-01-02 | Battelle Memorial Institute | Text analysis technique |
US20040064447A1 (en) * | 2002-09-27 | 2004-04-01 | Simske Steven J. | System and method for management of synonymic searching |
US6886010B2 (en) * | 2002-09-30 | 2005-04-26 | The United States Of America As Represented By The Secretary Of The Navy | Method for data and text mining and literature-based discovery |
US7130844B2 (en) * | 2002-10-31 | 2006-10-31 | International Business Machines Corporation | System and method for examining, calculating the age of an document collection as a measure of time since creation, visualizing, identifying selectively reference those document collections representing current activity |
US20040098405A1 (en) | 2002-11-16 | 2004-05-20 | Michael Zrubek | System and Method for Automated Link Analysis |
US7792827B2 (en) * | 2002-12-31 | 2010-09-07 | International Business Machines Corporation | Temporal link analysis of linked entities |
US7016889B2 (en) * | 2003-01-30 | 2006-03-21 | Hewlett-Packard Development Company, Lp. | System and method for identifying useful content in a knowledge repository |
US20040193698A1 (en) * | 2003-03-24 | 2004-09-30 | Sadasivuni Lakshminarayana | Method for finding convergence of ranking of web page |
US20040225644A1 (en) * | 2003-05-09 | 2004-11-11 | International Business Machines Corporation | Method and apparatus for search engine World Wide Web crawling |
US7283997B1 (en) * | 2003-05-14 | 2007-10-16 | Apple Inc. | System and method for ranking the relevance of documents retrieved by a query |
US20040249871A1 (en) * | 2003-05-22 | 2004-12-09 | Mehdi Bazoon | System and method for automatically removing documents from a knowledge repository |
US7146361B2 (en) | 2003-05-30 | 2006-12-05 | International Business Machines Corporation | System, method and computer program product for performing unstructured information management and automatic text analysis, including a search operator functioning as a Weighted AND (WAND) |
US7685117B2 (en) * | 2003-06-05 | 2010-03-23 | Hayley Logistics Llc | Method for implementing search engine |
US7308643B1 (en) * | 2003-07-03 | 2007-12-11 | Google Inc. | Anchor tag indexing in a web crawler system |
US20050060290A1 (en) * | 2003-09-15 | 2005-03-17 | International Business Machines Corporation | Automatic query routing and rank configuration for search queries in an information retrieval system |
US7739281B2 (en) * | 2003-09-16 | 2010-06-15 | Microsoft Corporation | Systems and methods for ranking documents based upon structurally interrelated information |
US7685296B2 (en) * | 2003-09-25 | 2010-03-23 | Microsoft Corporation | Systems and methods for client-based web crawling |
US7346839B2 (en) | 2003-09-30 | 2008-03-18 | Google Inc. | Information retrieval based on historical data |
US7797316B2 (en) | 2003-09-30 | 2010-09-14 | Google Inc. | Systems and methods for determining document freshness |
US20050102282A1 (en) | 2003-11-07 | 2005-05-12 | Greg Linden | Method for personalized search |
US8631001B2 (en) | 2004-03-31 | 2014-01-14 | Google Inc. | Systems and methods for weighting a search query result |
US20050234877A1 (en) | 2004-04-08 | 2005-10-20 | Yu Philip S | System and method for searching using a temporal dimension |
US7519586B2 (en) * | 2004-04-30 | 2009-04-14 | International Business Machines Corporation | Method of searching |
US20050256848A1 (en) | 2004-05-13 | 2005-11-17 | International Business Machines Corporation | System and method for user rank search |
US7562068B2 (en) | 2004-06-30 | 2009-07-14 | Microsoft Corporation | System and method for ranking search results based on tracked user preferences |
US20060047643A1 (en) | 2004-08-31 | 2006-03-02 | Chirag Chaman | Method and system for a personalized search engine |
WO2006085778A2 (en) | 2005-02-11 | 2006-08-17 | Eurekster, Inc | Information prioritisation system and method |
US20060248055A1 (en) | 2005-04-28 | 2006-11-02 | Microsoft Corporation | Analysis and comparison of portfolios by classification |
US8438142B2 (en) | 2005-05-04 | 2013-05-07 | Google Inc. | Suggesting and refining user input based on original user input |
US7853485B2 (en) | 2005-11-22 | 2010-12-14 | Nec Laboratories America, Inc. | Methods and systems for utilizing content, dynamic patterns, and/or relational information for data analysis |
US9177124B2 (en) * | 2006-03-01 | 2015-11-03 | Oracle International Corporation | Flexible authentication framework |
-
2003
- 2003-12-31 US US10/748,664 patent/US7346839B2/en active Active
-
2004
- 2004-09-15 EP EP11186365.0A patent/EP2416263A3/en not_active Withdrawn
- 2004-09-15 JP JP2006533916A patent/JP2007507798A/ja not_active Withdrawn
- 2004-09-15 CA CA2540573A patent/CA2540573C/en active Active
- 2004-09-15 CA CA2757550A patent/CA2757550A1/en not_active Abandoned
- 2004-09-15 EP EP11186370.0A patent/EP2416264A3/en not_active Withdrawn
- 2004-09-15 EP EP11186363.5A patent/EP2416262A3/en not_active Withdrawn
- 2004-09-15 DE DE200420021885 patent/DE202004021885U1/de not_active Expired - Lifetime
- 2004-09-15 DE DE200420021886 patent/DE202004021886U1/de not_active Expired - Lifetime
- 2004-09-15 EP EP04784004A patent/EP1668551A1/en not_active Ceased
- 2004-09-15 CN CN200480033254.8A patent/CN1879107B/zh active Active
- 2004-09-15 AU AU2004277678A patent/AU2004277678C1/en active Active
- 2004-09-15 WO PCT/US2004/030000 patent/WO2005033978A1/en active Application Filing
- 2004-09-15 EP EP11186372.6A patent/EP2416265A3/en not_active Withdrawn
-
2006
- 2006-11-20 US US11/561,625 patent/US7840572B2/en not_active Expired - Fee Related
- 2006-11-21 US US11/562,285 patent/US8112426B2/en active Active
- 2006-11-22 US US11/562,617 patent/US8051071B2/en active Active
- 2006-11-30 US US11/565,026 patent/US8316029B2/en not_active Expired - Lifetime
- 2006-11-30 US US11/565,004 patent/US20070094255A1/en not_active Abandoned
-
2007
- 2007-01-09 JP JP2007001794A patent/JP4603556B2/ja active Active
-
2010
- 2010-10-01 US US12/896,744 patent/US8407231B2/en not_active Expired - Lifetime
- 2010-10-12 US US12/902,966 patent/US8521749B2/en not_active Expired - Lifetime
-
2011
- 2011-02-10 JP JP2011027886A patent/JP5312498B2/ja active Active
- 2011-06-30 US US13/174,243 patent/US8234273B2/en not_active Expired - Lifetime
- 2011-06-30 US US13/174,304 patent/US8527524B2/en not_active Expired - Lifetime
- 2011-09-14 US US13/232,599 patent/US8549014B2/en not_active Expired - Lifetime
- 2011-09-26 US US13/244,848 patent/US8239378B2/en not_active Expired - Lifetime
- 2011-09-26 US US13/244,863 patent/US8185522B2/en not_active Expired - Lifetime
- 2011-09-26 US US13/244,841 patent/US8224827B2/en not_active Expired - Lifetime
- 2011-09-26 US US13/244,853 patent/US8244723B2/en not_active Expired - Lifetime
- 2011-09-26 US US13/244,867 patent/US8266143B2/en not_active Expired - Lifetime
- 2011-09-30 US US13/250,703 patent/US8577901B2/en not_active Expired - Lifetime
-
2012
- 2012-04-24 US US13/454,424 patent/US8639690B2/en not_active Expired - Lifetime
- 2012-09-14 US US13/615,730 patent/US9767478B2/en active Active
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100514337C (zh) * | 2007-09-10 | 2009-07-15 | 腾讯科技(深圳)有限公司 | 关键词的联想信息生成系统和生成方法 |
CN105247481A (zh) * | 2013-05-29 | 2016-01-13 | 惠普发展公司,有限责任合伙企业 | 网页输出选择 |
CN105247481B (zh) * | 2013-05-29 | 2019-05-07 | 惠普发展公司,有限责任合伙企业 | 用于网页输出选择的计算系统、方法和机器可读非暂时性存储介质 |
CN104778202A (zh) * | 2015-02-05 | 2015-07-15 | 北京航空航天大学 | 基于关键词的事件演化过程的分析方法及系统 |
CN104778202B (zh) * | 2015-02-05 | 2018-08-14 | 北京航空航天大学 | 基于关键词的事件演化过程的分析方法及系统 |
CN107622090A (zh) * | 2017-08-22 | 2018-01-23 | 上海艾融软件股份有限公司 | 对象的获取方法、装置及系统 |
CN107622090B (zh) * | 2017-08-22 | 2020-10-16 | 上海艾融软件股份有限公司 | 对象的获取方法、装置及系统 |
CN112783837A (zh) * | 2021-01-12 | 2021-05-11 | 北京首汽智行科技有限公司 | 一种api文档查找方法 |
CN112783837B (zh) * | 2021-01-12 | 2024-01-30 | 北京首汽智行科技有限公司 | 一种api文档查找方法 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1879107A (zh) | 基于历史数据的信息检索 | |
EP1775665A2 (en) | Document scoring based on link-based criteria | |
AU2007200526A1 (en) | Document scoring based on query analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder |
Address after: American California Patentee after: Google limited liability company Address before: American California Patentee before: GOOGLE Inc. |
|
CP01 | Change in the name or title of a patent holder |