CN1797399A - 用于文本挖掘和搜索的应用程序编程接口 - Google Patents

用于文本挖掘和搜索的应用程序编程接口 Download PDF

Info

Publication number
CN1797399A
CN1797399A CNA2005101161016A CN200510116101A CN1797399A CN 1797399 A CN1797399 A CN 1797399A CN A2005101161016 A CNA2005101161016 A CN A2005101161016A CN 200510116101 A CN200510116101 A CN 200510116101A CN 1797399 A CN1797399 A CN 1797399A
Authority
CN
China
Prior art keywords
search
data
public
results
inquiry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005101161016A
Other languages
English (en)
Other versions
CN1797399B (zh
Inventor
E·D·布里尔
R·J·拉格诺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN1797399A publication Critical patent/CN1797399A/zh
Application granted granted Critical
Publication of CN1797399B publication Critical patent/CN1797399B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching

Abstract

描述了允许对结构化形式的搜索引擎结果和查询日志的计划性访问的系统和方法。能够从搜索引擎中检索包含提供给web浏览器的HTML页面中的信息(潜在地还有其它信息)的中间形式的搜索结果。该中间形式然后可以使用本地资源在客户机上分解来组装结构化的对象。该库也提供对搜索结果的高速缓存。这可以在本地机器和远程数据库上提供。例如,当一个查询的结果在高速缓存中存在时,它们可以从这些位置检索而不查询搜索引擎。文档和/或网页也可以被高速缓存。该库也能够被指导来仅从高速缓存中操作,从而有效地展现本地数据集而不是远程搜索引擎。

Description

用于文本挖掘和搜索的应用程序编程接口
相关申请的交叉引用
本申请要求于2004年11月11日提交的序号为60/626,790、名为“APPLICATION PROGRAMMING INTERFACE FOR TEXT MINING ANDSEARCH(用于文本挖掘和搜索的应用程序编程接口)”的美国专利临时申请符合35U.S.C.§119(e)款的优先权,该申请通过引用整体包含在此。
背景技术
在当今的信息化时代,通过消费者可用的多种工具,简化了数据的定位和收集。这样的数据收集的一种方法可以通过计算机网络(例如,互联网、内联网、LAN、WAN等)的接口变得更为方便,其中用户能够向搜索引擎输入所需的信息,并检索对应于所输入的搜索元素的一组结果。另外,用户能够重复搜索工作来提炼和/或修改用户想要检索的数据。这样的额外搜索能够基于用户的愿望手动地或自动地进行。
存在使用唯一的算法和/或技术来定位数据并将数据返回给用户以执行搜索的诸多不同的搜索引擎。例如,一种搜索引擎能够提供允许用户利用布尔串来请求数据的工具,而另一种搜索引擎可以使用对用户的自然语言界面。作为更多的示例,搜索引擎能够将其搜索限制于满足预定准则的文档,然第二种搜索引擎能够搜索每个可用的资源来检索所请求的信息。
通常,搜索引擎担当一种服务,其中该服务对所需的潜在数据源做出调用,然后接收诸如文本或可扩展标记语言(XML)等一组信息。这样的数据结果能够以未组织起来的方式返回,其中用户必须对所有返回的信息进行分类来确定是否有一个或多个结果包含用户希望检索的信息。以这种方式,如果用户不能从返回的集合中定位所需的信息,对信息的搜索可能是效率低下的和/或不完整的。而且,如果用户反复地执行对数据的搜索,那么用户连续地向搜索引擎输入搜索元素可能是效率低下的。需要允许更高效地搜索和定位用户所需数据的系统和/或方法。
发明内容
下文提出了此处描述的各方面的简化概要,以提供对这些方面的基本理解。该概要不是本发明的广泛综述。它既不旨在标识本发明的关键或重要的元素,也不旨在描绘本发明的范围。其唯一的目的是以简化的形式提出本发明的某些概念,作为后面提供的更详细描述的序言。
描述了允许对结构化形式的搜索引擎结果和查询日志进行计划性访问的系统和方法。例如,可以从搜索引擎中检索中间XML形式的搜索结果,该中间XML形式类似于用于为web浏览器准备的超文本链接标记语言(HTML)页面的形式。该中间形式然后可以在客户机上使用本地资源分解来组装为结构化对象。该中间形式可以包含比通常包含在为web浏览器准备的HTML结果页面(诸如,但不限于,调试统计数据或分级数据)中的信息的更多的信息。
该库也提供搜索结果的高速缓存。这可以在本地机器和远程数据库上提供。例如,当一个查询的结果在高速缓存中存在时,那么可以从这些位置检索它们而不查询搜索引擎。文档(网页)也可以被高速缓存。该库也能够被指导来仅从高速缓存中操作,从而有效地展现本地数据集而不是远程搜索引擎。高速缓存的数据可以被编辑或完全地构造。能够支持多个高速缓存,因为如果高速缓存是随时间改变的,那么可以通过切换高速缓存来对不同的时帧比较搜索结果。
该库可以利用同一API组件以多个搜索引擎为目标。这允许应用程序使用API组件在搜索引擎之间立即切换而无需修改其代码。该库处理使得所有的搜索交互看上去相同所需的变换。另外,该库可以制作看上去是一特定搜索引擎的结果页面的网页,即使该查询和结果是来自于一个不同的搜索引擎或完全是构造的。
为了达到前述和相关的目的,本发明包含以下充分描述的特征。以下描述和附图详细阐述了本发明的某些说明性的方面。然而,这些方面仅指示其中可采用本发明的原理的多种方式中的几种。当结合附图考虑,阅读以下本发明的具体实施方式,本发明的其它方面、优点和新颖的特征会变得显而易见。
附图说明
图1示出了根据一个方面的示例性数据检索系统。
图2示出了根据一个方面具有提取组件和结果组件的示例性数据检索系统。
图3示出了根据一个方面具有查询日志和结果高速缓存的示例性数据检索系统。
图4示出了根据一个方面的库和应用程序接口。
图5示出了根据一个方面将库和应用程序接口用于多个搜索引擎的示例性系统。
图6示出了根据一个方面使用页面制作器的数据组装系统。
图7示出了根据一个方面通过利用来自搜索引擎的结果来优化开发的示例性方法。
图8示出了根据一个方面检索并组装来自离线数据源的数据用于消费的示例性方法。
图9示出了根据一个方面利用API来定位和实现数据的示例性方法。
图10示出了根据各方面的示例性计算环境。
图11示出了根据各方面能够使用的示例性网络。
附录A描述了各种类库和应用程序编程接口,且该文档被认为是说明书的一部分。
具体实施方式
现在将参考附图描述本发明的各方面,全文中同样的标号指同样的元素。本发明涉及能够允许开发者利用提供对搜索引擎结果和查询日志的访问的应用程序编程接口(API)组件的系统和方法。搜索引擎结果能够被高速缓存,且能够利用查询日志,这样开发者能够使用这一API组件来与搜索结果和查询日志的库接口,以便能够更容易地设计可以充分利用高速缓存的搜索结果和查询日志的程序和/或网站。以这种方式,使用这一搜索结果的应用程序能够变得更高效,并能够通过使用结果的高速缓存代替反复使用搜索引擎来限制对搜索引擎的处理负荷。数据的这一高速缓存能够在多个位置上出现,诸如本地磁盘上、存储器中或预先配置的高速缓存服务器上。
现在参考图1,示出了具有库110和API组件210的系统100,API组件120与搜索引擎130和存储体140接口。库110能够用于通过API组件120以结构化形式向一个或多个用户提供数据。这样的数据能够从多个来源收集,诸如搜索引擎130和存储体140。以这种方式,数据的结构化形式能够减轻对解析出所需数据和/或创建计划性对象来访问这一数据的需求。
API组件120能够用于组装和提取来自搜索引擎130的信息的各部分,这样,通过库110,以结构化形式提供了这些信息。数据的结构能够基于用户和/或应用程序的需求来自动或手动地配置。而且,例如,API组件120能够利用客户机的资源来减轻搜索引擎130的负载。数据的结构可以通过类库来定义。(见附录A,其被认为是本申请的一部分。)类库能够用于确定由搜索引擎返回且随后提供给库110的数据的结构和内容。这样,根据一种方法,网站开发者能够使用API组件120来与来自搜索引擎130和/或存储体140的数据接口,以便能够更容易地设计充分利用任一数据源提供的数据的程序和/或网站。
API组件120能够与一个或多个完全不同的应用程序和/或设备(例如,存储体140)接口来提供数据,而不需在每次需要数据和/或结果时实际例示搜索引擎130。以这种方式,所请求的数据能够比常规方法更快地提供给请求者,而不会使实际的搜索引擎负担沉重。另外,能够分配和管理系统资源,使得能够减轻超载情况。这样,当反复请求数据时,能够比常规方法更快地提供结果。
搜索引擎130可以是能够接受一组搜索准则并利用这些准则来搜索并提供满足所需搜索准则的一个或多个结果的任一合适类型的应用程序。搜索准则可以涉及所需信息的一个或多个方面,诸如数据长度、格式、内容、创建日期等。另外,搜索引擎130能够使用接受要在搜索中使用的数据元素的一种或多种方法,这些数据元素诸如各种语言、布尔连接符、内容、格式等。一个或多个用户能够本地和/或远程地访问搜索引擎130。这样的接口能够利用便于API组件120和搜索引擎130之间的通信的至少一个协议和/或标准来实现。例如,API组件120能够位于使用以太网与无线以太网服务器通信的处理组件上。无线服务器进而可以与搜索引擎130通信来请求进行至少一个搜索。
搜索引擎130能够如所需地基于事件周期性地或连续地进行搜索。例如,搜索引擎可以使用一组准则以在六个月的时间段内每周执行一次搜索。以这种方式,随时间被添加至特定网络的内容能够在定期的基础上访问,以保证用户接收最新的数据内容。作为更多的示例,能够将人工智能(AI)组件(未示出)连接至搜索引擎130来确定执行数据搜索的最佳方式。例如,用户的数据准则能够被修改成提供一组理想的数据结果。类似地,AI组件能够用于基于事件和/或搜索引擎130可用的额外信息确定何时执行搜索。
在本发明的一个方面,向访问组件提供所请求的搜索元素的适当位置能够通过机器学习来确定,其中可使用具有搜索的期望结果和/或不期望结果的示例的一个或多个训练数据集来训练该系统。在另一个方面,能够利用基于指示期望结果的一个或多个特征的初始条件。这样的初始条件能够随时间并响应于与返回的结果相关联的用户动作来调整,以改进辨别力。例如,用户利用的结果能够用于训练系统来学习相关联的查询期望的结果。另外,对一特定数据项最经常请求哪些结果的了解能够用于配置适当的接口以仅展示数据订户感兴趣和/或被授权来查看的信息。例如,被用户访问更多次的结果可被认为是对用户更有用的。以这种方式,如果一特定数据消费者请求特定的属性和/或方法,那么这样的数据方面可以在将来被利用。
另外,如此处所使用的,术语“推断”一般指的是从通过事件和/或数据捕捉到的一组观察值来推出或推断系统、环境和/或用户的状态的过程。例如,推断可以用于确定特定的上下文或动作,或能够生成状态的概率分布。推断可以是概率性的——即,基于对数据和事件的考虑对感兴趣的状态的概率分布的计算。推断可以指用于从一组事件和/或数据中组成更高级事件的技术。这样的推断能够导致从一组观察到的事件和/或存储的事件数据中构造新的事件或动作,而无论该事件是否在紧密相邻的时间上相关,也无论该事件或数据是来自一个还是若干个事件和数据源。各种分类方案和/或系统(例如,支持矢量机、神经网络(例如,后向传播、前馈后向传播、径向基(radial base)和模糊逻辑)、专家系统、贝叶斯网络和数据融合)能够用于执行与本发明有关的自动和/或推断的动作。
在本发明的又一方面,能够使用一种技术来预先考虑由用户使用的搜索准则。例如,诸如表示用于向访问组件提供所请求的搜索元素的数据和与这些数据相关联的属性的历史数据等信息能够用于预测在网络中检索所请求的数据的较佳位置。例如,根据本发明的一方面,可以使用基于统计量、概率、推断和分类器(例如,显式或隐式训练的)的智能决策,分类器包括贝叶斯学习、贝叶斯分类器和其他统计分类器,诸如决策树学习法、支持矢量机、线性和非线性回归和/或神经网络。以这种方式,AI组件(未示出)能够由访问组件110用于提供基于与特定数据源有关的特定数据消费者的学到的动作的决策制定。
存储体140可以用于存储关于数据的参数和/或存储实际数据。这样的数据能够在存储体140中按所需的进行结构化,并且还能够提供要由用户组织和编辑的数据。例如,诸如查询和结果等关于搜索引擎130的数据如所需地被存储在存储体140并被访问。此外,来自存储体140的数据能够被独占地使用来减轻对搜索引擎130的资源的花费。
图2示出了其中客户机被耦合至API组件220和库230以访问搜索引擎240的系统200。对客户机使用组装组件260和提取组件250以便于消费从API组件220中接收到的数据。客户机210实质上可以是向完全不同的来源要求数据的任何设备、系统和/或组件。例如,客户机可以是运行在处理器上的应用程序,其中该应用程序使用数据来创建并向一个或多个用户发布网页。
提取组件250可以用于从API组件220和/或库230中接受中间形式的数据,其中该数据能够由客户机210更容易地处理和消费。例如,能够以XML中间形式向客户机提供来自搜索引擎240的搜索结果,它基本上接近于用于为web浏览器准备的HTML页面的数据。该提取组件然后可以使用客户机资源来解析出所需的数据。例如,一旦被分解出,组装组件能够将提取的数据集合起来以创建HTML网页。
图3示出了其中搜索引擎310被耦合至查询日志320和结果高速缓存330的系统300。查询日志320和结果高速缓存330与库340接口,以允许数据从搜索引擎310转移。库340可以通过API组件350与组装组件360通信,如上所述,搜索引擎310能够接受作为搜索项的数据对象,且随后执行搜索来从一个或多个不同的来源检索数据。这样的搜索项能够被存储在查询日志320中,且可以在稍后的时间被组织、编辑和检索。类似地,由搜索引擎310收集的数据能够被存储在结果高速缓存330中,并如所需地组织和结构化。
以这种方式,库340能够与搜索引擎310和存储在结果高速缓存330中的来自搜索引擎的结果接口。该库能够结构化来自任一来源的数据以向完全不同的一方提供。API组件350能够向库请求将由组装组件360使用的所需的数据的结构。所请求的数据的正确的来源能够基于诸如请求的频率、所需数据的内容和/或类型、和/或数据的时效等一个或多个因素来确定。以这种方式,可以达到对系统资源更高效的使用,同时提供满足用户期望的数据。另外,例如,结果高速缓存330能够用于将存储的数据从一种格式转换成另一种格式。而且,可以如所需地进行一个或多个内部监察来删除冗余的搜索结果并提供数据的清理。
另外,结果高速缓存300能够组装用户可接口并用来选择所需数据的返回的数据。例如,存储在结果高速缓存330中的数据能够用于创建复制品网页。以这种方式,组装组件360能够接收到看上去是实时数据的数据。另外,结果高速缓存330能够允许组装组件360如所需地检索实时数据。以这种方式,结果高速缓存330可以用于代替或结合搜索引擎310来检索所需的数据。
驻留在结果高速缓存330中的数据和/或数据指针能够被组织和编辑,以便于对填充结果高速缓存330的数据和/或数据指针的有效访问。例如,数据能够根据进行的搜索、数据内容、数据格式等来分组。作为另一个示例,数据内容能够被编辑来简化诸如组装组件360等一个完全不同的设备的消费。这样,利用结果高速缓存330能够提供预先格式化的数据并减轻对搜索引擎资源的使用,以提供一种更有效的系统体系结构。
库340能够请求和接收来自诸如搜索引擎310等实时来源的数据和来自诸如查询日志320和结果高速缓存330等已存储位置的数据。API能够用于向库请求数据、内容、结构等来向组装组件360提供这些信息。例如,传送给组装组件360的数据可以是能够如所需地解析和重建的XML形式。例如,组装组件能够使用实时和已存储的数据来创建能够由一个或多个用户使用的交互式复制品网页。这样,组装组件360能够从API 350检索数据并如用户所需地重建数据。
图4示出了其中应用程序410使用API组件420通过库430与远程数据库440和本地处理器450接口的系统400。远程数据库440和本地处理器450包含结果高速缓存460和470。这些高速缓存能够提供对特定数据类型、格式和内容等的数据存储。这样,来自一个查询的结果能够如用户所需地从一个或多个结果高速缓存(例如,460、470等)中检索。例如,库430也能够被指导来仅从高速缓存操作,从而有效地展现本地数据集而不是远程搜索引擎。高速缓存的数据能够通过数据编辑器480被编辑或完全地构造。而且,能够支持多个高速缓存——即,如果该高速缓存随时间改变,那么能够通过切换高速缓存(例如,从结果高速缓存460切换到结果高速缓存470)对不同的时帧比较搜索结果。
数据编辑器480能够由库430用于如所需地编辑、组织和结构化数据。例如,应用程序410能够充分利用来自一个或多个结果高速缓存的数据,并能够结构化和/或配置数据以满足应用程序410的要求。数据编辑器480能够使用任何数量的装置来与库430通信。例如,数据编辑器可以是提供用于对库430内的数据作所需修改的工具的人机交互界面。
远程数据库440可以是其中存储数据的几乎任何平台。这样的数据能够在远程数据库440中被配置、组织、编辑等。远程数据库440能够通过网络连接(例如,LAN、WAN、CAN等)与API组件420接口,并能够利用各种通信协议和/或标准来与API组件420接口。例如,该远程数据库可以位于一个完全不同的网络中,且可以在执行了对数据的每一搜索后接受结果。
本地处理器450可以是能够接受和处理数据以获得结果的基本上任何类型的设备。这样的处理可以通过可驻留在本地环境中的软件和/或硬件来完成。例如,维护搜索结果的本地高速缓存能够减少用于诸如搜索引擎等完全不同的设备的处理时间。本地处理器可以是计算机、可编程逻辑控制器、软件、固件等。可以理解,尽管该处理器对API组件420是本地的,但是它可以使用任何数量的协议和/或标准在基本上任何位置与API组件420接口。
图5示出了其中应用程序组件510利用API设备520与多个搜索引擎540-546接口的系统500。API设备520包括含有一个或多个搜索引擎540-546的搜索引擎结果和/或查询日志的库530。例如,应用程序组件510可以是用于创建和组合网页的软件。在一种方法中,应用程序组件510能够通过使用API设备520快速地定位和使用所需的特定数据。API设备520能够使用界面来允许用户选择并配置从一个或多个搜索引擎540-546返回的各种数据元素。另外,API设备520能够用于通过搜索来确定所需数据和与其相关联的特定搜索引擎的数量和位置。
搜索引擎540-546可以对API设备520是远程或本地的。例如,搜索引擎541可以对API设备520是远程的,且通过因特网访问。相反,例如,搜索引擎544可以是在与API设备520相同的计算机上使用的本地应用程序。可以使用各种协议以便于API设备520和一个或多个搜索引擎540-546之间的通信。
可以使用一种以上协议来提供系统500内各组件之间的通信,且可以彼此并发地使用这些协议。例如,与搜索引擎540的通信可以使用无线协议(例如,无线以太网、红外线等),同时搜索引擎546并发地使用以太网。以这种方式,API设备520不限于特定的I/O接口来请求数据搜索和从搜索引擎540-546返回。
利用API设备520能够以多个搜索引擎为目标。这能够允许应用程序组件利用API设备520在搜索引擎540-546之间无缝地切换而不需修改其代码。另外,API设备能够处理使得基本上所有的搜索交互看上去相同所需的变换。另外,API设备520能够制作看上去是特定搜索引擎540-546的结果页面的网页,即使查询和结果是来自于不同的搜索引擎或是从完全不同的数据集完全地构造的。
搜索引擎540-546能够使用任何数量的特定算法和/或例程来接受并进行所请求的数据搜索。另外,每一搜索引擎540-546能够提供如用户所需的的特定信息。以这种方式,API设备520能够担当由一个或多个搜索引擎540-546执行的搜索的返回填充的库。这些返回的数据能够被结构化,使得它能够由应用程序组件510访问来去除对返回的数据进行解析并创建计划性对象的需求。
图6示出了其中应用程序610与API组件620和库630通信的系统600。库630与耦合至搜索引擎660的查询日志640和耦合至搜索引擎670的结果高速缓存650接口。搜索引擎660和670可以对特定的数据进行所需的搜索。例如,结果高速缓存650可以由从搜索引擎660和670中的一个所返回的文档和/或XML形式构成。搜索结果可以从搜索引擎中以类似于用于为web浏览器准备的HTML页面的数据格式的中间XML形式来检索。
查询日志640能够耦合至库630来提供与一个或多个数据搜索相关联的各种数据的存储。查询日志640能够包含用于为特定数据进行搜索的一个或多个语句、搜索元素、描述符等。查询日志640可以使用能够如用户所需地组织和划分数据的编辑组件(未示出)。例如,数据可以按照会话、搜索、关键词等来分类。
页面制作器680能够耦合至库630,以利用完全不同的数据源来创建复制品网页。例如,页面制作器680能够使用数据来制作看上去是一特定搜索引擎的结果页面的网页,即使该查询和结果是来自完全不同的搜索引擎(例如,搜索引擎660和670)或完全是构造的。作为更多的示例,能够利用来自相同搜索引擎和查询日志以及与其相关联的结果高速缓存来创建一个或多个网页。
图7、8和9示出了根据本发明的方法700、800和900。为说明的简单起见,这些方法被描绘和描述为一系列动作。可以理解并意识到,本发明不受所示的动作和/或动作的顺序的限制,例如,动作可以按各种顺序发生和/或与此处未提供和描述的其它动作并发地发生。而且,不是所有示出的动作都是实现根据本发明的方法所必需的。另外,本领域的技术人员可以理解并意识到,该方法可以通过状态图或事件被可选地表示为一系列相互关联的状态。
图7示出了使用至少一个搜索引擎来定位和检索特定数据以与一个或多个组件一起使用的方法700。在710,一个或多个数据元素被发送给搜索引擎。这样的数据元素可以由基本上任何所需的数据长度、格式、内容、包装等构成。该一个或多个数据元素能够利用各种协议和/或标准被传输到搜索引擎。另外,搜索引擎能够使用一个或多个算法与多个数据源接口,来定位所请求的数据。这样的搜索引擎可以位于发送数据元素的一方本地(例如,在同一计算机上),或远程位于诸如完全不同的网络上。
在720处,基于由请求者发送的至少一个数据元素执行搜索。进行的搜索能够被修改成适应于用户的需求或要求。例如,搜索能够限于仅可用资源的一个子集,或限于符合若干预定格式中的一种的数据。搜索能够手动进行(例如,用户启动)或自动进行(例如,基于事件、周期性地或在某时)。在730处,存储来自搜索引擎的结果。这样的结果能够被解析并组织,使得数据以按更可消费的形式对用户可用。例如,存储数据可以基于时间和/或其它因素而被限制,以仅维护满足特定时间限制的一组数据。作为更多的示例,如有需要,数据可以被分组,使得同样的数据被存储在一起,和/或满足某一准则的数据作为一个子集存储。
在740处,所存储的数据与一个或多个应用程序接口。这样的应用程序能够使用搜索引擎结果来创建数据的交互式复制品。与所存储的数据通信可以涉及多个完全不同的协议、数据结构等来正确地访问所需的数据。在750处,来自搜索引擎的结果用于优化开发。在一种方法中,各种结果以一特定的结构(例如,XML、HTML等)存储,以用于创建和/或模拟搜索引擎活动。以这种方式,例如,开发者能够使用这样的优化来访问和利用用于一特定应用程序的数据。
图8示出了其中所存储的数据由至少一个设备组装和利用的方法800。在810处,根据由至少一个用户确定的各种参数,通过搜索引擎来定位数据。在820处,与每一搜索相关联的数据(例如,搜索项、搜索指令、数据元素等)被存储在查询日志中。在执行了这样的搜索之后,从来自每一搜索返回的结果被存储在结果高速缓存中。该结果高速缓存能够如所需地存储从一个或多个搜索返回的数据。这些返回的数据可以不仅包括数据本身,而且包括能够描述数据的各种属性的元数据。这样的属性可以包括数据的位置、数据的格式、数据符合的标准等。
在840处,询问查询日志和结果高速缓存中的至少一个。以这种方式,例如,能够采集所需的数据而不使用搜索引擎(或其它实时机制)。不使系统资源(例如,搜索引擎)负担沉重而采集这些数据提供了优于常规方法的明显的优点。这样的优点包括,但不限于,系统的效率、对更可消费的数据的访问、对数据预先格式化等。在850处,从查询日志和/或结果高速缓存的至少一个中检索到的数据被组装,以供至少一个设备的消费。
图9示出了其中使用API来定位和实现数据的方法。在910处,进行对特定数据的搜索。如上所述,数据的各方面可以被定义和使用来定位和检索所需的数据。在920处,搜索结果被放置在返回数据存储中。这样的数据可以对能够与返回数据存储接口的基本上任何设备可用。另外,数据可以包括指向数据源的指针,使得实际上不在该存储中的数据能够通过一个或多个数据指针而被立即访问。在930处,利用API来定位返回数据存储内的特定数据。这样的数据可以基于此处先前提及的各种因素来定位。
在940处,搜索引擎结果被结构化来符合开发需求。这样的数据结构可以包括要在开发中实现的信息的类型、格式、类、内容等。以这种方式,数据可以被有效地解构且随后重新组装。另外,例如,这样的结构化数据可以来源于搜索引擎、返回数据存储和/或查询日志。在950处,这些数据在一个或多个应用程序中实现。这样的数据实现可以通过根据开发者和/或实现这些数据的应用程序的要求优化对这些数据的使用,来利用搜索引擎结果。
参考图10,描绘了用于实现本发明的各方面的示例性环境1000,包括计算机1012。计算机1012包括处理单元1014、系统存储器1016和系统总线1018。系统总线1018将包括但不限于系统存储器1016的系统组件耦合至处理单元1014。处理单元1014可以是各种可用处理器中的任何一种。双微处理器和其它多处理器体系结构也可以用作处理单元1014。
系统总线1018可以是若干类型的总线结构中的任一种,包括存储器总线或存储器控制器、外围总线和使用各种总线体系结构中的任一种的局部总线,这些体系结构包括,但不限于,8位总线、工业标准体系结构(ISA)、微通道体系结构(MCA)、扩展的ISA(EISA)、智能驱动器电子设备(IDE)、VESA局部总线(VLB)、外围部件互联(PCI)、通用串行总线(USB)、高级图形端口(AGP)、个人计算机存储卡国际协会总线(PCMCIA)以及小型计算机系统接口(SCSI)。
系统存储器1016包括易失性存储器1020和非易失性存储器1022。基本输入/输出系统(BIOS)包含有助于诸如启动时在计算机1012中元件之间传递信息的基本例程,存储在非易失性存储器1022中。作为示例,而非限制,非易失性存储器1022可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器1020包括担当外部高速缓存存储器的随机存取存储器(RAM)。作为示例,而非限制,RAM以多种形式中可用,诸如同步RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双倍数据速率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、同步链路DRAM(SLDRAM)以及直接存储器总线RAM(DRRAM)。
计算机1012也包括可移动/不可移动、易失性/非易失性的计算机存储介质。例如,图10示出了盘存储1024。盘存储1024包括,但不限于,类似于磁盘驱动器、软盘驱动器、磁带驱动器、Jaz驱动器、Zip驱动器、LS-100驱动器、闪存卡和记忆棒等设备。另外,盘存储1024可以包括单独的或与其它存储介质相结合的存储介质,其它存储介质包括,但不限于,诸如光盘ROM设备(CD-ROM)、可记录CD驱动器(CD-R驱动器)、可重写CD驱动器(CD-RW驱动器)或数字多功能盘ROM驱动器(DVD-ROM)等光盘驱动器。为便盘存储设备1024连接至系统总线1018,一般使用诸如接口1026等可移动或不可移动接口。
可以理解,图10描述了担当用户和在合适的操作环境1000中描述的基本计算机资源之间的中介的软件。这样的软件包括操作系统1028。可以存储在盘存储1024上的操作系统1028用于控制和分配计算机系统1012的资源。系统应用程序1030利用操作系统1028通过存储在系统存储器1016或者盘存储1024上的程序模块1032和程序数据1034对资源的管理。可以理解,本发明可以使用各种操作系统或操作系统的组合来实现。
用户通过输入设备1036命令或信息输入至计算机1012。输入设备1036包括,但不限于,诸如鼠标、跟踪球、指示笔、触摸垫等定点设备、键盘、麦克风、操纵杆、游戏垫、圆盘式卫星天线、扫描仪、电视调谐器卡、数码照相机、数码摄影机、web摄像头等。这些和其它输入设备经由接口端口1038通过系统总线1018连接至处理单元1014。接口端口1038包括,例如,串行端口、并行端口、游戏端口或通用串行总线(USB)。输出设备1040使用和输入设备1036相同类型的端口中的某一些。这样,例如,USB端口可以用于向计算机1012提供输入,并从计算机1012中向输出设备1040输出信息。提供输出适配器1042,以示出在其它输出设备1040中,存在像监视器、扬声器、打印机等需要专用适配器的某些输出设备1040。作为示例而非限制,输出适配器1042包括提供输出设备1040和系统总线1018之间的连接的装置的显卡和声卡。应该注意到,诸如远程计算机1044等其它设备和/或设备的系统同时提供输入和输出能力。
计算机1012可以使用至一个或多个远程计算机,诸如远程计算机1044的逻辑连接在网络化环境中操作。远程计算机1044可以是个人计算机、服务器、路由器、网络PC、工作站、基于微处理器的电器、对等设备或其它常见的网络节点,且通常包括上文相对于计算机1012描述的许多或所有元件。为简短起见,对远程计算机1044仅示出了存储器存储设备1046。远程计算机1044通过网络接口1048逻辑上连接至计算机1012,然后通过通信连接1050物理连接。网络接口1048包括诸如局域网(LAN)和广域网(WAN)等通信网络。LAN技术包括光纤分布式数据接口(FDDI)、铜线分布式数据接口(CDDI)、以太网/IEEE 802.3、令牌环/IEEE 802.5等。WAN技术包括,但不限于,点对点链路、如综合业务数字网络(ISDN)及其变体等电路交换网、分组交换网以及数字用户线(DSL)。
通信连接1050指用来将网络接口1048连接至总线1018的硬件/软件。尽管通信连接1050为说明性的清楚而被显示为在计算机1012的内部,但是它也可以对计算机1012而言是外部的。仅出于示例性的目的,连接至网络接口1048所必需的硬件/软件包括,诸如,包括常规电话级调制解调器、线缆调制解调器和DSL调制解调器的调制解调器、ISDN适配器以及以太网卡。
图11示出了可在其中使用本发明的示例性计算环境1100。系统1100包括一个或多个客户机1110。客户机1110可以是硬件和/或软件(例如,线程、进程、计算设备)。系统1100还包括一个或多个服务器1130。同样地,服务器1130可以是硬件和/或软件(例如,线程、进程、计算设备)。
客户机1110和服务器1130之间的一个可能的通信可以是在两个或多个计算机进程之间传输的数据包的形式。系统1100还包括可以用来便于客户机1110和服务器1130之间的通信的通信架构1150。客户机1110可以与可用于存储对客户机1110本地的信息的一个或多个客户机数据存储1160接口。类似地,服务器1130可以与可用于存储对服务器1130本地的信息的一个或多个服务器数据存储1140接口。
附录A描述了各种类库和应用程序编程接口(API),且附录A被认为是本说明书的一部分。可以理解,尽管在附录A中描述的类库、API等可以与此处描述的各个方面结合使用,但是这样的类库和/或API不在限制意义上解释,也不被解释为描绘了本发明的范围。相反,在附录A中描述的类库和API本质上是示例性的,且本发明可以与这些和/或任何其它合适的类库、API等结合使用。
以上描述的包括本发明的示例。当然,不可能为描述本发明的目的而描述组件和方法的每个可想得到的组合,但是本领域的普通技术人员能够认识到,可以有本发明众多其它组合和置换。从而,本发明旨在包括落入所附权利要求的精神和范围内的所有这些替换、修改和变化。在这点上,也可以认识到,本发明包括系统,也包括含有用于执行本发明的各种方法的步骤的计算机可执行指令的计算机可读介质。另外,尽管仅相对于本发明的若干方面或实现中的一个而揭示本发明的具体特征,但是这样的特征可以与对任何给定或特定应用需要且有利的其它实现的一个或多个其它特征相结合。此外,就在详细描述或权利要求书中使用术语“包括”、“包含”、“含有”、“拥有”及其变化而言,这些术语旨在以类似于术语“包括”及其变化的方式是包含性的。
                            附录A
内容
1名字空间Microsoft.TMSN...........................................15
1.1接口...........................................................16
1.2类.............................................................16
    1.2.1类AnchorInfo.............................................16
    1.2.2类SearchResult...........................................20
    1.2.3类TMSNSearch.............................................29
    1.2.4类WordFloatFrequencyPair.................................68
    1.2.5类WordFrequencyPair......................................72
第1章
名字空间Microsoft.TMSN
名字空间内容                                                 页码
————————————————————————————————
接口
————————————————————————————————
AnchorInfo...................................................16
关于超链接及其周围的上下文的信息.
SearchResult.................................................20
与带有相关信息的搜索查询的匹配
TMSNSearch...................................................29
搜索功能的各个位
WordFloatFrequencyPair.......................................68
串和浮点型计数对
WordFrequencyPair............................................72
串和整型计数对
Microsoft.TMSN-AnchorInfo
1.1接口
1.2类
1.2.1类AnchorInfo
关于超链接及其周围的上下文的信息
声明
 public class AnchorInfo:Object
字段
·ContextLeft
  publicstring ContextLeft
  该链接左边的文本
·ContextRight
  publicstring ContextRight
  该链接右边的文本
·Source
  public string Source
  该链接出现的位置
·Target
  public string Target
  该链接的目的地
·Text
  public string Text
  该链接的描述
Microsoft.TMSN-AnchorInfo
属性
  ·ContextSize
    public int ContextSize{get;set;}
    获得或设置为周围上下文搜索锚左边和右边的最佳字符个数
构造函数
 ·.ctor
    public AnchorInfo()
    创建具有空目的地、描述、来源和上下文的Anchorinfo
 ·.ctor
    public AnchorInfo()
    创建具有给定目的地、描述、来源和上下文的AnchorInfo
    -参数
        _target-链接的目的地
        _text-链接的描述
        _source-链接出现的位置
        _contextLeft-链接左边的字
        _contextRight-链接右边的字
·.ctor
   public AnchorInfo()
    创建具有给定目的地、描述、来源的AnchorInfo
     -参数
         _target-链接的目的地
         _text-链接的描述
         _source-链接出现的位置
·.ctor
   public AnchorInfo()
    创建具有给定目的地、描述的AnchorInfo
Microsoft.TMSN-AnchorInfo                                 5
        -参数
        _target-链接的目的地
        _text-链接的描述
·.ctor
   public AnchorInfo()
   创建具有给定目的地的Anchorinfo
       -参数
        _target-链接的目的地
方法
·CompareTo
  public int CompareTo()
  比较两个AnchorInfo对象以供排序
       -参数
        _obj-另一AnchorInfo
·Equals
  public bool Equals()
  比较两个AnchorInfos是否相等。比较中不考虑上下文。
  comparison.
       -参数
        _obj-另一AnchorInfo
·Finalize
  protected void Finalize()
  允许在由无用单元收集回收之前试图释放资源和执行其他消除操作。
·GetHashCode
  public int GetHashCode()
  返回仅基于Source、Target和Text的散列码
Microsoft.TMSN-AnchorInfo
·GetType
  public System.Type GetType()
  获得当前的实例的类型
·MemberwiseClone
  protected obj ect MemberwiseClone()
  创建当前的实例的浅副本
·ToString
  public string ToString()
  返回表示当前实例的串
扩展信息
·Assembly:TMSNSearch
Microsoft.TMSN-SearchResult
1.2.2类SearchResult
与带有相关信息的搜索查询的匹配
声明
  public class SearchResult:Object
属性
·CacheDocuments
  public bool CacheDocuments{get;set;}
  获得或设置指示是否记住GetDocument的返回值的标记。默认为真。
·Debug
  public string Debug{get;set;}
  获得或设置来自搜索的调试信息。
·DisplayUrl
  public string DisplayUrl{get;set;}
  获得或设置所匹配文档的URL的显示版本作为串。
  默认为UrlString,且将其设为空值会将其复位为默认。
·ExtraText
  public string ExtraText{get;set;}
  获得或设置要在匹配描述中包括的额外的文本。
·Extra TextLight
  public string ExtraTextLight{get;set;}
  获得或设置要在匹配描述中包括的额外的文本。(比在ExtraText中强调较轻)。
Microsoft.TMSN-SearchResult
·Format
  public Microsoft.TMSN.DocumentFormat Format{get;set;}
  获得或设置文档的类型。
·FormatString
  public string FormatString{get;set;}
  获得或设置文档类型的名称。
·Query
  public string Query{get;set;}
  获得或设置生成该结果的查询。
·Rank
  public int Rank{get;set;}
  获得或设置文档与查询的匹配等级。
·Summary
  public string Summary{get;set;}
  获得或设置相对于匹配的文档的摘要。
·Title
  public string Title{get;set;}
  获得或设置匹配的文档的标题。
·Url
  public System.Uri Url{get;set;}
  获得或设置匹配的文档的URL。
·UrlString
  public string UrlString{get;set;}
  获得或设置匹配的文档的URL,作为串。
Microsoft.TMSN-SearchResult
构造函数
  ·.ctor
     public SearchResult()
     创建带有空白字段的新的SearchResult
  ·.ctor
     public SearchResult()
     创建带有所提供的细节的新的SearchResult
        -参数
           _url-匹配文档的URL
           _title-匹配文档的标题
           _summary-相对于匹配的文档的概要
           _rank-文档与查询的匹配等级
  ·.ctor
     public SearchResult()
     创建带有所提供的细节的新的SearchResult
        -参数
           _query-生成该结果的查询
           _url-匹配文档的URL
           _title-匹配文档的标题
           _summary-相对于匹配的文档的概要
           _rank-文档与查询的匹配等级
  ·.ctor
     public SearchResult()
     创建带有所提供的细节的新的SearchResult
        -参数
          _url-匹配文档的URL
          _title-匹配文档的标题
          _summary-相对于匹配的文档的概要
          _rank-文档与查询的匹配等级
Microsoft.TMSN-SearchResult
·.ctor
   publ ic SearchResult()
   创建带有所提供的细节的新的SearchResult
      -参数
        _query-生成该结果的查询
        _url-匹配文档的URL
        _title-匹配文档的标题
        _summary-相对于匹配的文档的概要
        _rank-文档与查询的匹配等级
·.ctor
  public SearchResult()
  创建带有所提供的细节的新的SearchResult
        -参数
           _url-匹配文档的URL
           _title-匹配文档的标题
           _summary-相对于匹配的文档的概要
           _rank-文档与查询的匹配等级
           _format-文档的类型
·.ctor
  public SearchResult()
  创建带有所提供的细节的新的SearchResult
        -参数
           _query-生成该结果的查询
           _url-匹配文档的URL
           _title-匹配文档的标题
           _summary-相对于匹配的文档的概要
           _rank-文档与查询的匹配等级
           _format-文档的类型
·.ctor
  public SearchResult()
  创建带有所提供的细节的新的SearchResult
         -参数
            _url-匹配文档的URL
Microsoft.TMSN-SearchResult
            _title-匹配文档的标题
            _summary-相对于匹配的文档的概要
            _rank-文档与查询的匹配等级
            _format-文档的类型
·.ctor
   public SearchResult()
   创建带有所提供的细节的新的SearchResult
        -参数
          _query-生成该结果的查询
          _url-匹配文档的URL
          _title-匹配文档的标题
          _summary-相对于匹配的文档的概要
          _rank-文档与查询的匹配等级
          _format-文档的类型
 ·.ctor
   public SearchResult()
   创建带有所提供的细节的新的SearchResult
         -参数
         _url-匹配文档的URL
         _title-匹配文档的标题
         _summary-相对于匹配的文档的概要
         _rank-文档与查询的匹配等级
         _format-文档的类型
·.ctor
   public SearchResult()
   创建带有所提供的细节的新的SearchResult
         -参数
            _query-生成该结果的查询
            _url-匹配文档的URL
            _title-匹配文档的标题
            _summary-相对于匹配的文档的概要
            _rank-文档与查询的匹配等级
            _format-文档的类型
·.ctor
Microsoft.TMSN-SearchResult
 public SearchResult()
 创建带有所提供的细节的新的SearchResult
       -参数
           _url-匹配文档的URL
           _title-匹配文档的标题
           _summary-相对于匹配的文档的概要
           _rank-文档与查询的匹配等级
           _format-文档的类型
·.ctor
   public SearchResult()
   创建带有所提供的细节的新的SearchResult
         -参数
             _query-生成该结果的查询
             _url-匹配文档的URL
             _title-匹配文档的标题
             _summary-相对于匹配的文档的概要
             _rank-文档与查询的匹配等级
             _format-文档的类型
·.ctor
   public SearchResult()
   创建带有所提供的细节的新的SearchResult
         -参数
             _url-匹配文档的URL
             _title-匹配文档的标题
             _summary-相对于匹配的文档的概要
             _rank-文档与查询的匹配等级
             _format-文档的类型
             _debug-对该结果的调试信息
·.ctor
   public SearchResult()
   创建带有所提供的细节的新的SearchResult
        -参数
            _query-生成该结果的查询
            _url-匹配文档的URL
Microsoff.TMSN-SearchResult
            _title-匹配文档的标题
            _summary-相对于匹配的文档的概要
            _rank-文档与查询的匹配等级
            _format-文档的类型
            _debug-对该结果的调试信息
·.ctor
   public SearchResult()
   创建带有所提供的细节的新的SearchResult
         -参数
            _url-匹配文档的URL
            _title-匹配文档的标题
            _summary-相对于匹配的文档的概要
            _rank-文档与查询的匹配等级
            _format-文档的类型
            _debug-对该结果的调试信息
·.ctor
   public SearchResult()
   创建带有所提供的细节的新的SearchResult
         -参数
            _query-生成该结果的查询
            _url-匹配文档的URL
            _title-匹配文档的标题
            _summary-相对于匹配的文档的概要
            _rank-文档与查询的匹配等级
            _format-文档的类型
            _debug-对该结果的调试信息
·.ctor
   public SearchResult()
   创建所提供的SearchResult实例的副本
         -参数
            _orig-要复制的SearchResult
·.ctor
  public SearchResult()
  创建所提供的SearchResult实例的副本
Microsott.TMSN-SearchResult
        -参数
           _query-生成该结果的查询
           _orig-要复制的SearchResult
方法
·Equals
 public bool Equals()
 比较两个SearchResult是否相等,在比较中仅考虑URL
       -参数
           _obj-另一SearchResult
·Finalize
  protected void Finalize()
  允许在由无用单元收集回收之前试图释放资源和执行其他消除操作。
·GetDocument
  public string GetDocument()
  从网络上的URL处检索文档
·GetDocument
  public string GetDocument()
  从网络上的URL处检索文档
        -参数
           _cacheOnly-如果为真,那么仅返回在高速缓存的文档
·GetDocument
  public string GetDocument()
  从网络上的URL处检索文档
        -参数
Microsoft.TMSN-SearchResult
            _timeout-等待响应的毫秒数
·GetDocumentStream
  public System.IO.Stream GetDocumentStream()
  从网络上的URL处检索流。该响应不被高速缓存。
·GetDocumentStream
  public System.IO.Stream GetDocumentStream()
  从网络上的URL处检索流。该响应不被高速缓存。
        -参数
           _timeout-等待响应的毫秒数
·GetHashCode
  public int GetHashCode()
  返回仅基于URL的散列码
·GetType
  public System.Type GetType()
  获得当前的实例的类型
·MemberwiseClone
  protected object MemberwiseClone()
  创建当前的实例的浅副本
·ToString
  public string ToString()
  返回表示当前实例的串
  扩展信息
·Assembly:TMSNSearch
Microsoft.TMSN-TMSNSearch
1.2.3类TMSNSearch
搜索功能的多个位
声明
 public class TMSNSearch:Object
字段
·databaseConnectionString
  familyorassembly string databaseConnectionString
  该实例的连接串
·databaseConnectionStringGlobal
  familyorassembly string databaseConnectionStringGlobal
  基本连接串
·databaseServer
  familyorassembly string databaseServer
  默认的数据库服务器
·databaseTimeoutValue
  familyorassembly int databaseTimeoutValue
  数据库的连接超时
·Default
  public Microsoft.TMSN.TMSNSearch Default
  TMSNSearch类的默认实例。这对线程不安全。
·regex Whitespace
  familyorassembly System.Text.RegularExpressions.Regex
  regexWhitespace
  一个或多个空白字符
Microsoft.TMSN-TMSNSearch
属性
·AutoDeleteTemporaryFiles
  public bool AutoDeleteTemporaryFiles{get;set;}
  获得或设置在处置时是否删除任何临时文件
·CacheSearchResults
  public bool CacheSearchResults{get;set;}
  获得或设置是否记住(高速缓存)对MSN Search的任何调用的返回值。这会返回一致的结果。它仅在存储器中,除非PersistSearchResultCache也为真。
·CacheSearchResultsCacheOnly
  public bool CacheSearchResultsCacheOnly{get;set;}
  获得或设置是否允许网络从MSN Search处取回。如果为真,那么仅使用高速缓存中的结果。
·CacheSearchResultsLimit
  public int CacheSearchResultsLimit{get;set;}
  获得或设置要高速缓存的查询的最大数目。如果非正,那么高速缓存是不受限制的。
  结果安装最近最少使用的顺序丢弃。
·CacheSearchResultsReadOnly
  public bool CacheSearchResultsReadOnly{get;set;}
  获得或设置是否允许在高速缓存中插入新的条目。
  如果为真,那么如果可能可以使用高速缓存,但是高速缓存不能扩展。
·CacheSearchResultsServer
  public bool CacheSearchResultsServer{get;set;}
  获得或设置是否使用数据库服务器来高速缓存对MSN Search的任何调用的返回值。
  这会返回一致的值。
·CacheSearchResultsServerCache
  public string CacheSearchResultsServerCache{get;set;}
Microsoft.TMSN-TMSNSearch
获得或设置服务器上用来将对MSN Search的任何调用的返回值高速缓存的高速缓存的名字。
这是没有效果的,除非CacheSearchResultServer为真。
·CacheSearchResultsServerName
  public string CacheSearchResultsServerName{get;set;}
  获得或设置用于将对MSN Search的任何调用的返回值高速缓存的高速缓存的名字。
  这是没有效果的,除非CacheSearchResultServer为真。
·CacheSearchResultsServerPostMinimumResults
  public int CacheSearchResultsServerPostMinimumResults{get;
  set;}
  获得或设置服务器高速缓存中需要允许存储设置的结果的最小数量。
·CheckAllLinks
  public bool CheckAllLinks{get;set;}
  获得或设置是否跟随所有的URL来检查重定向一这可能非常慢!
·Database Timeout
  public int DatabaseTimeout{get;set;}
  获得或设置用于数据库连接的超时。该值指示等待服务器响应的秒数。
  设置为非正数将被忽略。
·DebugInfo
  public bool DebugInfo{get;set;}
  获得或设置在可用时是否从搜索提供者处检索调试和其他信息,
  并将其存储在每一SearchResult的Debug属性中。
·DomainFilter
  public string DomainFilter{get;set;}
  Microsoft.TMSN-TMSNSearch                                              19
    获得或设置用于限制对搜索返回的结果的域的过滤器。默认允许所有的域。
    注意到高速缓存对该属性的每一设置是特定的。
  ·FollowRedirectTimeout
    public int FollowRedirectTimeout{get;set;}
    获得或设置用于跟随其定向的超时(通常发生在用于广告跟踪而得到的搜索结果中)。
    该值指示了等待每一服务器响应的毫秒数。设置为非正数会禁用跟随重定向。
  ·FormatFilter
    public Microsoft.TMSN.DocumentFormat FormatFilter{get;
    set;}
    获得或设置于限制搜索返回的文档的类型的过滤器。默认为允许所有文档格式。
    注意到,高速缓存对该属性的每一设置是特定的。
  ·FuzzifyStrong
    public bool FuzzifyStrong{get;set;}
    获得或设置当使用模糊搜索时是否搜索URL上的远距离变体。
  ·FuzzyUrlMatches
    public bool FuzzyUrlMatches{get;set;}
    获得或设置当使用”Logged...ForUrl”方法时(对其他方法没有效果)是否搜索与所提供
    的URL的模糊匹配。如果为真,查找给定URL上的变化,包括基于路径的回退。
  ·ParallelLargeRequests
    public bool ParallelLargeRequests{get;set;}
    获得或设置是否使用并行取出来检索大的结果集。一般而言,对单线程应用程序将该值保留为真。
  ·PersistSearchResultCache
    public bool PersistSearchResultCache{get;set;}
Microsoft.TMSN-TMSNSearch
 获得或设置是否持久保存对MSN Search的任何调用的所高速缓存的返回值。
 如果CacheMSNResultsGlobal为假,那么对Get返回假且对Set没有效果。
 高速缓存会被持久保存在PersistenMSNResultCacheFileName命名的文件中,
 或者如果没有指定,那么持久保存在TMSN CACHE环境变量指定的文件中。
·PersistSearchResultCacheFileName
  public string PersistSearchResultCacheFileName{get;set;}
  获得或设置在哪里持久保存对MSN Search的任何调用的高速缓存的返回值。
  如果CacheSearchResults或PersistSearchResultCache为假,那么它在Get上返回空值,
  且对Get没有效果。这默认为由环境变量TMSN CACHE命名的文件。
  如果也没有指定,那么默认为应用程序目录中的tmsncache.bin。
·RankLimit
  public int RankLimit{get;set;}
  获得或设置从日志中取出复杂结果时会考虑的最大等级。
  将其设为非正值(默认)将考虑所有的等级。
·RequestBundleSize
  public int RequestBundleSize{get;set;}
  获得或设置当组成结果集时一词检索的的结果的最大数量。最好将其留为默认值。
·Retrieve Timeout
  public int RetrieveTimeout{get;set;}
  获得或设置用于在LinkAnchorInfos方法中检索文档的超时。该值指示等待服务器响应的毫秒数。
  将其设为非正数将无限期等待。这是默认的。
·SuppressDatabaseExceptions
  public bool SuppressDatabaseExceptions{get;set;}
  获得或设置当数据库连接问题发生时是否安静地忽略引发的异常。
  默认为假,意味着调用者必须为抛出的异常做好准备。
Microsoft.TMSN-TMSNSearch
·TextTokenizer
  public Microsoft.TMSN.TMSNSearch.TextTokenizerFunction
  TextTokenizer{get;set;}
  获得或设置当生成WordFrequency列表时使用的标记化器;默认为TextTokensFiltered.
  构造函数
·.ctor
   public TMSNSearch()
   构造带有默认搜索提供者的TMSNSearch对象
·.ctor
   public TMSNSearch()
   构造带有指定搜索提供者的TMSNSearch对象
         -参数
           _provider-使用的搜索提供者
方法
·CacheSearchResultServerClear
public void CacheSearchResultServerClear()
如果存在,那么清空MSN Search结果的数据库服务器高速缓存。
·CacheSearchResultServerCreate
public void CacheSearchResultServerCreate()
基于当前的CacheSearchResultsServerName和CacheSearchResultsServerCache,
创建MSN Search结果的数据库服务器高速缓存。
·ClearSearchResultCache
public void ClearSearchResultCache()
如果存在,那么清空MSN Search结果的高速缓存。也会破坏任何持久保存的高速缓存数据。
Microsoft.TMSN-TMSNSearch
·Dedup
  public System.String[]Dedup()
  从列表中去除重复的条目.
        -参数
           _orig-带有潜在重复的列表
·Dedup
  public System.String[]Dedup()
  从列表中去除重复的条目
  如果removeEmptyStrings为真,那么也去除空串。
        -参数
           _orig-带有潜在重复的列表
           _removeEmptyStrings-如果为真,则去除空串。
·Dedup
  public System.Uri[]Dedup()
  从列表中去除重复的条目.
        -参数
           _orig-带有潜在重复的列表
·Dedup
  public Microsoft.TMSN.SearchResult[]Dedup()
  从列表中去除重复的条目.
        -参数
           _orig-带有潜在重复的列表
·Dedup
  public Microsoft.TMSN.AnchorInfo[]Dedup()
  从列表中去除重复的条目.
        -参数
           _orig-带有潜在重复的列表
Microsoft.TMSN-TMSNSearch
·Dedup
  public System.Array Dedup()
  从列表中去除重复的条目.
        -参数
           _orig-带有潜在重复的列表
·Dedup
  public System.Collections.ArrayList Dedup()
  从列表中去除重复的条目.
         -参数
            _orig-带有潜在重复的列表
·Dedup
  public System.Collections.ArrayList Dedup()
  从列表中去除重复的条目.
  如果removeEmptyStrings为真,那么也去除空串。
        -参数
           _orig-带有潜在重复的列表
           _removeEmptyStrings-如果为真,则去除空串。
·Delete TemporaryFiles
  public void DeleteTemporaryFiles()
  删除创建的任何临时文件。
·Equals
  public bool Equals()
  判断指定的是否等于当前的
        -参数
           _obj-
·FetchSqlResults
  amilyorassembly System.String[]FetchSqlResults()
Microsoft.TMSN-TMSNSearch
         -参数
            _sqlQuery-
·FetchSqlResults
  familyorassembly system.String[]FetchSqlResults()
         -参数
            _cmd-
·FetchSqlResultsInt
  familyorassembly System.Int32[]FetchSqlResultsInt()
          _参数
             _sqlQuery-
·FetchSqlResultsInt
  familyorassembly System.Int32[]FetchSqlResultsInt()
          -参数
             _cmd-
·FethSqlResultsIntBatch
  familyorassembly System.Int32[]FetchSqlResultsIntBatch()
          -参数
             _sqlQuery-
·FetchSqlResultsIntBatch
  familyorassembly System.Int32[]FetchSqlResultsIntBatch()
          -参数
             _cmd-
·FetchSqlResultsIntSingle
  familyorassembly int FetchSqlResultsIntSingle()
Microsoft.TMSN-TMSNSearch
         -参数
            _sqlQuery-
·FetchSqlResultsIntSingle
  familyorassembly int FetchSqlResultsIntSingle()
         -参数
            _cmd-
·FetchSqlResultsSingle
  familyorassembly string FetchSqlResultsSingle()
         -参数
            _sqlQuery-
·FetchSqlResultsSingle
  familyorassembly string FetchSqlResultsSingle()
          -参数
            _cmd-
·FetchSqlResultsStringInt
  familyorassembly Microson.TMSN.WordFrequencyPair[]
  FetchSqlResultsStringInt()
          -参数
            _sqlQuery-
·FetchSqlResultsStringInt
  familyorassembly Microson.TMSN.WordFrequencyPair[]
  FetchSqlResultsStringInt()
          -参数
            _cmd-
Microsoft.TMSN-TMSNSearch
·Finalize
  protected void Finalize()
  允许在由无用单元收集回收之前试图释放资源和执行其他消除操作。
·GetHashCode
  public int GetHashCode()
  用于特定类型的散列函数,适于在散列算法和如散列表等数据结构中使用。
·GetType
  public System.Type GetType()
  获得当前的实例的类型
·HashSet
  public System.String[]HashSet()
  为该URL或其等价物获取可能的散列码值。已经是散列码的URL值通过而不改变。
        -参数
           _url-为其查找散列码的URL
·HtmlDecode
  public string HtmlDecode()
  将已经被HTML编码用于HTTP传输的串转换为解码的串。
  不像HttpUtility.HtmlDecode,不会在奇数行或断开的编码上中止。
        -参数
           _s-要解码的串
·HtmlExtractLinks
  public Microsoft.TMSN.AnchorInfo[]HtmlExtractLinks()
  仅提取由SearchResult描述的HTML文档的超链接,作为Anchorinfo。
Microsoft.TMSN-TMSNSearch
        -参数
           _source-从中提取该链接的SearchResult
·HtmlExtractLinks
  public Microson.TMSN.AnchorInfo[]HtmlExtractLinks()
  仅提取由SearchResult描述的HTML文档的超链接,作为Anchorinfo。
        -参数
           _source-从中提取链接的SearchResult
           _timeout-等待响应的毫秒数
·HtmlExtractLinks
  public Microson.TMSN.AnchorInfo[]HtmlExtractLinks()
  仅提取HTML文档中的超链接,作为AnchorInfo
        -参数
           _sourceUrl-用作HTML的源的位置
           _html-HTML文档,作为串。
·HtmlExtractLinks
  public Microsoft.TMSN.AnchorInfo[]HtmlExtractLinks()
  仅提取HTML文档中的超链接,作为AnchorInfo
        -参数
           _sourceUrl-用作HTML的源的位置
           -html-HTML文档,作为串
·HtmlExtractText
  public string HtmlExtractText()
  仅从HTML文档中提取文本。特殊的格式可能会扰乱结果。
  muddle the result.
        -参数
           _html-原始HTML文档,作为串。
Microsoft.TMSN-TMSNSearch
·HtmlExtractTextTokens
  public System.String[]HtmlExtractTextTokens()
  从HTML文档中提取文本的标记。特殊的格式化可能会扰乱结果。
        -参数
           _html-原始HTML文档,作为串。
·HtmlExtractTextTokensFiltered
  public System.String[]HtmlExtractTextTokensFiltered()
  从HTML文档中提取文本的标记。特殊的格式化可能会扰乱结果。
  跳过少于3个字符的标记、不以字母开始的标记以及是无用词的标记。
  标记也是小写字母的。
        -参数
           _html-原始HTML文档,作为串
·HtmlToWordFrequencyPairs
  public Microsoft.TMSN.WordFrequencyPair[]
  HtmlToWordFrequencyPairs()
  将HTML转化为已排序字列表,频率对。
        -参数
           _html-原始HTML正文。
·LinkAnchorInfos
  public Microsoft.TMSN.AnchorInfo[]LinkAnchorInfos()
  返回链接至给定URL的顶部结果,带有锚信息。
        -参数
           _linkedUrl-必须被链接至的URL
           _maxResults-最大返回结果数量
·LinkResults
  public Microsoft.TMSN.SearchResult[]LinkResults()
  返回链接至给定URL的顶部结果。
Microsoft.TMSN-TMSNSearch
        -参数
           -linkedUrl-必须被链接至的URL
           _maxResults-最大返回结果数量
·LoadSearchResultCache
  public void LoadSearchResultCache()
  如果存在,从由PersistMSNResultCacheFileName指定的文件装载MSN Search结果的高
  速缓存。这会在需要时自动调用,但是可以用来提前准备高速缓存。
·LoggedCommonQueriesForUrls
  public System.String[]LoggedCommonQueriesForUrls()
  基于日志,返回在给定的集合中返回每个URL或URL散列的查询。
        -参数
           _urls-要查找的URL
            _resultLimit-返回结果的数量的限制-尽管它们不是从任何有意义的顺序中选择的。
·LoggedCommonQueriesForUrls
  public System.String[]LoggedCommonQueriesForUrls()
  基于日志,返回在给定的集合中返回每个URL或URL散列的查询。
        -参数
           -urls-要查找的URL
·LoggedCommonQueriesForUrls
  public System.String[]LoggedCommonQueriesForUrls()
  基于日志,返回在给定的集合中返回每个URL或URL散列的查询。
        -参数
           _urls-要查找的URL
           _resultLimit-返回结果的数量的限制—尽管它们不是从任何有意义的顺序中选择的。
Microsoft.TMSN-TMSNSearch
·LoggedCommonQueriesForUrls
  public System.String[]LoggedCommonQueriesForUrls()
  基于日志,返回在给定的集合中返回每个URL或URL散列的查询。
        -参数
           _urls-要查找的URL
·LoggedCommonUrlHashesForQueries
  public System.String[]LoggedCommonUrlHashesForQueries()
  基于日志,返回为一组查询所返回的URL。
        -参数
           _queries-查找的查询
           _resultLimit-返回结果的数量的限制-尽管它们不是从任何有意义的顺序中选择的。
·LoggedCommonUrlHashesForQueries
  public System.String[]LoggedCommonUrlHashesForQueries()
  基于日志,返回为一组查询所返回的URL。
        -参数
          _queries-查找的查询
·LoggedExtensionsForQuery
  public Microsoft.TMSN.WordFrequencyPair[]
  LoggedExtensionsForQuery()
  找出以在Clog中给定的串开始或结束的查询的分布。
        -参数
           _queryStart-查找的查询片断
           _resultLimit-返回的结果的数量限制
·LoggedExtensionsForQuery
  public Microsoft.TMSN.WordFrequencyPair[]
  LoggedExtensionsForQuery()
  找出以在Clog中给定的串开始的查询的分布。
Microsoft.TMSN-TMSNSearch
        -参数
           _query-查找的查询片断
·LoggedExtensionsForQueryCount
  public int LoggedExtensionsForQueryCount()
  找出以在Clog中给定的串开始的查询的数量。
        -参数
           _queryStart-查找的查询片断
·LoggedFrequencyForQuery
  public System.Int32[]LoggedFrequencyForQuery()
  找出集合中每一查询在CLog中出现的次数。
        -参数
           _queries-查找的查询
·LoggedFrequencyForQuery
  public int LoggedFrequencyForQuery()
  找出一特定查询在CLog中出现的次数。
        -参数
           _query-查找的查询
·LoggedFrequencyForQuerySequence
  punic int LoggedFrequencyForQuerySequence()
  找出一特定查询序列在Clog中出现的次数。
        -参数
           _query1-查找的第一个查询
           _query2-随后查找的查询
·LoggedFrequencyForQuerySequence
  public int LoggedFrequencyForQuerySequence()
  找出一特定查询序列在Clog中出现的次数。
Microsoft.TMSN-TMSNSearch
        -参数
           _query1-查找的第一个查询
           _query2-随后查找的查询
           _maximumInterval-在第一和第二个查询之间的最大的秒数
·LoggedQueriesForUrl
  public System.String[]LoggedQueriesForUrl()
  基于日志,返回返回给定的URL或散列码的查询。
        -参数
           _url-查找的URL
·LoggedQueriesForUrl
  public System.String[]LoggedQueriesForUrl()
  基于日志,返回返回给定的URL或散列码的查询。
        -参数
           _url-查找的URL
·LoggedQueriesForUrl
  public System.String[]LoggedQueriesForUrl()
  基于日志,返回返回给定的URL或散列码的查询。
        -参数
           _url-查找的URL
           _resultLimit-返回结果的数量的限制-尽管它们不是从任何有意义的顺序中选择的。
·LoggedQueriesForUrl
 public System.String[]LoggedQueriesForUrl()
 基于日志,返回返回给定的URL或散列码的查询。
        -参数
Microsoft.TMSN-TMSNSearch
            _url-查找的URL
            _resultLimit-返回结果的数量的限制—尽管它们不是从任何有意义的顺序中选择的。
·LoggedQueriesForUrlDirect
  familyorassembly system.String[]LoggedQueriesForUrlDirect()
  基于日志,返回返回给定的URL或散列码的查询。
        -参数
           _url-查找的URL
           _resultLimit-返回结果的数量的限制-尽管它们不是从任何有意义的顺序中选择的。
·LoggedQueriesForUrlDirectWeighted
  familyorassembly Microsoft.TMSN.WordFrequencyPair[]
  LoggedQueriesForUrlDirectWeighted()
  基于日志,返回返回给定的URL或散列码的查询。
  也返回每一查询的频率。
        -参数
           _url-查找的URL
           _resultLimit-返回结果的数量的限制。
·LoggedQueriesForUrlsForQuery
  public System.String[]LoggedQueriesForUrlsForQuery()
  Return the queries that returned any of the URLs retumed for a query,
  based on the logs.
        -参数
           _query-查找的查询
           _resultLimit-返回结果的数量的限制-尽管它们不是从任何有意义的顺序中选择的。
·LoggedQueriesForUrlsForQuery
  public System.String[]LoggedQueriesForUrlsForQuery()
  基于日志,返回为查询返回任何URL的查询。
Microsoft.TMSN-TMSNSearch
        -参数
           _query-查找的查询
·LoggedQueriesForUrlsForQueryWeighted
  public Microsoft.TMSN.WordFrequencyPair[]
  LoggedQueriesForUrlsForQueryWeighted()
  基于日志,返回为查询返回任何URL的查询,以及关于有多少共有的URL的计数器。
        -参数
           _query-查找的查询
           _resultLimit-返回结果的数量的限制
·LoggedQueriesForUrlsForQueryWeighted
  public Microsoft.TMSN.WordFrequencyPair[]
  LoggedQueriesForUrlsForQueryWeighted()
  基于日志,返回为查询返回任何URL的查询,以及关于有多少共有的URL的计数器。
        -参数
           _query-查找的查询
·LoggedQueriesForUrlWeighted
  public Microsoft.TMSN.WordFrequencyPair[]
  LoggedQueriesForUrlWeighted()
  基于日志,返回返回给定的URL或散列码的查询。
  也返回每一查询的频率。
        -参数
           _url-查找的URL
·LoggedQueriesForUrlWeighted
  public Microsoft.TMSN.WordFrequencyPair[]
  LoggedQueriesForUrlWeighted()
  基于日志,返回返回给定的URL或散列码的查询。
  也返回每一查询的频率。
        -参数
Microsoft.TMSN-TMSNSearch
            _url-查找的URL
·LoggedQueriesForUrlWeighted
 public Microsoft.TMSN.WordFrequencyPair[]
 LoggedQueriesForUrlWeighted()
 基于日志,返回返回给定的URL或散列码的查询。
 也返回每一查询的频率。
        -参数
           _url-查找的URL
           _resultLimit-返回结果的数量的限制
·LoggedQueriesForUrlWeighted
  public Microsoft.TMSN.WordFrequencyPair[]
  LoggedQueriesForUrlWeighted()
  基于日志,返回返回给定的URL或散列码的查询。
  也返回每一查询的频率。
        -参数
           _url-查找的URL
           _resultLimit-返回结果的数量的限制
·LoggedQuerySequenceFollows
  public Microsoft.TMSN.WordFrequencyPair[]
  LoggedQuerySequenceFollows()
  从Clog中找出在给定查询之后的查询,带有计数器。
        -参数
           _query1-序列中的第一个查询
·LoggedQuerySequenceFollows
  public Microsoft.TMSN.WordFrequencyPair[]
  LoggedQuerySequenceFollows()
  从Clog中找出在给定查询之后的查询,带有计数器。
        -参数
           _query1-序列中的第一个查询
           _resultLimit-返回结果的数量的限制
Microsoft.TMSN-TMSNSearch
·LoggedQuerySequenceFollows
  public Microsoft.TMSN.WordFrequencyPair[]
  LoggedQuerySequenceFollows()
  从Clog中找出在给定查询之后的查询,带有计数器。
        -参数
           _query1-序列中的第一个查询
           _resultLimit-返回结果的数量的限制
           _maximumInterval-两个查询之间的最大秒数。
·LoggedQuerySequencePrecedes
  public Microsoft.TMSN.WordFrequencyPair[]
  LoggedQuerySequencePrecedes()
  从Clog中找出在给定查询之后的查询,带有计数器。
         -参数
            _query2-序列中的第二个查询
·LoggedQuerySequencePrecedes
  public Microsoft.TMSN.WordFrequencyPair[]
  LoggedQuerySequencePrecedes()
  从Clog中找出在给定查询之后的查询,带有计数器。
        -参数
           _query2-序列中的第二个查询
           _resultLimit-返回结果的数量的限制
·LoggedQuerySequencePrecedes
  public Microsoft.TMSN.WordFrequencyPair[]
  LoggedQuerySequencePrecedes()
  从Clog中找出在给定查询之后的查询,带有计数器。
        -参数
           _query2-序列中的第二个查询
           _resultLimit-返回结果的数量的限制
             _maximumInterval-两个查询之间的最大秒数
Microsoft.TMSN-TMSNSearch
·LoggedUrlHashesForQueriesForUrl
  public System.String[]LoggedUrlHashesForQueriesForU rl()
  基于日志,返回为返回给定URL或URL散列的查询返回的URL。
        -参数
           _url-查找的URL
·LoggedUrlHashesForQueriesForUrl
  public System.String[]LoggedUrlHashesForQueriesForUrl()
  基于日志,返回为返回给定URL或URL散列的查询返回的URL。
        -参数
        _url-查找的URL
·LoggedUrlHashesForQueriesForUrl
  public System.String[]LoggedUrlHashesForQueriesForUrl()
  基于日志,返回为返回给定URL或URL散列的查询返回的URL。
        -参数
           _url-查找的URL
           _resultLimit-返回结果的数量的限制-尽管它们不是从任何有意义的顺序中选择的。
·LoggedUrlHashesForQueriesForUrl
  public System.String[]LoggedUrlHashesForQueriesForUrl()
  基于日志,返回为返回给定URL或URL散列的查询返回的URL。
        -参数
           _url-查找的URL
           _resultLimit-返回结果的数量的限制—尽管它们不是从任何有意义的顺序中选择的。
Microsoft.TMSN-TMSNSearch
·LoggedUrlHashesForQueriesForUrlDirect
  familyorassembly System.String[]
  LoggedUrlHashesForQueriesForUrlDirect()
  基于日志,返回为返回给定URL或URL散列的查询返回的URL。
        -参数
           _url-查找的URL
           _resultLimit-返回结果的数量的限制-尽管它们不是从任何有意义的顺序中选择的。
·LoggedUrlHashesForQuery
  public System.String[]LoggedUrlHashesForQuery()
  基于日志,返回为查询返回的URL。
        -参数
           _query-查找的查询
           _resultLimit-返回结果的数量的限制—尽管它们不是从任何有意义的顺序中选择的。
·LoggedUrlHashesForQuery
  public System.String[]LoggedUrlHashesForQuery()
  基于日志,返回为查询返回的URL。
        -参数
           _query-查找的查询
·MemberwiseClone
  protected object MemberwiseClone()
  创建当前实例的浅副本。
·MSNSearchResultPage
   public string MSNSearchResultPage()
  为给定查询和项产生伪造的MSN Search结果页面。
  支持文件是从MSN Search站点上装载的。
         -参数
Microsoft.TMSN-TMSNSearch
         _query-搜索的查询
         _results-显示的结果集
·MSNSearchResultPage
  public string MSNSearchResultPage()
  为给定查询和项产生伪造的MSN Search结果页面。
         -参数
           _query-搜索的查询
           _results-显示的结果集
            _local-如果为真,那么支持图像和样式表被预期处于和HTML相同的目录中,
                   如果为假,那么从MSN Search站点上装载支持文件。
·MSNSearchResultPage
  public string MSNSearchResultPage()
  为给定查询和项产生伪造的MSN Search结果页面。
  支持文件是从MSN Search站点上装载的。
         -参数
           _query-搜索的查询
           -results-显示的结果集
           _headerText-在结果之前包含的文本
           _plainHeaderText-如果为真,那么headerText被假定为是纯文本;
                            如果为假,那么headerText被假定为HEML片断。
·MSNSearchResultPage
  public string MSNSearchResultPage()
  为给定查询和项产生伪造的MSN Search结果页面。
         -参数
           _query-搜索的查询
           _results-显示的结果集
           _local-I如果为真,那么支持图像和样式表被预期处于和HTML相同的目录中;
            如果为假,那么从MSN Search站点上装载支持文件。
           _headerText-在结果之前包含的文本
           _plainHeaderText-如果为真,那么headerText被假定为是纯文本;
                            如果为假,那么headerText被假定为HEML片断
Microsoft.TMSN-TMSNSearch
·MSNSearchResultPageLaunch
  public string MSNSearchResultPageLaunch()
  为给定查询和项产生伪造的MSN Search结果页面,并在相关联的浏览器中装入页面。
        -参数
           _query-搜索的查询
           _results-显示的结果集
·MSNSearchResultPageLaunch
  public string MSNSearchResultPageLaunch()
  为给定查询和项产生伪造的MSN Search结果页面,并在相关联的浏览器中装入页面。
        -参数
           _query-搜索的查询
           _results-显示的结果集
           _headerText-在结果之前包含的文本
           _plainHeaderText-如果为真,那么headerText被假定为是纯文本;
                            如果为假,那么headerText被假定为HEML片断
·MSNSearchResultPageLaunch
  public void MSNSearchResultPageLaunch()
  为给定查询和项产生伪造的MSN Search结果页面,并在相关联的浏览器中装入页面。
        -参数
           _fileName-使用的文件名
           _query-搜索的查询
           _results-显示的结果集
·MSNSearchResultPageLaunch
  public void MSNSearchResultPageLaunch()
  为给定查询和项产生伪造的MSN Search结果页面,并在相关联的浏览器中装入页面。
        -参数
           _fileName-使用的文件名
           _query-搜索的查询
Microsoft.TMSN-TMSNSearch
            _results-显示的结果集
            _headerText-在结果之前包含的文本
            _plainHeaderText-如果为真,那么headerText被假定为是纯文本;
                             如果为假,那么headerText被假定为HEML片断
·QueryResults
  public Microsoft.TMSN.SearchResult[]QueryResults()
  返回给定查询项集合的顶部结果,匹配所有查询项
        -参数
           _queryTerms-查询项集合
           _maxResults-最大返回结果数量
·QueryResults
  public Microsoft.TMSN.SearchResult[]QueryResults()
  返回给定查询项集合的顶部结果,使用All或Any匹配。
        -参数
           _queryTerms-查询项集合
           _maxResults-最大返回结果数量
           _anyTerms-如果为假,执行All匹配,如果为真,执行Any匹配。
·QueryResults
  public Microsoft.TMSN.SearchResult[]QueryResults()
  为给定查询短语返回顶部结果。
  注意到指示All匹配,如同键入用户界面一样,不是短语匹配!
        -参数
           _query-查询的串
           _maxResults-最大返回结果数量
·QueryResults
  public Microsoft.TMSN.SearchResult[]QueryResults()
  为给定查询返回顶部结果
        -参数
           _query-查询的项或短语的集合
           _maxResults-最大返回结果数量
Microsoft.TMSN-TMSNSearch
            _matchType-执行的查询的类型
·Redirect
   public string Redirect()
   通过下述任何重定向检索资源的真实URL。该请求会为等待3000毫秒以解析每一重定向。
        -参数
           _url-原始URL
·Redirect
  public string Redirect()
  通过下述任何重定向检索资源的真实URL。
        -参数
           _url-原始URL
           _timeout-等待每一服务器的时间量,以毫秒为单位。
·Redirect
  public string Redirect()
  通过下述任何重定向检索资源的真实URL。
  该请求会等待3000毫秒以分解每一重定向。
        -参数
           _url-原始URL
·Redirect
  public string Redirect()
  通过下述任何重定向检索资源的真实URL。
        -参数
           _url-原始URL
           _timeout-等待每一服务器的时间量,以毫秒为单位。
Microsoft.TMSN-TMSNSearch
·RemoveNulls
  public System.String[]RemoveNulls()
  返回去除空元素的输入数组和副本。
        -参数
           _orig-原始数组
·RemoveNulls
  public System.String[]RemoveNulls()
  返回去除空元素的输入数组的副本。
  如果removeEmpyStrings为真,也去除空串。
        -参数
           _orig-原始数组
           _removeEmptyStrings-如果为真,则去除空串。
·RemoveNulls
  public System.Uri[]RemoveNulls()
  返回去除空元素的输入数组的副本。
        -参数
           _orig-原始数组
·RemoveNulls
  public Microsoft.TMSN.SearchResult[]RemoveNulls()
  返回去除空元素的输入数组的副本。
        -参数
           _orig-原始数组
·RemoveNulls
  public Microsoft.TMSN.AnchorInfo[]RemoveNulls()
  返回去除空元素的输入数组的副本。
        -参数
           _orig-原始数组
Microsoft.TMSN-TMSNSearch
·RemoveNulls
  public System.Array RemoveNulls()
  返回去除空元素的输入数组的副本。
        -参数
           _orig-原始数组
·RemoveNulls
  public System.Colleetions.ArrayList RemoveNulls()
  返回去除空元素的输入数组的副本。
        -参数
           _orig-原始数组
·RemoveNulls
  public System.Collections.ArrayList RemoveNulls()
  返回去除空元素的输入数组的副本。
  如果removeEmptyStrings为真,也去除空串。
        -参数
           _orig-原始数组
           _removeEmptyStrings-如果为真,则去除空串。
·ResultCountEstimate
  public int ResultCountEstimate()
  返回对给定查询项集合的结果数量的估算,匹配全部。
  注意到,这是不精确且不稳定的。
        -参数
           _queryTerms-查询项集合
·ResultCountEstimate
  public int ResultCountEstimate()
  返回对给定查询项集合的结果数量的估算,匹配全部。
  注意到,这是不精确且不稳定的。
          -参数
Microsoft.TMSN-TMSNSearch
           _queryTerms-查询项集合
           _anyTerms-如果为假,执行All匹配,如果为真,执行Any匹配
·ResultCountEstimate
  public int ResultCountEstimate()
  返回对给定查询短语的结果数量的估算。
  注意到这是All匹配,如同键入用户界面一样,不是短语匹配!
  注意到,这是不精确且不稳定的。
        -参数
           _query-查询的短语
·ResultCountEstimate
  public int ResultCountEstimate()
  返回对给定查询的结果数量的估算。
  注意到,这是不精确且不稳定的。
        -参数
           _query-查询的项或短语的集合
           _matchType-执行的查询的类型
·Retrieve
  public System.String[]Retrieve()
  检索对应于URL元素的文档集合。
  试图确定来自于响应的编码。默认为UTF8。
        -参数
        _urls-将要检索的文档的地址
·Retrieve
  public System.String[]Retrieve()
  检索对应于RTL元素的文档集合。
  试图确定来自于响应的编码,默认为UTF8。在指定的超时中等待响应,如果超时非正,那么无限期等待。
        -参数
           _urls-将要检索的文档的地址
Microsoft.TMSN-TMSNSearch
            _timeout-等待每一响应的毫秒数
·Retrieve
  public System.String[]Retrieve()
  检索对应于RTL元素的文档集合。
  试图确定来自于响应的编码,默认为UTF8。
        -参数
           _urls-将要检索的文档的地址
·Retrieve
  public System.String[]Retrieve()
  检索对应于RTL元素的文档集合。
  试图确定来自于响应的编码,默认为UTF8。
  在指定的超时中等待响应,如果超时非正,那么无限期等待。
        -参数
           _urls-将要检索的文档的地址
           _timeout-等待每一响应的毫秒数
·Retrieve
  public System.String[]Retrieve()
  检索对应于RTL元素的文档集合。
  试图确定来自于响应的编码,默认为UTF8。
        -参数
           _urls-将要检索的文档的地址.
           每一个必须是URL对象或URL串。
·Retrieve
  public System.String[]Retrieve()
  检索对应于RTL元素的文档集合。
  试图确定来自于响应的编码,默认为UTF8。
  在指定的超时中等待响应,如果超时非正,那么无限期等待。
        -参数
Microsoft.TMSN-TMSNSearch
             _urls-将要检索的文档的地址.
                  每一个必须是URL对象或URL串。
            _timeout-等待每一响应的毫秒数
·Retrieve
  public string Retrieve()
  将要检索的文档的地址.试图确定来自于响应的编码,默认为UTF8。
        -参数
           _url-将要检索的文档的地址
·Retrieve
  public string Retrieve()
  从URL中检索文档。
  试图确定来自于响应的编码,默认为UTF8。
  在指定的超时中等待响应,如果超时为非正,那么无限期等待。
        -参数
           -url-将要检索的文档的地址
           _timeout-等待响应的毫秒数
·Retrieve
  public string Retrieve()
  从使用指定编码的URL中检索文档。
        -参数
           _url-将要检索的文档的地址
           _encoding-文档的编码
·Retrieve
  public string Retrieve()
  从使用指定编码的URL中检索文档。
  在指定的超时中等待响应,如果超时为非正,那么无限期等待。
        -参数
           _url-将要检索的文档的地址
Microsoft.TMSN-TMSNSearch
            _timeout-等待响应的毫秒数
            _encoding-文档的编码
·Retrieve
  public string Retrieve()
  从URL中检索文档。
  试图确定来自于响应的编码,默认为UTF8。
        -参数
           _url-将要检索的文档的地址
·Retrieve
  public string Retrieve()
  从URL中检索文档。
  试图确定来自于响应的编码,默认为UTF8。
  在指定的超时中等待响应,如果超时为非正,那么无限期等待。
        -参数
           _url-将要检索的文档的地址
           _timeout-等待响应的毫秒数
·Retrieve
  public string Retrieve()
  从URL中检索文档。
  试图确定来自于响应的编码,默认为UTF8。
  在指定的超时中等待响应,如果超时为非正,那么无限期等待。
        -参数
           _url-将要检索的文档的地址
           _timeout-等待响应的毫秒数
           _encoding-文档的编码
·RetrieveStream
  public System.IO.Stream RetrieveStream()
  从给定的URL中检索Stream。
        -参数
Microsoft.TMSN-TMSNSearch
             _url-将要检索的Stream的地址
·RetrieveStream
  public System.IO.Stream RetrieveStream()
  从给定的URL中检索Stream。
  在指定的超时中等待响应,如果超时为非正,那么无限期等待。
        -参数
           -url-将要检索的Stream的地址
           _timeout-等待响应的毫秒数
·RetrieveStream
  public System.IO.Stream RetrieveStream()
  从给定的URL中检索Stream。
        -参数
           _url-将要检索的Stream的地址
·RetrieveStream
  public System.IO.Stream RetrieveStream()
  从给定的URL中检索Stream。
  在指定的超时中等待响应,如果超时为非正,那么无限期等待。
        -参数
           _url-将要检索的Stream的地址
           _timeout-等待响应的毫秒数
·SaveSearchResultCache
  public void SaveSearchResultCache()
  如果存在,将MSN Search的结果的高速缓存保存至由PersistMSNResultCacheFileName指定的文件中。
·SearchResultsToDocuments
  public System.String[]SearchResultsToDocuments()
  将一组SearchResult对象映射至对应的HTML文档。
        -参数
Microsoft.TMSN-TMSNSearch
             _results-要映射的SearchResult对象
·SearchResultsToDocuments
  public System.String[]SearchResnltsToDocuments()
  将一组SearchResult对象映射至对应的HTML文档。
        -参数
           _results-要映射的SearchResult对象
           _timeout-等待每一响应的毫秒数
·SearchResultsToSummaries
  public System.String[]SearchResultsToSummaries()
  将一组SearchResult对象映射至对应的摘要。
        -参数
           _results-要映射的SearchResult对象
·SearchResultsToSummaryWordFrequencyPairs
  public Microsoft.TMSN.WordFrequencyPair[][]
  SearchResultsToSummaryWordFrequencyPairs()
  将一组SearchResult对象映射至对应摘要的World-Frequency对。
        -参数
           _results-要映射的SearchResult对象
·SearchResultsToSummaryWordFrequencyPairsAggregate
  public Microsoft.TMSN.WordFrequencyPair[]
  SearchResultsToSummaryWordFrequencyPairsAggregate()
将一组SearchResult对象映射至一组对应摘要的World-Frequency对。
              -参数
                 _results-要映射的SearchResult对象
 ·SearchResultsToUrls
   public System.Uri[]SearchResultsToUrls()
 将一组SearchResult对象映射至对应的URL。
Microsoft.TMSN-TMSNSearch
          -参数
             _results-要映射的SearchResult对象
·SearchResultsToUrlStrings
  public System.String[]SearchResultsToUrlStrings()
  将一组SearchResult对象映射至对应的URL。
          -参数
             _results-要映射的SearchResult对象
·SearchResultsToWordFrequencyPairs
  public Microsoft.TMSN.WordFrequencyPair[][]
  SearchResultsToWordFrequencyPairs()
  将一组SearchResult对象映射至对应的HTML文档的World-Frequency对。
        -参数
           _results-要映射的SearchResult对象
·SearchResultsToWordFrequencyPaiirs
  public Microsoft.TMSN.WordFrequencyPair[][]
  SearchResultsToWordFrequencyPairs()
将一组SearchResult对象映射至对应的HTML文档的World-Frequency对。
        -参数
           _results-要映射的SearchResult对象
           _timeout-等待每一响应的毫秒数
·SearchResultsToWordFrequencyPairsAggregate
  public Microsoft.TMSN.WordFrequencyPair[]
  SearchResultsToWordFrequencyPairsAggregate()
 将一组SearchResult对象映射至一组对应的HTML文档的World-Frequency对。
        -参数
           _results-要映射的SearchResult对象
Microsoft.TMSN-TMSNSearch
 ·SearchResultsToWordFrequencyPairsAggregate
   public Microsoft.TMSN.WordFrequencyPair[]
   SearchResultsToWordFrequencyPairsAggregate()
  将一组SearchResult对象映射至一组对应的HTML文档的World-Frequency对。
         -参数
            _results-要映射的SearchResult对象
            _timeout-等待每一响应的毫秒数
·SetDatabaseConnectionString
  familyorassembly void SetDatabaseConnectionString()
  生成基于默认和配置文件的连接串。
·SetProxy
  public void SetProxy()
  设置用于所有请求的代理服务器。
  它被指定为代理的端口地址,没有代理服务器则为空串,或对IE代理服务器为空值(默认)。
  注意到IE代理服务器仅反映静态设置,而不反映自动配置引起的任何动态设置!
  也可以通过设置TMSNProxy配置键来指定默认。
          -参数
             _proxy-代理的地址端口,没有代理服务器则为空串,或对IE代理服务器为空值。
 ·SqlString
   familyorassembly string SqlString()
   格式化在SQL命令中使用的串。
         -参数
            _item-将被格式化的串。
·StringToUri
  public System.Uri[]StringToUri()
  将一组串转化为URL
Microsoft.TMSN-TMSNSearch
        -参数
           _strings-原始串
·StringToUri
  public System.Uri StringToUri()
  将串转化为URI
        -参数
           _str-原始串
·TextTokens
  public System.String[]TextTokens()
  返回文档中的所有标记。
      -参数
         _txt-作为串的原始文档。
·TextTokensFiltered
  public System.String[]TextTokensFiltered()
  返回文档中的标记。
  跳过低于3字符的标记,不以字母开始的标记以及为无用词的标记。
  标记也是小写字母的。
         -参数
            _txt-作为串的原始文档
 ·TextToWordFrequencyPairs
   public Microsoft.TMSN.WordFrequencyPair[]
   TextToWordFrequencyPairs()
   将文本转化为自-频率对的已排序列表。
          -参数
             _doc-文本的正文
·ToString
  public string ToString()
  返回表示当前实例的串
Microsoft.TMSN-TMSNSearch
·UriToString
  public System.String[]UriToString()
  将一组URI转化为串。
        -参数
           _uris-原始Uri
·UriToString
  public string UriToString()
  将Uri转化为串。
       -参数
          _uri-原始Uri
扩展信息
 ·Assembly:TMSNSearch
Microsoft.TMSN-WordFloatFrequencyPair
1.2.4类WordFloatFrequencyPair
串和浮点计数对
声明
 public class WordFloatFrequencyPair:WordFrequencyPair
 属性
·FloatFrequency
 public double FloatFrequency{get;}
 该对的精确的计数
·Frequency
  public int Frequency{get;}
  该对的计数。
·Word
  public string Word{get;}
  该对的串。
构造器
·.ctor
   public WordFloatFrequencyPair()
   创建带有空字和零计数的对。
·.ctor
   public WordFloatFrequencyPair()
   创建带有给定串和计数的对。
  -参数
Microsof.TMSN-WordFloatFrequencyPair
           _word-该对的串
           _frequency-该对的计数
·.ctor
   public WordFloatFrequencyPair()
   创建带有给定串的World和FloatFrequency的对。
          -参数
             _word-该对的串。
 ·.ctor
    public WordFloatFrequencyPair()
    创建带有给定串的World和FloatFrenquecy的对。
          -参数
             _pair-要复制的对。
 方法
·Clone
  public Microsoft.TMSN.WordFrequencyPair Clone()
  创建为当前实例的副本的新对象。
  它是WorldFloatFrequencyPair,但它不能够如此定义。
·CompareTo
  public int CompareTo()
  与另一WordFrequencyPair比较用于排序。
        -参数
           _obj-另一个WordFrequencyPair
·Equals
  public bool Equals()
  确定指定的实例是否与当前的实例相同。
Microsoft.TMSN-WordFloatFrequencyPair
         -参数
            _obj-
·Finalize
  protected void Finalize()
  允许在由无用单元收集回收之前试图释放资源和执行其他消除操作。
·GetHashCode
  public int GetHashCode()
  用于特定类型的散列函数,适于在散列算法和如散列表等数据结构中使用。
·GetType
  public System.Type GetType()
  获得当前的实例的类型
·MemberwiseClone
  protected object MemberwiseClone()
  创建当前实例的浅副本。
·Scale
  public Microsoft.TMSN.WordFloatFrequencyPair Scale()
  返回带有给定因数缩放的WordFloatFrequencyPair。
        -参数
           _scaleFactor-与Frequency相乘的因数。
·ToString
  public string ToString()
  返回表示当前实例的串
Microsoft.TMSN-WordFlatFrequencyPair
扩展信息
   ·Assembly:TMSNSearch
Microsoft.TMSN-WordFrequencyPair
1.2.5类WordFrequencyPair
串和整数计数对。
声明
 pubic class WordFrequencyPair:Object
属性
·Frequency
  public int Frequency{get;}
  该对的计数
·Word
  public string Word{get;}
  该对的串
  构造器
·.ctor
   public WordFrequencyPair()
   创建带有空字和零计数的对。
·ctor
  public WordFrequencyPair()
  创建带有给定串和计数的对。
        -参数
           _word-该对的串。
           _frequency-该对的计数
Microsoft.TMSN-WordFrequencyPair
·.ctor
   public WordFrequencyPair()
   创建带有给定串和单位计数的对。
          -参数
            _word-该对的串。
·.ctor
   public WordFrequencyPair()
   创建带有给定串的Word和Frequency的对。
         -参数
            _pair-要复制的对
方法
·Clone
  public Microsoft.TMSN.WordFrequencyPair Clone()
  创建为当前实例的副本的新对象。
·CompareTo
  public int CompareTo()
  与另一WordFrequencyPair比较用于排序。
        -参数
           _obj-另一个WordFrequencyPair
·Equals
  public bool Equals()
  确定指定的实例是否与当前的实例相同。
        -参数
           -obj-
Microsoft.TMSN-WordFrequencyPair
·Finalize
  protected void Finalize()
  允许在由无用单元收集回收之前试图释放资源和执行其他消除操作。
·GetHashCode
  public int GetHashCode()
  用于特定类型的散列函数,适于在散列算法和如散列表等数据结构中使用。
·GetType
  public System.Type GetType()
  获得当前的实例的类型
·MemberwiseClone
  protected object MemberwiseClone()
  创建当前的实例的浅副本
·ToString
  public string ToString()
  返回表示当前实例的串。
扩展信息
·Assembly:TMSNSearch

Claims (20)

1.一种向用户提供数据的系统,包括:
一库组件,它存储关于至少一个搜索引擎结果的信息,其中,所述库组件能够修改所述至少一个搜索引擎结果的结构;以及
一应用程序接口(API)组件,它指定一个或多个应用程序如何与所述库组件接口来优化对至少一个搜索引擎结果的利用。
2.如权利要求1所述的系统,其特征在于,还包括一结果高速缓存,它存储从查询中返回的至少一个数据对象,其中,所述结果高速缓存能够组织、编辑和构造一个或多个数据对象。
3.如权利要求2所述的系统,其特征在于,所述结果高速缓存能够制造复制来自一个或多个数据搜索的、具有或不具有修改、添加和去除的结果的网页。
4.如权利要求1所述的系统,其特征在于,还包括一搜索引擎,它能够接受一组搜索元素并返回满足所接受的搜索元素的一组数据对象。
5.如权利要求4所述的系统,其特征在于,所述API组件能够与一个以上搜索引擎接口,且可以在搜索引擎之间切换而不需修改应用程序代码。
6.如权利要求1所述的系统,其特征在于,所述数据对象是以可扩展标记语言(XML)形式、超文本链接标记语言(HTML)形式、二进制形式和纯文本中的至少一种来检索的。
7.如权利要求1所述的系统,其特征在于,还包括一查询日志,它存储关于用于所述搜索引擎的至少一个搜索查询的信息。
8.如权利要求1所述的系统,其特征在于,所述库组件组合至少两个搜索引擎结果集,来对至少一个应用程序实现。
9.如权利要求1所述的系统,其特征在于,还包括一人工智能(AI)组件,它确定适当位置,并通知所述适当位置的访问组件提供所请求的搜索元素。
10.如权利要求9所述的系统,其特征在于,所述AI组件至少部分地基于支持矢量机、神经网络、后向传播网络、前馈后向传播网络、径向基网络、模糊逻辑网络、专家系统、贝叶斯网络和数据融合网络中的一个来作出确定。
11.一种优化对从至少一个搜索引擎中接收到的数据的利用的计算机实现的方法,包括:
存储至少两个搜索引擎结果;
从所述至少两个搜索引擎结果中提取至少一个数据元素;
组装所述至少两个搜索引擎结果来优化应用程序的开发;以及
在至少一个应用程序中实现所组装的搜索引擎结果。
12.如权利要求11所述的方法,其特征在于,还包括将用于执行搜索的数据存储在一查询日志中。
13.如权利要求11所述的方法,其特征在于,还包括询问一个或多个所存储的搜索结果,所述一个或多个搜索结果包含资源和指向资源的指针中的至少一个。
14.如权利要求13所述的方法,其特征在于,所述指针是统一资源定位器。
15.如权利要求11所述的方法,其特征在于,还包括利用一应用程序接口(API)来定位一个或多个结果和检索一个或多个所存储的结果。
16.如权利要求11所述的方法,其特征在于,还包括结构化所述至少两个搜索引擎结果来符合应用程序开发要求。
17.如权利要求11所述的方法,其特征在于,还包括将查询和结果中的至少一个高速缓存在本地存储器、本地存储设备和远程服务器中的至少一个上。
18.如权利要求11所述的方法,其特征在于,还包括在两个或多个搜索引擎之间切换。
19.如权利要求11所述的方法,其特征在于,还包括制作模拟至少一个搜索引擎的结果页面的复制品网页。
20.一种提供对搜索结果的计划性访问的系统,包括:
用于存储来自一组数据准则的搜索结果的装置;
用于构造搜索结果来最优地用于为至少一个设备的消费的装置;以及
用于向至少一个设备提供组装格式的结果的装置。
CN2005101161016A 2004-11-11 2005-10-17 向用户提供数据的系统以及用于优化对数据的利用的方法 Expired - Fee Related CN1797399B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US62679004P 2004-11-11 2004-11-11
US60/626,790 2004-11-11
US11/172,638 US7565362B2 (en) 2004-11-11 2005-07-01 Application programming interface for text mining and search
US11/172,638 2005-07-01

Publications (2)

Publication Number Publication Date
CN1797399A true CN1797399A (zh) 2006-07-05
CN1797399B CN1797399B (zh) 2010-04-07

Family

ID=35911316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005101161016A Expired - Fee Related CN1797399B (zh) 2004-11-11 2005-10-17 向用户提供数据的系统以及用于优化对数据的利用的方法

Country Status (10)

Country Link
US (1) US7565362B2 (zh)
EP (1) EP1659506A1 (zh)
JP (1) JP5065584B2 (zh)
KR (1) KR101153082B1 (zh)
CN (1) CN1797399B (zh)
AU (1) AU2005229637B2 (zh)
BR (1) BRPI0504308A (zh)
CA (1) CA2522510A1 (zh)
MX (1) MXPA05010941A (zh)
RU (1) RU2412476C2 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100447793C (zh) * 2007-01-10 2008-12-31 苏州大学 基于视觉特征的页面查询接口抽取方法
WO2010124514A1 (zh) * 2009-04-30 2010-11-04 广东国笔科技股份有限公司 在线业务管理网络及其运营方法
CN102393844A (zh) * 2010-07-16 2012-03-28 捷讯研究有限公司 应用注册和统一媒体搜索
CN103902720A (zh) * 2014-04-10 2014-07-02 北京博雅立方科技有限公司 一种关键词的拓展词获取方法及装置
CN104462025A (zh) * 2013-10-29 2015-03-25 上海宝信软件股份有限公司 加快招标文件生成的缓冲方法及系统
CN110738024A (zh) * 2019-09-24 2020-01-31 深圳丝路天地电子商务有限公司 将WebAPP转换为API服务接口的方法
CN112347337A (zh) * 2020-11-17 2021-02-09 平安数字信息科技(深圳)有限公司 离线应用的数据检索方法、装置、计算机设备及存储介质

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7155667B1 (en) 2000-06-21 2006-12-26 Microsoft Corporation User interface for integrated spreadsheets and word processing tables
US7624356B1 (en) 2000-06-21 2009-11-24 Microsoft Corporation Task-sensitive methods and systems for displaying command sets
US6948135B1 (en) 2000-06-21 2005-09-20 Microsoft Corporation Method and systems of providing information to computer users
US6883168B1 (en) 2000-06-21 2005-04-19 Microsoft Corporation Methods, systems, architectures and data structures for delivering software via a network
US7346848B1 (en) 2000-06-21 2008-03-18 Microsoft Corporation Single window navigation methods and systems
US7000230B1 (en) 2000-06-21 2006-02-14 Microsoft Corporation Network-based software extensions
US7191394B1 (en) 2000-06-21 2007-03-13 Microsoft Corporation Authoring arbitrary XML documents using DHTML and XSLT
AU2001264895A1 (en) * 2000-06-21 2002-01-02 Microsoft Corporation System and method for integrating spreadsheets and word processing tables
US7275216B2 (en) 2003-03-24 2007-09-25 Microsoft Corporation System and method for designing electronic forms and hierarchical schemas
US7370066B1 (en) 2003-03-24 2008-05-06 Microsoft Corporation System and method for offline editing of data files
US7415672B1 (en) 2003-03-24 2008-08-19 Microsoft Corporation System and method for designing electronic forms
US7913159B2 (en) 2003-03-28 2011-03-22 Microsoft Corporation System and method for real-time validation of structured data files
US7296017B2 (en) 2003-03-28 2007-11-13 Microsoft Corporation Validation of XML data files
US7451392B1 (en) 2003-06-30 2008-11-11 Microsoft Corporation Rendering an HTML electronic form by applying XSLT to XML using a solution
US7406660B1 (en) 2003-08-01 2008-07-29 Microsoft Corporation Mapping between structured data and a visual surface
US7334187B1 (en) 2003-08-06 2008-02-19 Microsoft Corporation Electronic form aggregation
US8819072B1 (en) 2004-02-02 2014-08-26 Microsoft Corporation Promoting data from structured data files
US7496837B1 (en) 2004-04-29 2009-02-24 Microsoft Corporation Structural editing with schema awareness
US7774620B1 (en) 2004-05-27 2010-08-10 Microsoft Corporation Executing applications at appropriate trust levels
US7692636B2 (en) 2004-09-30 2010-04-06 Microsoft Corporation Systems and methods for handwriting to a screen
US7712022B2 (en) 2004-11-15 2010-05-04 Microsoft Corporation Mutually exclusive options in electronic forms
US7509353B2 (en) * 2004-11-16 2009-03-24 Microsoft Corporation Methods and systems for exchanging and rendering forms
US7721190B2 (en) 2004-11-16 2010-05-18 Microsoft Corporation Methods and systems for server side form processing
US7904801B2 (en) 2004-12-15 2011-03-08 Microsoft Corporation Recursive sections in electronic forms
US7937651B2 (en) 2005-01-14 2011-05-03 Microsoft Corporation Structural editing operations for network forms
US7461059B2 (en) * 2005-02-23 2008-12-02 Microsoft Corporation Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks
US7725834B2 (en) 2005-03-04 2010-05-25 Microsoft Corporation Designer-created aspect for an electronic form template
US8010515B2 (en) * 2005-04-15 2011-08-30 Microsoft Corporation Query to an electronic form
US8200975B2 (en) 2005-06-29 2012-06-12 Microsoft Corporation Digital signatures for network forms
US8001459B2 (en) 2005-12-05 2011-08-16 Microsoft Corporation Enabling electronic documents for limited-capability computing devices
JP4539613B2 (ja) * 2006-06-28 2010-09-08 富士ゼロックス株式会社 画像形成装置、画像生成方法およびプログラム
US20080109401A1 (en) * 2006-09-12 2008-05-08 Microsoft Corporation Presenting predetermined search results with query suggestions
EP1967965B1 (de) * 2007-03-05 2012-09-12 Avaya GmbH & Co. KG Verfahren zum Ermitteln von Informationen aus einer Datenbank
US8126881B1 (en) 2007-12-12 2012-02-28 Vast.com, Inc. Predictive conversion systems and methods
US7962435B2 (en) * 2008-02-20 2011-06-14 Panasonic Corporation System architecture and process for seamless adaptation to context aware behavior models
US20100057675A1 (en) * 2008-08-27 2010-03-04 Microsoft Corporation Search Provider Recommendation
CN101667179B (zh) * 2008-09-03 2012-08-15 华为技术有限公司 移动搜索方法及其系统、搜索服务器同步元索引的方法
CN102479218A (zh) * 2010-11-30 2012-05-30 深圳市金蝶友商电子商务服务有限公司 通过api接口进行快递查询的方法和服务器
US9973884B2 (en) * 2012-03-07 2018-05-15 Intel Corporation Device, system and method of controlling access to location sources
KR101642213B1 (ko) 2012-03-29 2016-07-22 인텔 코포레이션 모바일 장치의 위치 추정 장치, 시스템 및 방법
US9645242B2 (en) 2012-04-10 2017-05-09 Intel Corporation Device, system and method of collaborative location error correction
US9104718B1 (en) 2013-03-07 2015-08-11 Vast.com, Inc. Systems, methods, and devices for measuring similarity of and generating recommendations for unique items
US9465873B1 (en) 2013-03-07 2016-10-11 Vast.com, Inc. Systems, methods, and devices for identifying and presenting identifications of significant attributes of unique items
US10007946B1 (en) 2013-03-07 2018-06-26 Vast.com, Inc. Systems, methods, and devices for measuring similarity of and generating recommendations for unique items
US9830635B1 (en) 2013-03-13 2017-11-28 Vast.com, Inc. Systems, methods, and devices for determining and displaying market relative position of unique items
US10127596B1 (en) 2013-12-10 2018-11-13 Vast.com, Inc. Systems, methods, and devices for generating recommendations of unique items
AU2014394628A1 (en) * 2014-05-17 2016-12-15 Khalid Omar Thabit A method of searching text based on two computer hardware processing properties: indirect memory addressing and ASCII encoding
US10268704B1 (en) 2017-10-12 2019-04-23 Vast.com, Inc. Partitioned distributed database systems, devices, and methods
RU2678716C1 (ru) * 2017-12-11 2019-01-31 Общество с ограниченной ответственностью "Аби Продакшн" Использование автоэнкодеров для обучения классификаторов текстов на естественном языке
RU2663474C1 (ru) * 2018-01-31 2018-08-06 Федеральное государственное казенное военное образовательное учреждение высшего образования "Академия Федеральной службы охраны Российской Федерации" (Академия ФСО России) Способ поиска подобных файлов, размещённых на устройствах хранения данных
CN108614871B (zh) * 2018-04-19 2022-07-05 中国银行股份有限公司 数据查询与结果生成方法、装置、设备及存储介质
CN116157790A (zh) * 2020-06-25 2023-05-23 普莱恩公司 文档处理和响应生成系统
US20230418885A1 (en) * 2022-06-23 2023-12-28 Popology Megaverse Llc System and method for acquiring a measure of popular by aggregation, organization, branding, stake and mining of image, video and digital rights

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5873080A (en) * 1996-09-20 1999-02-16 International Business Machines Corporation Using multiple search engines to search multimedia data
US6278992B1 (en) * 1997-03-19 2001-08-21 John Andrew Curtis Search engine using indexing method for storing and retrieving data
US6009422A (en) * 1997-11-26 1999-12-28 International Business Machines Corporation System and method for query translation/semantic translation using generalized query language
US6098064A (en) * 1998-05-22 2000-08-01 Xerox Corporation Prefetching and caching documents according to probability ranked need S list
EP1360604A2 (en) * 2000-03-31 2003-11-12 Harlequin Ltd. Method and system for gathering, organizing, and displaying information from data searches
WO2002003234A2 (en) * 2000-06-30 2002-01-10 Troy Schultz Method and apparatus for a gis based search engine utilizing real time advertising
US7451136B2 (en) * 2000-10-11 2008-11-11 Microsoft Corporation System and method for searching multiple disparate search engines
US20020091712A1 (en) * 2000-10-28 2002-07-11 Martin Andrew Richard Data-base caching system and method of operation
US7925967B2 (en) 2000-11-21 2011-04-12 Aol Inc. Metadata quality improvement
US7133863B2 (en) * 2000-12-28 2006-11-07 Intel Corporation Method and apparatus to search for information
US20040205690A1 (en) * 2001-01-19 2004-10-14 Friedrich Pieper Integrated dynamic control flow and functionality generation for network computing environments
US20020165860A1 (en) * 2001-05-07 2002-11-07 Nec Research Insititute, Inc. Selective retrieval metasearch engine
US6738764B2 (en) * 2001-05-08 2004-05-18 Verity, Inc. Apparatus and method for adaptively ranking search results
US6795820B2 (en) * 2001-06-20 2004-09-21 Nextpage, Inc. Metasearch technique that ranks documents obtained from multiple collections
US7437344B2 (en) * 2001-10-01 2008-10-14 L'oreal S.A. Use of artificial intelligence in providing beauty advice
JP2006505833A (ja) * 2002-02-27 2006-02-16 ディー. セーター ニール メディアのカスタマイズを促進するシステムおよび方法
JP2003296226A (ja) * 2002-04-05 2003-10-17 Hitachi Ltd ウェブアクセス提供方法およびサーバ装置
US20030217044A1 (en) * 2002-05-15 2003-11-20 International Business Machines Corporation Method and apparatus of automatic method signature adaptation for dynamic web service invocation
US20040225730A1 (en) * 2003-01-17 2004-11-11 Brown Albert C. Content manager integration

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100447793C (zh) * 2007-01-10 2008-12-31 苏州大学 基于视觉特征的页面查询接口抽取方法
WO2010124514A1 (zh) * 2009-04-30 2010-11-04 广东国笔科技股份有限公司 在线业务管理网络及其运营方法
CN102393844A (zh) * 2010-07-16 2012-03-28 捷讯研究有限公司 应用注册和统一媒体搜索
CN102393844B (zh) * 2010-07-16 2015-01-21 黑莓有限公司 应用注册和统一媒体搜索
CN104462025A (zh) * 2013-10-29 2015-03-25 上海宝信软件股份有限公司 加快招标文件生成的缓冲方法及系统
CN103902720A (zh) * 2014-04-10 2014-07-02 北京博雅立方科技有限公司 一种关键词的拓展词获取方法及装置
CN103902720B (zh) * 2014-04-10 2017-11-21 北京博雅立方科技有限公司 一种关键词的拓展词获取方法及装置
CN110738024A (zh) * 2019-09-24 2020-01-31 深圳丝路天地电子商务有限公司 将WebAPP转换为API服务接口的方法
CN112347337A (zh) * 2020-11-17 2021-02-09 平安数字信息科技(深圳)有限公司 离线应用的数据检索方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
EP1659506A1 (en) 2006-05-24
CN1797399B (zh) 2010-04-07
JP5065584B2 (ja) 2012-11-07
CA2522510A1 (en) 2006-05-11
RU2412476C2 (ru) 2011-02-20
US7565362B2 (en) 2009-07-21
JP2006139763A (ja) 2006-06-01
AU2005229637B2 (en) 2010-09-09
MXPA05010941A (es) 2006-05-15
AU2005229637A1 (en) 2006-05-25
KR20060092894A (ko) 2006-08-23
BRPI0504308A (pt) 2006-06-27
US20060101037A1 (en) 2006-05-11
RU2005134946A (ru) 2007-05-20
KR101153082B1 (ko) 2012-06-04

Similar Documents

Publication Publication Date Title
CN1797399A (zh) 用于文本挖掘和搜索的应用程序编程接口
CN1155906C (zh) 数据处理方法、系统、处理程序及记录媒体
CN1293500C (zh) 组织计算机网络中电子邮件文档的方法及电子邮件系统
CN1182467C (zh) 可扩充的分布企业应用集成系统
CN1204515C (zh) 自由格式数据处理的方法和设备
CN1170240C (zh) 结构化文档检索显示方法和装置
CN1304981C (zh) 用于基于规则的万维网方案与活动的系统与方法
CN1669018A (zh) 手持终端框架系统
CN100342691C (zh) 多模式对话处理方法
CN1609795A (zh) 用于计算机平台的编程接口
CN1609794A (zh) 用于计算机平台的编程接口
CN1592905A (zh) 自动产生数据库查询的系统和方法
CN1689022A (zh) 可扩展标记语言流化转换器
CN1667575A (zh) 非集成工具的集成体系结构
CN1609855A (zh) 查询优化系统和方法
CN1524216A (zh) 软件构件插件程序结构的系统和方法
CN1359489A (zh) 用于构筑建模工具的装置和方法
CN1739107A (zh) 为可由硬件/软件接口系统管理的信息单元提供同步服务的系统和方法
CN1679026A (zh) Web服务设备和方法
CN1808430A (zh) 智能、图示和自动化互联网和计算机信息的检索和挖掘方法
CN1961294A (zh) 为可由硬件/软件接口系统管理的信息单元提供关系和分层同步服务的系统和方法
CN1609793A (zh) 用于计算机平台的编程接口
CN1605182A (zh) 用于网络高速缓存的方法和系统
CN1749999A (zh) .net数据类型和实例的持久存储
CN1744036A (zh) 报告软件中支持定制图形表示的系统和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100407

Termination date: 20121017