CN101317173A - 用于通信和合作的系统 - Google Patents

用于通信和合作的系统 Download PDF

Info

Publication number
CN101317173A
CN101317173A CNA2006800442871A CN200680044287A CN101317173A CN 101317173 A CN101317173 A CN 101317173A CN A2006800442871 A CNA2006800442871 A CN A2006800442871A CN 200680044287 A CN200680044287 A CN 200680044287A CN 101317173 A CN101317173 A CN 101317173A
Authority
CN
China
Prior art keywords
user
project
note
key word
linguistic context
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800442871A
Other languages
English (en)
Inventor
德瓦乔提·萨卡尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sarkar Pte Ltd
Original Assignee
Sarkar Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sarkar Pte Ltd filed Critical Sarkar Pte Ltd
Publication of CN101317173A publication Critical patent/CN101317173A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Abstract

一种用于通信和合作的系统和方法,其使用了通用的基于注释的机制,从而可在用户之间共享项目并且可以基于现有的信息检索排名技术来对项目和用户进行搜索和排名。介绍了一种新的方法,用于基于类别语境同时对用户和项目进行聚类。这些机制被用来创建允许基于语境发表和预订项目的机制。

Description

用于通信和合作的系统
技术领域
本发明涉及用于通信和合作(collaboration)的方法,这种方法扩展了搜索的概念,以允许基于现有的信息检索排名(Information Retrievalranking)技术来对项目(item)和用户两者进行搜索和排名。这被用来提供基于语境(context)的通信机制。
背景技术
万维网的出现和计算机的几乎无处不在已经显著地改变了人们查找和使用信息的方式。然而,随着我们进入21世纪,我们却面临着独特的困境。信息和知识比以前更加重要,并且正越来越大量地被产生出来,但是要找到有用和相关的信息却越来越困难了。
Web搜索技术代表了这个领域的一个重大突破。早期的搜索引擎创建web爬虫或蜘蛛,这些web爬虫或蜘蛛是遍历web上的页面图形并将它们下载到中央服务器的软件程序。然后这些页面图形放到反向索引中,并且基于信息检索(IR)方法被搜索。一个人可以搜索包含一个单词或一组单词的所有文档。虽然这对较小的页面集合是有用的,但却无法缩放。所返回的大量与查询无关的文档损害了搜索的有用性。因此,无法找到重要的文档,因为要扫描所有结果以找出有关的那些是不实际的。
这种“丰溢(abundance)”问题在Kleingerg、Page和Brin的早期开创性论文中得到了解决。他们使用了文档之间的超链接来作为相关性判断的代理。已经知道,许多其他页面链接到的页面的相关性似乎高于平均水平。Page和Brin利用以下直觉精炼了这个概念:重要的不仅在于有多少页面指向某个页面,而且在于这些页面的质量如何。它们提出了PageRank(页面排名)方法,这种方法被用于Google搜索引擎中。这是一种独立于查询的对页面的排名,这种排名基于链接到该页面的页面。
Kleinberg提出了一种更为精炼的关于网页质量的概念。他指出好页面不一定指向其他好页面(他称之为权威(authority))。取而代之,存在特殊的被称为轴心(hub)的节点,这些节点包含去往好权威的链接的集合。HITS算法利用以下直觉基于轴心和权威两者来评估质量:好的轴心是链接到许多好的权威的轴心,好的权威是许多好的轴心链接到的权威。这是以一种依赖于查询的方式来计算的。
这些方法允许了获得网络上的聚合性智能,以帮助将相关的、有用的页面显示在搜索结果的顶部。从Google的成功可以清楚看到这种链接分析和排名(LAR)算法的成功。这引起了在此领域的大量研究,从而有了上述算法的许多变体,比如Hilltop、SALSA、随机化HITS、子空间HITS等等。最近,已经提出了像TOPHITS这样的三级算法,其利用三个变量的张量分解(tensor decomposition)以提高结果的质量。HITS受到主题漂移的困扰,其中用于计算轴心和权威的初始页面可能不与查询的主题完全有关。TOPHITS通过将轴心和权威的相关性分配给查询的主题,来使用链接文本(超链接中的文本)改善HITS。
然而,即使在web搜索技术进步之后,仍然存在许多大问题。一个普通的查询会返回数百万的结果。如果在最顶部的10个或20个结果中没有找到所需的页面,搜索就是无效果的。这个问题由于以下事实而更加复杂:对于相同的查询,所有用户都获得相同的结果,即使他们可能具有各种各样的信息需求。另一方面,web上平均每个查询是2.3个单词。这使得搜索引擎非常难以迎合所有用户的信息需求。主要的从业者用来减轻此问题的一种方法是个性化搜索。CubeSVD是最近的一种个性化搜索的张量分解方法,其通过利用用户的点击流(用户点击的查询结果)来为用户确定相关性。但是,取决于个性化的实现方式,仍然有重大的隐私问题,并且仍然需要观察这些方法是否有效。
诸如搜索公司内联网网页或文件共享之类的企业搜索和桌面搜索的情形更加糟糕。一些研究估计所有公司数据中有80%那么多是无组织的(不在数据库或应用中),例如文件、电子邮件等等。由于文档之间不存在超链接连通,因此无法应用web的LAR算法的进步。这些系统中的排名仍然局限于全文搜索的TFIDF风格算法,从而导致更低的质量。即使最近的丰富索引方法,例如在即将发布的Microsoft Windows Vista操作系统中使用基于关键字的类别,仍然受到与先前的IR系统相同的问题的困扰-据估计,基于关键字来搜索文档的人只有20%的时间可能使用与文档上的关键字相同的关键字。这导致了这样的荒谬情形,即在因特网上找到文档比在某人自己的硬盘上找到文档还要容易。
最近,通过一种被称为公众分类法(Folksonomy)的共享方法,在分类领域进行了有趣的工作。不同于早先Yahoo!和ODP以集中方式对web进行手工分类的尝试,他们尝试使用合作式标记方法来共享书签、图片和网页。这方面的主要创新者包括Flickr、del.icio.us和Technorati。虽然每种标记方法是不同的,但它们都尝试使用关键字来作为为用户创建共享空间的基础。然而,总的来说只有少量的用户实际使用公众分类法。这一部分是因为它们用起来比搜索更困难这一事实,而且也因为公众分类法中的页面的覆盖范围只是可用页面的一小部分。与能够自动爬行于web或磁盘以索引所有文档的搜索不同,不存在相当的机制来将页面高效地带到公众分类法中。
一般来说,博客(blog)和消息传递系统存在一组类似的问题。博客是一种创建“读-写”web的尝试,其中用户不仅是信息的消耗者,而且也可以在线张贴内容。可能只有在某人发表的博客贴子能够以高效的方式触及可能感兴趣的读者时,博客的真实前景才会得到实现。所要求的正是搜索的反面:不是人搜索相关的博客张贴,而是博客张贴需要搜索相关的人。目前没有办法实现这一点。在诸如电子邮件之类的其他消息传递系统中情形更加糟糕。虽然电子邮件和IM是一对一交互的高效机制,但它们却不能高效地处理对某一主题发送电子邮件的概念。分发列表是最接近按主题邮寄的代理,但却无法动态地创建这种列表并将人们分配到这些列表。将文档的存在传达给他人的唯一方式常常是电子邮件。这导致了对这种分发列表的滥用,收件箱中充斥着与用户不那么相关的邮件,并且导致信息过载和丢失。
一般来说,组织,不论是公司组织、政府组织、非政府组织、军队组织还是宗教组织,都变得更大更复杂了。随着这种组织的规模增大,人们越来越难以得知彼此并且组织常被划分成独立部分,其中“左侧的”不知道“右侧的”在做什么。当组织面临迅速变化的环境,必须动态地使组织的不同部分一起工作以利用机会或面对威胁时,这就是一个重大的问题。具有诸如电话或电子邮件之类的点对点通信的、诸如等级体系和部门之类的传统组织结构不允许灵活地进行有效响应。基于语境的通信和合作机制可以扮演重要的角色。允许人们基于特定的语境(例如新的机会/威胁)而聚集起来并在其结束时散开的范例将使得能够为组织创建一种更有机的方法,这种方法更能够对变化作出响应。web搜索的基本手法,即网页创建者和最终用户不需要知道彼此才能够“合作”,可以被扩展到通信和合作,从而使组织可以驾驭复杂的情况。
本发明背后的基本概念
本发明尝试通过按通信和合作来定义问题来提供一种解决方案。它专注于创建这样的系统和方法,其允许i)创建一种通用的基于注释(annotation)的合作系统,使得可以应用信息检索的进步,ii)用于对用户和项目进行聚类的方法,以及iii)允许人们基于语境上来发表和预订消息的通信方法。在这些机制中可能有多个在本领域中是新颖的特征。这些方法可以与彼此或与其他系统结合使用,或者单独使用。
利用IR的通用的基于注释的合作系统
有许多形式的本领域已知的基于注释的共享系统。所有的公众分类法都是这种系统的示例。但是,注释系统就其共享和合作的有效性来说是不同的。Microsoft Windows NTFS文件系统始终具有向任何文件添加关键字的能力,但是这在实际中并没有被使用,主要是因为这种关键字不能用来高效地查找文件。Technorati标签是一种允许博客发布者标记其贴子以便人们可以发现它的技术,这种技术不那么有效,因为只有作者可以标记项目。Flickr是一个照片共享站点,它允许用户与他人共享其照片。但是,一旦用户已经看过了他人的照片,他们对他人照片的使用就是有限的,因此Flickr的动力更多的是关于共享,而不是合作的。
但是,del.icio.us是关于书签的成功合作系统的一个示例。由于一个人的书签有可能对其他人具有独立的价值,因此共享该书签的动作所扮演的角色就比比如Flickr要更加重要。由于不同的人可能面临类似的问题,因此对帮助解决该问题的相关信息的共享就获得了一个合作的维度。除书签的固有价值之外,del.icio.us的机制也不同于其他公众分类法。它允许多个用户标记同一个项目,并且多个用户确实会标记同一个项目,因为他们会通过这样做而独立地获益。
在本领域已经知道,Web的许多方面都表现出幂律(power law)。幂律是这样一种分布,当其被绘于如图2那样的对数-对数图中时,它形成直线。这被认为是不规则碎片的基本指标,并且考虑到了规模不变(该分布在任何规模下看起来都是相似的)。在网页的内容、关键字之间的超链接、搜索查询、web服务器上的文件大小、流量模式甚至是构成因特网的物理线路中都注意到了幂律。页面之间的超链接中的幂律允许了诸如PageRank和HITS之类的LAR算法有效地收敛到一种解决方案,因此成为实际的方法。文档的内容中使用的单词来遵循幂律,也称为Zipf定律。这一点被诸如TF-IDF(词条频率-逆文档频率)等等之类的IR排名方法隐性地利用,以按相关性对搜索结果进行排序。del.icio.us也表现出如图1所示的幂律。一个项目中的关键字频率、项目对关键字的数目、项目对用户的数目以及用户对项目的数目等等都遵循幂律分布。本发明注意到del.icio.us中的关键字对项目分布与web搜索引擎中的关键字对查询分布类似(web中的链接文本确实如此)。每项目用户分布与万维网上的进入链接(进入网页的超链接)的分布类似。实际上,虽然Web上的超链接通常被认为是页面导航的一种形式,但是本发明注意到它们也可被认为是注释的一种形式。
本发明假定这些幂律属性是语言本身的属性以及我们感知周围的项目的有用性的方式的属性。这是通信和合作的两个相互强化的过程的必然结果。因此,能够适当地利用发生在这些过程中的自然出现的自组织的任何注释系统将会表现出类似的幂律特性,这种特性可被现有的IR和LAR研究团体有利地利用。
利用这种基本观点,本发明以至少两种重要的方式推广了注释系统的概念。注释不仅被认为是用户利用关键字来标记项目的动作,而且被认为是要求用户以简洁的方式描述一个项目的任何动作。搜索中的点击流至少是另一种等同的注释方法。它也生成注释,从而查询的关键字与给定用户点击的URL关联起来。web上的超链接中的链接文本也是这种注释的另一种机制,但它不那么有表现力。将文件置于文件系统等级体系中是注释的一种形式,但它更加迅速和有限,并且类似于将该文件上的等级体系树中的目录的所有名称与它关联起来。虽然链接文本和文件名不像标记或点击流那么高效,但当数量足够大时,它们就接近本发明的这种形式的注释的效果了。
其次,注释可以被应用到某个群组的通信和合作活动内可以标识的任何项目。这不仅限于web URL,而且可以包涵任何能够被概念化的事物。这可以包括但不限于企业LAN中的文件、工程管理系统中的任务和事项、集体讨论会话中的想法、纸质文档、电子数据表上的表格、RDB中的数据、web服务、RSS馈送等等。假设存在一种机制(离线或在线、数字或其他)来允许用户检索并使用项目,那么项目可以是任何能够用唯一id(比如URI、社会安全号或条码)来表示的事物。
本发明的通用的基于注释的合作系统被定义为包含多个项目的任何注释系统,其中i)系统允许项目被多个用户彼此独立地识别和共享(例如它可被检索、评估、查看或使用);ii)其中每个这种用户可利用它们认为对描述项目有用的关键字来独立地注释项目,并且每个这种项目可能被多个这种用户所注释(即每个项目可能对不同用户有独立的价值);iii)其中每个用户可以基于这种关键字独立地查找项目,从而所有具有(对于每个项目跨多个用户聚集的)相应关键字的项目都被检索;对于足够相异的用户和项目群体将会表现出近似幂律分布的自组织属性。这里的关键概念是独立性,它意味着用户无需知道彼此的活动和/或存在就可以进行操作。这意味着用户之间的项目组织的唯一机制是在不同用户之间共享的关键字含义。
更具体而言,每当具有唯一标识符[User ID]的用户利用描述具有唯一标识符[Item ID]的项目的关键字[Keyword 1,Keyword 2...Keyword N]来描述该项目时,可以通用产生以下形式的事件的任何机制来生成注释:
[Item ID][User ID][Keyword 1,Keyword 2,....Keyword N]
本发明注意到,如果这种基于注释的系统在以下方面表现出近似的幂律分布:
-项目对关键字的数目
-项目内的关键字频率
-用户对项目的数目
-项目对用户的数目
然后这种机制显示出以下属性:
-在按相关性对搜索结果进行排序时可以使用TFIDF风格排名。每个项目可由一个关键字向量来表示,该关键字向量类似于IR中的平凡文档。另外,与web上的链接文本类似,每个注释表示不同的人对项目的内容的判断,并且在被聚集在一起时甚至能够比项目的作者/创建者更好地描述内容。因此,与标准的全文搜索相比,基于聚集的关键字的排名常常产生优良的质量。
-可以将每个事件看作从用户到项目的“合成”超链接。通过将用户看作轴心并将项目看作权威,可以在确定结果集合并对搜索结果进行排名时结合IR算法,比如LAR方法(如Borodin等人所述),如HITS、Hilltop、SALSA、PHITS、随机化HITS、子空间HITS、TOPHITS、CubeSVD等等。这种方法提供的结果质量可以等于并且有时好于它们当前基于web中的超链接的性能。由于用户到项目和项目到用户都显示出幂律,因此这些算法将会像web那样迅速收敛。这可以允许被注释的项目在当前不可能的情形(例如企业中的文件)中受益于LAR风格的方法。
-当用户利用一组关键字来对项目进行注释时,在描述项目的大量方式中,普通的用户自然会选择它们认为对描述项目有用的关键字。在这样做时,用户不仅描述了项目,而且同时也描述了它们认为什么重要。这使得可以类似于文档那样利用关键字来查询用户。针对一个查询对用户排名的操作可利用上述IR方法中的任何一种来完成,其中包括将用户看作轴心的LAR算法。
-比起任何个人来,团体可以更有效地对用户可能用来搜索项目/用户的不同关键字进行注释。但是,也可以通过以类似于单词-文档矩阵的方式使用关键字-项目或关键字-用户矩阵来使用LSI或PLSA,从而允许利用关键字查询项目或用户,即使没有注释具体地将它们与关键字关联起来。这些利用了更高阶的同现(co-occurrence)数据来发现这种单词。通过对事件数据使用三级方法,例如PHITS+PLSA、HOSVD、CubeSVD和TOPHITS,可以进一步增强这一点。
对于本领域的技术人员来说很明显的是,基于以上内容,在这种注释系统中可以对项目以及用户实现基于IR的许多搜索方法。在特定的实施例中它们是被有选择地使用还是彼此结合使用并不会脱离本发明的精神。另外,总是可以为项目/用户、关键字-项目和关键字-用户矩阵构造注释关键字向量,并且将注释看作合成超链接,而不管注释系统是否表现出幂律。上述所有方法都可应用在任何这种情况下,但效力可能较低。
项目和用户的聚类(clustering)
过去已经尝试过创建用于对文档进行聚类的方法。分类学和受控词汇表已经被尝试过但却失败了,因为创建一个超结构使得所有项目可被有效地放到其中,是不现实的。已经尝试过基于文本相似性对结果数据使用聚类,但是这种注释方法生成的子类别经常使用户难以理解。
本发明将聚类的概念一般地扩展到项目,具体地扩展到搜索。以不断变窄的语境在搜索结果中向下钻取的能力是平均查询长度为2.3个关键字的web搜索中的问题的一种可能的解决方案。现代用户习惯于在文件系统中的文件夹中向下钻取以查找它们所寻找的文件。因此,如果搜索结果被按关键字聚类成子类别(例如图10),则用户可表现出于文件系统类似的浏览行为。这将等同于利用与这种子类别相对应原关键字来加强原始查询。这将会更加用户友好,并且可能比诸如Google Suggest之类的查询精炼方法更加优良。这种方法不限于web搜索,而是可以应用到任何形式的搜索,包括但不限于桌面搜索和企业搜索。
除了对项目进行聚类之外,可能存在对用户进行聚类的潜在用途。这可能是创建特殊兴趣群组的动态形成或者基于兴趣而不是基于熟悉度来创建社交网络,等等。本发明的通用注释机制允许就关键字而言以与项目相类似的方式来看待用户。在本领域中已知许多聚类算法,这些算法可用来对项目以及用户进行聚类。这些算法包括投影方法,比如主成分分析和多维缩放,或者其他方法,比如自组织图、K-means聚类等等。项目可以基于其注释中使用的关键字或对其进行注释的用户或者两者而被聚类。类似地,用户可以基于其关键字或项目或两者被聚类。
所有的聚类方法都需要解决的关键问题之一是降低复杂度。例如,有相当大的复杂度与项目以及用户的关键字相关联。在实际中,唯一的注释语境的数目可能与项目数目一样多。因此,聚类问题变成选择用来使类似项目和用户集中到一起的相关关键字的子集。这是一个困难的问题,因为可能的组合的数量极为巨大,并且确定关键字对项目以及用户的相关性很困难,等等。另外,与项目不同的是,用户具有随时间变化的许多方法,并且能够共享许多关键字。
诸如LSI之类的模式识别方法使用维度减少来作为对付这种复杂性的一种方法,但它们执行起来代价较高并且不断被更新,并且很难理解它们实际在做什么。
本发明注意到,当用户和项目两者被同时聚类时,会发生最相关的聚类。本发明披露了一种方法,它实现了显著的复杂度降低,并且对用户和项目两者都提供了直觉的、有效的聚类结果。它基于语境的概念。语境在这里被定义为关键字的集合(set of keywords)。在搜索的情况下,语境将对应于基于关键字的逻辑AND的搜索。如果项目或用户匹配了某个语境中的所有关键字,则该项目或用户将被认为属于该语境。语境的子语境具有该语境的所有关键字以及至少一个其他关键字。因此,存在于子语境中的所有用户和项目也都存在于语境中。注释事件中的关键字集合是语境(如果将关键字的定义扩展到包括UserID和ItemID的话,注释事件本身可被认为是语境,在这种情况下,注释事件是由该关键字集合形成语境的子语境。另外,用户可被认为是项目)。
项目和用户的聚类则可被定义为确定用来将用户和项目集中到一起的最相关的语境的集合。当这种语境集合的大小远小于系统中的所有语境的集合时,就可以实现复杂度降低。本发明使用了以下直觉:相关的/有用的语境是被使用的语境。因此,这样的语境集合可以从用户在描述项目时使用的注释事件中的实际关键字来确定,并通过查找至少包含某个最小数目的项目和用户的语境来确定。在实际中,对于具有足够相异的用户/项目群体的注释系统,即使较小的最小数目也可以带来显著的维度减少,以及根据基于兴趣的类别的用户/项目聚类。这克服了实现论坛的主要问题之一-很难判定哪些主题对于用户有意义以使其能够有效地沟通。本发明的自然出现的语境或主题带来了对用户和项目的动态、相关的聚类,其提供了对此问题的解决方案。
在包括web搜索在内的搜索的情况下,可以基于对搜索结果的点击流从查询日志获取注释(它们也可以与链接文本有利地组合,其中这种链接来自不同的web主机或博客或独立的注释者和其他注释源的其他代理)。上面定义的语境集合可被计算并被称为类别语境。对于搜索中的任何给定语境,类别语境中的作为搜索查询的子语境的语境集合可以被计算,并且所得到的集合中的每个关键字(在取出搜索语境的关键字之后)可被提供作为如上所述的向下钻取子类别。向下钻取给定的子类别等同于改变查询的语境以使它包括与向下钻取子类别相对应的关键字。因此,每个向下钻取关键字对应于查询的语境的一个子语境。这并不限于单个单词关键字,而是包涵了可被当作为向下钻取关键字的基于协同定位和n-gram的单词序列。这些向下钻取关键字可在基于特定排名顺序被排序的情况下被呈现。这种排名顺序可针对这种子语境,根据事件的数目来计算(或者根据用户或项目的数目来计算;并且可以基于诸如“今天”之类的时间范围以及累积总数来计算数目)。另外,对类别语境本身的计算可以以时间界限的方式来完成,其中给定时间窗口中的所有事件都被用于计算类别语境。
向下钻取期间的实际搜索过程可以独立于在计算这种向下钻取时使用的注释,并且可以是搜索引擎用来执行包括全文搜索等在内的搜索的任何方法。子类别的角色仅在于向用户呈现相关关键字,然后其被用于加强搜索查询。
基于语境的通信方法
通信是所有合作活动的支柱。然而当今的大多数通信技术都限于一对一范例(比如电话、电子邮件、SMS/IM等等)或者一对多范例(比如TV、无线电、Web等)。有一类在现有技术中未被兼顾的重要通信:多对多通信。多对多并不意味着会议呼叫情况下的多个人或者电子邮件的多个接收者。更确切地说,与一对多情况一样,接收者在通信之前并不知道消息发送者。例如,将文件放置在企业文件系统中的某人需要将其存在传达给需要它的可能未知的人。博客允许了任何人在Web上张贴内容,但是不存在有效的机制来允许目标web用户发现博客的张贴。
该问题可以被表达为“对于每个项目其用户;对于每个用户其项目”。搜索允许了人们找到相关的项目,但是从通信和合作的角度来看可能更重要的是项目找到相关的人的能力。以上描述的方法可被有利地用于解决此问题。
多对多通信系统可被实现为两个单独的部分:需要搜索认为项目相关的用户的项目发表者以及搜索所有项目以找出与其相关的项目的用户。对于本领域的技术人员来说很明显的是,任何这种机制都必须平衡对包罗性、相关性和隐私性的需求,以创建实际的实现方式。
本发明将通信过程划分成三个阶段:发表(publish)、语境化(contextualize)和预订(subscribe)。它使用一种基于语境的方法来进行发表,其中发表者需要为所关注的项目选择最相关的语境以便触及所需的预订者。此语境优选地限于如上所述的注释系统的类别语境。发表者可将公众可获得的一种形式的身份与项目一起公开。这可以通过使用发表者所特有的发表者ID(可能同于也可能不同于发表者的用户ID)并利用该id注释项目来完成。可以使发表动作成为一种明确的动作,该明确动作生成被称为发表注释事件的特殊类型的注释事件,或者可以是将发表者ID附加到项目的普通注释事件。
预订者基于来自用户过去已经指示出或显示出兴趣的类别语境的集合的语境来周期性地获得(拉出)项目。这种预订者项目可基于项目的关键字与用户过去用在对语境的注释中的关键字之间的匹配被“个性化”或重排名。这可以通过计算文档的发表者ID与用户过去认为有用(或注释过)的项目的发表者ID之间的匹配来有利地加强。发表者ID充当发表者的分布形式的声誉。过去对来自发表者的项目进行了注释(例如进行了选择或添加了书签)的预订者在个性化时的重排名后可以使今后来自同一发表者的项目排名较高。相应地,如果发表者在过去收到的来自某个用户的注释相对较少,则今后来自该发表者的项目的排名将会较低。为了完成反馈环,注释事件的实现方式可以不同于普通的搜索,其中注释了项目的用户可以使他们承认的发表者ID被自动包括在他们的注释中。这些注释事件可被聚集,并且允许了在语境中对发表者进行排名,就像对项目进行排名那样。
语境化是这样一个过程,其中在特定语境中首次被发表的项目被向下推送到该语境中的用户子集中。该用户子集充当项目的引导群组,并且如果他们觉得适当则可利用关键字对其进行注释。这些注释事件被聚集,并且被注释的项目随后被提供给所有的语境预订者。语境化阶段可限于预定的时间窗口,最低限于项目获取注释的速率,或者任何其他适当的度量。此过程加速了某些情形下接纳项目的过程。这允许了项目收到某个最低级别的注释,以对其进行充分的分类以便将来搜索或预订。这可被有利地用于将新项目介绍给某个语境的有影响力的发表者(这些发表者能够推广该项目),并且有助于其迅速被接受,如果他们觉得该项目相关且适当的话。语境化是一个可选的步骤,如果具体实现方式能通过这样做得到价值的话则可以实现该步骤。
根据上述这些概念来模拟系统的原因有多个。一个主要的原因是末端用户隐私。在一些情况下(例如企业工作组),按关键字搜索用户是可接受或者甚至正是想要的(例如“查找专家”)。在这种情况下,某个人可以通过电话或电子邮件直接联系被搜索的人。但是在许多情形中,用户可能不希望其联系信息或个人细节被公开。在这些情形下,可以通过以下方式来实现类似的目的:发送者公开其身份但向某个语境中的用户盲目地发送消息,这种用户可以基于它们个体的判断来回复。通过将发送者限于单个(或者可能少量语境),使得发送者专注于选择正确的人群组来发送消息。这是人类判断的一个重要方面,而在信息过滤以及其中被注释的过程收集项目的搜索中则没有这种判断。
通过公开身份,项目也可以基于发表者ID来针对搜索以及预订被排名。这使得作者能够基于末端用户在其贴子中感知到的价值而在预订者中建立声誉。这也是发表者负责的一种机制。广受尊敬的作者会有一种既定的兴趣,以通过只发表高质量项目来保护其声誉。如果它们无意间或有意地没有做到这一点,则它们就会不再被广受尊敬。由于声誉是要花时间来建立的,因此广受尊敬的作者如果推广低质量的项目则会获得很少而失去很多。这是一种很难兜售的分布式声誉,并且与从基于注释的分析的合成超链接或链接分析中可以辨别出的相比,这样的作者可向信息检索算法添加一个重要的新维度。实质上,它将专家判断元素包括到了排名过程中。因此,具体实现方式可以选择在计算语境内的项目的总体排名时结合每个项目的注释信息以及发表者ID信息。
语境化阶段对于项目被迅速地注释以正确的关键字集合是很重要的。如前所述,团体对项目进行语境化的能力超过了任何个体的。在像del.icio.us这样的团体中,可以看出项目中的关键字的分布遵循幂律。被多于预定百分比的用户注释的关键字的数目通常是相对稳定的,并且在超过某个阈值之后相对于事件数目就表现出规模不变性。这些顶部关键字被称为项目的限定特性/关键字,并且如果项目以语境敏感方式(例如语境化)被暴露给用户,则这些顶部关键字可以相对迅速地被捕捉。限定特性合理地代表了团体对项目的语境的判断,并且使预订可以更加相关和准确。
语境化对于新项目迅速被承认也是很重要的。来自不那么为人所知的发表者的项目可以以针对性的方式被发送到该语境的广受尊敬的发表者,如果他们在该项目中发现了价值,他们就可以用他们的身份来发表它(实质上是将其身份与原始作者一起附加到项目)。这将允许新项目在整个群体内迅速被接纳。这还将允许有前景的新才干迅速暴露出来。
团体处理语境中的项目的能力可以基于语境中的用户的数目而增大。每个人不需要处理每个项目。项目可在团体的子集间被划分,并且可以以并行方式被语境化。类别语境代表了发生这种合作的有意义地点。例如,在Google中索引了超过50亿个页面,并且每天有多于1000亿封电子邮件(不幸的是其中包括垃圾邮件)。这种通信机制的适当实现方式可以在一段合理的时间内对像整个Web那么大的域进行语境化。对于通用的注释机制,此通信方法代表了对web搜索中的蜘蛛的角色的实用替代。此外,一般的语境级统计信息可被提供给发送者,以允许他们找到适当的语境。这种统计信息可包括但不限于语境中的用户和项目的数目。如果用户对项目的比率高于平均,那么这可以是热点主题的良好指标。如果比率远低于平均,那么发送者可以判定该语境对于其消息来说竞争性太大了。这给出了一种重要的反馈环,该反馈环可以影响Web上的内容生成,或者更一般地说,可以影响任何合作式组织希望如何将资源分配到任务。
即使在初始的语境化过程之后注释仍会继续,并且随着时间过去,项目继续被不同的人用不同的关键字来描述。语境化阶段可以有助于项目的初始筛选,以使得相关的或有前景的项目被放到前面。进一步的注释允许了通过更相关的限定关键字集合来对项目进行进一步的表征。由于团体随着时间的过去而以不同的方式表征项目的有用性,项目的限定特性中的关键字可随着时间而变化(表现出搅动行为)。注释的整个过程可以被比作通过小世界网络发送项目,其中用户不知道目的地,并且每个用户基于其对项目与语境的相关性的判断通过新的语境来将其传递给其他用户。实际上,语境关联的语义网络既是由基于这种语境的交互的社交网络所创建的,并且也反映了该网络。类别语境代表了这种网络中的连接紧密的轴心,这些轴心允许了在用户之间高效地传输项目。
预订过程允许了在语境级聚集的项目基于用户兴趣被周期性地检索。用户对某个语境的兴趣可由用户明确指定,或者基于在预订过程内项目的使用模式、点击流或用户注释来隐性地得出。用户兴趣的明确指定等同于持续对某个语境的查询并且在后台针对它不断地检索项目。但是,与搜索过程不同的是,预订中对用户兴趣的明确指定不太可能是实用的方法。在任何给定时刻,可能有许多语境中的许多项目与用户相关,而用户可能对其并不知晓。这种预订系统的隐性目标是帮助发现这种项目。本发明使用了一种形式的个性化,其基于注释事件来描绘用户概况以推断兴趣。
本领域中已经知道许多个性化方法。本发明介绍了对于实现充分的个性化很重要的三个方面-类别语境、发表者ID和针对重排名的TFIDF的基于时间的变体。大多数用于个性化的基于用户概况描绘的方法尝试基于用户过去认为有用的关键字来对项目进行排名。但是,这种方法遗漏了重要的新的兴趣领域,而不断强化有限的关键字集合,从而损害了用户体验。通过利用类别语境,可以基于团体认为有用的东西来引入偶然发现元素。这种偶然发现的项目通常将用户引导到未曾预期到的新领域,并且帮助针对用户概况(profile)来发现感兴趣的相关的新领域。这可以在这种新项目的注释事件(例如点击)中被隐性地捕捉,或者可以通过用户因为阅读/使用项目而在这种新语境中执行搜索来明确捕捉。
预订过程认为每个类别语境是其从中进行预订的独立项目源。预订从用户概况中的所有类别语境中检索项目。这可以通过基于兴趣分布来分布这种检索来完成。例如,如果我们假设用户具有有限的注意力跨度(例如每天中某个最大数目的项目),那么从某个语境检索出的项目的数目与检索出的项目总数的比率可能与用户在那个特定语境中花费的注意力的量(比如阅读/检索的项目的数目,等等)与总量的比率相同。对此分布的计算也可限于某个给定时间窗口,在该时间窗口期间用户的概况被描绘。
采取跨不同类别语境的兴趣分布的形式的用户概况可根据需要被呈现给用户以便他们审查。用户可以以多种手法来删除或更新这种比率以允许细调其偏好。但是,由于用户可能不容易明显看出对某个比率的改变将意味着什么,一个实施例可以只允许用户指定或解除指定这样的类别语境:这种类别语境将不断被下载,而不论实际用户使用如何。它也可以允许用户从概况中去除/删除任何类别语境。
在这种合作式排名与用户认为相关的东西之间需要有一个平衡。本发明介绍了一种用于基于用户概况的重排名的TF-IDF方法的基于时间的变体,以为特定用户确定相关性。对于特定语境中的特定用户,关键字及其实际使用频率是从该语境的注释事件得出的。为了计算时间使用频率(temporal usage frequency),测量了关键字的使用次数和从用户首次使用该语境中的该关键字的时间起的时间间隔。此频率被外推到预定时间段的频率,以给出本发明所说的时间使用频率。例如,对于给定的关键字,在其首次被使用起的两天之内,用户使用了它两次。这将给出每年365次的时间使用频率。像TF-IDF风格的方法中常见的那样,通过使用频率的对数值来衰减该时间使用频率,并且该时间使用频率被用作该语境中用户感兴趣的关键字向量的权重。项目中的关键字向量的权重可以以传统的TF-IDF方式来完成,并且对于此用户,项目对语境的排名(匹配)可以以两个向量的点积的普通方式来计算。基于这种计算出的排名在语境内对项目进行重排名。
如上所述的用户兴趣概况包含敏感的个人数据。因此,可能用户更喜欢在其PC上进行客户端侧实现并且能够拥有完全的访问权限以了解存储了什么并对其进行更改,而不那么喜欢在中央服务器上管理这种信息。但是,这意味着对于给定的语境,如果不将大量数据下载到客户端侧就无法在与语境相对应的整个项目集合上执行重排名。或者,即使在中央服务器上,对这种个性化的重排名的计算也可能代价高到无法执行,或者可能因为语境团体的合作式排名可能丢失而被需要。这些目标之间的平衡是通过将重排名限制到语境中的顶部的合作排名结果的子集来获得的。这可以通过仅从语境中拉出来自该语境的某个数目的项目,并且基于用户概况对这些结果进行重排名来实现。该数目使得可以控制合作式排名和个性化之间的混合。
基于速率的计算(比如TF-IDF的基于时间变体)可以有利地结合发表者ID实现,以高效地检索令人感兴趣的作者。与可能具有大量项目的恒定流的普通关键字不同的是,大多数作者产生相对少量的项目。如果发表者ID被当作项目的关键字向量中的关键字,那么即使是普通的TF-IDF式的方法也会给发表者ID赋予比其他关键字更高的权重。这可以通过为发表者ID使用用户的时间使用频率来进一步加强。例如,让我们假定发表者A总共发表了2篇博客贴子,并且在从用户遇到该发表者ID开始的过去2天内用户已经阅读了该发表者的两篇贴子。让我们假定另一发表者B拥有20篇博客贴子,用户在过去一年中已经阅读了所有这20篇。对于新的项目,发表者A的排名将高于发表者B。但是,如果用户没有阅读发表者的后续项目,或者发表者A不产生后续项目,则排名将会随着时间而降低。此方法确保了最近被证明有用的发表者ID最初将会排名较高,但是允许了其他的一贯产生有用项目的发表者追赶上不这么做的发表者。
类似的基于时间的TF-IDF方法可用于对系统的向下钻取类别中的类别语境进行排名。实质上,用户对语境的实际使用及其新近度可被适当地结合到排名过程中,而不只是语境中的累积事件数目或给定时间窗口的累积数目。
发明内容
根据本发明的宽广概念,本发明提供了一种用于合作的方法,该方法包括:识别可在多个具有唯一标识符的用户之间共享的多个具有唯一标识符的项目;使每个用户独立于其他用户地利用至少一种自然语言的至少一个关键字来注释多个这种项目,每个这种项目被至少一个用户注释,每个这种注释由一个注释事件表示,该注释事件包含进行注释的用户的标识符、被注释的项目的标识符以及进行注释的用户选择来描述被注释的项目的至少一个关键字,每个这种注释事件是从至少一种类型的多个事件源生成的;聚集来自事件源的这种注释事件,以便从特定项目的注释事件聚集与该项目相关联的关键字,并且从特定用户的注释事件聚集与该用户相关联的关键字;以及使至少一个这种用户按关键字搜索项目或用户,以使得在其聚集关键字中具有被搜索的关键字的相应项目或用户分别作为结果被返回。
本发明的实施例提供了系统和方法,从而允许用户独立于彼此地注释多个项目,以使得每个项目可能被多个用户注释,并且每个用户可以基于跨项目的多个注释聚集的项目关键字来搜索项目。这里使用的术语“注释”一般是指对项目的任何简洁描述,以便关键字被从用户收集,然后被与该用户的标识符相关联地存储。项目可对应于可以用唯一标识符来标识的任何项目(包括文件系统中的文件、纸质文档、过程管理系统中的任务和事项、仓库中存储的想法,等等)。在本发明的实施例中,注释可以以多种方法来收集,包括发表、标记、点击搜索结果集合中的结果、来自文件系统路径的目录和文件名,超链接文本,等等。
本发明还可包括:分别针对每个事件源类型基于与查询的相关性来对搜索结果进行排名;聚集这种排名以计算每个结果的最终排名;并且跨所有事件源类型聚集结果以按相关性顺序呈现最终结果。
在一个实施例中,搜索的结果集合是利用比如TF-IDF这样的信息检索算法来排名的。在本发明的另一方面中,每个注释被认为等同于超链接以及基于链接分析排名算法确定结果集合并对结果集合排名。在另一方面中,对于每个注释,每个用户被认为是轴心,每个项目被认为是权威,并且结果和排名通过诸如HITS等之类的链接分析方法来确定。例如,通过这种方法,除网页之外的项目,例如企业文件共享中的文件等,可以受益于通常与web搜索相关联的更高准确性。
在本发明的另一实施例中,注释被处理以便能够对用户和项目进行基于语境的聚类。注释根据基于关键字的语境被归类,以使得具有多于某个预定数目的用户和预定数目的项目的语境同时代表用户和项目的聚类。通过为搜索结果提供向下钻取类别,这被用于加强搜索过程。例如,web搜索引擎可从其点击流日志收集注释,并使用以下聚类方法来对结果分类并提供允许用户以有意义的方式进一步缩窄结果的可能的查询修改。
在本发明的另一实施例中,可以基于关键字搜索用户。这可以通过使用用户的注释的聚集关键字或者通过使用如上所述的诸如HITS、BFS或INDEGREE之类的链接分析排名来完成。对查询的用户排名可以类似于如前所述的项目的方式来实现。
在本发明的另一实施例中,用户可以通过发表和预订以基于语境的方式与其他用户通信。在发表时,用户通过利用语境和发表者标识符对新项目进行注释来将该新项目引入系统中。其他用户可通过搜索或通过预订来找到这种项目。预订是指基于用户过去认为有用的语境自动搜索和检索顶部结果并以个性化方式来呈现它们。这种语境可由用户明确指定或基于用户的注释而被监视。在本发明的一个方面中,个性化是通过利用TF-IDF的基于时间的替换方式对排名较高的被预订项目的子集进行重排名来实现的。在此实施例的另一方面中,预定可限于指定时间窗口内的项目。在此实施例的另一方面中,发表和预订都可限于代表用户和项目的聚类的语境。
在另一实施例中,使发表成为明确的动作,并且发表者标识符被用作在每个预订处以个性化方式对项目排名的基础。这允许了发表者基于用户群体上的接纳而获取分布式声誉,并且排名较高的发表者具有发表高质量项目的既定兴趣。这创建了一种形式的可用于项目排名的专家判断。
根据本发明的另一方面,该方面还包括按语境同时对项目和用户进行聚类;按语境来聚集注释事件;确定在其聚集注释事件中具有预定最小数目的唯一用户标识符和预定最小数目的唯一项目标识符的语境;以及基于这种语境对项目和用户进行聚类。该方法还包括基于使用聚类算法来对项目或用户的结果集合进行聚类并且将聚类作为搜索结果的子类别呈现。聚类可以基于来自由以下各项构成的群组的一种方法来实现:LSA、K-means、自组织图、外围组件分析、多维缩放和投影方法。聚类可以基于来自由以下各项构成的群组的至少一种数据类型执行:关键字、项目标识符和用户标识符。
根据本发明的另一方面,项目的限定关键字是根据项目的聚集关键字计算的,从而它们对应于被多于某个百分比的注释群体使用的关键字的集合。限定关键字的这些集合被用作确定含义、概念及其语义关系的机器表示的基础。语义关系可利用来自由模式识别方法和相关分析方法(例如LSA)构成的群组中的至少一种方法来计算,并且本体可表示成知识表示格式。本体可以表示成作为以下各项构成的群组之一的格式:RDF、OWL、实体-关系图、关系数据库方案、面向对象的类、XML和表。该方法还包括过滤方法,其中特定的关键字存在于来自结果集合的项目中的话,则这些项目可被去除。
附图说明
现在,下面参考附图描述本发明,附图中:
图1是示出典型的语境分布的示图;
图2示出了显示幂律分布的图;
图3是示出根据本发明的基本系统设计的示图;
图4是示例性的计算环境;
图5是基于浏览器的注释事件生成器的用户界面的视图;
图6是基于文件系统的注释事件生成器的用户界面的视图;
图7是基于电子邮件软件的注释事件生成器的用户界面的视图;
图8是示例性的记忆对话;
图9是示例性的发表对话;
图10是注释浏览器的用户界面的视图;
图11是示出注释聚集的过程的流程图;
图12是示出搜索和个性化的过程的流程图;
图13是示出发表和预订的过程的流程图;
图14是示例性的记忆注释事件;
图15是预订点击流注释事件;以及
图16是示例性的发表事件。
具体实施方式
计算环境
图3示出了通用注释系统的一般概览。这种系统包括客户端系统110,该客户端系统110可连接到诸如内联网LAN/WAN 140之类的网络,并且可能直接地或通过LAN连接到因特网150。这种客户端系统110可用于对来自因特网150的诸如网页之类的内容以及来自LAN 140的诸如文件和电子邮件之类的内联网内容进行访问。接收、检索和显示。内容服务器180可以是web上可用的服务器,例如可以向客户端系统110提供内容的web服务器或应用服务器。在因联网LAN中有许多类型的可向客户端系统110提供内容的服务器可用,例如邮件服务器184、文件服务器183、数据库服务器182,以及在服务器181中容宿的许多定制和打包软件应用。客户端系统110还可能通过诸如外联网、虚拟专用网(VPN)、非基于TCP/IP的网络之类的其他种网络连接到内容服务器。
客户端系统110可以以传统的个人计算机201的形式实现在如图4的通用计算设备中,该个人计算机201包括处理单元202、系统存储器203以及将系统存储器和其他系统组件耦合到处理单元202的系统总线204。系统总线204可以若干类型中的任何一种,包括存储器总线或存储器控制器、外围总线和局部总线,并且可以使用多种总线结构中的任何一种。系统存储器203包括只读存储器(ROM)205和随机访问存储器(RAM)206。存储在ROM 205中的基本输入/输出系统(BIOS)207包含在个人计算机201的组件之间传送信息的基本例程。BIOS 205还包含系统的启动例程。个人计算机201还包括用于对硬盘(未示出)进行读和写的硬盘驱动器208、用于对可移动磁盘210进行读和写的磁盘驱动器209以及用于对可移动光盘212(例如CD-ROM或其他光介质)进行读和写的光盘驱动器211。硬盘驱动器208、磁盘驱动器209和光盘驱动器211分别通过硬盘驱动器接口213、磁盘驱动器接口214和光驱接口215连接到系统总线204。驱动器及其相关联的计算机可读介质提供对个人计算机201的计算机可读指令、数据结构、程序模块和其他数据的非易失性存储。存储计算机可访问的数据的其他类型的计算机可读介质也可被用在操作环境中。
程序模块可被存储在硬盘、磁盘210、光盘212、ROM 205和RAM206上。程序模块可包括操作系统216、一个或多个应用程序217、其他程序模块218和程序数据219。用户可以通过诸如键盘222和点选设备221之类的输入设备将命令和信息输入到个人计算机201中。其他输入设备(未示出)可包括麦克风、操纵杆、游戏台、圆盘式卫星天线、扫描仪等等。这些和其他输入设备经常通过与系统总线204相耦合的串行端口接口220连接到处理单元202;但它们也可以通过诸如并行端口、游戏端口或通用串行总线(USB)之类的其他接口连接。监视器228或其他显示设备也经由诸如视频适配器223之类的接口连接到系统总线204。视频相机或其他视频源耦合到视频适配器223,用来提供用于视频会议和其他应用的视频图像,这些视频图像可被个人计算机201处理并进一步传送。在其他实施例中,可以提供单独的视频卡,用来接受来自多个设备的信号,包括卫星广播编码图像。除了监视器外,个人计算机通常包括其他外围输出设备(未示出),例如扬声器和打印机。
个人计算机201可利用与诸如远程计算机229之类的一个或多个远程计算机的逻辑连接来工作在联网环境中。远程计算机229可以是另一个个人计算机、服务器、路由器、网络PC、对等设备或其他常见的网络节点。它通常包括以上结合个人计算机201描述的组件中的许多或全部。图4所示的逻辑连接包括局域网(LAN)227和广域网(WAN)226。
当被置于LAN联网环境中时,PC 201通过网络接口或适配器224连接到本地网络227。当被用于诸如因特网之类的WAN联网环境中时,PC201通常包括调制解调器225或用于在网络226上建立通信的其他装置。调制解调器225可以PC 201的内部或外部,并且经由串行端口接口220连接到系统总线204。在联网环境中,在远程存储设备230中可存储程序模块,例如被示为驻留在201或其一些部分内的包括Microsoft Word在内的那些程序模块。
客户端系统110也可包括桌面个人计算机、工作站、膝上型笔记本电脑、个人数字助理(PDA)、蜂窝电或任何具备WAP能力的设备或任何其他能够直接或连接地与因特网接口的计算设备。客户端系统110可在浏览程序内运行,所述浏览程序例如是Microsoft的Internet ExplorerTM浏览器、Netscape NavigatorTM浏览器、MozillaTM浏览器、OperaTM浏览器或者在蜂窝电话、PDA或其他无线设备的情况下的具备WAP能力的浏览器,等等。
服务器系统120对应于内联网环境内的注释服务器,服务器系统130对应于可为来自web各处的客户端服务的因特网150上的注释服务器。服务器系统120通过接收注释事件、聚集事件并处理来自客户端的搜索和预订请求来为客户端系统服务。这可以实现在如上所述的PC设备上,或者实现在服务器配置上,例如来自Sun Microsystems的UNIX服务器、基于Linux和基于Windows的Intel服务器,等等。
可以利用许多不同的方法,包括C、C++、Java、C#、VisualBasic、诸如PERL或TCL之类的脚本语言,来设计软件。可以针对基于浏览器的递送,例如HTML、XML、Java、JavaScript、ActiveX等代码或任何其他适当的脚本语言(例如VBScript),来开发客户端系统的一些方面。在一些实施例中,代码不被下载到客户端系统110,并且所需的代码被服务器执行,或者已经存在于客户端系统110处的代码被执行。
本发明可利用其他计算机系统配置来实现,包括手持设备、多处理器系统、基于微计算机的可编程消费者电子设备、网络PC、袖珍计算机、工程工作站、大型机计算机等等。本发明可实现为数字电子电路,或者实现为计算机硬件、固件、软件或它们的组合。适当的处理器例如包括通用和专用微处理器两者。前述任何一种都可被专门设计的ASIC(专用集成电路)所补充或者被结合在专门设计的ASIC中。
注释
如上所述,注释是指用户对项目的任何简洁描述,它使得可以得出根据用户判断来描述项目的关键字。这是以针对这种注释的每次发生的事件的形式来发出的。事件中包含的数据元素的样本在图14中以XML形式示出。可以从多个事件源和事件源类型以多种方式生成这种事件。优选实施例利用事件生成器112的概念来实现这一点。这些事件生成器可采取工具条、插件、共享库、OS级支持等等形式。每个事件源类型具有其自己的事件生成器。对于每个事件源类型也可能有多个事件生成器。虽然优选实施例直接从用户交互获取关键字,但是它们也可利用针对用户的文档和电子邮件的全文的自动过程来获得。另外,对邮件消息或文档的关键字的指定可由用户以与指定要被突出的文本的方式相类似的方式以文本来完成。本领域的技术人员将会意识到存在许多种从用户获得这样的关键字的方式。
例如,基于浏览器的注释事件可以如图5从浏览器的工作条插件生成。基于文件系统的事件可以如图6从Explorer插件生成。每个事件生成器112可通过它能够置于注释事件中的EventSourceID和EventSourceLabel元素来描述它自身。可以利用与公司LAN的基于文件系统的注释事件不同的事件源来指定浏览器中的网页的注释事件。基于事件生成器112,这种事件可被传输到诸如LAN之类的私有网络上的一个或多个注释服务器,或者可被传输到因特网上的一个或多个注释服务器。
注释事件包括被注释的项目的项目ID和进行注释的用户的用户ID。为了使准确度最高,对于来自所有事件源的事件,一个唯一的项目应当对应于同一个唯一的项目ID,并且一个唯一的用户应当对应于同一个唯一的用户ID。但是,优选实施例留给具体实现方式来根据具体实现方式的要求确定实现此目标的最佳方式。这么做是因为可以从与相异的事件生成器的集成获得好处,即使用户ID和项目ID并不准确地符合上述要求。在存在适当相异的项目和用户群体的许多情况下,聚集值的重要性可超过准确度。例如,Web上的同一个页面可具有多个URL(实质上是多个项目ID)。但在许多情况下找到其中一个就足够了。像Google这表搜索引擎为了用户的便利尝试聚集这种URL,但是Web的基本结构并不要求这种聚集或唯一性。
在优选实施例中,项目可以是任何能够被URI给出的唯一项目ID所标识的事物。这自然可以包括使用URL的web内容,就像公众分类法中常见的那样。这也可以包括文件系统中的文件和文件夹、邮件服务器处的电子邮件消息,以及包括诸如具有条码的纸质文档之类的物理对象、工程管理系统中的具有唯一id的任务/事项、以文本形式存储在具有URI的应用中的集体讨论会话中的想法,等等。本领域中已知有许多方法来生成这种唯一项目ID,并且它们可以根据具体实现方式的要求被利用。优选实施例允许了用户可选地指定注释事件中包括的项目的标题和描述,其方式类似于电子邮件允许主题和主体的方式。这与项目ID一起被存储,如图14所示。优选实施例允许用户在为用户本地存储的“记忆”对话注释事件期间指定标题和描述。这可以用来在如图10所示的注释浏览器窗口的“Myitems(我的项目)”中显示项目,并且允许用户对项目的描述进行定制。如果项目对于系统来说是新的,则发表者必须指定项目的标题和描述;否则如图9所示的“发表”对话根据存储在服务器处的项目信息预先填充此信息。点击流注释事件不指定标题和描述信息。其他实施例可以多种不同的方式来处理这一点,例如利用最近的标题和描述信息来更新服务器中的项目信息等等。如果需要,一些实施例可以基于用户利用键来对注释事件进行数字签名以允许认证和认可。
例如,图5、6和7示出了以工具条形式集成事件生成器112的方法。工具条是充当诸如web浏览器、文件系统资源管理器(explorer)和电子邮件应用之类的现有应用的插件的程序。这是本领域中已知的,并且目前有许多示例,例如来自MSN、Yahoo!和Google的插件。工具条具有“Remember(记忆)”按钮和“Publish(发表)”按钮。“Remember”按钮通过启动如图8所示的记忆对话窗口来允许用户注释项目,“Publish”按钮通过启动如图9所示的发表对话窗口来允许用户发表项目。图5示出web浏览器中的工具条可允许用户通过“Remember”按钮来对当前显示的URL进行注释,或者利用“Publish”按钮将项目发表到系统。这种工具条还可允许用户对显示的页面中的任何超链接进行右键点击,并选择启动记忆或发表对话窗口的菜单项。另外,如果用户利用工具条中的搜索来搜索页面并且点击在结果中返回的URL之一,则工具条可监视这种用户活动并利用搜索中针对项目使用的关键字来生成事件,如图15所示。在确定所生成的事件之前,利用进一步的用户监视,例如评估用户是否阅读了点击的页面或者甚至用户阅读该页面到什么程度,可以进一步加强这一点。因此,需要向进行注释的用户分配用户ID。对于基于因特网的注释服务器,这可以通过向用户动态分配作为cookie存储的唯一ID或者使用户在注释之前登录到服务器来完成。基于浏览器的事件生成器可将其所有注释事件发送到这种内联网服务器,但也可以选择将在公共web的页面上生成的事件发送到基于因特网的注释服务器。用户ID被表示成URI的形式。
在图6中,类似的一组手法可用在文件系统的情况下。就像浏览器情况一样,可利用“Remember”或“Publish”按钮来注释任何文件或文件夹。右键点击项目可给出语境菜单项目,以访问与按钮相同的功能。在文件系统项目上执行的搜索可如上所述在后台被注释。在一些情形下,例如用户登录到因联网LAN中时,可以从操作系统有利地获取UserID信息。出于诸如安全性和隐私性之类的原因,这种事件可以仅被发送到基于内联网的注释服务器。
图7示出了同样的概念被应用到电子邮件软件,例如MicrosoftOutlook。如上所述,可以利用关键字来注释任何电子邮件。类似地,利用以关键字来注释或发表文件和基于关键字搜索文件的能力可以加强保存文件和打开文件对话框。本领域的技术人员将会意识到,在任何给定的应用内可以有许多实现这种功能的方式。例如,工具条或OS可提供允许定制应用为任何项目启动记忆对话窗口的API。这种定制应用可具有其自己的事件源标识,并且可以根据其自己的要求来预先填充项目ID。
因此,出于描述目的,假定所有注释事件都是通过比如上述工具条那样的事件生成器112(图3中)来创建的。这些事件生成器112可具有由生成器添加到事件的唯一事件源标识符。例如,工具条注释电子邮件可添加事件源ID http://www.abc.tld/Email和标签“ABC Company Email”。为了防止事件源ID中的名称空间冲突,优选实施例使用基于URI的语法。但是,确保唯一性的责任被留给了具体实现方式。
用户的用户ID可由事件生成器112根据具体实现方式的要求以多种方式来确定。这可以通过使用户利用userid(例如电子邮件id)和口令登录到服务器以允许注释服务器生成唯一的用户ID来获取,或者它可以使用操作系统的登录信息、联合身份解决方案、单次签约数据或者它可自动生成唯一ID并将其保存为浏览器中的cookie。
在一些实施例中,可以具有其他形式的爬虫形式的注释事件生成器。web爬虫170是本领域中公知的,并且被搜索引擎用来获得web上的页面以便进行索引。这种爬虫可用于查找网页之间的超链接并生成注释事件。链接文本可取代关键字被使用并且web主机或博客信息可取代userid被使用。这样生成的事件的质量与前述记忆对话或点击流相比可能较低,因为链接文本通常用来确定较少的相关关键字,而要识别独立的判断源(创建超链接的实际用户)是不容易的。Technorati的rel=”tag”风格标签可用于为页面生成注释事件。但这也是受限制的,因为只有页面的作者能够分配这种标签。
在其他实施例中,还可以创建基于内联网的爬虫160,其中文件系统中的所有文件、邮件服务器中的邮件或其他数据类型都可被自动注释。例如,文件系统爬虫可扫描包括个人和共享驱动器在内的整个文件系统。这种爬虫是本领域已知的,并且类似于桌面搜索软件中对文件进行索引的程序。这种程序可被修改,以使用目录路径中的目录和文件标签来作为文件的关键字。这可以基于文件的内容来计算唯一的散列(例如密码散列)并且查找不同用户的个人文件夹中的相同文件并且利用不同的userid和不同的关键字集合来为相同的文件生成不同的事件。但是,与用户直接注释文件的注释机制相比,这种方法有局限。这些局限可包括文件具有像“Stuff”这样的易于误导的名称、电子邮件和其他形式的数据具有很少或没有相关信息,等等。因此,这种爬虫也可使用基于项目的内容生成关键字的自动注释方法。将项目结合到注释服务器中的优选方法是使用下文详细描述的发表和预订范例。
聚集
注释事件被聚集以提供本发明的功能。这与信息检索中对文档的索引有些类似。在文档索引中,单词的反向索引被创建,其中每个单词被映射到它在其中出现的文档。在本发明中,事件被聚集成三个单独的映射-将每个用户ID映射到其事件,将每个项目ID映射到其事件,以及将每个语境映射到其事件。这里的事件指的是由至少一个关键字构成的关键字集合。本领域中已知许多索引或散列方法,这些方法可被用来实现这种映射,而没有必要对这种过程进行详细描述。作为参考,在Google有限公司的Dean等人的论文“MapReduce:Simplified Data Processing on LargeClusters”中可以找到一种这样的方法。
首先,针对用户映射所有事件。这意味着在同一数据结构上可获得具有相同用户ID的所有事件。这么做是为了事件规范化和用户概况描绘。取决于具体实现方式的要求,基于用户的映射可在客户端系统110中或在服务器系统120处完成。优选实施例在客户端系统110处使用基于用户的映射,因为就隐私性、安全性和网络边缘处计算力的使用来说它可能更合乎需要。这可以利用驻留在客户端系统110上的软件来实现,该软件从所有事件生成器112接收事件(步骤300)并将它们存储在本地的持续性存储设备(比如111)上。
许多公众分类法和其他注释方法假定用户只注释项目一次。但是,在如本发明的通用注释机制中,用户可以多次注释同一项目。这可能是由于在不同语境中注释/使用项目或在不同事件生成器中使用项目。对于给定项目的所有注释事件在基于用户的映射处都被聚集,并且表示每个事件生成器的唯一语境的事件集合被计算并被称为原始事件。然后这个原始事件的集合被规范化(图11中的步骤310或405)。规范化是指针对每个用户,对于某一项目积累所有关键字及其使用计数,并且除以该用户的该项目的总关键字使用。例如,如果用户对于某一项目使用2个关键字-比如Keyword1和Keyword2。用户为该项目使用Keyword1的总次数为3,使用Keyword2的总次数为7。那么在规范化之后,Keyword1的计数将会是3/(3+7)=0.3,类似地,Keyword2的计数将会是0.7。在规范化结束时,针对特定的用户,对于给定项目产生规范化的事件。根据具体实现方式的要求,规范化可以针对每个事件源执行,或者针对每个项目跨所有事件执行。可能有许多种规范化事件的方式,但是优选实施例跨所有事件源进行规范化,并且确保在针对每个项目聚集关键字时每个用户对于每个项目实际上获得一个关键字“选票”。
这种规范化后的事件及其相应的原始事件被发送(步骤320)到相关的注释服务器,例如基于内联网的搜索(比如120)或者基于因特网的搜索(比如130)。这是以递增方式完成的,并且仅在有状态变化时才进行。关于向哪些服务器发送规范化后的事件的选择是基于项目的。如果项目是像因特网网页这样的公共资源,则事件可被传输到基于因特网的和基于内联网的注释服务器两者。也可能存在客户端系统110可向其传输事件的多个因特网或内联网服务器。此信息可被保存为客户端系统110中的配置概况
然后通过聚集器模块122或132在注释服务器(例如120或130)处接收事件。规范化后的事件首先基于项目被映射(步骤406)。这意味着对应于特定项目ID的所有事件都被聚集到同一数据结构。由于这些是规范化后的事件,因此每个项目将最多具有来自特定用户ID的一个事件。关键字计数按照来自所有已注释项目的用户的关键字被聚集。总关键字计数将等于用户的数目或者实际上等于注释了项目的独立判断源的数目。如前所述,关键字分布大致近似于幂律分布。在注释了项目的用户中,被多于某个比例的用户使用的关键字的数目将会近似恒定,并且就注释事件的数目而言是规模不变的。例如,如果被项目的注释群体中多于5%使用的关键字的数目将会大致恒定,而不论项目是收到了50个注释还是500个。取决于具体实现方式的需求,适当百分比(例如5%或10%)的用户使用的关键字,可被认为是项目的限定特性或关键字。限定关键字是来自注释聚集的群组描述,并且是对将项目分配到这些关键字的隐性主题的可靠指导。项目的限定关键字如上所述基于事件被更新(步骤407)。应当注意,限定集合中的关键字确实表现出搅动行为,即不同的单词可能随着时间而进入和离开限定集合。
聚集器模块随后基于语境来映射原始事件。语境可以是单个关键字或两个或更多个关键字的集合。其中具有语境的所有关键字的事件被认为是语境的一部分。因此,将事件映射到语境的步骤408允许了将作为语境的一部分的所有事件聚集在单个数据结构中。在实际中,很容易有与项目同样多或更多的唯一语境。如前所述,本发明使用了类别语境的概念来降低语境空间的复杂度并允许对用户和项目两者同时进行聚类。在优选实施例中,类别语境是根据原始的(未规范化的)注释事件计算的,并且对应于具有某个最小数目的唯一项目和用户的语境。一些实施例还可将类别语境的定义限制到这样的语境:具有某个最小数目的项目,这些项目都被某个最小数目的用户所注释。一些实施例可优选使用规范化后的事件来计算类别语境。其他实施例可使用原始事件,但限制发送到服务器的原始事件,使得对于项目和用户的每个唯一语境只发送一个事件。
类别语境可在事件被接收到时被生成性地计算(步骤408)。可以通过基于唯一关键字聚集事件来开始。随着在某个关键字中积累事件,可以通过去除原始关键字并获得唯一关键字的第二集合来再次对它们进行散列,所述唯一关键字的第二集合中的每个关键字代表其自己和原始关键字的语境。这可以递归地继续下去,以在每个语境达到类别语境的预定标准时生成类别语境。在优选实施例中,通过额外的两个限制来防止主题漂移从而进一步加强了此方法。只有对应于项目的限定关键字的关键字被用于确定事件是否是语境的一部分。并且使具有低于某个级别的事件率的类别语境不再是类别语境(或者可以使用只保存最近使用的缓存机制)。上述限制是相当严格的要求,它们在大规模实现方式中可能有意义。对于不能从这种限制得到价值的实现方式,至少可以以以下方式来放松这些限制:
-所有接收到的事件都被用于计算
-包含语境的关键字的事件,即使这些关键字不对应于项目的限定关键字
-包含语境的关键字的事件,其中至少一个这种关键字对应于项目的限定关键字,
-通过分别基于其聚集关键字而不是使用事件来确定与语境相对应的用户和项目
-通过基于语境的关键字确定项目并确定注释了这种项目的用户
-通过基于语境的关键字确定用户并确定他们注释的项目
另外,优选实施例创建“合成”类别语境。可以认为语境形成了定向非循环图(或DAG)。例如,Keyword1 AND Keyword2(Keyword1+Keyword2)的语境代表这样的项目:这种项目是与Keyword1相对应的项目以及与Keyword2相对应的项目的子集。可以认为Keyword1和Keyword2各自是Keyword1+Keyword2的语境的父亲。如果Keyword1+Keyword2是类别语境,则优选实施例会也“合成”其父语境来作为类别语境(即使根据基于预定标准聚集其事件它们可能没有这样的资格)。
优选实施例基于类别语境来聚集事件。这被生成性地完成,以使得当语境变成类别语境时,事件数据与其父语境被分开管理。这允许了为每个类别语境单独计算用户和项目排名,以及将每一个看作发表和预订的单独目的地。这可以以一种懒惰的方式来完成,可以只在需要时为类别语境聚集事件(例如为其接收到搜索查询或发表/预订请求时)。
本领域的技术人员将会理解,对于跨注释聚集的不同元素的插入、更新和删除注释事件的实现方式将会取决于每种实现方式的要求,但是相对直观的是将其实现为遵守如上所述的基本聚集要求。聚集的注释数据可以以多种不同的方法来存储,例如存储在搜索引擎索引(比如Lucene)中或者关系数据库中。事件可以实时被聚集,或者可以以分批模式被聚集,所述分批模式以预定的间隔执行或者响应于来自用户的动作(例如搜索查询)而执行。确切的方法可以基于特定实现方式的要求来确定,并且对其的选择并不更改本发明的基本意图。某些事件源类型在一些情形下可能比其他的产生更好的排名结果。例如,取决于实现方式,来自“记忆”对话的事件与其他的相比可产生对用户兴趣的更好指示。因此,如果需要,一个实施例可以具有允许分开排名和其他计算的聚集数据结构。最终的排名可以基于对来自不同事件源类型的排名的聚集来计算。
搜索
用户可通过将关键字发送(步骤500)到客户端系统110中的搜索模块114来发起搜索。这可以以多种方式来完成。例如,图5、6和7的工具条中的搜索字段。用户可以启动如图10所示的专用注释浏览器窗口,并且键入到搜索字段中。可能有许多实现这一点的方式,只要它们将查询串传输到搜索模块114。搜索通常是关键字形式的,并且遵循与web上的搜索引擎中常见的搜索相同的格式。查询实际上代表语境,如上所述。
服务器处的搜索响应模块123或133负责确定匹配的项目或用户(命中)并且确定这种命中的相关性(排名)。本发明中的一个核心创新在于认识到了在基于注释对命中进行排名时使用信息检索技术的能力。这包括传统的TF-IDF风格方法(如Amit Singhal的“Modern InformationRetrieval:A brief overview”中所述)以及LAR风格方法(如Borodin等人的“Link Analysis Ranking Algorithms,Theory,and Experiments”中所述)。如果查询语境对应于类别语境,则LAR风格方法是排名的优选形式。如前所述,可以通过将每个注释用作用户和项目之间的合成链接来结合LAR风格方法。一般地,用户和项目都可被认为是具有从用户到项目的定向链接的图中的节点。更具体而言,这允许了在链接分析算法中用户被看作轴心并且项目被看作权威。
优选实施例由于隐私考虑而不允许查询用户基于关键字搜索用户,并且创建了一种发表/预订方法来替代它。实质上,它不允许返回用户信息作为搜索结果,而允许某人向相关的人(由服务器处完成的基于用户的搜索确定)发送消息,而人们不需要泄漏其隐私信息,并且它向这种人提供了是否回复发送者的选项。这限于类别语境。
在优选实施例中,基于HITS算法对类别语境进行排名(504)。可以使用任何LAR算法,例如所描述的那些。这个领域已经被广泛地研究,并且存在针对各种缺陷的许多变体。优选实施例使用类别语境的事件部分来作为初始集合。如前所述,这些事件的选择使得语境的所有关键字都存在并且它们对应于项目的限定关键字。这么做是为了解决通常与HITS算法相关联的主题漂移问题。这些事件被用于生成用户和项目之间的合成链接并且HITS算法被应用到它。这以轴心排名的形式为用户给出的排名,并且以权威排名的形式为项目给出了排名。可在生成时为类别语境计算这些排名(步骤408),并且在事件被聚集时保持更新这些排名(步骤409)。基于对类别语境的查询的对用户和项目的排名可利用这些排名来有利地完成。用户排名可以利用与项目排名不同的算法来完成。例如,项目可以利用HITS算法来排名,而用户可以利用Borodin等人描述的BFS算法来排名。
对于不同类别语境的语境,优选实施例基于在事件的基于项目的映射中的规范化后的事件来利用简单的基于TF-IDF的排名(步骤502)。允许用户搜索的其他实施例可以基于每个用户的聚集关键字来生成命中。如果在聚集关键字中存在语境关键字,则用户可被返回作为命中(步骤505)。这种机制可使用TF-IDF风格的机制来进行排名(步骤506)或者任何其他可从IR应用的方法。
为了促进迅速的查询响应,用户和项目的这种命中和排名信息可在传统的搜索引擎(例如Lucene)中以反向索引存储,或者可存储在关系数据库(例如Oracle)内。
在其他实施例中,也可以以与项目类似的方式在类别语境中对发表者ID排名。每个项目可能具有多个发表者ID。这些ID中的每一个可以按与项目类似的方式利用合成链接与用户相关联。给定的发表者ID的关联用户是跨所有项目聚集的。用户被模拟为轴心,发表者ID被模拟为权威。用于对项目排名的相同方法可用来对发表者ID排名。这些排名指示出在语境内的用户间发表者具有的权威级别。在不是类别语境的语境中也可进行排名,但是数据的稀少可能使得TF-IDF风格方法、张量分解方法(例如CubeSVD、LSI或PLSA和PHITS)等成为更优良的替代。项目的排名也可部分基于其发表者ID的排名,并且在为查询计算项目的最终排名时可聚集这种排名。
就排名而言,用户和项目之间有基本差别。项目通常表现出幂律行为,这种行为允许了确定项目的限定特性。这使得TF-IDF风格方法能有效地辨别相关性,因为它可以利用聚集规范化后的事件中的关键字计数。另一方面,用户往往具有比项目多得多的方面,并且这些方面随时间变化。LAR风格方法或张量分解方法(例如CubeSVD)在给定的实现方式中可以成为比TF-IDF更优良的替代。本领域的技术人员将会注意到,在IR技术的应用中可能有许多变化。不同的实施例可根据其要求选择实现不同的IR技术来进行排名。这不会脱离此机制的基本意图。
搜索的结果还返回进一步的向下钻取类别(步骤502、504和506)。这些实际上是对相关关键字的建议,用于进一步加强查询。优选实施例根据类别语境计算向下钻取类别。具体而言,这意味着对于所有作为查询语境的孩子的类别语境,去除查询语境的关键字,生成下一级别的唯一关键字,按它们的累积事件计数对它们进行排序并返回顶部(例如20个)关键字。某些实施例可从与语境相对应的项目的关键字来计算这些。其他实施例可使用搜索的点击流来作为计算的基础。一些实施例可优选使用“最近”的事件计数,这些“最近”的事件计数对应于给定时间间隔中这些计数的累积数字。如前所述,一些实施例也可以基于用户对类别语境的时间使用频率来使用基于时间的TF-IDF方法,以获得更好的一组个性化的向下钻取类别。
许多其他排名方法可与上述方法结合使用。例如,对于文本内容,全文索引用来加强基于注释的排名。对于网页,超链接连通性可被传统的LAR方法所利用。所有这些对项目或用户的不同排名源都可以利用本领域已知的多种排名聚集算法被有利地聚集,所述算法可以基于具体实现方式的要求来选择。
结果和类别随后被从搜索响应模块133返回到客户端系统110,并且被利用显示模块113显示给用户。这些结果可被显示在专用窗口中,例如图10的注释浏览器。在搜索结果中可以加强其他数据,例如被查询的语境中的用户和项目的总数。一些实施例可以提供也可用于查询指定的对应于命中的事件源或事件源类型的列表(实质上把它们看作类别语境)。
个性化、预订和发表
基于所有事件来搜索和返回搜索结果的一个不合需要的结果是幂律表现出“富者更富”现象,其中语境的排名较高的命中开始被少数项目等等所充满,并且新来者越来越难以可见。这对于整个系统的有用性是有害的,并且实质上使得交互生态系统聚合到仅仅少数参与者。通过使用基于时间的方法可对此略有改善。例如,可以针对与上述整个聚集相分开的时间窗口(例如过去一小时或今天或本周,等等)来聚集事件。这允许了最近的事件的获得更好的暴露。
图10示出了在“Latest(最近)”附签中显示这种基于时间的结果的注释浏览器。从显示的角度来看,需要使客户端系统110能够处理结果的这种基于时间的变化。诸如电子邮件之类的许多当前的基于时间的系统按接收时间来对消息进行排序。如果像在此系统中一样存在大量这样的消息,则这就可能是不可行的。因此,“Latest”附签需要基于相关性来显示项目。这要求基本用户界面手法的变化,因为用户将不再能够保持跳跃他们已经看到的并高效地找到它们尚未看过的(例如像电子邮件中那样顺序地向下查看列表)。这可以通过实现以下手法来完成:用户已经看见过的项目可被保存在一个被称为“My items”的单独列表中。通过在“Latest”附签中时选择组合框中的“My Items”菜单项可以访问该列表。这将显示出在“Latest”给出的时间窗口中用户已经看见、注释、发表等等的所有项目。“My Items”在选择“All(全部)”附签时也将具有类似的含义,但将包括所有项目而不考虑时间窗口。
这种功能需要区分真正的新项目和现有项目上的新事件。流行的项目将在新用户找到它们时不断被注释。聚集器模块132可通过评估项目对于系统来说是否是新的或者项目对于语境来说是否是新的(在这种情况下它被添加,否则它不被添加)来检测事件是否应当被置于这种基于时间的存储中(步骤402)。或者,一些实施例可将项目上的事件示意为新的,如果在给定的时间窗口中它没有接收到事件,或者项目的事件率已降低到了预定事件率之下。
这将允许默认的“Latest”附签窗口总是专注于呈现最近的、最相关的项目。可以随时、不断地按相关性对其进行排序。可通过其他范例来加强这种显示手法,所述其他范例例如是桌面上的新项目的自动收报机纸条(ticker-tape)或者在接收到具有高相关性的项目时系统托盘上的警告消息,等等。
利用发表和预订机制有利地加强了这种基于时间的方法,所述机制允许了以增强新的、相关的内容的可发现性为目的的有针对性的内容递送。这是通过利用以下机制来实现的:
-使用类别语境以允许发表者和预订者聚集起来
-通过允许发表者为项目选择最相关的语境
-通过使发表成为负有责任的明确动作
-通过具有允许团体以分布方式迅速进行处理的语境化阶段
-通过具有允许发表者的分布形式的声誉的个性化预订过程
项目可通过发表被引入系统中。在发表时,发表者将项目分配到类别语境,如图9所示,然后将它发表到系统。基本上,发表是注释的一种形式。在优选实施例中,使发表成为与注释分开的明确动作。这可以通过按下图5、6、7中的“Publish”按钮来完成。发表者需要利用userid和口令向系统认证(步骤600)。在被核实时,系统向发表者分配唯一的发表者ID,该发表者ID被用于发表者发表的所有项目。取决于实现方式的要求,这可以与发表者的用户ID相同也可以与它不同。发表者随后将项目分配到他们认为与该项目最相关的唯一类别语境(步骤601)。这是通过发表者的判断来确定的,但可以受助于以下事实:发表者可以看到期望的类别语境的项目以及用户和项目总数。如果期望的类别语境的用户数目相对于项目数目要多得多,则可表明这是一个其中对项目的兴趣相当大的语境,并且如果项目是相关的,则它将有更大的机会获得接受。如果语境具有的项目的数目与用户相比相对较大,则有可能项目需要与其他项目竞争以获得该语境中的用户的注意,那么发表者可以根据其对项目与其他项目相比的相对实用性来决定是使用它还是另一语境。
一旦发表者发表了项目(例如通过按下图9中的发表按钮),则项目就以发表事件的形式被发送到服务器系统(120或130)。这种发表事件的样本在图16中以XML格式示出。发表事件类似于注释事件,只不过它必然包括事件的发表者的唯一发表者ID。现有的项目可被任何发表者发表,而不只是首先将项目引入系统中的原始发表者。这仅仅等同于将新的发表者ID添加到项目。就规范化以及项目和语境映射而言,每个这种发表事件被处理的方式类似于其他注释事件(步骤602)。发表者ID不被用在关键字的规范化计算中,因为这会偏移关键字的描述。但是,发表者ID是项目的元数据,并且可以跨所有这种注释在项目级被聚集。这些ID在确定项目的限定关键字时未被包括,但可被包括在来自搜索的结果中(步骤502、504和506),以允许用户基于他们与发表者的熟悉度来对项目重新排名。发表者ID允许了发表者与其预订者的分布形式的声誉(或者责任)。
如果项目对于语境来说是新的或者对于服务器系统(120或130)来说是新的,则优选实施例尝试对项目进行语境化(步骤603)。这是这样一个过程,在该过程中项目被推送到用户的集合,该集合可能是类别语境中的用户的子集。这种用户可由服务器系统利用排名方法确定语境的顶部用户来确定,或者可以包括语境的有影响力的发表者,或者可以是语境的用户的随机子集,或者是取决于具体实现方式的要求的其他方式,包括将项目发送到语境中的所有用户。这种针对特定用户的推送机制可由服务器通过预订过程来实现。实质上,预订者不时地从服务器拉出项目。服务器使用预订者的用户ID来确定是否将用于语境化的项目添加到针对用户的结果。在项目被语境化之前,用户不能作为普通预订过程的一部分进行下载。语境化的主要目的是允许较小的但有代表性的用户群组以迅速的方式利用“Remember”按钮注释或利用“Publish”按钮发表他们认为相关的项目,以便它能够更快地被语境的团体所接纳(对于搜索和预订有更高排名),以及允许项目确定其限定关键字以及可被他人用来搜索项目的其他这种关键字。如果有影响力的发表者被包括在语境的用户的子集中则可加速此过程。本领域的技术人员将会注意到,语境化过程只是要加速接受并且在具有高流量的语境中有用,但不是必要条件。如果语境具有较低的流量级别或者在此过程的开销不能提供相当的价值的其他情形下可以省略该步骤。
搜索的一个问题是用户需要指定他们感兴趣的语境以检索结果。这不是一种使用户能在相关项目变得可用时发现它们的高效方式。优选实施例使用预订过程114来以自动方式检索被显示(113)到图10中的“Latest”附签并基于相关性降序呈现的相关项目,以及作为向下钻取类别的类别语境(如前所述)。这种语境可包括全局有用的语境,例如“Most Read(最多阅读)”、“Most Recent(最近)”等等,以及基于用户的兴趣概况的那些。预订过程基于类别语境创建用户概况。这可以明确地完成,也可以隐性地完成。用户可以以持续查询的形式明确地指定他们感兴趣的类别语境,以侃得来自它们的项目在后台被不断下载。这也是通过观察用户对每个类别语境的相对注释事件频率(通过点击等)并以该比例检索项目来隐性地完成的。优选实施例使用来自所有事件源类型的注释事件来计算这些比率。在其他实施例中,来自不同事件源类型的注释事件可根据实现方式的要求被不同地加权。例如,可以认为来自“记忆”对话的注释事件比来自点击流的注释事件更表明了用户的兴趣,因此为其赋予更高的权重。
为了保护用户的隐私,优选实施例将此概况存储在客户端系统110中,以使得用户保有对其概况的完全控制并且可根据其意愿查看或编辑它。客户端系统110可以匿名地基于类别语境来检索项目,但是为了使语境化过程能工作,预订过程114要求用户基于登录过程利用userid/口令来向系统认证(步骤610),以便用户的概况被检索。一些实施例可将这种形式的推送过程用于除语境化外的其他目的,例如针对性广告的递送。
与在“All”附签中的项目的整个集合上的普通搜索不同的是,对“Latest”附签中的向下钻取类别的处理被对照以下两者进行了调节:用于事件的时间窗口,以及基于用户对类别语境的时间使用频率的基于时间的TF-IDF。实质上,这种向下钻取类别的排名反映了时间窗口的累积事件计数以及用户的使用和使用的新近度。这允许了用户很容易地发现最近的“热门”相关主题。
为了提高呈现给用户的项目的相关性,预订过程114在显示(113)给用户之前对项目进行个性化。在本领域中已知许多种个性化方法,但仍不是很清楚这种方法的有效性。优选实施例采取以下方法:在服务器系统(120或130)处对语境检索排名较高的项目然后在客户端系统110处基于用户概况对项目进行重排名。此方法具有多个被有利地利用的特性,例如增强了隐私性和安全性、利用了合作式和基于内容的排名(分别基于服务器和客户端的排名)以及使用了网络边缘上的计算力。项目基于用户的概况被下载(步骤611)到客户端。这可以通过以下方式来完成:对用户在给定时间段(例如一天)中通常阅读/使用项目的数目,然后取该数目的适当倍数并将其分布在用户概况的语境上。例如,用户每天阅读150个项目,并且所有这种阅读中有10%是在语境“Ajax”中的。预订系统可在这一天期间下载以下两者中较少的那个:15000个项目以使10%的项目对应于关键字“Ajax”,或者尽可能多的项目。这些比率可在用户与系统交互时被实时更新,或者可在预定间隔之后(例如每天一次)以分批方式更新。倍数允许了基于服务器处的排名(它是团体对项目的相关性的意见的代理)和客户端处的排名(它是基于用户的兴趣来确定的)的顺序之间的混合。适当的倍数可针对每个用户或每个语境被计算,或者甚至可由用户通过可视手法(例如滑动条控件)以交互方式设置。
为每个这种语境从服务器下载的项目基于用户的概况被重排名(步骤612)。这是通过将该语境的用户概况的关键字向量与每个项目的关键字向量相比较来实现的。优选实施例以严格方式确定来自用户概况的语境的关键字向量和每个项目的关键字向量。只有下述关键字被用于计算关键字向量(这种事件包括概况中的所有事件并且不基于要被重排名的项目):这些关键字是作为用户的语境的一部分的注释事件中的项目的限定关键字的一部分。在计算中排除了与“My Items”附签的点击流相对应的注释事件。此向量的权重是以如前所述的基于时间的TF-IDF方式来计算的,其中在该语境中用户对关键字的时间使用频率被用作向量中的关键字的权重。通过将语境的用户概况的关键字向量与每个项目的关键字向量相比较来完成重排名。项目的关键字频率是从项目的经聚集的规范化后的事件来确定的。然后,像传统的TF-IDF方法那样,这被乘以逆文档频率,并且带有基于对数的衰减log(N/d),其N对应于项目的总数,d对应于其中有该关键字的项目的数目。基于项目的关键字向量与该语境中的用户的关键字向量的点积来为每个项目计算排名。
以类似于关键字的方式,利用发表者ID来加强以上计算。每个这种发表者ID可被包括在关键字向量中,并且可影响点积产生的最终排名。由于发表者ID与关键字相比出现得相对不那么频繁,因此它们将对最终加权有重大的影响。重要的是要注意,发表者ID的加权效果限于用户认为发表者有用的语境,在一个语境中排名很高的发表者并不影响另一个中的项目排名。重排名等同于基于这些计算出的排名的降低值来对项目进行排序。本领域的技术人员将会注意到,所有上述条件都是严格限制,并且可以根据实现方式的要求而以许多不同方式被放松。具体实现方式可放松针对作为项目的限定关键字的一部分事件的关键字的条件。具体实现方式可使用项目的所有限定关键字,而不论用户是否将它们用于他们的注释中。具体实现方式可适当地根据其需要衰减发表者ID对排名的影响,或者根本不将发表者ID用在排名中。存在许多种可以使用的类似TF-IDF的排名的变体。项目的产生和消耗率可用作计算的基础。
然后如前所述这些被显示(613)在图10中的“Latest”附签上。对于注释浏览器,“Latest”附签中的搜索只基于时间窗口搜索项目,而不是搜索系统中的所有项目。这不同于覆盖了系统已知的所有项目的“All”附签中的搜索。
预订显示也被用于识别发表者ID并将它们传输回服务器。优选实施例将对每个项目允许的发表者ID的数目限制到预定的数目,比如10,并且按发表顺序将ID与项目一起存储,直到该预定数目为止。预订在检索项目时为每个项目下载所有已知的发表者ID。预订过程存储所有这种发表者ID(实质上在用户概况中更新每个这种发表者ID的使用)并且将其用在基于发表者ID的重排名的计算中。这些不仅像上面所述那样被用于重排名,而且项目的原始发表者ID和具有最大匹配的发表者ID还被添加到来自用户的对该项目的注释事件。然后这通过前述注释聚集方法被传输回(步骤614)服务器。这也更新了语境的用户概况(步骤615)。这闭合了就发表者ID而言的反馈环,并且允许它们在服务器侧被排名以用于将来的语境化和其他目的。最佳匹配发表者ID给出用户熟悉的发表者,从而为注释获得信誉。原始发表者ID被包括,以便将信誉给予将项目引入到系统的发表者。本领域的技术人员将会注意到,存在许多种不同的实现这种反馈环的方法,并且将给出可以根据给定实现方式的要求被有利使用的不同系统特性。但是,这不会脱离为返回中央服务器的发表者ID提供反馈环的基本意图。某些实施例可允许用户搜索排名较高的发表者。其他实施例可通过将项目的发表者排名包括在对搜索命中的评估中来加强对项目的排名。某些实施例可以与上述发表者ID相类似的方式为给定项目使用用户ID。某些实现方式可以以与上述预订相类似的方式来为搜索结果507使用重排名。搜索结果的向下钻取类别也可根据时间窗口基础或用户时间使用频率基础被排名。优选实施例纯粹基于服务器处的全体积累事件来保持搜索结果,并且对于使用它的所有用户都是相同的。只有预订项目被重排名。完全这一点以便用户除了其个体视图外还能看到数据的纯粹群组视图。这允许了在所有用户间共享的项目的至少一个视图。
对于任何给定的类别语境,注释系统可接收大量项目。基于类别语境将项目检索到客户端的预订过程不会随着这种流程而缩放。优选实施例周期性地检索语境的预定数目的最相关项目。这意味着在客户端处可能有许多项目不可用于重排名。但是,在任何给定时刻,客户端很可能具有最相关的项目。其他实施例可采用方法的变体,其中所项目甚至所有事件都被检索,并且某个时间窗口的项目的客户端镜像与服务器镜像保持同步,等等。重排名中使用的发表者ID和关键字的关键统计信息被从服务器提供到客户端。这是在预订时完成的,并且以周期方式保持最新。类似的方法被用于在项目变化时获得它的限定关键字。所有这种数据都可以以捎带在用户对信息的实际请求(例如搜索)上的方式来检索,或者可以按固定的间隔被维护。所有的用户概况数据也可以按固定的间隔被备份到服务器和/或从其于网络的存储中获得。这可以由相对于管理注释服务器的那个独立的实体来存储。本领域的技术人员将会注意到,上述发明可以按许多系统配置来实现,而不会改变上述的基本功能。说明书隐性地假定注释服务器在客户端-服务器体系结构中与客户端通信。但是,注释服务器处理可以以多种传统的方式被分布,例如负载平衡、3层体系结构、基于RPC/Web服务的方法、对等方法等等。由于处理是基于项目和语境来完成的,因此计算可以基于散列被分布。在项目的情况下,每个服务器可以只处理基于散列函数确定的项目子集。在基于语境的服务器的情况下,处理可以基于语境被分配到服务器。可以利用类似REST的方法,以便可以实现本地缓存服务器以加快性能。处理也可以以至少一种针对基于语境的服务器的新颖方式被分布。可以使用类似DNS的方法,其中基于语境跨多个服务器以等级体系的方式来联合处理。例如,对关于语境“Programming”的事件的所有处理都可被传递到专攻“Programming”的服务器,并且基于语境“Javascript Programming”从那里被发送到另外的服务器。
优选实施例只是使用本发明的基本概念的示例性系统,存在许多可能的变体,并且它们不会脱离本发明的基本意图。优选实施例可被扩展到为搜索语境使用布尔逻辑表达式,例如AND、OR和NOT,就像搜索引擎中常见的那样。可以通过实现诸如“Spam”或“Adult”等专用关键字来创建合作式垃圾邮件或不当内容过滤。这可以以按钮形式或其他适当形式被呈现给用户。在客户端系统处可通过允许用户为这种关键字的关键字计数设置值来控制过滤,并且预订检索过程以及重排名过程都可过滤掉任何对于这些关键字具有大于用户指定量的关键字计数的项目。关于这一主题的可能的变体是如果这种关键字是项目的限定关键字则过滤掉项目。一个实施例可将发表看作特殊的项目类型而不是现有项目上的注释事件,从而允许每个这种注释具有单独的项目ID。这允许了注释在其元数据中引用另一注释,并且允许了创建这种注释的链。这将允许类似论坛的功能,这种功能允许创建会话线程并且允许这些消息被存储在注释服务器本身之内,而不是所描述的优选实施例中的格式,其中项目被与注释服务器分开地存储,并且发表事件只充分用于宣告其存在的方法。
本发明的一些实施例通过略作调整即可用在现有的软件应用内,以提供重大的新功能。在一个这种实施例中,类别语境的概念可被有利地结合在当前的web搜索引擎中,其方式是通过在这种搜索引擎处从点击流来得出它们。这可以很容易被添加到任何搜索引擎,并且可以在生成具有更大平均数目的关键字的查询方面扮演重要角色。比起当前的个性化方法来,这可能是更有效的实现相关结果的方式。
在另一实施例中,利用专门设计的接受作为邮件地址的关键字的邮件服务器,可利用类似关键字的语境来注释电子邮件。例如,关键字Key1可被输入为Key1@specialServer.tld。现有电子邮件客户端(比如Outlook)的插件模块可被修改,以创建允许通过自动完成邮件地址来无缝地输入这种关键字的交互范例。此电子邮件可通过利用收件人:、抄送:和暗送:被发送到这种地址。这将允许对电子邮件进行分类,而不必改变下层的协议。每当邮件被转发或答复时,这种注释就被进行,并且发送者的电子邮件id被用作此系统的用户ID,等等,并且所有这种注释都可在服务器处被聚集。前端的插件模块随后可提供优选实施例的其他功能,例如将电子邮件分类到类别语境中,以及搜索,等等。另一个可能的方法是使用主题行的文本来得出关键字,从而停止单词被剥出,并且电子邮件现在可以以类似于本发明的消息的方式被处理。
基于发表者ID上的TF-IDF的基于时间的变体来对项目重排名的概念甚至在现今也可有利地实现在电子邮件客户端软件中。发表者ID将会是收件箱中接收到的电子邮件的发送者电子邮件id。邮件软件可监视用户,以查明来自哪些发送者的哪些电子邮件被用户阅读,以计算每个发送者的时间使用频率。从特定发送者接收到的电子邮件的数目可充当与发送者id相关联的项目的数目的代理。重排名功能可被有利地实现,以基于相关性对用户的收件箱进行排序。
类似的方法也可有利地被用来利用适当开发的软件为一般用户群体进行博客张贴、播客和任何可以以语境敏感的方式发现的基于RSS馈送的项目。所有这种张贴都可作为发表事件被发送到适当的注释服务器,并且RSS读取器软件可被适当地修改,以允许本发明所描述的预订和注释。发表者ID可从RSS url合成,或者可由注释服务器处的特殊登录过程分配。
本领域的技术人员将会注意到,本发明和所描述的实施例可以以各种形式应用到企业或桌面、web上的博客以及本发明的其他适当用途。即时消息传递软件以及聊天软件可使用本发明来实现基于语境的实时消息传递。本发明还具有与针对性广告递送的特定相关性。对用户的搜索允许了广告以有针对性的方式被推送给用户。这可以被Web搜索引擎提供商利用来提供新形式的、基于推送的广告,而不是当前的基于拉出的、基于关键字的广告模型。由于与当前的web搜索相比预订增大了用户被暴露到的语境的数目,因此它创建了相应的大量具有高相关性的广告机会。用于用户概况可被保存在客户端中,因此这可被利用在新颖形式的广告递送中,例如向TV或电影/视频提供以个性化方式流式传输到用户的商业广告,其可以允许像电视那样免费提供内容的新内容递送模型,等等。这种通信形式可以理想地适合于递送分类广告,其中多对多通信范例允许了以更低的成本和更高的效率来对这种广告进行有针对性的递送。例如,二手相机的卖主可通过使用相应的类别语境来与二手相机的可能买主通信。
本发明的实施例可以有利地利用同一发明人的两个专利申请中提供的语义机制-“System for semantically disambiguating text information”(美国专利申请No.US10/954,964和PCT/SG2005/000321)以及“A methodand system for organizing items”(PCT/SG2005/000320)。这些在先申请的内容通过引用被结合到本申请中。申请No.US 10/054,064公开了一种用户界面方法,其允许文本被转换成含义的唯一机器表示。因此,像blog、blogs、weblog等关键字可被映射到代表含义“weblog”的单个id。这使本发明的注释、搜索、预订和其他机制可以更加准确。不是按上述使它们更难被找到的关键字将项目划分到三个分开的语境中,而是将它们归类到一个语境中,以便易于取回和比较。由于本发明的机制可允许来自任何语言的关键字,因此含义的这种机器表示也可以以交叉语言方式来实现,并且实现相同的歧义消除。申请No.PCT/SG2005/000320公开了一种知识表示方法,其允许这种语义元数据通过“related-To(与...相关)”关系以有限等级体系的形式来组织。这可被有利地利用来消除语境的歧义,就好像申请No.US10/054,064消除文本歧义那样。例如,以下的语境实际上引用相同的项目集合-{“Javascript”,“Programming”}和{“Javascript”}。实质上,由于Javascript是编程语言,所以与Javascript相关的大多数项目也与编程相关。从而关键字“Programming”没有向项目集合添加新的信息或辨别能力。通过具有两个分开的语境,语境空间被割裂了。通过该专利申请中所述的从“Javascript”到“Programming”的“related-To”关系,可以补救这一点。这意味着对于“Javascript”是关键字的任何项目,可以假定“Programming”关键字存在。通过预先布置这种语义关系,可以消除两个语境的歧义以建立同一个语境。该专利申请还描述了被称为“浏览路径行为”的机制,该机制可有利地用于针对向下钻取关键字的类别语境,以获得更直觉性的用户体验。在两个专利申请中公开了这些发明的许多其他能力,这些能力可以与本发明的机制有利地组合。
本发明也可充当用于生成语义元数据或概念及其关系的重要方法。本发明中的项目的限定关键字可用来生成候选概念。例如,通过查看每个项目的限定关键字中的类似单词来以(自动地或手工地)生成可被分配到同一含义的关键字。具有相同词干形式的不同关键字可被自动映射到共同的含义(例如同一项目中使用的“blog”和“blogs”可能指的是同一事物)。通过一点手工干预,可以将“weblog”关联到同一含义,如果它在任何给定项目的限定关键字中经常与“blog”或“blogs”一起使用的话。类似地,跨不同自然语言的关键字可与同一含义相关联。作为一种更一般性的方法,可以取得限定关键字及其相应项目的矩阵,并执行诸如LSI之类的相关分析,这种分析将允许我们调查包括同现以及二阶、三阶或更高阶同现的单词形式之间的相关以生成“related-To”关系以及限定概念和分配它们的关键字。这与IR中的其他这种尝试很不相同。本发明的机制所产生的限定关键字是相对于现实世界的项目的团体对单词含义的解释,并且指示了实际使用中的含义。这给出了高质量的数据集合,根据该集合,诸如LSI之类的模式识别方法和其他相关方法可用来得出语义元数据及其关系。类别语境也代表了可用于这种分析以得出语义元数据的类似高质量数据集合。这种元数据可被转换成2个专利申请为了其功能而要求的形式,并且这种功能随后可用来提高本发明的准确度。
与以上类似,这可以被扩展到生成语义Web所定义的更丰富的本体,其方式是允许注释者以诸如“band=Beatles”的关键字的形式指定关系并使用与确定限定关键字类似的方法来允许发现给定项目/概念的属性名称,并且使用它来以自动或半自动方式生成本体。
本发明的适当实施例可用作加强组织内的处理功能的新方法。例如,希望在组织内移动其桌子的人可以仅仅向诸如“Move Request”之类的语境发表消息,并且移动请求的处理所涉及的所有当事人可预订此主题并且同时被通知。这些当事人可包括请求的授权者、施设、技术等等。这些当事人中的每一个可利用原始项目ID作为其关键字之一来发表项目,以允许将这种消息链接到原始请求的语境。这些发表的项目可对应于处理请求的组织工作流中的步骤的完成。例如,这种步骤可包括请求的授权、将请求通知给其他语境、请求的终止、将请求分配到另一语境,等等。这可以通过以下方式来加强:利用语义元数据来有力地确定发表的项目的类型,例如定义“Move Request”语义元数据,并将其分配到该项目的类型。为了促进更宽的处理功能,此机制可与现有的BPMS系统相接口。像本发明这样的多对多通信范例可帮助对这种交互创建更有机、适应性更强的结构。
本领域的技术人员将会理解,可对特定实施例中示出的本发明进行各种变化和/或修改,而不脱离广泛描述的本发明的范围或精神。因此,当前的实施例在所有意义上都将被认为是示例性的而不是限制性的。

Claims (65)

1.一种用于合作的方法,该方法包括:
识别可在多个具有唯一标识符的用户之间共享的多个具有唯一标识符的项目;
使每个用户独立于其他用户地利用至少一种自然语言中的至少一个关键字来注释多个这种项目,每个这种项目被至少一个用户注释,每个这种注释由一个注释事件表示,该注释事件包含进行注释的用户的标识符、被注释的项目的标识符以及进行注释的用户选择用于描述被注释的项目的至少一个关键字,每个这种注释事件是从至少一种类型的多个事件源生成的;
聚集来自所述事件源的这种注释事件,以便从特定项目的注释事件聚集与该项目相关联的关键字,并且从特定用户的注释事件聚集与该用户相关联的关键字;以及
使至少一个这种用户按关键字搜索项目或用户,以使得在其聚集关键字中具有被搜索的关键字的相应项目或用户分别作为结果被返回。
2.如权利要求1所述的方法,其中所述事件源类型是由以下各项构成的群组中的至少一种:记忆对话、发表项目、标记项目、搜索的点击流、突出项目中的单词并使这些单词充当该项目的关键字、将文件保存到文件系统、链接文本分析、操作系统和软件模块。
3.如权利要求1所述的方法,其中所述项目是由以下各项构成的群组中的任何一种:数字资源、物理资源、人、有生命实体、文本广告、视频广告、事件、位置、状态、过程、动作、群组、概念、文件、电子邮件、即时消息、博客张贴、播客、网页、网站、web服务、数据结构、软件模块、软件对象、应用、操作系统、关系数据库的表中的行、XML数据和以RDF表示的资源。
4.如权利要求1所述的方法,其中所述唯一标识符是由以下各项构成的群组中的任何一种:散列值、URL、URI、URN、UNC、条码、RFID、基准符号、电子邮件地址、社会安全号、车辆注册号和电话号码。
5.如权利要求1所述的方法,其中每个项目最多具有一个唯一标识符。
6.如权利要求1所述的方法,其中每个用户最多具有一个唯一标识符。
7.如权利要求1所述的方法,其中所述标识符是全局唯一的。
8.如权利要求1所述的方法,还通过使用户利用用户id和口令进行认证来分配唯一的用户标识符。
9.如权利要求1所述的方法,其中所述项目还被至少一个标题字段和/或描述字段所描述。
10.如权利要求1所述的方法,其中所述项目标识符是用户标识符。
11.如权利要求1所述的方法,其中至少一个关键字是项目标识符。
12.如权利要求1所述的方法,其中至少一个关键字是用户标识符。
13.如权利要求1所述的方法,其中所述注释事件被用户数字签名。
14.如权利要求1所述的方法,其中所述注释事件经由网络被发送到至少一个服务器以便聚集。
15.如权利要求1所述的方法,其中所述网络是因特网。
16.如权利要求1所述的方法,其中针对每个用户的注释事件聚集是在客户端处完成的。
17.如权利要求1所述的方法,其中针对每个用户的注释事件在它们针对每个项目被聚集之前被规范化。
18.如权利要求1所述的方法,还利用信息检索排名算法基于与查询的相关性来对搜索结果进行排名。
19.如权利要求18所述的方法,使所述搜索结果基于多个这种算法被排名,然后聚集这种排名以确定相关性。
20.如权利要求18所述的方法,还为查询构造关键字向量,并且构造聚集关键字的向量及其它们针对每个结果的出现频率;
利用来自由以下各项构成的群组的排名算法基于这种向量计算排名:TF-IDF、TF-IDF变体、OKAPI和回转式规范化。
21.如权利要求20所述的方法,其中所述项目的聚集关键字限于所述项目的限定关键字。
22.如权利要求18所述的方法,还计算项目的结果集合;
将对这些项目进行了注释的所有用户包括在所述结果集合中;以及
出于链接分析排名算法的目的,将用户看作轴心并将项目看作权威;
创建从每个这种用户到该用户注释过的所有项目的合成超链接;以及
利用至少一种链接分析排名算法来计算项目的排名,并且利用至少一种链接分析排名算法来计算所述结果集合的用户的排名。
23.如权利要求22所述的方法,其中所述链接分析排名算法是由以下各项构成的群组中的一种:Indegree、HITS、随机化HITS、子空间HITS、SALSA、HUBAVG、算法的权威阈值族、MAX、BFS、BAYESIAN、简化BAYESIAN、PageRank、个性化PageRank、TrafficRank、TOPHITS、CubeSVD、PHITS和PLSA+PHITS。
24.如权利要求22所述的方法,其中所述结果集合中的用户和项目的聚集关键字包含所述搜索的关键字。
25.如权利要求22所述的方法,其中用来计算所述结果集合的每个注释事件包含所述查询的所有关键字。
26.如权利要求22所述的方法,其中用来计算所述结果集合的每个注释事件包含所述查询的所有关键字,并且至少一个这种关键字是所述注释事件的项目的限定关键字。
27.如权利要求1所述的方法,其中至少一个关键字是含义的机器表示。
28.如权利要求1所述的方法,其中至少一个关键字是语义元数据。
29.如权利要求28所述的方法,还利用至少一个词典描述所述语义元数据并且基于所述词典消除查询的关键字以及项目和用户的聚集关键字的歧义。
30.权利要求1所述的方法,还将项目的限定关键字或类别语境的关键字看作集合并基于所有这种集合中的关键字的同现来生成本体。
31.如权利要求30所述的方法,其中词典中的概念之间的语义关系是从所述同现数据生成的。
32.如权利要求1所述的方法,还按语境同时对项目和用户进行聚类。
33.如权利要求32所述的方法,还按语境来聚集注释事件;
确定在其聚集注释事件中具有预定最小数目的唯一用户标识符和预定最小数目的唯一项目标识符的语境;以及
基于这种语境对项目和用户进行聚类。
34.如权利要求33所述的方法,还将所述注释事件限制到预定的时间窗口。
35.如权利要求33所述的方法,还确定作为所述查询的子语境的所有这种语境;
从所确定的语境计算唯一关键字集合,其中存在于所确定的语境中的所有关键字都存在,除了作为所述搜索查询的一部分的这种关键字之外;
通过将每个这种唯一关键字附加到原始查询并重新发出查询,使得所述关键字作为用户可向下钻取到的子类别来呈现。
36.如权利要求1所述的方法,还在用户利用关键字集合注释项目时发表项目。
37.如权利要求36所述的方法,还利用与所述用户相对应的唯一发表者标识符来注释所发表的项目。
38.如权利要求37所述的方法,还通过使进行发表的用户利用用户id和口令进行认证来分配唯一的发表者标识符。
39.如权利要求36所述的方法,其中所述注释事件是发表注释事件。
40.如权利要求39所述的方法,其中所述发表注释事件是具有唯一项目标识符的项目。
41.如权利要求36所述的方法,其中所述注释事件的关键字的集合是类别语境。
42.如权利要求36所述的方法,其中所发表的项目在针对所述语境的用户子集的已发表语境中排名较高,直到满足预定的条件为止。
43.如权利要求37所述的方法,其中搜索结果被基于所述发表者标识符排名。
44.如权利要求37所述的方法,其中发表项目的动作对应于工作流过程中的步骤的完成。
45.如权利要求44所述的方法,其中所述步骤是包括授权、请求、分配、终止和通知的群组之一。
46.如权利要求37所述的方法,还基于用户概况自动地以周期方式进行搜索;
利用信息检索排名算法,基于与查询的相关性来对搜索结果进行排名;
针对每个用户,检索和存储排名较高的结果的子集;以及
根据用户的请求将所述结果呈现给用户。
47.如权利要求46所述的方法,还按发表者标识符针对每个语境对存储的结果进行重排名。
48.如权利要求46所述的方法,其中所发表的项目在针对所述语境的用户子集的已发表语境中排名较高,直到满足预定的条件为止。
49.如权利要求48所述的方法,其中所述用户子集是从由以下各项构成的群组中的任何一种的用户中选出的:排名较高的发表者、排名较高的用户和随机选择的用户。
50.如权利要求46所述的方法,还在用户对呈现的项目进行注释时生成注释事件,以使得在对该项目的事件之时存在的发表者标识符被包括在所述注释事件中。
51.如权利要求50所述的方法,其中所述发表者限于用户和/或原始发表者最承认的发表者。
52.如权利要求1所述的方法,还基于用户概况自动地以周期方式搜索语境的集合;
利用信息检索排名算法,基于与查询的相关性来对搜索结果进行排名;
针对每个语境,检索和存储排名较高的结果的子集;以及
根据用户的请求将所述结果呈现给用户。
53.如权利要求52所述的方法,还将所述搜索限于在预定的时间段内已被添加到所述语境的事件。
54.如权利要求52所述的方法,其中所述语境限于类别语境。
55.如权利要求52所述的方法,其中所述语境是由用户明确指定的。
56.如权利要求52所述的方法,还基于来自关键字和用户标识符构成的群组的至少一个参数,利用TFIDF的基于时间的变体来针对每个语境对存储的结果进行重排名。
57.如权利要求1所述的方法,其中通过搜索相关用户并将至少一个广告显示给至少一个用户,来将所述广告推送到所述用户。
58.如权利要求57所述的方法,其中这种广告基于用户概况被重排名。
59.如权利要求57所述的方法,其中所述广告由来自文本、音频和视频的群组中的至少一种以及分类广告构成。
60.如权利要求1所述的方法,其中所述搜索基于语境跨多个注释聚集服务器被联合。
61.如权利要求1所述的方法,还从所述结果中去除项目集合,其中这种项目是利用预定关键字的集合中的至少一个来注释的。
62.如权利要求61所述的方法,其中只有当所述关键字的注释频率高于预定级别时项目才被去除。
63.如权利要求1所述的方法,其中所述搜索是在搜索引擎处执行的;并且注释事件是从所述搜索引擎的搜索日志的点击流生成的。
64.一种用于合作的系统,包括:
用于识别可在多个具有唯一标识符的用户之间共享的多个具有唯一标识符的项目的装置;
用于使每个用户独立于其他用户地利用至少一种自然语言中的至少一个关键字来注释多个这种项目的装置,每个这种项目被至少一个用户注释,每个这种注释由一个注释事件表示,该注释事件包含进行注释的用户的标识符、被注释的项目的标识符以及进行注释的用户选择用于描述被注释的项目的至少一个关键字,每个这种注释事件是从至少一种类型的多个事件源生成的;
用于聚集来自所述事件源的这种注释事件以便从特定项目的注释事件聚集与该项目相关联的关键字并且从特定用户的注释事件聚集与该用户相关联的关键字的装置;以及
用于使至少一个这种用户按关键字搜索项目或用户以使得在其聚集关键字中具有被搜索的关键字的相应项目或用户分别作为结果被返回的装置。
65.如权利要求33所述的方法,还将所述语境限于其中有预定数目的下述项目的那些语境:所有这些项目都被预定数目的用户注释。
CNA2006800442871A 2004-09-29 2006-09-26 用于通信和合作的系统 Pending CN101317173A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US10/954,964 US20060074980A1 (en) 2004-09-29 2004-09-29 System for semantically disambiguating text information
SGPCT/SG2005/000320 2005-09-27
PCT/SG2005/000320 WO2006036127A1 (en) 2004-09-29 2005-09-27 A method and system for organizing items
SGPCT/SG2005/000321 2005-09-28
US11/440,896 2006-05-24

Publications (1)

Publication Number Publication Date
CN101317173A true CN101317173A (zh) 2008-12-03

Family

ID=36119181

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800442871A Pending CN101317173A (zh) 2004-09-29 2006-09-26 用于通信和合作的系统

Country Status (3)

Country Link
US (2) US20060074980A1 (zh)
CN (1) CN101317173A (zh)
WO (2) WO2006036127A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101867614A (zh) * 2010-06-13 2010-10-20 许祥鸿 一种手机业务数据检索方法
CN101964853A (zh) * 2009-07-24 2011-02-02 村田机械株式会社 网络复合机
CN102811207A (zh) * 2011-06-02 2012-12-05 腾讯科技(深圳)有限公司 网络信息推送方法及系统
CN102833176A (zh) * 2011-06-13 2012-12-19 腾讯科技(深圳)有限公司 获取信息的方法、装置和系统
WO2013016993A1 (zh) * 2011-08-02 2013-02-07 腾讯科技(深圳)有限公司 一种搜索方法、系统和装置
CN104584012A (zh) * 2012-08-28 2015-04-29 微软公司 标识与呈现给用户的实体相关联的用户特定服务
CN104969173A (zh) * 2012-10-11 2015-10-07 韦韦欧股份有限公司 动态应用过滤运算器作为对话界面一部分的用于自适应对话状态管理的方法
CN108738036A (zh) * 2017-04-14 2018-11-02 广州杰赛科技股份有限公司 移动通信的关键用户提取方法和系统
CN110633430A (zh) * 2018-05-31 2019-12-31 北京百度网讯科技有限公司 事件发现方法、装置、设备和计算机可读存储介质

Families Citing this family (458)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7035864B1 (en) 2000-05-18 2006-04-25 Endeca Technologies, Inc. Hierarchical data-driven navigation system and method for information retrieval
US7617184B2 (en) * 2000-05-18 2009-11-10 Endeca Technologies, Inc. Scalable hierarchical data-driven navigation system and method for information retrieval
US7640267B2 (en) 2002-11-20 2009-12-29 Radar Networks, Inc. Methods and systems for managing entities in a computing device using semantic objects
US8943024B1 (en) 2003-01-17 2015-01-27 Daniel John Gardner System and method for data de-duplication
US8375008B1 (en) 2003-01-17 2013-02-12 Robert Gomes Method and system for enterprise-wide retention of digital or electronic data
US8065277B1 (en) 2003-01-17 2011-11-22 Daniel John Gardner System and method for a data extraction and backup database
US8630984B1 (en) 2003-01-17 2014-01-14 Renew Data Corp. System and method for data extraction from email files
US8200775B2 (en) * 2005-02-01 2012-06-12 Newsilike Media Group, Inc Enhanced syndication
US7433876B2 (en) 2004-02-23 2008-10-07 Radar Networks, Inc. Semantic web portal and platform
US20060036451A1 (en) 2004-08-10 2006-02-16 Lundberg Steven W Patent mapping
WO2006036150A1 (en) * 2004-09-28 2006-04-06 Nielsen Media Research, Inc Data classification methods and apparatus for use with data fusion
US20060074980A1 (en) * 2004-09-29 2006-04-06 Sarkar Pte. Ltd. System for semantically disambiguating text information
US20060088026A1 (en) * 2004-10-27 2006-04-27 Microsoft Corporation Message based network configuration of domain name services
US8069151B1 (en) 2004-12-08 2011-11-29 Chris Crafford System and method for detecting incongruous or incorrect media in a data recovery process
CA2490645A1 (en) * 2004-12-16 2006-06-16 Ibm Canada Limited - Ibm Canada Limitee Data-centric distributed computing
US7496832B2 (en) * 2005-01-13 2009-02-24 International Business Machines Corporation Web page rendering based on object matching
US7958257B2 (en) * 2005-01-19 2011-06-07 International Business Machines Corporation Message filtering and demultiplexing system
EP1684192A1 (en) * 2005-01-25 2006-07-26 Ontoprise GmbH Integration platform for heterogeneous information sources
ATE510259T1 (de) * 2005-01-31 2011-06-15 Ontoprise Gmbh Abbilden von web-diensten auf ontologien
US20060265489A1 (en) * 2005-02-01 2006-11-23 Moore James F Disaster management using an enhanced syndication platform
US8200700B2 (en) 2005-02-01 2012-06-12 Newsilike Media Group, Inc Systems and methods for use of structured and unstructured distributed data
US8700738B2 (en) * 2005-02-01 2014-04-15 Newsilike Media Group, Inc. Dynamic feed generation
US20080195483A1 (en) * 2005-02-01 2008-08-14 Moore James F Widget management systems and advertising systems related thereto
US20070050446A1 (en) * 2005-02-01 2007-03-01 Moore James F Managing network-accessible resources
US8347088B2 (en) * 2005-02-01 2013-01-01 Newsilike Media Group, Inc Security systems and methods for use with structured and unstructured data
US9202084B2 (en) 2006-02-01 2015-12-01 Newsilike Media Group, Inc. Security facility for maintaining health care data pools
US20080046471A1 (en) * 2005-02-01 2008-02-21 Moore James F Calendar Synchronization using Syndicated Data
US8140482B2 (en) 2007-09-19 2012-03-20 Moore James F Using RSS archives
GB0502259D0 (en) * 2005-02-03 2005-03-09 British Telecomm Document searching tool and method
US8527468B1 (en) 2005-02-08 2013-09-03 Renew Data Corp. System and method for management of retention periods for content in a computing system
US20060195313A1 (en) * 2005-02-25 2006-08-31 Microsoft Corporation Method and system for selecting and conjugating a verb
US7844565B2 (en) 2005-03-30 2010-11-30 Primal Fusion Inc. System, method and computer program for using a multi-tiered knowledge representation model
US10002325B2 (en) 2005-03-30 2018-06-19 Primal Fusion Inc. Knowledge representation systems and methods incorporating inference rules
US7606781B2 (en) * 2005-03-30 2009-10-20 Primal Fusion Inc. System, method and computer program for facet analysis
US7849090B2 (en) * 2005-03-30 2010-12-07 Primal Fusion Inc. System, method and computer program for faceted classification synthesis
US9378203B2 (en) 2008-05-01 2016-06-28 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
US9177248B2 (en) 2005-03-30 2015-11-03 Primal Fusion Inc. Knowledge representation systems and methods incorporating customization
US7596574B2 (en) * 2005-03-30 2009-09-29 Primal Fusion, Inc. Complex-adaptive system for providing a facted classification
US9104779B2 (en) 2005-03-30 2015-08-11 Primal Fusion Inc. Systems and methods for analyzing and synthesizing complex knowledge representations
US8849860B2 (en) 2005-03-30 2014-09-30 Primal Fusion Inc. Systems and methods for applying statistical inference techniques to knowledge representations
US20060230028A1 (en) * 2005-04-07 2006-10-12 Business Objects, S.A. Apparatus and method for constructing complex database query statements based on business analysis comparators
US20060230027A1 (en) * 2005-04-07 2006-10-12 Kellet Nicholas G Apparatus and method for utilizing sentence component metadata to create database queries
US20060229853A1 (en) * 2005-04-07 2006-10-12 Business Objects, S.A. Apparatus and method for data modeling business logic
US20060229866A1 (en) * 2005-04-07 2006-10-12 Business Objects, S.A. Apparatus and method for deterministically constructing a text question for application to a data source
EP1889181A4 (en) * 2005-05-16 2009-12-02 Ebay Inc METHOD AND SYSTEM FOR SEARCHING SEARCH
WO2006128183A2 (en) 2005-05-27 2006-11-30 Schwegman, Lundberg, Woessner & Kluth, P.A. Method and apparatus for cross-referencing important ip relationships
US7720834B2 (en) * 2005-06-23 2010-05-18 Microsoft Corporation Application launching via indexed data
US7933395B1 (en) * 2005-06-27 2011-04-26 Google Inc. Virtual tour of user-defined paths in a geographic information system
US8161025B2 (en) * 2005-07-27 2012-04-17 Schwegman, Lundberg & Woessner, P.A. Patent mapping
US7321883B1 (en) * 2005-08-05 2008-01-22 Perceptronics Solutions, Inc. Facilitator used in a group decision process to solve a problem according to data provided by users
EP1919771A4 (en) * 2005-08-31 2010-06-09 Intuview Itd EXPERT DECISION SUPPORT SYSTEM AND REAL-TIME METHODS OF OPERATING DOCUMENTS IN LANGUAGES OTHER THAN ENGLISH
EP1770488A1 (de) * 2005-09-26 2007-04-04 Siemens Aktiengesellschaft Verfahren und System zur Unterstützung eines Funktionsaufrufs mittels einer Benutzeroberfläche
US8688673B2 (en) * 2005-09-27 2014-04-01 Sarkar Pte Ltd System for communication and collaboration
US20070078842A1 (en) * 2005-09-30 2007-04-05 Zola Scot G System and method for responding to a user reference query
US8620667B2 (en) * 2005-10-17 2013-12-31 Microsoft Corporation Flexible speech-activated command and control
JP4047885B2 (ja) * 2005-10-27 2008-02-13 株式会社東芝 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
US8019752B2 (en) * 2005-11-10 2011-09-13 Endeca Technologies, Inc. System and method for information retrieval from object collections with complex interrelationships
US20070112675A1 (en) * 2005-11-14 2007-05-17 Flinn Brenda J Goods and Services Locator Language for Uniform Resource Identifier Components
US8156097B2 (en) 2005-11-14 2012-04-10 Microsoft Corporation Two stage search
US7801844B2 (en) * 2005-11-23 2010-09-21 Microsoft Corporation Surrogate key generation and utilization
US9135304B2 (en) * 2005-12-02 2015-09-15 Salesforce.Com, Inc. Methods and systems for optimizing text searches over structured data in a multi-tenant environment
US7877486B2 (en) 2005-12-08 2011-01-25 International Business Machines Corporation Auto-establishment of a voice channel of access to a session for a composite service from a visual channel of access to the session for the composite service
US7890635B2 (en) 2005-12-08 2011-02-15 International Business Machines Corporation Selective view synchronization for composite services delivery
US20070132834A1 (en) * 2005-12-08 2007-06-14 International Business Machines Corporation Speech disambiguation in a composite services enablement environment
US20070136449A1 (en) * 2005-12-08 2007-06-14 International Business Machines Corporation Update notification for peer views in a composite services delivery environment
US7809838B2 (en) 2005-12-08 2010-10-05 International Business Machines Corporation Managing concurrent data updates in a composite services delivery system
US20070133773A1 (en) 2005-12-08 2007-06-14 International Business Machines Corporation Composite services delivery
US7818432B2 (en) 2005-12-08 2010-10-19 International Business Machines Corporation Seamless reflection of model updates in a visual page for a visual channel in a composite services delivery system
US7827288B2 (en) 2005-12-08 2010-11-02 International Business Machines Corporation Model autocompletion for composite services synchronization
US11093898B2 (en) 2005-12-08 2021-08-17 International Business Machines Corporation Solution for adding context to a text exchange modality during interactions with a composite services application
US7792971B2 (en) * 2005-12-08 2010-09-07 International Business Machines Corporation Visual channel refresh rate control for composite services delivery
US8259923B2 (en) 2007-02-28 2012-09-04 International Business Machines Corporation Implementing a contact center using open standards and non-proprietary components
US8189563B2 (en) 2005-12-08 2012-05-29 International Business Machines Corporation View coordination for callers in a composite services enablement environment
US10332071B2 (en) 2005-12-08 2019-06-25 International Business Machines Corporation Solution for adding context to a text exchange modality during interactions with a composite services application
US8005934B2 (en) * 2005-12-08 2011-08-23 International Business Machines Corporation Channel presence in a composite services enablement environment
US7461033B1 (en) * 2005-12-22 2008-12-02 Sprint Communications Company L.P. Computation linguistics engine
US8150857B2 (en) 2006-01-20 2012-04-03 Glenbrook Associates, Inc. System and method for context-rich database optimized for processing of concepts
US7676449B2 (en) * 2006-03-28 2010-03-09 Yahoo! Inc. Creating and viewing private events in an events repository
US7668838B2 (en) * 2006-03-28 2010-02-23 Yahoo! Inc. Providing event information to third party event applications
JP2007272390A (ja) * 2006-03-30 2007-10-18 Sony Corp リソース管理装置、タグ候補選定方法及びタグ候補選定プログラム
JP2007272442A (ja) * 2006-03-30 2007-10-18 Fujitsu Ltd サービス提供方法、サービス提供プログラムおよびサービス提供装置
US20070255742A1 (en) * 2006-04-28 2007-11-01 Microsoft Corporation Category Topics
CN103235776B (zh) * 2006-05-10 2017-09-26 谷歌公司 呈现搜索结果信息
US8150827B2 (en) * 2006-06-07 2012-04-03 Renew Data Corp. Methods for enhancing efficiency and cost effectiveness of first pass review of documents
US7970746B2 (en) * 2006-06-13 2011-06-28 Microsoft Corporation Declarative management framework
US7730068B2 (en) * 2006-06-13 2010-06-01 Microsoft Corporation Extensible data collectors
US8255383B2 (en) * 2006-07-14 2012-08-28 Chacha Search, Inc Method and system for qualifying keywords in query strings
WO2008014499A2 (en) * 2006-07-27 2008-01-31 Nervana Inc. Information nervous system
US20080046369A1 (en) * 2006-07-27 2008-02-21 Wood Charles B Password Management for RSS Interfaces
KR100815563B1 (ko) * 2006-08-28 2008-03-20 한국과학기술정보연구원 Dbms 기반 지식 확장 및 추론 서비스 시스템 및 그방법
US8931055B2 (en) * 2006-08-31 2015-01-06 Accenture Global Services Gmbh Enterprise entitlement framework
US20080065742A1 (en) * 2006-09-08 2008-03-13 International Business Machines Corporation Contextually categorization of complex data repositories in an information architecture analysis
US8290980B2 (en) * 2006-09-08 2012-10-16 Yahoo! Inc. Generating event data display code
US20080065740A1 (en) * 2006-09-08 2008-03-13 Andrew Baio Republishing group event data
US9043265B2 (en) * 2006-09-21 2015-05-26 Aebis, Inc. Methods and systems for constructing intelligent glossaries from distinction-based reasoning
US7945527B2 (en) * 2006-09-21 2011-05-17 Aebis, Inc. Methods and systems for interpreting text using intelligent glossaries
US8676802B2 (en) * 2006-11-30 2014-03-18 Oracle Otc Subsidiary Llc Method and system for information retrieval with clustering
US9754273B2 (en) * 2006-12-19 2017-09-05 Microsoft Technology Licensing, Llc Enterprise resource tracking of knowledge
US8594305B2 (en) 2006-12-22 2013-11-26 International Business Machines Corporation Enhancing contact centers with dialog contracts
US20080154612A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Local storage and use of search results for voice-enabled mobile communications devices
US20080154870A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Collection and use of side information in voice-mediated mobile search
US20080153465A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Voice search-enabled mobile device
US20080154608A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. On a mobile device tracking use of search results delivered to the mobile device
US20080162526A1 (en) * 2006-12-28 2008-07-03 Uma Kant Singh Method and system for managing unstructured data in a structured data environment
US7788247B2 (en) * 2007-01-12 2010-08-31 Microsoft Corporation Characteristic tagging
US7930263B2 (en) * 2007-01-12 2011-04-19 Health Information Flow, Inc. Knowledge utilization
US7873710B2 (en) 2007-02-06 2011-01-18 5O9, Inc. Contextual data communication platform
KR20080078255A (ko) * 2007-02-22 2008-08-27 삼성전자주식회사 파일 관리 방법 및 장치와 그 파일을 저장한 정보저장매체
US9247056B2 (en) 2007-02-28 2016-01-26 International Business Machines Corporation Identifying contact center agents based upon biometric characteristics of an agent's speech
US9055150B2 (en) 2007-02-28 2015-06-09 International Business Machines Corporation Skills based routing in a standards based contact center using a presence server and expertise specific watchers
US7552114B2 (en) 2007-03-07 2009-06-23 International Business Machines Corporation System, and method for interactive browsing
US8103646B2 (en) * 2007-03-13 2012-01-24 Microsoft Corporation Automatic tagging of content based on a corpus of previously tagged and untagged content
US8204856B2 (en) 2007-03-15 2012-06-19 Google Inc. Database replication
US9558184B1 (en) * 2007-03-21 2017-01-31 Jean-Michel Vanhalle System and method for knowledge modeling
US7680940B2 (en) * 2007-03-28 2010-03-16 Scenera Technologies, Llc Method and system for managing dynamic associations between folksonomic data and resources
US8533232B1 (en) * 2007-03-30 2013-09-10 Google Inc. Method and system for defining relationships among labels
US8332209B2 (en) * 2007-04-24 2012-12-11 Zinovy D. Grinblat Method and system for text compression and decompression
US7908560B2 (en) * 2007-04-24 2011-03-15 International Business Machines Corporation Method and system for cross-screen component communication in dynamically created composite applications
US8393967B2 (en) 2007-04-27 2013-03-12 Microsoft Corporation Construction of gaming messages with contextual information
US7890549B2 (en) * 2007-04-30 2011-02-15 Quantum Leap Research, Inc. Collaboration portal (COPO) a scaleable method, system, and apparatus for providing computer-accessible benefits to communities of users
US20090043768A1 (en) * 2007-05-03 2009-02-12 Kivati Software, Llc method for differentiating states of n machines
US7899666B2 (en) 2007-05-04 2011-03-01 Expert System S.P.A. Method and system for automatically extracting relations between concepts included in text
US8918717B2 (en) * 2007-05-07 2014-12-23 International Business Machines Corporation Method and sytem for providing collaborative tag sets to assist in the use and navigation of a folksonomy
US20080288516A1 (en) * 2007-05-17 2008-11-20 Hadfield Marc C Universal meme identification
US20080301096A1 (en) * 2007-05-29 2008-12-04 Microsoft Corporation Techniques to manage metadata fields for a taxonomy system
US9251137B2 (en) * 2007-06-21 2016-02-02 International Business Machines Corporation Method of text type-ahead
US8005643B2 (en) 2007-06-26 2011-08-23 Endeca Technologies, Inc. System and method for measuring the quality of document sets
US8935249B2 (en) 2007-06-26 2015-01-13 Oracle Otc Subsidiary Llc Visualization of concepts within a collection of information
US20090007256A1 (en) * 2007-06-28 2009-01-01 Microsoft Corporation Using a trusted entity to drive security decisions
US7783620B1 (en) * 2007-06-29 2010-08-24 Emc Corporation Relevancy scoring using query structure and data structure for federated search
US7783630B1 (en) * 2007-06-29 2010-08-24 Emc Corporation Tuning of relevancy ranking for federated search
US20090063943A1 (en) * 2007-08-29 2009-03-05 Swaminathan Balasubramanian Use of Dynamic Anchors to Transmit Content
US20090063946A1 (en) * 2007-08-29 2009-03-05 International Business Machines Corporation Anchor store for transmitting multiple dynamic anchors
DE102007042442A1 (de) * 2007-09-06 2009-03-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und System zur Kennzeichnung von Objekten
NO20075351A (no) * 2007-10-18 2009-02-09 Fast Search & Transfer Asa Fremgangsmåte for å begrense aksess til søkeresultater og søkemotor som støtter fremgangsmåten
CA2607537A1 (en) * 2007-10-22 2009-04-22 Ibm Canada Limited - Ibm Canada Limitee Software engineering system and method for self-adaptive dynamic software components
US8194976B2 (en) * 2007-10-22 2012-06-05 Hewlett-Packard Development Company, L.P. Machine readable documents and reading methods
US8140535B2 (en) * 2007-10-23 2012-03-20 International Business Machines Corporation Ontology-based network search engine
US8036980B2 (en) * 2007-10-24 2011-10-11 Thomson Reuters Global Resources Method and system of generating audit procedures and forms
US8050988B2 (en) * 2007-10-24 2011-11-01 Thomson Reuters Global Resources Method and system of generating audit procedures and forms
US8041702B2 (en) * 2007-10-25 2011-10-18 International Business Machines Corporation Ontology-based network search engine
US8903842B2 (en) 2007-10-26 2014-12-02 Microsoft Corporation Metadata driven reporting and editing of databases
US20090112932A1 (en) * 2007-10-26 2009-04-30 Microsoft Corporation Visualizing key performance indicators for model-based applications
US8516058B2 (en) * 2007-11-02 2013-08-20 International Business Machines Corporation System and method for dynamic tagging in email
US20090119572A1 (en) * 2007-11-02 2009-05-07 Marja-Riitta Koivunen Systems and methods for finding information resources
US7856434B2 (en) 2007-11-12 2010-12-21 Endeca Technologies, Inc. System and method for filtering rules for manipulating search results in a hierarchical search and navigation system
JP5490010B2 (ja) 2007-11-19 2014-05-14 インターナショナル・ビジネス・マシーンズ・コーポレーション 記述論理ファイル・システムを用いて情報を格納する方法、システムおよびコンピュータ・プログラム
US8412516B2 (en) * 2007-11-27 2013-04-02 Accenture Global Services Limited Document analysis, commenting, and reporting system
US10152721B2 (en) * 2007-11-29 2018-12-11 International Business Machines Corporation Aggregate scoring of tagged content across social bookmarking systems
US8037425B2 (en) 2007-12-14 2011-10-11 Scenera Technologies, Llc Methods, systems, and computer readable media for controlling presentation and selection of objects that are digital images depicting subjects
US8340492B2 (en) * 2007-12-17 2012-12-25 General Instrument Corporation Method and system for sharing annotations in a communication network
US7860898B1 (en) * 2007-12-19 2010-12-28 Emc Corporation Techniques for notification in a data storage system
US20090171923A1 (en) * 2008-01-02 2009-07-02 Michael Patrick Nash Domain-specific concept model for associating structured data that enables a natural language query
US20090177634A1 (en) * 2008-01-09 2009-07-09 International Business Machine Corporation Method and System for an Application Domain
US7512576B1 (en) 2008-01-16 2009-03-31 International Business Machines Corporation Automatically generated ontology by combining structured and/or semi-structured knowledge sources
US8316035B2 (en) 2008-01-16 2012-11-20 International Business Machines Corporation Systems and arrangements of text type-ahead
US8752184B1 (en) 2008-01-17 2014-06-10 Google Inc. Spam detection for user-generated multimedia items based on keyword stuffing
US8745056B1 (en) 2008-03-31 2014-06-03 Google Inc. Spam detection for user-generated multimedia items based on concept clustering
US8504452B2 (en) * 2008-01-18 2013-08-06 Thomson Reuters Global Resources Method and system for auditing internal controls
US8615490B1 (en) 2008-01-31 2013-12-24 Renew Data Corp. Method and system for restoring information from backup storage media
US8201075B2 (en) * 2008-02-29 2012-06-12 Research In Motion Limited Enhanced browser navigation
EP2107474A1 (en) * 2008-03-31 2009-10-07 British Telecommunications Public Limited Company Data access
US8171020B1 (en) 2008-03-31 2012-05-01 Google Inc. Spam detection for user-generated multimedia items based on appearance in popular queries
US8112431B2 (en) 2008-04-03 2012-02-07 Ebay Inc. Method and system for processing search requests
US10552391B2 (en) 2008-04-04 2020-02-04 Landmark Graphics Corporation Systems and methods for real time data management in a collaborative environment
US8229938B2 (en) 2008-04-04 2012-07-24 Landmark Graphics Corporation Systems and methods for correlating meta-data model representations and asset-logic model representations
US8954474B2 (en) * 2008-04-21 2015-02-10 The Boeing Company Managing data systems to support semantic-independent schemas
US8359532B2 (en) * 2008-04-28 2013-01-22 International Business Machines Corporation Text type-ahead
US8676732B2 (en) 2008-05-01 2014-03-18 Primal Fusion Inc. Methods and apparatus for providing information of interest to one or more users
US8676722B2 (en) 2008-05-01 2014-03-18 Primal Fusion Inc. Method, system, and computer program for user-driven dynamic generation of semantic networks and media synthesis
US9361365B2 (en) 2008-05-01 2016-06-07 Primal Fusion Inc. Methods and apparatus for searching of content using semantic synthesis
US20090287991A1 (en) * 2008-05-19 2009-11-19 Battelle Memorial Institute Generation of fusible signatures for fusion of heterogenous data
US8190643B2 (en) * 2008-05-23 2012-05-29 Nokia Corporation Apparatus, method and computer program product for processing resource description framework statements
US8682819B2 (en) * 2008-06-19 2014-03-25 Microsoft Corporation Machine-based learning for automatically categorizing data on per-user basis
US8266514B2 (en) * 2008-06-26 2012-09-11 Microsoft Corporation Map service
US8073680B2 (en) 2008-06-26 2011-12-06 Microsoft Corporation Language detection service
US8107671B2 (en) 2008-06-26 2012-01-31 Microsoft Corporation Script detection service
US7966348B2 (en) * 2008-06-27 2011-06-21 International Business Machines Corporation Dynamic ontology-driven template selection
US8386485B2 (en) * 2008-07-31 2013-02-26 George Mason Intellectual Properties, Inc. Case-based framework for collaborative semantic search
EP2332039A4 (en) * 2008-08-11 2012-12-05 Collective Inc METHOD AND SYSTEM FOR CLASSIFYING TEXT
US20100050153A1 (en) * 2008-08-21 2010-02-25 Clevest Solutions Inc. Method and system of editing workflow logic and screens with a gui tool
US9189537B2 (en) * 2008-08-29 2015-11-17 Red Hat, Inc. Extraction of critical information from database
CA2734756C (en) 2008-08-29 2018-08-21 Primal Fusion Inc. Systems and methods for semantic concept definition and semantic concept relationship synthesis utilizing existing domain definitions
US8438148B1 (en) * 2008-09-01 2013-05-07 Google Inc. Method and system for generating search shortcuts and inline auto-complete entries
US20100057733A1 (en) * 2008-09-02 2010-03-04 Suresh Ravinarayanan Purisai Method, computer program product, and apparatus for enabling access to enterprise information
US9317599B2 (en) * 2008-09-19 2016-04-19 Nokia Technologies Oy Method, apparatus and computer program product for providing relevance indication
GB2463669A (en) * 2008-09-19 2010-03-24 Motorola Inc Using a semantic graph to expand characterising terms of a content item and achieve targeted selection of associated content items
US8260823B2 (en) * 2008-10-09 2012-09-04 International Business Machines Corporation Dissemination, acquisition, discovery and use of people-oriented folksonomies
KR101040119B1 (ko) * 2008-10-14 2011-06-09 한국전자통신연구원 콘텐츠 검색 장치 및 방법
US8555240B2 (en) * 2008-10-15 2013-10-08 International Business Machines Corporation Describing formal end-user requirements in information processing systems using a faceted, tag-based model
US8490049B2 (en) * 2008-10-15 2013-07-16 International Business Machines Corporation Faceted, tag-based approach for the design and composition of components and applications in component-based systems
US20100100371A1 (en) * 2008-10-20 2010-04-22 Tang Yuezhong Method, System, and Apparatus for Message Generation
US20100131513A1 (en) 2008-10-23 2010-05-27 Lundberg Steven W Patent mapping
WO2010056723A1 (en) * 2008-11-12 2010-05-20 Collective Media, Inc. Method and system for semantic distance measurement
US10318603B2 (en) * 2008-12-04 2019-06-11 International Business Machines Corporation Reciprocal tags in social tagging
US8195692B2 (en) * 2008-12-11 2012-06-05 International Business Machines Corporation System and method for managing semantic and syntactic metadata
US10489434B2 (en) * 2008-12-12 2019-11-26 Verint Americas Inc. Leveraging concepts with information retrieval techniques and knowledge bases
US20100161631A1 (en) * 2008-12-19 2010-06-24 Microsoft Corporation Techniques to share information about tags and documents across a computer network
US8639682B2 (en) * 2008-12-29 2014-01-28 Accenture Global Services Limited Entity assessment and ranking
US20100192054A1 (en) * 2009-01-29 2010-07-29 International Business Machines Corporation Sematically tagged background information presentation
US8326688B2 (en) * 2009-01-29 2012-12-04 Collective, Inc. Method and system for behavioral classification
JP5385624B2 (ja) * 2009-01-30 2014-01-08 富士フイルム株式会社 画像キーワード付与装置および画像検索装置ならびにそれらの制御方法
US20100211535A1 (en) * 2009-02-17 2010-08-19 Rosenberger Mark Elliot Methods and systems for management of data
US20100241639A1 (en) * 2009-03-20 2010-09-23 Yahoo! Inc. Apparatus and methods for concept-centric information extraction
WO2010108261A1 (en) * 2009-03-21 2010-09-30 Matthew Oleynik Systems and methods for research database management
US10754896B2 (en) * 2009-03-24 2020-08-25 Micro Focus Llc Transforming a description of services for web services
US9037567B2 (en) 2009-04-15 2015-05-19 Vcvc Iii Llc Generating user-customized search results and building a semantics-enhanced search engine
US8862579B2 (en) 2009-04-15 2014-10-14 Vcvc Iii Llc Search and search optimization using a pattern of a location identifier
US10628847B2 (en) 2009-04-15 2020-04-21 Fiver Llc Search-enhanced semantic advertising
US8200617B2 (en) 2009-04-15 2012-06-12 Evri, Inc. Automatic mapping of a location identifier pattern of an object to a semantic type using object metadata
CN101872349B (zh) * 2009-04-23 2013-06-19 国际商业机器公司 处理自然语言问题的方法和装置
US20100281025A1 (en) * 2009-05-04 2010-11-04 Motorola, Inc. Method and system for recommendation of content items
US8949241B2 (en) * 2009-05-08 2015-02-03 Thomson Reuters Global Resources Systems and methods for interactive disambiguation of data
US20100299603A1 (en) * 2009-05-22 2010-11-25 Bernard Farkas User-Customized Subject-Categorized Website Entertainment Database
WO2010138972A2 (en) 2009-05-29 2010-12-02 Abacast, Inc. Selective access of multi-rate data from a server and/or peer
CN101937442A (zh) * 2009-06-29 2011-01-05 国际商业机器公司 用于缓存术语数据的方法和系统
WO2011005948A1 (en) * 2009-07-09 2011-01-13 Collective Media, Inc. Method and system for tracking interaction and view information for online advertising
US9026542B2 (en) * 2009-07-25 2015-05-05 Alcatel Lucent System and method for modelling and profiling in multiple languages
US20110035418A1 (en) * 2009-08-06 2011-02-10 Raytheon Company Object-Knowledge Mapping Method
US9292855B2 (en) 2009-09-08 2016-03-22 Primal Fusion Inc. Synthesizing messaging using context provided by consumers
US20110060644A1 (en) * 2009-09-08 2011-03-10 Peter Sweeney Synthesizing messaging using context provided by consumers
US20110060645A1 (en) * 2009-09-08 2011-03-10 Peter Sweeney Synthesizing messaging using context provided by consumers
JP2011065546A (ja) * 2009-09-18 2011-03-31 Hitachi Solutions Ltd ファイル検索システム及びプログラム
US9286362B2 (en) * 2009-09-25 2016-03-15 International Business Machines Corporation System and method to customize metadata for different users running on the same infrastructure
US9475359B2 (en) * 2009-10-06 2016-10-25 Johnson Controls Technology Company Systems and methods for displaying a hierarchical set of building management system information
US8655830B2 (en) * 2009-10-06 2014-02-18 Johnson Controls Technology Company Systems and methods for reporting a cause of an event or equipment state using causal relationship models in a building management system
US20110087650A1 (en) * 2009-10-06 2011-04-14 Johnson Controls Technology Company Creation and use of causal relationship models in building management systems and applications
KR101072100B1 (ko) 2009-10-23 2011-10-10 포항공과대학교 산학협력단 표현 및 설명 추출을 위한 문서 처리 장치 및 방법
US8667006B2 (en) * 2009-10-29 2014-03-04 International Business Machines Corporation Rapid peer navigation in faceted search systems
US8676828B1 (en) * 2009-11-04 2014-03-18 Google Inc. Selecting and presenting content relevant to user input
US9262520B2 (en) 2009-11-10 2016-02-16 Primal Fusion Inc. System, method and computer program for creating and manipulating data structures using an interactive graphical interface
US20110119269A1 (en) * 2009-11-18 2011-05-19 Rakesh Agrawal Concept Discovery in Search Logs
US20110125754A1 (en) * 2009-11-20 2011-05-26 Cbs Interactive Inc. Reverse Dynamic Filter-Linked Pages System And Method
US20110131204A1 (en) * 2009-12-02 2011-06-02 International Business Machines Corporation Deriving Asset Popularity by Number of Launches
US8533281B2 (en) * 2009-12-02 2013-09-10 International Business Machines Corporation Centralized management of mobile assets—push based management of corporate assets
US20110138335A1 (en) * 2009-12-08 2011-06-09 Sybase, Inc. Thin analytics for enterprise mobile users
WO2011072172A1 (en) * 2009-12-09 2011-06-16 Renew Data Corp. System and method for quickly determining a subset of irrelevant data from large data content
WO2011075610A1 (en) 2009-12-16 2011-06-23 Renew Data Corp. System and method for creating a de-duplicated data set
US8631071B2 (en) * 2009-12-17 2014-01-14 International Business Machines Corporation Recognition of and support for multiple versions of an enterprise canonical message model
US9111004B2 (en) * 2009-12-17 2015-08-18 International Business Machines Corporation Temporal scope translation of meta-models using semantic web technologies
US8793208B2 (en) 2009-12-17 2014-07-29 International Business Machines Corporation Identifying common data objects representing solutions to a problem in different disciplines
US9026412B2 (en) * 2009-12-17 2015-05-05 International Business Machines Corporation Managing and maintaining scope in a service oriented architecture industry model repository
US20110179108A1 (en) * 2010-01-21 2011-07-21 International Business Machines Corporation System for Aggregating Information and Delivering User Specific Content
US8914368B2 (en) 2010-03-31 2014-12-16 International Business Machines Corporation Augmented and cross-service tagging
US8185558B1 (en) 2010-04-19 2012-05-22 Facebook, Inc. Automatically generating nodes and edges in an integrated social graph
US8782080B2 (en) 2010-04-19 2014-07-15 Facebook, Inc. Detecting social graph elements for structured search queries
US8751521B2 (en) 2010-04-19 2014-06-10 Facebook, Inc. Personalized structured search queries for online social networks
US8180804B1 (en) 2010-04-19 2012-05-15 Facebook, Inc. Dynamically generating recommendations based on social graph information
US8918418B2 (en) 2010-04-19 2014-12-23 Facebook, Inc. Default structured search queries on online social networks
US8732208B2 (en) 2010-04-19 2014-05-20 Facebook, Inc. Structured search queries based on social-graph information
US8868603B2 (en) 2010-04-19 2014-10-21 Facebook, Inc. Ambiguous structured search queries on online social networks
KR100989581B1 (ko) * 2010-04-28 2010-10-25 한국과학기술정보연구원 개체명 사전 및 마이닝 규칙이 결합된 온톨로지 스키마를 이용한 리소스 기술 프레임워크 네트워크 구축 장치 및 방법
US8769392B2 (en) * 2010-05-26 2014-07-01 Content Catalyst Limited Searching and selecting content from multiple source documents having a plurality of native formats, indexing and aggregating the selected content into customized reports
US8843814B2 (en) * 2010-05-26 2014-09-23 Content Catalyst Limited Automated report service tracking system and method
US20110296376A1 (en) * 2010-05-26 2011-12-01 Sybase, Inc. Dynamically Injecting Behaviors Into Flex View Components
US9298818B1 (en) * 2010-05-28 2016-03-29 Sri International Method and apparatus for performing semantic-based data analysis
US8266551B2 (en) * 2010-06-10 2012-09-11 Nokia Corporation Method and apparatus for binding user interface elements and granular reflective processing
US9235806B2 (en) 2010-06-22 2016-01-12 Primal Fusion Inc. Methods and devices for customizing knowledge representation systems
US10474647B2 (en) 2010-06-22 2019-11-12 Primal Fusion Inc. Methods and devices for customizing knowledge representation systems
US8516016B2 (en) 2010-07-07 2013-08-20 Johnson Controls Technology Company Systems and methods for facilitating communication between a plurality of building automation subsystems
US8682921B2 (en) 2010-07-07 2014-03-25 Johnson Controls Technology Company Query engine for building management systems
US20120016661A1 (en) * 2010-07-19 2012-01-19 Eyal Pinkas System, method and device for intelligent textual conversation system
US8799177B1 (en) * 2010-07-29 2014-08-05 Intuit Inc. Method and apparatus for building small business graph from electronic business data
US8667421B2 (en) 2010-08-03 2014-03-04 Aaron Grunberger Method and system for revisiting prior navigated pages and prior edits
US8589789B2 (en) 2010-08-03 2013-11-19 Aaron Grunberger Method and system for revisiting prior navigated pages and prior edits
US9208223B1 (en) * 2010-08-17 2015-12-08 Semantifi, Inc. Method and apparatus for indexing and querying knowledge models
US9275001B1 (en) 2010-12-01 2016-03-01 Google Inc. Updating personal content streams based on feedback
JP5671983B2 (ja) * 2010-12-02 2015-02-18 株式会社リコー 情報処理装置、機器管理システム、情報処理方法、及び情報処理プログラム
WO2012071656A1 (en) * 2010-12-03 2012-06-07 Titus Inc. Method and system of hierarchical metadata management and application
US9189566B2 (en) 2010-12-07 2015-11-17 Sap Se Facilitating extraction and discovery of enterprise services
US9928296B2 (en) * 2010-12-16 2018-03-27 Microsoft Technology Licensing, Llc Search lexicon expansion
US9589053B1 (en) * 2010-12-17 2017-03-07 The Boeing Company Method and apparatus for constructing a query based upon concepts associated with one or more search terms
US11294977B2 (en) 2011-06-20 2022-04-05 Primal Fusion Inc. Techniques for presenting content to a user based on the user's preferences
US9418150B2 (en) 2011-01-11 2016-08-16 Intelligent Medical Objects, Inc. System and process for concept tagging and content retrieval
US8543911B2 (en) 2011-01-18 2013-09-24 Apple Inc. Ordering document content based on reading flow
US9557891B2 (en) * 2011-02-04 2017-01-31 Rakuten, Inc. Information supply device
US8898163B2 (en) * 2011-02-11 2014-11-25 International Business Machines Corporation Real-time information mining
US9558267B2 (en) 2011-02-11 2017-01-31 International Business Machines Corporation Real-time data mining
US8533142B2 (en) * 2011-02-22 2013-09-10 Siemens Product Lifecycle Management Software Inc. Product lifecycle management system using partial solve
US8630860B1 (en) * 2011-03-03 2014-01-14 Nuance Communications, Inc. Speaker and call characteristic sensitive open voice search
US9183294B2 (en) * 2011-04-08 2015-11-10 Siemens Aktiengesellschaft Meta-data approach to querying multiple biomedical ontologies
US9904726B2 (en) 2011-05-04 2018-02-27 Black Hills IP Holdings, LLC. Apparatus and method for automated and assisted patent claim mapping and expense planning
US8930959B2 (en) 2011-05-13 2015-01-06 Orions Digital Systems, Inc. Generating event definitions based on spatial and relational relationships
US9003318B2 (en) * 2011-05-26 2015-04-07 Linden Research, Inc. Method and apparatus for providing graphical interfaces for declarative specifications
US20120324367A1 (en) 2011-06-20 2012-12-20 Primal Fusion Inc. System and method for obtaining preferences with a user interface
US9262527B2 (en) * 2011-06-22 2016-02-16 New Jersey Institute Of Technology Optimized ontology based internet search systems and methods
US9400835B2 (en) * 2011-07-28 2016-07-26 Nokia Technologies Oy Weighting metric for visual search of entity-relationship databases
US20130046894A1 (en) * 2011-08-18 2013-02-21 Sap Ag Model-driven rest consumption framework
US9183279B2 (en) 2011-09-22 2015-11-10 International Business Machines Corporation Semantic questioning mechanism to enable analysis of information architectures
US9069846B2 (en) * 2011-09-29 2015-06-30 International Business Machines Corporation Business content hierarchy
US20130086080A1 (en) 2011-10-03 2013-04-04 Steven W. Lundberg System and method for information disclosure statement management and prior art cross-citation control
US9940363B2 (en) 2011-10-03 2018-04-10 Black Hills Ip Holdings, Llc Systems, methods and user interfaces in a patent management system
US9069844B2 (en) * 2011-11-02 2015-06-30 Sap Se Facilitating extraction and discovery of enterprise services
US8996989B2 (en) * 2011-11-10 2015-03-31 Seereason Partners, Llc Collaborative first order logic system with dynamic ontology
US9479568B2 (en) 2011-12-28 2016-10-25 Nokia Technologies Oy Application switcher
US8996729B2 (en) 2012-04-12 2015-03-31 Nokia Corporation Method and apparatus for synchronizing tasks performed by multiple devices
US9836177B2 (en) 2011-12-30 2017-12-05 Next IT Innovation Labs, LLC Providing variable responses in a virtual-assistant environment
US8577824B2 (en) * 2012-01-10 2013-11-05 Siemens Aktiengesellschaft Method and a programmable device for calculating at least one relationship metric of a relationship between objects
US9037590B2 (en) * 2012-01-23 2015-05-19 Formcept Technologies and Solutions Pvt Ltd Advanced summarization based on intents
EP2639792A1 (en) * 2012-03-16 2013-09-18 France Télécom Voice control of applications by associating user input with action-context idendifier pairs
US8747115B2 (en) 2012-03-28 2014-06-10 International Business Machines Corporation Building an ontology by transforming complex triples
US9177289B2 (en) 2012-05-03 2015-11-03 Sap Se Enhancing enterprise service design knowledge using ontology-based clustering
US9336187B2 (en) * 2012-05-14 2016-05-10 The Boeing Company Mediation computing device and associated method for generating semantic tags
US8577671B1 (en) * 2012-07-20 2013-11-05 Veveo, Inc. Method of and system for using conversation state information in a conversational interaction system
US9465833B2 (en) 2012-07-31 2016-10-11 Veveo, Inc. Disambiguating user intent in conversational interaction system for large corpus information retrieval
US20140046653A1 (en) * 2012-08-10 2014-02-13 Xurmo Technologies Pvt. Ltd. Method and system for building entity hierarchy from big data
US8539001B1 (en) 2012-08-20 2013-09-17 International Business Machines Corporation Determining the value of an association between ontologies
US9420121B2 (en) * 2012-09-28 2016-08-16 Interactive Memories Inc. Method for tracking theme-based digital assets for clients engaged in image-based project creation through an electronic interface
US8972389B2 (en) * 2012-10-16 2015-03-03 International Business Machines Corporation Use of ontology to find a category of a selected keyword in a webpage
US20140136295A1 (en) 2012-11-13 2014-05-15 Apptio, Inc. Dynamic recommendations taken over time for reservations of information technology resources
US8996555B2 (en) * 2012-11-26 2015-03-31 Sap Se Question answering framework for structured query languages
US20140165002A1 (en) * 2012-12-10 2014-06-12 Kyle Wade Grove Method and system using natural language processing for multimodal voice configurable input menu elements
US10013481B2 (en) 2013-01-02 2018-07-03 Research Now Group, Inc. Using a graph database to match entities by evaluating boolean expressions
US9390195B2 (en) * 2013-01-02 2016-07-12 Research Now Group, Inc. Using a graph database to match entities by evaluating boolean expressions
US9710568B2 (en) * 2013-01-29 2017-07-18 Oracle International Corporation Publishing RDF quads as relational views
US9355166B2 (en) 2013-01-31 2016-05-31 Hewlett Packard Enterprise Development Lp Clustering signifiers in a semantics graph
US8914416B2 (en) 2013-01-31 2014-12-16 Hewlett-Packard Development Company, L.P. Semantics graphs for enterprise communication networks
US9704136B2 (en) 2013-01-31 2017-07-11 Hewlett Packard Enterprise Development Lp Identifying subsets of signifiers to analyze
US9672822B2 (en) 2013-02-22 2017-06-06 Next It Corporation Interaction with a portion of a content item through a virtual assistant
US9972030B2 (en) 2013-03-11 2018-05-15 Criteo S.A. Systems and methods for the semantic modeling of advertising creatives in targeted search advertising campaigns
US20140278985A1 (en) * 2013-03-13 2014-09-18 DataPop, Inc. Systems and methods for the enhancement of semantic models utilizing unstructured data
US20140310190A1 (en) 2013-03-14 2014-10-16 Worldone, Inc. System and method for concept discovery with online information environments
US9262550B2 (en) * 2013-03-15 2016-02-16 Business Objects Software Ltd. Processing semi-structured data
US9158532B2 (en) * 2013-03-15 2015-10-13 Ptc Inc. Methods for managing applications using semantic modeling and tagging and devices thereof
US9299041B2 (en) 2013-03-15 2016-03-29 Business Objects Software Ltd. Obtaining data from unstructured data for a structured data collection
US10157175B2 (en) 2013-03-15 2018-12-18 International Business Machines Corporation Business intelligence data models with concept identification using language-specific clues
US10152538B2 (en) 2013-05-06 2018-12-11 Dropbox, Inc. Suggested search based on a content item
WO2014182771A1 (en) 2013-05-07 2014-11-13 Veveo, Inc. Incremental speech input interface with real time feedback
US20140337305A1 (en) * 2013-05-13 2014-11-13 TollShare, Inc. Geographic coordinates based content search
US9378250B2 (en) * 2013-05-13 2016-06-28 Xerox Corporation Systems and methods of data analytics
US9298778B2 (en) * 2013-05-14 2016-03-29 Google Inc. Presenting related content in a stream of content
JP6184167B2 (ja) * 2013-05-21 2017-08-23 株式会社東芝 データ処理装置、方法およびプログラム
US10223637B1 (en) 2013-05-30 2019-03-05 Google Llc Predicting accuracy of submitted data
US10642928B2 (en) * 2013-06-03 2020-05-05 International Business Machines Corporation Annotation collision detection in a question and answer system
US9633317B2 (en) * 2013-06-20 2017-04-25 Viv Labs, Inc. Dynamically evolving cognitive architecture system based on a natural language intent interpreter
US10083009B2 (en) * 2013-06-20 2018-09-25 Viv Labs, Inc. Dynamically evolving cognitive architecture system planning
US9594542B2 (en) * 2013-06-20 2017-03-14 Viv Labs, Inc. Dynamically evolving cognitive architecture system based on training by third-party developers
US10474961B2 (en) 2013-06-20 2019-11-12 Viv Labs, Inc. Dynamically evolving cognitive architecture system based on prompting for additional user input
US10417591B2 (en) 2013-07-03 2019-09-17 Apptio, Inc. Recursive processing of object allocation rules
US9276855B1 (en) 2013-07-16 2016-03-01 Google Inc. Systems and methods for providing navigation filters
US9454585B2 (en) * 2013-08-09 2016-09-27 Openlane, Inc. Searching multiple data sources
US20150081701A1 (en) * 2013-09-16 2015-03-19 Metanautix, Inc. Systems and methods for data flow exploration
US10325232B2 (en) 2013-09-20 2019-06-18 Apptio, Inc. Allocating heritage information in data models
US10146865B2 (en) * 2013-10-04 2018-12-04 Orions Digital Systems, Inc. Tagonomy—a system and method of semantic web tagging
US9342501B2 (en) * 2013-10-30 2016-05-17 Lenovo (Singapore) Pte. Ltd. Preserving emotion of user input
US10078689B2 (en) * 2013-10-31 2018-09-18 Verint Systems Ltd. Labeling/naming of themes
US11048736B2 (en) * 2013-12-05 2021-06-29 Lenovo (Singapore) Pte. Ltd. Filtering search results using smart tags
IN2013CH06086A (zh) * 2013-12-26 2015-07-03 Infosys Ltd
US20150186808A1 (en) * 2013-12-27 2015-07-02 International Business Machines Corporation Contextual data analysis using domain information
US9378276B1 (en) * 2014-01-03 2016-06-28 Google Inc. Systems and methods for generating navigation filters
US9836503B2 (en) 2014-01-21 2017-12-05 Oracle International Corporation Integrating linked data with relational data
US11244364B2 (en) 2014-02-13 2022-02-08 Apptio, Inc. Unified modeling of technology towers
US9495478B2 (en) * 2014-03-31 2016-11-15 Amazon Technologies, Inc. Namespace management in distributed storage systems
US9779015B1 (en) 2014-03-31 2017-10-03 Amazon Technologies, Inc. Oversubscribed storage extents with on-demand page allocation
US9772787B2 (en) 2014-03-31 2017-09-26 Amazon Technologies, Inc. File storage using variable stripe sizes
US10372685B2 (en) 2014-03-31 2019-08-06 Amazon Technologies, Inc. Scalable file storage service
US10264071B2 (en) 2014-03-31 2019-04-16 Amazon Technologies, Inc. Session management in distributed storage systems
US9984067B2 (en) 2014-04-18 2018-05-29 Thomas A. Visel Automated comprehension of natural language via constraint-based processing
US9483457B2 (en) * 2014-04-28 2016-11-01 International Business Machines Corporation Method for logical organization of worksheets
US10990629B2 (en) * 2014-05-05 2021-04-27 Aveva Software, Llc Storing and identifying metadata through extended properties in a historization system
US20150319227A1 (en) 2014-05-05 2015-11-05 Invensys Systems, Inc. Distributed historization system
US10698924B2 (en) 2014-05-22 2020-06-30 International Business Machines Corporation Generating partitioned hierarchical groups based on data sets for business intelligence data models
US10346358B2 (en) * 2014-06-04 2019-07-09 Waterline Data Science, Inc. Systems and methods for management of data platforms
US10311206B2 (en) 2014-06-19 2019-06-04 International Business Machines Corporation Electronic medical record summary and presentation
US11379781B2 (en) * 2014-06-27 2022-07-05 o9 Solutions, Inc. Unstructured data processing in plan modeling
US10614400B2 (en) 2014-06-27 2020-04-07 o9 Solutions, Inc. Plan modeling and user feedback
US10176236B2 (en) 2014-07-29 2019-01-08 Microsoft Technology Licensing, Llc Systems and methods for a distributed query execution engine
US10169433B2 (en) 2014-07-29 2019-01-01 Microsoft Technology Licensing, Llc Systems and methods for an SQL-driven distributed operating system
US10437843B2 (en) 2014-07-29 2019-10-08 Microsoft Technology Licensing, Llc Optimization of database queries via transformations of computation graph
CN105446952B (zh) * 2014-08-20 2019-03-19 国际商业机器公司 用于处理语义片段的方法和系统
US11551567B2 (en) * 2014-08-28 2023-01-10 Ideaphora India Private Limited System and method for providing an interactive visual learning environment for creation, presentation, sharing, organizing and analysis of knowledge on subject matter
US20180366013A1 (en) * 2014-08-28 2018-12-20 Ideaphora India Private Limited System and method for providing an interactive visual learning environment for creation, presentation, sharing, organizing and analysis of knowledge on subject matter
GB2530499A (en) * 2014-09-23 2016-03-30 Ibm Rest resource collection management
CN104408639A (zh) * 2014-10-22 2015-03-11 百度在线网络技术(北京)有限公司 多轮会话交互方法和系统
US10540347B2 (en) * 2014-10-27 2020-01-21 Nuance Communications, Inc. Contextual search disambiguation
US10042928B1 (en) * 2014-12-03 2018-08-07 The Government Of The United States As Represented By The Director, National Security Agency System and method for automated reasoning with and searching of documents
GB2533326A (en) * 2014-12-16 2016-06-22 Ibm Electronic message redacting
US10362133B1 (en) * 2014-12-22 2019-07-23 Palantir Technologies Inc. Communication data processing architecture
US9852136B2 (en) 2014-12-23 2017-12-26 Rovi Guides, Inc. Systems and methods for determining whether a negation statement applies to a current or past query
US10095689B2 (en) * 2014-12-29 2018-10-09 International Business Machines Corporation Automated ontology building
US10002179B2 (en) 2015-01-30 2018-06-19 International Business Machines Corporation Detection and creation of appropriate row concept during automated model generation
US9854049B2 (en) 2015-01-30 2017-12-26 Rovi Guides, Inc. Systems and methods for resolving ambiguous terms in social chatter based on a user profile
CN104573094B (zh) * 2015-01-30 2018-05-29 深圳市华傲数据技术有限公司 网络账号识别匹配方法
RU2596599C2 (ru) * 2015-02-03 2016-09-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Система и способ создания и использования пользовательских онтологических моделей для обработки пользовательского текста на естественном языке
JP6643807B2 (ja) * 2015-03-09 2020-02-12 キヤノン株式会社 文書管理クライアント装置、文書管理方法
WO2016145480A1 (en) * 2015-03-19 2016-09-22 Semantic Technologies Pty Ltd Semantic knowledge base
US10885148B2 (en) 2015-03-24 2021-01-05 Intelligent Medical Objects, Inc. System and method for medical classification code modeling
US20160350885A1 (en) * 2015-05-27 2016-12-01 Ascent Technologies Inc. System and methods for generating modularized and taxonomy-based classification of regulatory obligations
EP3101534A1 (en) * 2015-06-01 2016-12-07 Siemens Aktiengesellschaft Method and computer program product for semantically representing a system of devices
WO2017003496A1 (en) 2015-06-30 2017-01-05 Apptio, Inc. Infrastructure benchmarking based on dynamic cost modeling
US10402435B2 (en) * 2015-06-30 2019-09-03 Microsoft Technology Licensing, Llc Utilizing semantic hierarchies to process free-form text
US9984116B2 (en) 2015-08-28 2018-05-29 International Business Machines Corporation Automated management of natural language queries in enterprise business intelligence analytics
US11301502B1 (en) * 2015-09-15 2022-04-12 Google Llc Parsing natural language queries without retraining
WO2017053901A1 (en) * 2015-09-23 2017-03-30 ValueCorp Pacific, Incorporated Systems and methods for automatic distillation of concepts from math problems and dynamic construction and testing of math problems from a collection of math concepts
US10268979B2 (en) 2015-09-28 2019-04-23 Apptio, Inc. Intermediate resource allocation tracking in data models
US10387815B2 (en) 2015-09-29 2019-08-20 Apptio, Inc. Continuously variable resolution of resource allocation
US10878010B2 (en) 2015-10-19 2020-12-29 Intelligent Medical Objects, Inc. System and method for clinical trial candidate matching
US10454789B2 (en) * 2015-10-19 2019-10-22 Draios, Inc. Automated service-oriented performance management
US10726367B2 (en) 2015-12-28 2020-07-28 Apptio, Inc. Resource allocation forecasting
CN105591842B (zh) * 2016-01-29 2018-12-21 中国联合网络通信集团有限公司 一种获取移动终端操作系统版本的方法和装置
US10474636B2 (en) 2016-03-25 2019-11-12 Amazon Technologies, Inc. Block allocation for low latency file systems
US10545927B2 (en) 2016-03-25 2020-01-28 Amazon Technologies, Inc. File system mode switching in a distributed storage service
US10140312B2 (en) 2016-03-25 2018-11-27 Amazon Technologies, Inc. Low latency distributed storage service
US10650475B2 (en) * 2016-05-20 2020-05-12 HomeAway.com, Inc. Hierarchical panel presentation responsive to incremental search interface
US11195599B2 (en) * 2016-08-25 2021-12-07 International Business Machines Corporation Determining sources of healthcare expertise related to a condition of the patient
US10474974B2 (en) 2016-09-08 2019-11-12 Apptio, Inc. Reciprocal models for resource allocation
US10936978B2 (en) 2016-09-20 2021-03-02 Apptio, Inc. Models for visualizing resource allocation
WO2018086711A1 (en) * 2016-11-14 2018-05-17 Siemens Aktiengesellschaft A method for composing an application using a plurality of distributed interaction patterns
US10482407B2 (en) 2016-11-14 2019-11-19 Apptio, Inc. Identifying resource allocation discrepancies
US10157356B2 (en) 2016-12-14 2018-12-18 Apptio, Inc. Activity based resource allocation modeling
US10679008B2 (en) * 2016-12-16 2020-06-09 Microsoft Technology Licensing, Llc Knowledge base for analysis of text
US10620910B2 (en) 2016-12-23 2020-04-14 Realwear, Inc. Hands-free navigation of touch-based operating systems
US11507216B2 (en) 2016-12-23 2022-11-22 Realwear, Inc. Customizing user interfaces of binary applications
US10936872B2 (en) 2016-12-23 2021-03-02 Realwear, Inc. Hands-free contextually aware object interaction for wearable display
US11099716B2 (en) 2016-12-23 2021-08-24 Realwear, Inc. Context based content navigation for wearable display
US20180203856A1 (en) * 2017-01-17 2018-07-19 International Business Machines Corporation Enhancing performance of structured lookups using set operations
US10169325B2 (en) 2017-02-09 2019-01-01 International Business Machines Corporation Segmenting and interpreting a document, and relocating document fragments to corresponding sections
US10176889B2 (en) 2017-02-09 2019-01-08 International Business Machines Corporation Segmenting and interpreting a document, and relocating document fragments to corresponding sections
US10740557B1 (en) 2017-02-14 2020-08-11 Casepoint LLC Technology platform for data discovery
US11158012B1 (en) 2017-02-14 2021-10-26 Casepoint LLC Customizing a data discovery user interface based on artificial intelligence
US11275794B1 (en) * 2017-02-14 2022-03-15 Casepoint LLC CaseAssist story designer
US10666593B2 (en) 2017-03-21 2020-05-26 Domo, Inc. Systems and methods for messaging and collaboration
CN107786667A (zh) * 2017-11-08 2018-03-09 八爪鱼在线旅游发展有限公司 一种基于云平台的数据处理方法、系统和设备
US10528664B2 (en) 2017-11-13 2020-01-07 Accenture Global Solutions Limited Preserving and processing ambiguity in natural language
US10552410B2 (en) 2017-11-14 2020-02-04 Mindbridge Analytics Inc. Method and system for presenting a user selectable interface in response to a natural language request
US11308128B2 (en) 2017-12-11 2022-04-19 International Business Machines Corporation Refining classification results based on glossary relationships
US10268980B1 (en) * 2017-12-29 2019-04-23 Apptio, Inc. Report generation based on user responsibility
US10324951B1 (en) 2017-12-29 2019-06-18 Apptio, Inc. Tracking and viewing model changes based on time
US11775552B2 (en) 2017-12-29 2023-10-03 Apptio, Inc. Binding annotations to data objects
US10896357B1 (en) * 2017-12-29 2021-01-19 Automation Anywhere, Inc. Automatic key/value pair extraction from document images using deep learning
EP3732587B1 (en) * 2017-12-29 2023-07-19 Datawalk Spolka Akcyjna Systems and methods for context-independent database search paths
WO2019139595A1 (en) * 2018-01-11 2019-07-18 Visa International Service Association Offline authorization of interactions and controlled tasks
CN110309336B (zh) * 2018-03-12 2023-08-08 腾讯科技(深圳)有限公司 图像检索方法、装置、系统、服务器以及存储介质
US10769427B1 (en) 2018-04-19 2020-09-08 Automation Anywhere, Inc. Detection and definition of virtual objects in remote screens
US11288294B2 (en) * 2018-04-26 2022-03-29 Accenture Global Solutions Limited Natural language processing and artificial intelligence based search system
CN108681812A (zh) * 2018-05-09 2018-10-19 江苏德义通环保科技有限公司 面向差异化环保需求商务供应链协同服务系统及管理方法
US10366361B1 (en) * 2018-05-10 2019-07-30 Definitive Business Solutions, Inc. Systems and methods for performing multi-tier data transfer in a group assessment processing environment
US11194849B2 (en) 2018-09-11 2021-12-07 International Business Machines Corporation Logic-based relationship graph expansion and extraction
CN109710772B (zh) * 2018-11-13 2023-03-31 国云科技股份有限公司 一种基于深度学习的问答库知识管理系统及其实现方法
US10747958B2 (en) * 2018-12-19 2020-08-18 Accenture Global Solutions Limited Dependency graph based natural language processing
US11281864B2 (en) * 2018-12-19 2022-03-22 Accenture Global Solutions Limited Dependency graph based natural language processing
US11423908B2 (en) * 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11176315B2 (en) * 2019-05-15 2021-11-16 Elsevier Inc. Comprehensive in-situ structured document annotations with simultaneous reinforcement and disambiguation
US11176209B2 (en) * 2019-08-06 2021-11-16 International Business Machines Corporation Dynamically augmenting query to search for content not previously known to the user
US11551676B2 (en) * 2019-09-12 2023-01-10 Oracle International Corporation Techniques for dialog processing using contextual data
US11335360B2 (en) 2019-09-21 2022-05-17 Lenovo (Singapore) Pte. Ltd. Techniques to enhance transcript of speech with indications of speaker emotion
US11734349B2 (en) * 2019-10-23 2023-08-22 Chih-Pin TANG Convergence information-tags retrieval method
JP7343820B2 (ja) * 2020-04-10 2023-09-13 日本電信電話株式会社 オントロジを用いた文章データ解析情報生成装置、文章データ解析情報生成方法、および文章データ解析情報生成プログラム
US11605376B1 (en) * 2020-06-26 2023-03-14 Amazon Technologies, Inc. Processing orchestration for systems including machine-learned components
US11468695B2 (en) * 2020-06-26 2022-10-11 Accenture Global Solutions Limited Substance description management based on substance information analysis using machine learning techniques
US11520839B2 (en) 2020-07-06 2022-12-06 International Business Machines Corporation User based network document modification
CN111901160B (zh) * 2020-07-15 2022-09-16 中盈优创资讯科技有限公司 一种梳理网络设备垃圾策略配置的方法及装置
US11089095B1 (en) * 2020-08-21 2021-08-10 Slack Technologies, Inc. Selectively adding users to channels in a group-based communication system
CN112632989B (zh) * 2020-12-29 2023-11-03 中国农业银行股份有限公司 一种合同文本中风险信息的提示方法、装置及设备
US20220312059A1 (en) * 2021-03-26 2022-09-29 Social Labs, LLC Systems and methods for media verification, organization, search, and exchange
CN113128232B (zh) * 2021-05-11 2022-06-21 济南大学 一种基于albert与多重词信息嵌入的命名实体识别方法
US11561978B2 (en) * 2021-06-29 2023-01-24 Commvault Systems, Inc. Intelligent cache management for mounted snapshots based on a behavior model
CN116701609B (zh) * 2023-07-27 2023-09-29 四川邕合科技有限公司 基于深度学习的智能客服问答方法、系统、终端及介质

Family Cites Families (113)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4429385A (en) * 1981-12-31 1984-01-31 American Newspaper Publishers Association Method and apparatus for digital serial scanning with hierarchical and relational access
US5010478A (en) * 1986-04-11 1991-04-23 Deran Roger L Entity-attribute value database system with inverse attribute for selectively relating two different entities
JP2516387Y2 (ja) * 1987-08-19 1996-11-06 三洋電機株式会社 情報ファイル装置
US5025491A (en) * 1988-06-23 1991-06-18 The Mitre Corporation Dynamic address binding in communication networks
US4839853A (en) * 1988-09-15 1989-06-13 Bell Communications Research, Inc. Computer information retrieval using latent semantic structure
US5241671C1 (en) * 1989-10-26 2002-07-02 Encyclopaedia Britannica Educa Multimedia search system using a plurality of entry path means which indicate interrelatedness of information
US5404295A (en) * 1990-08-16 1995-04-04 Katz; Boris Method and apparatus for utilizing annotations to facilitate computer retrieval of database material
US5309359A (en) * 1990-08-16 1994-05-03 Boris Katz Method and apparatus for generating and utlizing annotations to facilitate computer text retrieval
JP2895184B2 (ja) * 1990-08-22 1999-05-24 株式会社日立製作所 文書処理システム及び文書処理方法
IL99946A (en) * 1991-11-03 1995-12-31 Or Gil Computerized Medical Sy Apparatus for determination of auditory threshold to intelligible speech
US5428778A (en) * 1992-02-13 1995-06-27 Office Express Pty. Ltd. Selective dissemination of information
JP3220885B2 (ja) * 1993-06-18 2001-10-22 株式会社日立製作所 キーワード付与システム
US5504914A (en) * 1993-06-23 1996-04-02 National Science Council Multi-level instruction boosting method using plurality of ordinary registers forming plurality of conjugate register pairs that are shadow registers to each other with different only in MSB
JPH0738487A (ja) * 1993-07-16 1995-02-07 Matsushita Electric Ind Co Ltd 無線通信装置
US6044365A (en) * 1993-09-01 2000-03-28 Onkor, Ltd. System for indexing and retrieving graphic and sound data
US5619709A (en) * 1993-09-20 1997-04-08 Hnc, Inc. System and method of context vector generation and retrieval
US5873056A (en) * 1993-10-12 1999-02-16 The Syracuse University Natural language processing system for semantic vector representation which accounts for lexical ambiguity
US5404428A (en) * 1993-12-07 1995-04-04 Sun Microsystems, Inc. Method and system for updating derived items in a view model which includes multiple coordinate systems
US5715444A (en) * 1994-10-14 1998-02-03 Danish; Mohamed Sherif Method and system for executing a guided parametric search
US5752250A (en) * 1994-12-02 1998-05-12 Fujitsu Limited Instance updating method and apparatus therefor
US5995920A (en) * 1994-12-22 1999-11-30 Caterpillar Inc. Computer-based method and system for monolingual document development
US5794050A (en) * 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
JP3282937B2 (ja) * 1995-01-12 2002-05-20 日本アイ・ビー・エム株式会社 情報検索方法及びシステム
US5745776A (en) * 1995-04-19 1998-04-28 Sheppard, Ii; Charles Bradford Enhanced electronic dictionary
US5694523A (en) * 1995-05-31 1997-12-02 Oracle Corporation Content processing system for discourse
GB2302420A (en) * 1995-06-19 1997-01-15 Ibm Semantic network
US6006221A (en) * 1995-08-16 1999-12-21 Syracuse University Multilingual document retrieval system and method using semantic vector matching
US6026388A (en) * 1995-08-16 2000-02-15 Textwise, Llc User interface and other enhancements for natural language information retrieval system and method
US5963940A (en) * 1995-08-16 1999-10-05 Syracuse University Natural language information retrieval system and method
US6067552A (en) * 1995-08-21 2000-05-23 Cnet, Inc. User interface system and method for browsing a hypertext database
US5732384A (en) * 1995-09-08 1998-03-24 Hughes Aircraft Graphical user interface for air traffic control flight data management
US5664740A (en) * 1995-09-29 1997-09-09 Owens-Corning Fiberglas Technology Inc. Raisable platform for apparatus for paying out an insulation support sheet
JPH09218815A (ja) * 1996-01-31 1997-08-19 Toshiba Corp ネットワーク通信機能を持つ情報機器及び同機器における情報アクセス方法
US5899989A (en) * 1996-05-14 1999-05-04 Sharp Kabushiki Kaisha On-demand interface device
JP3099756B2 (ja) * 1996-10-31 2000-10-16 富士ゼロックス株式会社 文書処理装置、単語抽出装置及び単語抽出方法
US5909679A (en) * 1996-11-08 1999-06-01 At&T Corp Knowledge-based moderator for electronic mail help lists
JP3655714B2 (ja) * 1996-11-15 2005-06-02 株式会社ニューズウオッチ 情報フィルタリング装置及び記録媒体
US5907838A (en) * 1996-12-10 1999-05-25 Seiko Epson Corporation Information search and collection method and system
US7146381B1 (en) * 1997-02-10 2006-12-05 Actioneer, Inc. Information organization and collaboration tool for processing notes and action requests in computer systems
US7236969B1 (en) * 1999-07-08 2007-06-26 Nortel Networks Limited Associative search engine
JPH10240220A (ja) * 1997-03-03 1998-09-11 Toshiba Corp 注釈表示機能を持つ情報処理機器
US5940821A (en) * 1997-05-21 1999-08-17 Oracle Corporation Information presentation in a knowledge base search and retrieval system
JP3001460B2 (ja) * 1997-05-21 2000-01-24 株式会社エヌイーシー情報システムズ 文書分類装置
CN1212578C (zh) * 1997-06-04 2005-07-27 盖瑞·L·夏普 用于在计算机系统中创建信息数据库的方法
US5897616A (en) * 1997-06-11 1999-04-27 International Business Machines Corporation Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
US6052515A (en) * 1997-06-27 2000-04-18 Sun Microsystems, Inc. System and process for providing visualization of program code internal state in an object-oriented programming language
US5933822A (en) * 1997-07-22 1999-08-03 Microsoft Corporation Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision
US6029165A (en) * 1997-11-12 2000-02-22 Arthur Andersen Llp Search and retrieval information system and method
GB9726654D0 (en) * 1997-12-17 1998-02-18 British Telecomm Data input and retrieval apparatus
US6173287B1 (en) * 1998-03-11 2001-01-09 Digital Equipment Corporation Technique for ranking multimedia annotations of interest
US6240423B1 (en) * 1998-04-22 2001-05-29 Nec Usa Inc. Method and system for image querying using region based and boundary based image matching
AUPP340798A0 (en) * 1998-05-07 1998-05-28 Canon Kabushiki Kaisha Automated video interpretation system
US6208988B1 (en) * 1998-06-01 2001-03-27 Bigchalk.Com, Inc. Method for identifying themes associated with a search query using metadata and for organizing documents responsive to the search query in accordance with the themes
US6006225A (en) * 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
US6356899B1 (en) * 1998-08-29 2002-03-12 International Business Machines Corporation Method for interactively creating an information database including preferred information elements, such as preferred-authority, world wide web pages
US6308179B1 (en) * 1998-08-31 2001-10-23 Xerox Corporation User level controlled mechanism inter-positioned in a read/write path of a property-based document management system
US6956593B1 (en) * 1998-09-15 2005-10-18 Microsoft Corporation User interface for creating, viewing and temporally positioning annotations for media content
AUPP603798A0 (en) * 1998-09-18 1998-10-15 Canon Kabushiki Kaisha Automated image interpretation and retrieval system
WO2000023863A2 (en) * 1998-10-16 2000-04-27 Computer Associates Think, Inc. Determining differences between two or more metadata models
IT1303603B1 (it) * 1998-12-16 2000-11-14 Giovanni Sacco Procedimento a tassonomia dinamica per il reperimento di informazionisu grandi banche dati eterogenee.
US6704739B2 (en) * 1999-01-04 2004-03-09 Adobe Systems Incorporated Tagging data assets
US6954902B2 (en) * 1999-03-31 2005-10-11 Sony Corporation Information sharing processing method, information sharing processing program storage medium, information sharing processing apparatus, and information sharing processing system
US6233561B1 (en) * 1999-04-12 2001-05-15 Matsushita Electric Industrial Co., Ltd. Method for goal-oriented speech translation in hand-held devices using meaning extraction and dialogue
US6728760B1 (en) * 1999-05-05 2004-04-27 Kent Ridge Digital Labs Optimizing delivery of computer media
US6249784B1 (en) * 1999-05-19 2001-06-19 Nanogen, Inc. System and method for searching and processing databases comprising named annotated text strings
US6711585B1 (en) * 1999-06-15 2004-03-23 Kanisa Inc. System and method for implementing a knowledge management system
US6519586B2 (en) * 1999-08-06 2003-02-11 Compaq Computer Corporation Method and apparatus for automatic construction of faceted terminological feedback for document retrieval
US6519603B1 (en) * 1999-10-28 2003-02-11 International Business Machine Corporation Method and system for organizing an annotation structure and for querying data and annotations
US6782395B2 (en) * 1999-12-03 2004-08-24 Canon Kabushiki Kaisha Method and devices for indexing and seeking digital images taking into account the definition of regions of interest
US6480837B1 (en) * 1999-12-16 2002-11-12 International Business Machines Corporation Method, system, and program for ordering search results using a popularity weighting
US6728692B1 (en) * 1999-12-23 2004-04-27 Hewlett-Packard Company Apparatus for a multi-modal ontology engine
IL145314A0 (en) * 2000-01-14 2002-06-30 Nds Ltd Advertisements in an end-user controlled playback environment
US7031956B1 (en) * 2000-02-16 2006-04-18 Verizon Laboratories Inc. System and method for synchronizing and/or updating an existing relational database with supplemental XML data
US6311194B1 (en) * 2000-03-15 2001-10-30 Taalee, Inc. System and method for creating a semantic web and its applications in browsing, searching, profiling, personalization and advertising
US6792418B1 (en) * 2000-03-29 2004-09-14 International Business Machines Corporation File or database manager systems based on a fractal hierarchical index structure
US20020019827A1 (en) * 2000-06-05 2002-02-14 Shiman Leon G. Method and apparatus for managing documents in a centralized document repository system
US6687696B2 (en) * 2000-07-26 2004-02-03 Recommind Inc. System and method for personalized search, information filtering, and for generating recommendations utilizing statistical latent class models
US6675159B1 (en) * 2000-07-27 2004-01-06 Science Applic Int Corp Concept-based search and retrieval system
US6513059B1 (en) * 2000-08-24 2003-01-28 Cambira Corporation Adaptive collaborative intelligent network system
TW476895B (en) * 2000-11-02 2002-02-21 Semcity Technology Corp Natural language inquiry system and method
US20020150869A1 (en) * 2000-12-18 2002-10-17 Zeev Shpiro Context-responsive spoken language instruction
US6714939B2 (en) * 2001-01-08 2004-03-30 Softface, Inc. Creation of structured data from plain text
US6526440B1 (en) * 2001-01-30 2003-02-25 Google, Inc. Ranking search results by reranking the results based on local inter-connectivity
US7120646B2 (en) * 2001-04-09 2006-10-10 Health Language, Inc. Method and system for interfacing with a multi-level data structure
US6975595B2 (en) * 2001-04-24 2005-12-13 Atttania Ltd. Method and apparatus for monitoring and logging the operation of a distributed processing system
US20020194154A1 (en) * 2001-06-05 2002-12-19 Levy Joshua Lerner Systems, methods and computer program products for integrating biological/chemical databases using aliases
US20020194201A1 (en) * 2001-06-05 2002-12-19 Wilbanks John Thompson Systems, methods and computer program products for integrating biological/chemical databases to create an ontology network
MXPA03011976A (es) * 2001-06-22 2005-07-01 Nervana Inc Sistema y metodo para la recuperacion, manejo, entrega y presentacion de conocimientos.
GB2377046A (en) * 2001-06-29 2002-12-31 Ibm Metadata generation
US7519576B2 (en) * 2001-09-13 2009-04-14 International Business Machines Corporation Integrated user interface mechanism for recursive searching and selecting of items
US20030093551A1 (en) * 2001-10-17 2003-05-15 Graham Taylor Adaptive software interface
US7346606B2 (en) * 2003-06-30 2008-03-18 Google, Inc. Rendering advertisements with documents having one or more topics using user topic interest
US7716161B2 (en) * 2002-09-24 2010-05-11 Google, Inc, Methods and apparatus for serving relevant advertisements
US9235849B2 (en) * 2003-12-31 2016-01-12 Google Inc. Generating user information for use in targeted advertising
US6889309B1 (en) * 2002-04-15 2005-05-03 Emc Corporation Method and apparatus for implementing an enterprise virtual storage system
US7191119B2 (en) * 2002-05-07 2007-03-13 International Business Machines Corporation Integrated development tool for building a natural language understanding application
US7437731B2 (en) * 2002-05-30 2008-10-14 Oracle International Corporation Coordinated collaboration system in an integration platform
AU2003258052A1 (en) * 2002-08-07 2004-02-25 Kryptiq Corporation Semantic qualification and contextualization of electronic messages
JP4336813B2 (ja) * 2002-12-06 2009-09-30 日本電気株式会社 画像記述システムおよび方法
US7702647B2 (en) * 2002-12-23 2010-04-20 International Business Machines Corporation Method and structure for unstructured domain-independent object-oriented information middleware
EP1631924A4 (en) * 2003-05-19 2009-12-30 Business Objects Americas DEVICE AND METHOD FOR ACCESSING VARIOUS NATIVE DATA SOURCES THROUGH A METADATA INTERFACE
US20040267798A1 (en) * 2003-06-20 2004-12-30 International Business Machines Corporation Federated annotation browser
JP2007505386A (ja) * 2003-09-12 2007-03-08 コニンクリユケ フィリップス エレクトロニクス エヌ.ブイ. 一覧のためウェブを検索することによるデータベース構築
US8589373B2 (en) * 2003-09-14 2013-11-19 Yaron Mayer System and method for improved searching on the internet or similar networks and especially improved MetaNews and/or improved automatically generated newspapers
US20060036583A1 (en) * 2004-08-16 2006-02-16 Laust Sondergaard Systems and methods for processing search results
JP2008511057A (ja) * 2004-08-19 2008-04-10 クラリア コーポレイション エンドユーザの情報要求に応答するための方法及び装置
US8255413B2 (en) * 2004-08-19 2012-08-28 Carhamm Ltd., Llc Method and apparatus for responding to request for information-personalization
US7565662B2 (en) * 2004-09-24 2009-07-21 International Business Machines Corporation Program agent initiated processing of enqueued event actions
US20060074980A1 (en) * 2004-09-29 2006-04-06 Sarkar Pte. Ltd. System for semantically disambiguating text information
US20070011155A1 (en) * 2004-09-29 2007-01-11 Sarkar Pte. Ltd. System for communication and collaboration
US7415481B2 (en) * 2004-09-30 2008-08-19 Microsoft Corporation Method and implementation for referencing of dynamic data within spreadsheet formulas
US7562342B2 (en) * 2004-12-02 2009-07-14 International Business Machines Corporation Method and apparatus for incrementally processing program annotations
US7620641B2 (en) * 2004-12-22 2009-11-17 International Business Machines Corporation System and method for context-sensitive decomposition of XML documents based on schemas with reusable element/attribute declarations

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964853A (zh) * 2009-07-24 2011-02-02 村田机械株式会社 网络复合机
CN101867614A (zh) * 2010-06-13 2010-10-20 许祥鸿 一种手机业务数据检索方法
CN102811207A (zh) * 2011-06-02 2012-12-05 腾讯科技(深圳)有限公司 网络信息推送方法及系统
CN102833176A (zh) * 2011-06-13 2012-12-19 腾讯科技(深圳)有限公司 获取信息的方法、装置和系统
WO2013016993A1 (zh) * 2011-08-02 2013-02-07 腾讯科技(深圳)有限公司 一种搜索方法、系统和装置
US9477765B2 (en) 2011-08-02 2016-10-25 Tencent Technology (Shenzhen) Company Limited Search method, system and device
CN104584012A (zh) * 2012-08-28 2015-04-29 微软公司 标识与呈现给用户的实体相关联的用户特定服务
CN104584012B (zh) * 2012-08-28 2018-02-23 微软技术许可有限责任公司 标识与呈现给用户的实体相关联的用户特定服务
CN104969173A (zh) * 2012-10-11 2015-10-07 韦韦欧股份有限公司 动态应用过滤运算器作为对话界面一部分的用于自适应对话状态管理的方法
CN108738036A (zh) * 2017-04-14 2018-11-02 广州杰赛科技股份有限公司 移动通信的关键用户提取方法和系统
CN108738036B (zh) * 2017-04-14 2021-06-18 广州杰赛科技股份有限公司 移动通信的关键用户提取方法和系统
CN110633430A (zh) * 2018-05-31 2019-12-31 北京百度网讯科技有限公司 事件发现方法、装置、设备和计算机可读存储介质

Also Published As

Publication number Publication date
WO2006036128A1 (en) 2006-04-06
US20080104032A1 (en) 2008-05-01
US20060074980A1 (en) 2006-04-06
WO2006036127A1 (en) 2006-04-06

Similar Documents

Publication Publication Date Title
CN101317173A (zh) 用于通信和合作的系统
US8688673B2 (en) System for communication and collaboration
US20210011919A1 (en) Search system and methods with integration of user annotations from a trust network
US20070011155A1 (en) System for communication and collaboration
JP5395014B2 (ja) 信頼性ネットワークからのユーザ注釈を一体化したサーチシステム及び方法
US9189479B2 (en) Semantic web portal and platform
US7761436B2 (en) Apparatus and method for controlling content access based on shared annotations for annotated users in a folksonomy scheme
CN101520784B (zh) 信息发布系统和信息发布方法
US10110544B2 (en) Method and system for classifying a question
US20070106627A1 (en) Social discovery systems and methods
US20080005064A1 (en) Apparatus and method for content annotation and conditional annotation retrieval in a search context
US20140143250A1 (en) Centralized Tracking of User Interest Information from Distributed Information Sources
US20040204958A1 (en) Electronic registration manager for business directory information
US20080183680A1 (en) Documents searching on peer-to-peer computer systems
US11216735B2 (en) Method and system for providing synthetic answers to a personal question
Flesca et al. Mining user preferences, page content and usage to personalize website navigation
JP2009510598A (ja) コミュニケーション及びコラボレーションのためのシステム
EP1929410B1 (en) A method and system for searching for people or items by keywords
US20160077727A1 (en) Online Protocol Community
Almarri Semantic Selection of Internet Sources through SWRL Enabled OWL Ontologies
Oh Network analysis of shared interests represented by social bookmarking behaviors
WO2000070807A2 (en) A method and system for user communication through internet notes
El-Arini Concept Modeling and Personalization for Combating Information Overload
Zheng Intents-based Service Discovery and Integration
Mao Epistemology-based social search for exploratory information seeking

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20081203