CN100390776C - 集群计算机系统中的组访问专用化的方法、设备和系统 - Google Patents

集群计算机系统中的组访问专用化的方法、设备和系统 Download PDF

Info

Publication number
CN100390776C
CN100390776C CNB018230733A CN01823073A CN100390776C CN 100390776 C CN100390776 C CN 100390776C CN B018230733 A CNB018230733 A CN B018230733A CN 01823073 A CN01823073 A CN 01823073A CN 100390776 C CN100390776 C CN 100390776C
Authority
CN
China
Prior art keywords
group
cluster
node
access
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB018230733A
Other languages
English (en)
Other versions
CN1494693A (zh
Inventor
罗伯特·米勒
维基·L.·莫利
劳丽·A.·威廉斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1494693A publication Critical patent/CN1494693A/zh
Application granted granted Critical
Publication of CN100390776C publication Critical patent/CN100390776C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/10Network architectures or network communication protocols for network security for controlling access to devices or network resources
    • H04L63/104Grouping of entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/505Clust

Abstract

访问集群计算机系统中的组的方法,其中集群计算机系统包含多个节点,组包含分别驻留在多个节点上的多个成员,该方法包括:(a)在多个节点中的第一节点上接收访问请求,其中访问请求标识与组相关的集群专用组名;和(b)在第一节点上处理访问请求,以在映射到集群专用组名的多个节点的至少一个子集上启动组操作。

Description

集群计算机系统中的组访问专用化的方法、设备和系统
技术领域
本发明通常涉及集群计算机系统,尤其涉及管理对驻留在这种系统上的组的访问。
背景技术
″集群″通常指计算机系统组织,其中把多个计算机或节点联网在一起以便共同执行计算机任务。计算机集群的一个重要方面是集群中的所有节点呈现为单系统映象,即从用户角度来看,集群中的节点共同表现为单个计算机或实体。
集群经常被用于比较大型的涉及高性能和可靠性的多用户计算机系统。例如,集群可以用于提供冗余或容错,以便当集群中任意节点失败时,该节点先前执行的操作会被集群中其它节点处理。集群还被用于提高总体性能,因为多个节点通常可以并行处理大量任务,而单个计算机则不能。通常,负载均衡也被用于保证公平地在节点间分配任务,以便防止单个节点超载,并且因此使总体系统性能最高。例如,集群的一个具体应用是提供对诸如数据库或存储设备的共享资源的多用户访问,因为多个节点可以处理相对较大数量的用户访问请求,并且即使集群中任意指定节点出现故障,用户通常仍可使用共享资源。
集群通常通过执行各个节点内的“作业”或“进程”来处理计算任务。在某些情况下,由不同节点执行的作业互相配合以处理计算机任务。这种协同作业通常能够彼此通信,并且在集群中通常使用被称为“组”的逻辑实体进行管理。通常向组分配某种形式的标识,并且组内的各个作业被标记该标识,以指示其组内成员资格。
组内的成员作业通常使用基于定序消息的方案彼此通信,其中保持组成员之间发送的消息的特定顺序,使得所有成员按照与每个其它成员相同的顺序看到由其它成员发送的消息,因而保证节点之间的同步。针对组成员执行的操作的要求通常被称作“协议”,并且通常通过使用一或多个协议,使得组成员共同执行任务。
虽然组内成员作业使用定序消息彼此通信以便共同执行任务,但是集群计算机系统通常还需支持组外实体,以便向组发送请求以执行不同的组操作。通常,通过向组分配特定的网络地址(例如,TCP/IP地址)来支持组外访问(external access to a group),使得希望访问组的外部实体可以向该特定地址发送请求。该技术有时被称作N+1寻址,其中N个地址被分配给组内的N个节点,加上一个用于组本身的附加地址。
就象其它传统网络寻址协议一样,通常在传统集群计算机系统中提供名字服务(name service)以把组的网络地址映射到“组名”。名字通常可以是任意形式的针对可通过网络访问的具体实体的速记标识或别名。使用名字代替直接地址访问网络实体的优点是,由于分配给实体的网络地址可以随时间发生改变,即使名字映射被修改,仍可以始终通过名字访问实体。
在传统集群计算机系统中,通常通过访问诸如驻留在网上的目录名称服务(DNS)服务器的网络名称服务器,获得网络实体的地址(包含集群节点或组的地址)。于是,如果一个实体期望访问网络上的另一个实体,访问方实体通常通过网络名称服务器解析被访问实体的名称,并且接着向服务器返回的网络地址发送消息。于是,在进行组外访问的情况下,希望向该组发送请求的实体通过网络名称服务器解析组名,并且向服务器返回的组地址发送消息。
在访问组时使用外部名字服务器的方式存在若干问题。首先,存在一个重要问题,其中集群的外部节点或其它实体可能向一个组发送会干扰该组的操作的消息。尤其在存在由病毒、特洛伊木马和其它恶意程序导致的安全风险的情况下,再加上互联网的普及应用,简单地通过访问与一个组相关的网络地址来访问该组的能力为集群计算机系统带来较大的安全风险。
其次,在许多情况下,可能期望在指定集群计算机系统或网络中,例如在逻辑分区系统中实现多个集群,或集群“实例”,其中多个集群实例可以在不同的逻辑计算机系统中并行执行,而所述逻辑计算机系统在相同的物理系统上执行。然而如果存在多个集群,存在相同组名不能存在于每个集群内的限制,因为通常使用不能将一组名解析成不同网络地址的公共名字服务器。通常,通过要求针对各个集群的单独专用局域网(LAN),并且禁止任何集群横跨子网,集群可以避免这种问题。然而,通常期望在广泛的网络拓扑中实现集群计算机系统,包含节点可以远距离彼此互连的地理分布(geographically-disbursed)实现,以及节点通过诸如互联网的公共网络耦合的实现。因此,在许多情况下不期望把集群限于专用LAN。
因此,本领域非常需要支持对驻留在集群计算机系统中的组的外部访问的方式,尤其是支持对组的外部访问、能够将访问仅限于授权实体的机构。
发明内容
本发明提供了一种访问集群计算机系统中的组的方法,其中集群计算机系统包含多个节点,组包含分别驻留在多个节点上的多个成员,该方法包括:(a)在多个节点中的第一节点上接收访问请求,其中访问请求标识与组相关的集群专用组名;和(b)在第一节点上处理访问请求,以在映射到集群专用组名的多个节点的至少一个子集上启动组操作。
本发明还提供了一种可被集群计算机系统中多个节点的第一节点访问的设备,包括:接收器,接收标志与组相关的集群专用组名的访问请求,处理器,处理所述访问请求,其特征在于,所述处理器在映射到集群专用组名的多个节点的至少一个子集上启动组操作,从而访问该组,其中该组包含分别驻留在多个节点上的多个成员。
本发明还提供了一种集群计算机系统,包括:(a)多个节点,通过网络彼此连接;(b)组,包含分别驻留在多个节点上的多个成员;和(c)设置在多个节点中的第一节点上的装置,所述装置被构造成,通过接收标志与组相关的集群专用组名的访问请求,并且处理访问请求以便在映射到集群专用组名的多个节点的至少一个子集上启动组操作,从而访问该组。
通过提供根据集群专用组名访问驻留于集群计算机系统中的组的设备,集群计算机系统,产品和方法,本发明解决了这些和其它与现有技术相关的问题。换言之,对于集群可访问的组,所有能够参与集群的节点被配置成映射到该组的相同集群专用组名,使得任何访问该集群的外部用户可以访问组名,并且使用组名启动该组的操作。相反,通常限制未经授权的用户(例如,在未经授权的节点上的用户)访问组名或使用该组名向集群发出请求,并且因此限制其访问该组。
在本发明的实施例中,通过使用仅可在参与集群的节点上访问的组地址数据结构,可以有效地对集群外部的节点或用户″隐藏″集群专用组名到组成员地址的映射(例如,组成员所驻留的节点的网络地址)。另外,本发明的实施例通常在各个节点本地解析组名到组成员地址的映射,因而不需要外部名字服务器或其它集中资源。
通常,各个节点上的集群基础设施被用于驻留和使用名字-地址映射,使得可以在集群中不同节点的集群基础设施内和之间内部处理组访问请求。同样地,通常只有那些访问节点上的集群基础设施的实体(通常为驻留在相同节点上的实体),以及访问合适组名以传递到集群基础设施的实体,才被允许访问特定的组。
因此,按照本发明的一个方面,部分地通过在多个节点中的第一节点上接收访问请求,访问集群计算机系统中的组,其中访问请求标识与该组相关的集群专用组名。接着,在第一节点上处理访问请求,以启动映射到集群专用组名的多个节点的至少一个子集上的组操作。
在附加在说明书之后并且构成本申请文件一部分的权利要求书中记载了作为本发明特征的这些和其它优点和特性。然而,为了更好地理解本发明,以及通过其使用所得到的优点和目标,应参考附图,和所附本发明的示例性实施例的描述。
附图说明
图1是引入本发明集群计算机系统的网络计算机系统的模块图。
图2是图1的集群计算机系统中的节点的模块图。
图3是驻留在图2所示节点上的组地址表的模块图。
图4是图解在图1所示集群计算机系统中的节点上,由用户作业启动的组访问操作期间发生的操作序列的流程图。
具体实施方式
这里描述的实施例通常使用集群专用组名访问驻留在集群计算机系统内的组。组名通常可以表示能够与软件实体关联的任意唯一标识符,包含字母数字字符,二进制数,指针,或其它形式的句柄、令牌或指示符的组合。如果不能从参与具体集群或集群“实例”的节点的外部访问组名,则组名是集群专用的。例如,如果组名驻留在参与集群实例的节点上,并且可被该节点上执行的作业访问,即如果组名在节点本地,则组名可以是集群专用的。例如,如果某种形式的认证机构被用来将对组名的访问仅限于能够参与集群的节点和/或作业,则组名也可以是集群专用的。
结合组名发起的组访问请求可以采取若干基于本发明的形式。例如,组访问请求可包括传递给集群基础设施,或作为请求方实体(例如,用户作业)驻留在相同或不同节点上的组成员的消息。可选地,组访问请求可包括针对集群基础设施的功能调用。可选地,也可以使用其它发出请求的方式,例如通过专用网络。
组访问通常具有的形式是启动的组操作,即由一或多个组成员共同或单独执行的操作。实际上,任何能够由软件(尤其是集群组)执行或启动的功能均可在组内实现,并且以这里描述的方式由组访问请求来启动。例如,管理连接到集群计算机系统的一或多个打印机的打印操作的打印服务组可能支持不同的打印操作,例如打印,配置打印机,管理spool或队列,启动或关闭打印机,向指定打印机传送打印作业等等。对于其它类型的组,可以支持其它类型的组操作。此外应当理解,能够代表外部用户启动的操作的类型可能被限于由一个组支持的可能组操作的子集,即某些操作可以是组内操作,并且可从组外访问。
通常,为了支持限制未经授权实体对组操作的访问的能力,所图解的实施例主要使用驻留在各个参与特定集群的节点上的集群基础设施,以保持组名到该组成员和/或该成员所驻留的节点的地址的本地映射。这样,对访问集群基础设施的作业或应用程序有效地隐藏了有关消息如何被分发到组成员,尤其是那些成员的地址的信息。因此,不是通过向特定地址发送请求来启动组内操作,而是请求被发送到集群基础设施,并且由具有层次高于低层网络地址的软件层和协议的集群基础设施管理,其中网络地址在常规方法中通常被用于访问集群组。此外,各个节点,并且通常是各个节点内的集群基础设施,能够本地解析组名-组成员地址映射。因而,通常不需要外部名字服务器。
通过以这里描述的方式使用组名,可实现若干优点。例如,由未经授权的实体进行的组外访问受到很大的限制,因为这种实体不能获得合适组名和/或发出标识组名的请求,并且不能在各个节点内本地解析名字-地址映射。这样,大大增强了集群安全性。
另外,通过使用对于特定集群实例是本地的组名,可以支持相同网络上的多个集群实例使用相同组名而没有冲突,例如在多个集群实例在相同网络上执行的逻辑分区系统中。此外,由集群计算机系统使用的网络拓扑通常与支持组操作的目的无关,因为在各个参与节点的集群基础设施内管理响应授权外部请求的组消息分发。此外,如果需要,这里描述的实施例支持将组访问
仅限于参与集群的节点子集的能力,其中提供了在这些节点内本地管理组名的能力。
再次参照附图,其中在若干视图中,类似号码表示类似部分,图1图解了集群计算机系统100,包含多个节点102(也表示成节点1-8),这些节点以分布式方式,例如通过局域网(LAN)104、106和广域网(WAN)108彼此互连。在图解的实施例中,系统100中的节点子集(例如,节点1-7)共同充当集群110,因而对外部计算设备呈现为单系统映象。其它节点和其它设备也可以驻留在系统100并且被引入系统100中;然而,这些设备可以不参与集群(例如节点8不参与图1所示结构中的集群110),或可以参与除集群110之外的集群。
在集群计算机系统和其它网络计算机系统中一般使用的任意数量的网络拓扑通常可被用于彼此互连本发明的节点102。此外,象本领域众所周知的那样,各个节点102可以物理定位于接近其它节点的位置处,或可以在地理上与其它节点分离。此外,用于互连节点的网络可以是专用或公共性质的网络,或可以包含专用和公共网络的组合。
现在转到图2,其中示出了集群110中一个节点102的示例性硬件结构。例如,节点102通常表示若干多用户计算机中的任意一个,比如网络服务器,中型计算机,大型计算机等等。然而应当理解,本发明可以被实现在其它计算机和数据处理系统中(例如,诸如工作站,台式计算机,便携计算机等等的独立或单用户计算机),或实现在其它可编程电子设备(例如引入嵌入式控制器等等)中。
节点102通常包含通过高速缓存系统16内配置的一或多级高速缓冲存储器连接到主存储器14的一或多个系统处理器12。此外,主存储器14通过系统输入/输出(I/O)总线18和多个接口设备(例如,输入/输出适配器20,工作站控制器22和存储控制器24)连接到若干类型的外部设备,所述接口设备分别提供对一或多个外部网络(例如,网络104),一或多个工作站28,和/或诸如直接存取存储设备(DASD)30的一或多个存储设备的外部访问。在可选实施例中,可使用任意数量的可选计算机体系结构。
为了实现本发明的专用化组访问功能,集群中的各个节点通常包含集群基础设施以管理节点上的集群相关操作。例如,节点102被图解成在主存储器14中驻留操作系统30,所述操作系统30实现被称作集群资源服务32的集群基础设施。还图解了一或多个作业或应用程序34,各个作业或应用程序均访问集群资源服务32内实现的集群功能。此外,节点102被图解为包含用户作业36,其中用户作业36可以是或不是集群组的成员,或访问集群资源服务32内实现的集群功能。
如下所述,此处描述的专用化组访问功能的一个具体应用是用于通过例如组外实体访问集群组,使得不被允许参与集群组的实体可以对该组发出请求。因此,在图解的实施例中,用户作业36通常表示这种外部实体,该外部实体不是被访问的组的成员,而是能够访问由被访问组支持或管理的服务或资源(不管该用户作业是否访问集群服务,并且不管该用户作业是否另一个组的成员)。在其它实施例中,可以结合组内成员间通信来使用这里描述的专用化组访问功能。
在节点102内还实现了集群控制(CTL)作业33,该作业参与集群控制组,以代表节点支持管理集群功能。在图解的实施例中,需要把集群控制作业驻留在每个参与集群的节点上,并且通过集群控制组执行不同的集群管理操作。例如,集群控制作业在各个节点上的存在允许用户作业向相同节点上的集群控制作业提交访问请求,借此,集群控制作业充当“代理”作业传送请求给集群资源服务器以进行处理。然而在其它实施例中,如果用户作业参与集群,或在某些情况下,如果用户作业在集群之外,但是驻留在参与集群的节点上,则允许用户作业直接访问集群资源服务。通常,对集群资源服务的访问构成功能调用,尽管在可选实施例中可以使用其它从作业向集群资源服务提交请求的形式(例如,基于消息的请求等等)。
因此回到图1,具有成员CTL1-CTL7的示例性集群控制组被图解成驻留在节点1-7上,就象在包含能够执行外部用户或作业期望的具体组操作的组成员A1-A7的示例性组A中那样。由作业U1表示一个这样的用户,该作业驻留在参与集群的节点上(节点1),并且因此能够访问与组A相关的组名。相反,图中另一个用户U2驻留在节点8上;然而,由于节点8未参与集群,阻止用户U2访问组A的组名。同样地,在该示例性场景中,限制用户U2启动组A上的组操作。
返回图2,应当理解,这里描述的功能可以在节点102的其它软件层中实现,并且该功能可以分配在集群110的其它程序,计算机或部件中间。因此,本发明不局限于这里描述的具体软件实现。
此后的讨论会集中在用于实现上述专用化组访问功能的具体例程。本发明可以被实现成操作系统的一部分或具体应用程序,部件,装置,程序,对象,模块或指令序列,被执行以实现本发明实施例的例程在此均被称为“计算机程序”,或简单地被称为“程序”。计算机程序通常包括一或多个指令,这些指令不同时间地驻留在计算机的不同存储器和存储设备中,并且当被计算机的一或多个处理器读取和执行时,导致计算机执行实施本发明的各个方面所需的必要步骤。此外,虽然这里在全功能计算机和计算机系统的背景中描述了本发明,然而本领域技术人员会理解,本发明的不同实施例能够被发布成各种形式的程序产品,并且无论实际用于执行发布的信号承载介质的具体类型如何,本发明同样适用。信号承载介质的例子包含但不限于可记录型介质,比如易失和非易失存储器件,软磁盘和其它移动盘,硬盘驱动器,光盘(例如,CD-ROM、DVD等等),和诸如数字和模拟通信链路的传输型介质。
应当理解,根据此后描述的不同程序在本发明具体实施例中的实现所针对的应用来标识所述程序。然而应当理解,以下任何特定程序命名的使用仅为了方便,并且本发明不应局限于单纯用于由该命名标识和/或暗示的任何特定应用。
为了实现专用化组访问,可以使用根据本发明的若干数据结构。例如,如图2所示,组名数据结构38可以被所有驻留在节点上的作业访问,包含驻留在节点上的各个组的组名。在图解的实施例中,组名数据结构被维护成可以由驻留在节点上的任意作业访问的全局数据结构。然而,组名数据结构相对集群通常是专用的。换句话说,不参与集群的任意节点被限制访问组名数据结构,这意味着,任意驻留在该外部节点的作业同样被限制访问组名数据结构。通过要求使用与组相关的组名发出所有针对该组的请求,外部节点和作业被限制向组提交请求。
若干不同数据结构可以被用来实现本发明的组名数据结构38。例如,可用组名表可用于某些实施例中。在其它实施例中,可以使用例如链接表等等的其他数据结构。
此外,在集群的各个节点上可以驻留和管理表格的相同复本。在可选实施例中,可以允许集群中一个节点上的用户作业访问集群中另一个节点上驻留的,或在可被多个节点访问的数据库中的组名数据结构,只要限制未驻留在参与集群的节点上的作业或其它实体对组名数据结构的访问。访问组名数据结构还可能需要认证,其中针对各个组的适当认证信息可以存储在组名数据结构记录的相应记录中。例如访问列表、访问权限等等的附加信息也可以被引入到这种基于本发明的数据结构中。
图2还图解了组地址数据结构40,该数据结构驻留在节点内,并且可被该节点的集群资源服务30访问。如上所述,通常在各个节点的集群基础设施的本地维护组名到成员地址和/或节点的映射,此映射会最终实现期望的组操作,并且同样地,数据结构40通常被维护成仅可由各个节点上的集群资源服务32访问的本地数据结构。
图3图解了数据结构40的一个示例性实现,尽管应当理解,其它数据结构也可以被用来存储这里描述的必要组地址映射。数据结构40通常在节点的集群基础设施的本地,并且在参与集群的不同节点中间被复制。应当理解,可以使用在集群内发布更新和同步各种本地数据结构的方式,例如通过定序消息方法,此方法被用来使各个节点的集群资源服务彼此接口。
数据结构40被图解为表格,包含多个记录,所述记录把组名42映射到一组节点名,其中针对该组的消息应当被导向所述一组节点名。在图解的实现中,节点列表被实现成由与组名42相关的指针44指向的链接表。链接表包含多个节点记录46,每个节点记录均标识一个节点名48,以及指向可以被用来访问节点的网络(例如IP)地址的列表的指针50。每个节点名记录46还包含指向链接表中下一个节点记录46的“下一个”指针52,其中列表中最后节点名记录46的“下一个”指针52中通常存储空值。
IP地址列表充当IP地址到特定节点名的映射,并且包含多个IP地址记录54,各个IP地址记录包含IP地址56和指向链接表中下一个IP记录54的“下一个”指针58。通常在列表中最后记录54的“下一个”指针58中存储空值。
如本领域众所周知的那样,多个IP地址可以与特定节点相关,使得当尝试通过特定IP地址访问节点时出现的故障可以导致使用与节点相关的辅助IP地址。
应当理解,可选数据结构可以被用来存储数据结构40中的信息。此外,在某些实现中,只有一个IP地址可与特定节点相关,其中组名和多个节点之间的映射可以省略节点名信息,并且可以通过映射数据结构中的组名记录直接指向IP地址列表。另外,在某些实现中,组成员而不是节点可以与名字或地址相关,因此,不是将组名映射到节点列表,而是在组名和实际组成员之间提供映射。其它修改对本领域普通技术人员也是显而易见的。
在操作中,通常由驻留在参与集群的节点上的用户作业启动组访问,以请求由驻留于集群的组执行特定组操作。作为例子,图4图解了示例性组访问操作60,其中可以响应由集群110中组的外部授权实体发出的访问请求执行该操作,以启动组操作。在示例性操作中,模块62-70表示在本地节点上执行的操作,其中请求访问组的用户作业驻留在该本地节点上。模块72-76被一或多个远程节点执行,尤其是需要参与请求的组操作的组成员所驻留的各个节点。
如模块62所示,通常,首先通过从本地节点的组名数据结构中找到组名,由用户作业发起组访问请求。如上所述,在图解的实施例中,对于驻留在本地节点上的所有作业,组名数据结构是全局的,但是对未驻留在本地节点上的实体是非公开的。
接着,如模块64所示,用户作业使用组名向该组的本地作业发送请求。在图解的实现中,如上所述,假定每个组在参与集群的每个节点上具有成员。这样,本地组成员可以充当代理作业,以便向驻留在集群计算机系统中其它节点上的组成员传递组访问请求。然而在其它实施例中,本地组成员可能未驻留在本地节点,因而可能需要用户作业发出功能调用,或将访问组的需求通知给本地节点上的集群资源服务。在其它实施例中,本地集群控制作业可以充当代表集群中另一个组的代理作业。
接着如模块66所示,组的本地作业向集群资源服务发出功能调用,以向该组传递访问请求。接着如模块68所示,集群资源服务访问本地节点上的组地址数据结构,以检索出对应于组消息应当分发到的组成员的IP地址列表。接着如模块70所示,集群资源服务使用IP地址列表向各个组成员发送消息。
如模块72所示,在接收所发送消息的各个远程节点上,驻留在远程节点的集群资源服务中的监视任务检测消息的接收。如模块74所示,该任务接着根据与消息相关的组名向适当组成员路由消息。如模块76所示,接着该消息被远程组作业处理,从而所请求的组操作由该组成员启动。应当理解,在模块76之后也可以执行例如应答其它节点,或向用户作业回送结果的附加活动。然而,组作业的消息处理通常根据所请求的特定组操作而有较大的变化。
应当理解,根据本发明,可以使用各个方式在使用集群资源服务的组成员之间发送消息。例如,可以使用由Block等人于1999年3月30日提交的美国专利申请09/280,469,以及由Block等人于1998年10月15日提交的美国专利申请09/173,090中公开的适用通信机构(这里参考引用了所述申请)。在可选实施例中也可以使用其它通信机构。
此外,为了在远端节点上处理消息,各种机构可以被用来检测消息,并向该节点上驻留的组成员传递适当消息。例如,如果各个节点被实现成可从国际商用机器公司得到的AS/400中型计算机系统,各个组成员可以和机器接口(MI)队列和读取该队列的监视作业相关,其中该接口队列与组名相关。队列可以注册在集群资源服务上,以成为组成员。接着,当对组提出请求时,该请求由本地节点发送给MI队列,而监视作业检测消息,读取消息,并且接着根据情况处理消息。在可选实施例中可以使用其它硬件和/或软件实现。
在不偏离本发明的宗旨和范围的前提下,可以进行各种修改。例如在一个实现中,可以要求组在每个节点上具有组成员,即使某些节点不主动参与组内消息传送(即,从组内参与成员的角度来说,这种节点是“被动的”)。其它修改对本领域普通技术人员也是显而易见的。因此,本发明由此后的权利要求限定。
工业实用性
本发明适用于计算系统的管理,尤其适用于管理对驻留在集群计算机系统上的组的访问。

Claims (25)

1.访问集群计算机系统中的组的方法,其中集群计算机系统包含多个节点,组包含分别驻留在多个节点上的多个成员,该方法包括:
(a)在多个节点中的第一节点上接收访问请求,其中访问请求标识与组相关的集群专用组名;和
(b)在第一节点上处理访问请求,以在映射到集群专用组名的多个节点的至少一个子集上启动组操作。
2.如权利要求1所述的方法,还包括利用驻留在第一节点上的用户作业产生访问请求。
3.如权利要求2所述的方法,还包括通过来自用户作业的调用向驻留在第一节点中的集群基础设施传送访问请求。
4.如权利要求1所述的方法,还包括:
(a)利用驻留在多个节点中的第二节点上的用户作业产生访问请求;和
(b)通过把访问请求传送给第一节点,利用驻留在第二节点上的代理作业处理访问请求。
5.如权利要求4所述的方法,其中代理作业是集群控制组的成员,该方法还包括:
(a)从用户作业向代理作业传送访问请求;和
(b)通过来自代理作业的调用,从代理作业向驻留在第二节点中的集群基础设施传送访问请求。
6.如权利要求1所述的方法,还包括通过访问集群专用数据结构,使用用户作业检索集群专用组名。
7.如权利要求6所述的方法,其中集群专用数据结构与用户作业驻留在相同节点上。
8.如权利要求7所述的方法,其中集群专用数据结构只能从集群专用数据结构所驻留的节点访问。
9.如权利要求8所述的方法,其中集群专用数据结构只能由集群专用数据结构所驻留的节点上驻留的作业访问。
10.如权利要求1所述的方法,其中启动组操作包括向驻留在映射到集群专用组名的节点上的多个组成员分发消息。
11.如权利要求10所述的方法,其中启动组操作还包括访问组地址数据结构以检索与集群专用组名相关的多个网络地址,其中分发消息给多个组成员的步骤包含向多个网络地址中的每个地址发送消息。
12.如权利要求1所述的方法,其中启动组操作由驻留在第一节点上的集群基础设施执行。
13.如权利要求12所述的方法,其中启动组操作包含利用集群基础设施在数据结构中检索映射到集群专用组名的多个地址,该数据结构对集群基础设施是本地的。
14.如权利要求1所述的方法,其中启动组操作包含在第一节点上本地解析集群专用组名和与多个节点的至少子集相关的多个地址之间的映射。
15.一种可被集群计算机系统中多个节点的第一节点访问的设备,包括:
接收器,接收标志与组相关的集群专用组名的访问请求,
处理器,处理所述访问请求,
其特征在于,所述处理器在映射到集群专用组名的多个节点的至少一个子集上启动组操作,从而访问该组,其中该组包含分别驻留在多个节点上的多个成员。
16.如权利要求15所述的设备,还包括被构造成产生访问请求的用户作业。
17.如权利要求16所述的设备,还包括驻留在第一节点上的集群基础设施。
18.如权利要求17所述的设备,还包括代理作业,被构造成从用户作业向集群基础设施传送访问请求。
19.如权利要求15所述的设备,还包括:
(a)集群专用数据结构,被构造成存储集群专用组名;和
(b)用户作业,被构造成访问集群专用数据结构以检索集群专用组名,并由此产生访问请求。
20.如权利要求19所述的设备,其中集群专用数据结构与用户作业驻留在相同节点上。
21.如权利要求20所述的设备,其中集群专用数据结构只能从集群专用数据结构所驻留的节点访问。
22.如权利要求15所述的设备,还包括组地址数据结构,被构造成存储与集群专用组名相关的多个网络地址,其中处理器通过访问组地址数据结构以检索多个网络地址,并且向多个网络地址的每个地址发送消息,从而启动组操作。
23.如权利要求22所述的设备,还包括集群基础设施,并且组地址数据结构对集群基础设施是本地的。
24.如权利要求15所述的方法,其中处理器还被构造成,通过在第一节点上本地解析集群专用组名和与多个节点的至少子集相关的多个地址之间的映射,从而处理访问请求。
25.一种集群计算机系统,包括:
(a)多个节点,通过网络彼此连接;
(b)组,包含分别驻留在多个节点上的多个成员;和
(c)设置在多个节点中的第一节点上的装置,所述装置被构造成,通过接收标志与组相关的集群专用组名的访问请求,并且处理访问请求以便在映射到集群专用组名的多个节点的至少一个子集上启动组操作,从而访问该组。
CNB018230733A 2001-04-30 2001-12-11 集群计算机系统中的组访问专用化的方法、设备和系统 Expired - Fee Related CN100390776C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/845,596 US7433957B2 (en) 2001-04-30 2001-04-30 Group access privatization in clustered computer system
US09/845,596 2001-04-30

Publications (2)

Publication Number Publication Date
CN1494693A CN1494693A (zh) 2004-05-05
CN100390776C true CN100390776C (zh) 2008-05-28

Family

ID=25295598

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB018230733A Expired - Fee Related CN100390776C (zh) 2001-04-30 2001-12-11 集群计算机系统中的组访问专用化的方法、设备和系统

Country Status (10)

Country Link
US (2) US7433957B2 (zh)
EP (1) EP1384162A4 (zh)
JP (1) JP3994059B2 (zh)
KR (1) KR100532339B1 (zh)
CN (1) CN100390776C (zh)
CZ (1) CZ20032918A3 (zh)
HU (1) HUP0304044A3 (zh)
PL (1) PL364641A1 (zh)
TW (1) TWI245185B (zh)
WO (1) WO2002088992A1 (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7433957B2 (en) * 2001-04-30 2008-10-07 International Business Machines Corporation Group access privatization in clustered computer system
DE10218905B4 (de) * 2002-04-26 2016-03-17 Intelligent Views Gmbh Verfahren und Datenstruktur zur Zugriffssteuerung in Wissensnetzen
FR2873526A1 (fr) * 2004-07-21 2006-01-27 France Telecom Procede et systeme de gestion de la surcharge d'identite et de la disponibilite privee/publique d'une adresse de messagerie instantanee
US8788311B2 (en) * 2005-04-15 2014-07-22 Fmr Llc Quality control of authoring work flow within a benefits content system
US7631050B2 (en) * 2005-10-27 2009-12-08 International Business Machines Corporation Method for confirming identity of a master node selected to control I/O fabric configuration in a multi-host environment
US7839523B2 (en) * 2005-12-13 2010-11-23 Xerox Corporation System and method for resolving a hardware identifier to a network address of networked device
US7688794B2 (en) * 2005-12-13 2010-03-30 Xerox Corporation System and method for diverting a printing job to a proximal networked device
US8230086B2 (en) * 2007-06-18 2012-07-24 International Business Machines Corporation Hidden group membership in clustered computer system
CN101968646A (zh) * 2010-09-16 2011-02-09 苏州盖娅智能科技有限公司 一种智能集群控制系统及其控制方法
US8195665B1 (en) * 2011-07-29 2012-06-05 Google Inc. Dynamic bitwise sharding of live stream comment groups
US9813491B2 (en) * 2011-10-20 2017-11-07 Oracle International Corporation Highly available network filer with automatic load balancing and performance adjustment
CN103324535B (zh) * 2012-03-23 2017-02-08 百度在线网络技术(北京)有限公司 一种计算资源的分配方法和装置
CN102938705B (zh) * 2012-09-25 2015-03-11 上海证券交易所 一种高可用多机备份路由表管理与切换方法
US10230787B2 (en) * 2016-07-15 2019-03-12 Dell Products L.P. System and method for managing distributed cluster identity
US10333786B2 (en) * 2016-07-15 2019-06-25 Dell Products L.P. System and method for refreshing an information handling system using many to one peer based communication

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5978779A (en) * 1997-11-14 1999-11-02 Merrill Lynch, Pierce, Fenner & Smith Distributed architecture utility

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5079767A (en) 1988-09-27 1992-01-07 Digital Equipment Corporation Method of multicast message distribution
US5371852A (en) 1992-10-14 1994-12-06 International Business Machines Corporation Method and apparatus for making a cluster of computers appear as a single host on a network
EP0598969B1 (en) 1992-11-27 1999-02-10 International Business Machines Corporation Inter-domain multicast routing
US5628005A (en) 1995-06-07 1997-05-06 Microsoft Corporation System and method for providing opportunistic file access in a network environment
US6047323A (en) 1995-10-19 2000-04-04 Hewlett-Packard Company Creation and migration of distributed streams in clusters of networked computers
US5805572A (en) 1995-11-22 1998-09-08 Sun Microsystems, Inc. Single-system image network subsystem in a clustered system
US5835723A (en) 1995-12-28 1998-11-10 Intel Corporation Dynamic assignment of multicast addresses
US5873084A (en) 1996-01-18 1999-02-16 Sun Microsystems, Inc. Database network connectivity product
US5778187A (en) 1996-05-09 1998-07-07 Netcast Communications Corp. Multicasting method and apparatus
US5850396A (en) 1996-06-24 1998-12-15 Gateway 2000, Inc. Multicast message distribution in a polynomial expansion manner
US6061346A (en) * 1997-01-17 2000-05-09 Telefonaktiebolaget Lm Ericsson (Publ) Secure access method, and associated apparatus, for accessing a private IP network
US6470389B1 (en) * 1997-03-14 2002-10-22 Lucent Technologies Inc. Hosting a network service on a cluster of servers using a single-address image
US6014669A (en) 1997-10-01 2000-01-11 Sun Microsystems, Inc. Highly-available distributed cluster configuration database
US6453035B1 (en) * 1998-03-02 2002-09-17 Stentor Resource Centre Inc. Method and apparatus for providing virtual private network services over public switched telephone network
US6243825B1 (en) * 1998-04-17 2001-06-05 Microsoft Corporation Method and system for transparently failing over a computer name in a server cluster
CA2331467A1 (en) 1998-05-12 1999-11-18 Gregory L. Slaughter Highly available cluster virtual disk system
US6332023B1 (en) * 1998-06-04 2001-12-18 Mci Communications Corporation Method of and system for providing services in a communications network
US6868442B1 (en) 1998-07-29 2005-03-15 Unisys Corporation Methods and apparatus for processing administrative requests of a distributed network application executing in a clustered computing environment
US6993034B1 (en) 1998-10-15 2006-01-31 International Business Machines Corporation Cluster destination address table—IP routing for clusters
US6549538B1 (en) * 1998-12-31 2003-04-15 Compaq Information Technologies Group, L.P. Computer method and apparatus for managing network ports cluster-wide using a lookaside list
US6665304B2 (en) * 1998-12-31 2003-12-16 Hewlett-Packard Development Company, L.P. Method and apparatus for providing an integrated cluster alias address
JP2000228674A (ja) 1999-02-04 2000-08-15 Nippon Telegr & Teleph Corp <Ntt> 複数拠点間通信におけるアドレス割り当て方法及び複数拠点間の通信方法並びにその接続装置
US6192417B1 (en) 1999-03-30 2001-02-20 International Business Machines Corporation Multicast cluster servicer for communicating amongst a plurality of nodes without a dedicated local area network
US6535990B1 (en) * 2000-01-10 2003-03-18 Sun Microsystems, Inc. Method and apparatus for providing fault-tolerant addresses for nodes in a clustered system
US6725264B1 (en) * 2000-02-17 2004-04-20 Cisco Technology, Inc. Apparatus and method for redirection of network management messages in a cluster of network devices
US6772226B1 (en) * 2000-08-15 2004-08-03 Avaya Technology Corp. VPN device clustering using a network flow switch and a different mac address for each VPN device in the cluster
US7433957B2 (en) * 2001-04-30 2008-10-07 International Business Machines Corporation Group access privatization in clustered computer system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5978779A (en) * 1997-11-14 1999-11-02 Merrill Lynch, Pierce, Fenner & Smith Distributed architecture utility

Also Published As

Publication number Publication date
JP2004531817A (ja) 2004-10-14
TWI245185B (en) 2005-12-11
EP1384162A4 (en) 2008-01-23
US20020161768A1 (en) 2002-10-31
US7433957B2 (en) 2008-10-07
US20080235333A1 (en) 2008-09-25
CZ20032918A3 (cs) 2004-02-18
HUP0304044A2 (hu) 2004-03-29
WO2002088992A1 (en) 2002-11-07
PL364641A1 (en) 2004-12-13
HUP0304044A3 (en) 2005-09-28
EP1384162A1 (en) 2004-01-28
KR100532339B1 (ko) 2005-11-29
US8078754B2 (en) 2011-12-13
KR20040015083A (ko) 2004-02-18
CN1494693A (zh) 2004-05-05
JP3994059B2 (ja) 2007-10-17

Similar Documents

Publication Publication Date Title
CN100390776C (zh) 集群计算机系统中的组访问专用化的方法、设备和系统
CN101098285B (zh) 获得动态介质访问控制地址的方法和系统
CN101098348B (zh) 动态获取媒体访问控制地址的方法和系统
US6298451B1 (en) Directory-based failure recovery and load balancing system
CN100462947C (zh) 用于实现卸载发起方功能的方法和系统
US6412025B1 (en) Apparatus and method for automatic configuration of a personal computer system when reconnected to a network
US8495131B2 (en) Method, system, and program for managing locks enabling access to a shared resource
US6061713A (en) Communications system for client-server data processing systems
US20050108394A1 (en) Grid-based computing to search a network
CA2231684A1 (en) System and method for multi-site distributed object management environment
CN100489791C (zh) 本地机构分割客户机资源的方法和系统
JPH1027148A (ja) インターネット用サーバシステム
US7797392B2 (en) System and method for efficiently supporting multiple native network protocol implementations in a single system
JPH11175484A (ja) ソフトウェア設定装置及びソフトウェア設定方法及び当該方法を実現するプログラムを記録した記録媒体
US20030012225A1 (en) Network addressing method and system for localizing access to network resources in a computer network
WO2020214757A1 (en) Virtual memory pool within a network which is accessible from multiple platforms
US20040093390A1 (en) Connected memory management
KR20040074972A (ko) 컴퓨터 시스템들의 네트워크에서 작업 부하 조정을 위한방법 및 시스템
US5881227A (en) Use of daemons in a partitioned massively parallel processing system environment
US7672954B2 (en) Method and apparatus for configuring a plurality of server systems into groups that are each separately accessible by client applications
CN112272228A (zh) 分布式注册中心架构
JPH09114722A (ja) 分散システムにおける共有情報管理方法
KR20210103639A (ko) 서버 공유시 사용자정보 암호화 시스템
US7581046B2 (en) Multi-image hardware access system for managing access to computer support systems
WO2002039313A2 (en) A data model for automated server configuration

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080528

Termination date: 20111211