CN1516419A - 在主机计算机网络上处理客户机请求的系统和方法 - Google Patents

在主机计算机网络上处理客户机请求的系统和方法 Download PDF

Info

Publication number
CN1516419A
CN1516419A CNA2003101215642A CN200310121564A CN1516419A CN 1516419 A CN1516419 A CN 1516419A CN A2003101215642 A CNA2003101215642 A CN A2003101215642A CN 200310121564 A CN200310121564 A CN 200310121564A CN 1516419 A CN1516419 A CN 1516419A
Authority
CN
China
Prior art keywords
container
scheduler
array
grid
client requests
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2003101215642A
Other languages
English (en)
Other versions
CN100576841C (zh
Inventor
J・R・H・查林杰
J·R·H·查林杰
咭了
M·诺瓦伊斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1516419A publication Critical patent/CN1516419A/zh
Application granted granted Critical
Publication of CN100576841C publication Critical patent/CN100576841C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals

Abstract

本发明提供在一种在主机计算机网络上处理客户机请求的系统/方法,它包括在主机中创建持久性容器,在容器中创建对象,把容器分组构成网格容器阵列,把单个网格容器阵列内的容器内的各对象分组构成网格对象阵列,为每个网格容器阵列创建一个微调度器,把每个客户机请求分割成多个任务,以及把任务组赋予微处理器,其中微处理器把各个任务赋予对象。当微处理器回送完成后的任务组时,本发明对微调度器赋予其他的任务组。该方法还能包括通过网关向多个网格服务调度器传送客户机请求。

Description

在主机计算机网络上处理 客户机请求的系统和方法
技术领域
一般地说,本发明涉及在计算机网络上处理请求,更具体地说,涉及一种改进的系统,它使用网格(grid)服务调度器把一个客户机请求分解成许多任务。该系统通过一个网格对象阵列中的多个对象来执行这些任务,这些对象处在容器(container)内,这些容器构成一个网格容器阵列,而该网络容器阵列由一个微调度器控制。
背景技术
可以说,网格计算是群集计算的一个逻辑演变。下文中使用Globus工具箱(可从位于美国依利诺斯州芝加哥的Argonne国家实验室得到)作为实现网格体系结构的参考点来考察这种说法。在考虑Globus工具箱时,应该指出这一技术正以很快的速度演变,每次发布都有很明显的不同。特别是Globus 3.0体系结构是一个大的飞跃,这是由于它基于开放网格服务体系结构标准。所以,在讨论Globus时,必须说明确切的发布版本,以设定讨论的上下文。
例如,考虑Globus 2.0实现,它领先于开放网格服务体系结构(OGSA)。在考察Globus 2.0体系结构时,很快便清楚它把网格定义为“群集之群集”。这一复合观点自Globus程序出现便已经表现出来;用于网格计算的老的术语曾是“元计算(meta-computing)”;这是对多群集体系结构的复合性质的一个引用。“群集之群集”观点与Globus程序的初始目的一致,即以单一基础设施统一位于地理上分离的国家实验室的若干群集。当考虑网格的可伸缩性时,这一观点也很有意义。向网格添加各个主机将很快造成一个不可管理的基础设施,而且把主机分组成单独管理的若干组是一个逻辑步骤。“群集之群集”范例提供一个双层的层次结构,它大大简化了对网格的管理。
然而,“群集之群集”范例的两个限制立即显现出来。第一个限制是这一方案是固有的双层结构。就是说,它只能支持双层层次结构,为了支持更深的层次,它必须扩展到原始的框架结构。第二个限制是不存在跨整个网格调度任务的中央设施;就是说,不存在元调度器。每个群集被配置一个群集调度器,它有权调度那个群集中的任务,但很快便清楚,必须有一个网格调度器(或元调度器)用于在整户网格上调度任务。设计这种调度器的主要困难在于,在原始的Globus工具箱(2.0版或更低版本)中在网格世界和群集调度世界之间存在一个间断。特别是,在一个群集内和在各群集之间的任务调度使用不同的调度技术和协议。下面描述的本发明提议一个用于网格和群集两个域的统一的任务调度域,所以它能无缝地支持层次结构很深的网格。
发明内容
本发明提供一种在主机计算机网络上处理客户机请求的方法,它包括在各主机中创建持久的容器,在容器中创建对象,把容器分组构成网格容器阵列,把处在单个网格容器阵列内的那些容器内的对象分组到网格对象阵列中,为每个网格容器阵列创建一个微调度器,把每个客户机请求分解成多个任务,以及把多组任务赋予多个微调度器,这里微调度器把各个任务赋予对象。本发明在微调度器返回已完成任务组时赋予微调度器额外的任务组。该方法还包括通过网关把客户机请求传送到多个网格服务调度器。
本发明还提供处理客户机请求的系统。该系统包括与网格容器阵列连接的网格服务调度器。每个网格容器阵列包括多个持久的容器(例如服务器),各容器驻留在不同的计算机主机中,还包括一个微调度器。每个容器包括许多对象。在构成一个单个网格容器阵列的那些容器内的对象构成一个网格对象阵列。网格服务调度器透明地把一个客户机请求分解成多个任务并把多组任务赋予每个微调度器。每个微调度器把从网格服务调度器接收的任务组中的各任务赋予其相应的网格对象阵列中的对象。
该系统能包括额外的调度器层次结构级别并包括网关,各网关与不同的网格服务调度器连接。门户与网关相连,这些门户沿网关把客户机请求传送给网格服务调度器。
每个容器阵列驻留在一个局域网中,使在网格容器阵列内对象间的通信为局部通信。网格服务调度器以透明方式分解客户机请求,使客户机不知道对客户机请求的分解。容器是持久性的服务容器,用于在跨越多个客户机请求的时间段上处理多个客户机的多个客户机请求。
附图说明
由下文中参考附图对优选实施例的详细描述,将更好地理解本发明,其中:
图1是由两个不同组织共享的一个体系结构的示意图;
图2是示意图,说明本发明的按需要创建容器的能力;
图3是示意图,说明在各种容器中创建网格对象;
图4是示意图,显示不同对象间的交互作用;
图5是示意图,说明本发明如何把任务转发给网格对象阵列中的对象;
图6是示意图,说明在一个复合网格容器中的多个客户机调度器;
图7是示意图,说明使用网格门户的层次调度;以及
图8是示意图,说明本发明在网格中的布局。
具体实施方式
如前所述,曾使用不同的调度技术和协议在群集内或群集间调度任务。本发明的“关注拓扑结构的网格服务调度器”(TAGSS)调度体系结构提出一个用于网格和群集两个域的统一的任务调度域,它能无缝地支持层次结构很深的网格。
本公开内容考察为网格设计元调度器所伴随的挑战。具体地说,我们将讨论群集环境和网格环境之间的差别,而且我们认为传统的群集调度体系结构不适用于网格环境中的元调度。当我们考虑到由于引入基于服务的体系结构使新的网格技术与传统的群集计算的距离更远时,这一说法就是特别正确的了。当我们讨论这些方面时,我们引入所发明的“关注拓扑结构的网络服务调度器”(TAGSS)的体系结构,它是为面向服务的网格体系结构设计的。
在这一节我们简单地说明群集和网格环境之间的那些影响任务调度基础设施设计的主要差别。关于拓扑考虑,第一个考虑涉及总拓扑基础设施。通常,群集有统一的拓扑结构,即计算主机通常有相同类型,在许多情况下是完全相同的,而且通常通过一个共同的网络可达到所有主机。在一些情况中,群集可装有高速网络。显然,这一环境很不同于平均情况的网格,因为用户可通过广域网达到网格资源,而且根据广域网链路的特性,将以不同的服务质量达到每个资源。网络速度的变化是在设计TAGSS时的主要考虑之一,这在以下章节中会变得清楚。
关于服务调度与作业调度关系,要做的另一重要考虑是关于近来向基于服务的体系结构的转变,如在OGSA标准中提议的那样。基于服务的体系结构与大多数群集调度器使用的基于作业的体系结构有相当大的差别。这里我们应该仔细地定义术语“作业”的含义。我们使用为群集计算可用的大多数任务调度中间件已经使用的术语,这些中间件的实例有:Condor(可从位于美国Wisconsin的Madison的Wisconsin-Madison大学得到)、PBS(可从位于美国加州Mountain View的Veridian Systems得到)、LSF(可从位于美国加州Markham Ontario的Platform Computing得到)以及Load Leveler(可从位于美国Armonk的国际商业机器公司得到)。所有这些调度器都被称为作业调度器。下文中比较作业调度器和服务调度器的特点。
关于作业和作业调度,一个作业与一个或多个进程相关联。当我们说一个作业被调度时,这是指一个或多个进程在目标主机中被创建。利用与作业所关联的进程的创建有关的参数描述作业;如命令行语法、环境变量;还根据它需要的资源,如CPU或主机数、运行时库等来描述作业。作业的另一有意义的方面是数据通信模型。即作业处理输入和输出数据的方式。使用命令行中的变元以及环境变量传送输入数据;在这两种情况中被支持的格式只有文本。就是说,输入数据是作为文本串传送的,这当然可以指含有适当输入数据的文件。输出数据以类似的方式传送;可以从标准输出管道得到文本输出,但通常输出数据是文件形式的。所以,一个作业通常与一组输入和输出文件耦合,由于这一原因,大多数群集调度器实现一个文件集结功能,它给出在执行一个作业之前将文件传送到远程主机和在作业完成时提取这组输出文件的能力。这一定义规定一个作业与单一工作单元关联,因为它包含的进程由单个一组输入参数(通常代表单一用户)启动而且通常在产生输出后作业进程停止执行。由于这一原因,与一个作业关联的进程可被描述为瞬态的。作业的瞬态特性把它的编程模式限定于批执行。
关于服务、服务请求和请求调度,一个服务可以同等地关联于更多个进程之一。然而,与服务关联的进程通常是持久性的。就是说,一个服务在完成一个给定任务之后它并不停止执行,相反,它是一个持久性的应用,很像一个服务器,能执行多个工作单元或多个服务请求。所以,请求调度活动不涉及任何新进程的创建。相反,请求调度包括使来自若干用户的服务请求按照某种管理策略进行排队,然后这些请求被引导到能更好地完成给定请求的适当的服务实例。服务提供者的这种持久性特性使得能够实现实时编程模式。至于数据管理方面,一个服务使用从标准(如WSDL和SOAP)中导出的更灵活的基础设施。输入和输出参数能被描述为支持若干处理器体系结构的可移植对象。
下表给出根据上述定义中讨论的各方面对作业和服务请求的比较:
               表1:作业和服务请求的特点
    方面     作业     服务请求
    执行模式     瞬时进程     提供持久性服务
    数据管理     文本参数和文件     结构化数据
    编程模式     批处理     批处理或实时处理
    调度模式     作业调度     请求调度
关于任务调度粒度的重要性,在进入对TAGSS体系结构的描述之前,我们再对使用比作业更细粒度的服务请求的优点做最后一点说明。因为服务请求是小得多的工作单元,它使这些应用只是外包(outsource)计算任务的一部分。这一特性允许一个应用的大部分代码和数据被包含在单个主机或组织之内。这一特性在其应用代码具有专有性质的应用中是一个重要要求,因为只有较少的代码段需要被移到外包组织,而且在标准服务外包(如基本数学例程)的情况中不需要传送代码。这一特性的更一重要应用是应用要处置大量数据的情况。在许多情况中,应用有可能人工管理数据和只传送资源外包的操作所严格需要的数据。这是一个重要的考虑,许多应用在公开其专有代码方面对这一考虑具有敏感性。在因只需传送不可缺少的数据而获得的效率方面,这也是一个重要的考虑。图1显示一个群集,它是一个大部分在单个组织中运行的应用,只外包小量并行化任务。在图1中,对象128用于完成特定的任务。对象128被包含在群集125中。两个组织120、121使用群集调度器和网格网关130通过群集125处理数据。与此相反,本发明提供一个网格,它利用若干不同组织内的任意个节点。在讨论了群集计算和网格计算之间的差别,特别是关于拓扑和任务调度方面之后,我们已建立了讨论本发明的“关注拓扑结构的网格服务调度器(TAGSS)”的背景。
本发明提供一个面向服务的体系结构。这样,我们开始讨论一个实时调度场景,而首要考虑是准确定义实时调度的含义。在上一节中已经讨论过,不同于批执行,服务提供者能提供实时编程。我们结合某些客户进程的通信模式来定义这些术语。
一个作业请求或服务请求是由执行客户进程的某一客户机发起的。在批编程模式中,客户进程在发出作业请求后退出。再有,在批编程模式下,在作业和客户进程之间通常没有进行工作的通信信道。在实时编程模式中,客户进程能与持久性服务提供器交互作用。在考虑服务请求调度器设计时,实时交互作用特别重要。特别是,实时交互作用有可能使服务成为全状态的,即服务能保持与给定客户机的交互作用有关的数据。处置状态的能力近来已加到万维网(Web)服务技术中,而且它是在OGSA中的主要设计点。
为了讨论全状态模式的优点,考虑它带给编程模式的好处。因为有可能在服务提供器中保持工作状态,客户进程有能力使一个服务请求使用对先前请求的结果的引用作为输入。我们将把这一特性称作“服务器一侧高速缓存”,我们将在介绍TAGSS编程接口时讨论TAGSS体系结构如何实现这一功能。
为了介绍TAGSS编程模式,参考TAGSS Java编程接口是有帮助的。存在以本机语言(如C)的联编,但对于这一讨论使用Java API是有好处的,这是由于服务和Java对象有很强的相似性。事实上,有可能利用自动工具把Java对象定义映射到WSDL服务描述。在这一节我们公开基于服务的定义所采用的框架。
关于容器服务,TAGSS体系结构的目的之一是提供一个简单的实时编程模式。在Java中,对象是在称作Java虚拟机(JVM)的运行时环境内执行的,在一个服务类似物中,服务是在容器内被执行的。TAGSS体系结构遵循这一类似,定义一个容器服务。容器服务提供与对象创建和对象方法调用关联的服务。这些概念与服务事例化和服务请求处理相关联。
本发明提供容器服务“工厂”。定义一个服务的主要方面之一是它被创建和被破坏的方式。在OGSA中,根据在工厂接口中实现的规格创建服务实例,在提出用于网格的编程模式时,其主要问题是如何运用这一接口。为了由一个客户进程发送一个服务请求,它必须与一个服务提供器实例绑定在一起。因为服务创建任务需要遵循更新的资源利用测量,TAGSS体系结构定义一个资源监视服务,它在创建容器服务时起主要作用。这个资源监视服务被称作调度器服务。调度器服务恒定地监视节点池中的资源利用情况,而且它控制那个节点池中容器服务的创建。
调度器服务不直接创建容器服务。在TAGSS体系结构中,调度服务是由下述图2所示进程/系统实现的。作为中央进程的TAGSS调度器200收集节点池210(或最小调度域)中的资源利用情况测量结果,并在这个最小调度域中处理对容器服务的所有请求。对于一个给定的最小调度域,只有一个TAGSS调度器实例200。
TAGSS代理205进行周期性的资源利用情况测量并把这些测量结果报告给它的指定最小调度域的TAGSS调度器200。TAGSS代理205还负责实现容器服务的工厂接口。容器服务可以是专用于给定客户机的,或者它们可以根据服务政策的质量由若干客户机共享。在下文的场景中讨论这两种可能性。
当绑定于排他的容器服务时,图2显示消息流(1-6),说明如何响应一个客户机请求按需要创建排他的容器服务。如图2中所示,客户进程215首先向TAGSS调度器200发送一个请求,以获得一个容器(1)。然后,TAGSS调度器200向TAGSS代理205发送一个指令(2)以创建一个容器。TAGSS代理205以产出(3)一个新容器220作为响应。然后TAGSS代理205向TAGSS调度器200返回容器引用指针(4)。然后,TAGSS调度器200向客户进程215返回容器引用指针(5)。然后客户进程215绑定(6)于新容器220。可以指出,客户进程215只与TAGSS调度器220和容器服务实例220直接通信,而不与TAGSS代理205直接通信。TAGSS代理205的存在对于客户进程215是透明的,如同是调度器服务的一个集成的部分。
关于绑定于共享的容器服务,如前所述,客户进程共享容器也是可能的。这一做法的好处在于它减小了每个网格主机210中创建的容器进程的个数。有可能使用具有不同运行时执行优先级的共享容器提供不同级别的服务质量。于是,客户机到指定容器的映射将按管理策略或服务级别协定(SLA)来完成。然而,共享容器的布置要求一个复杂的安全性基础设施。本发明能使用一个类似于Java Servlets(服务小程序)环境的一个框架来提供共享容器所需的适当的安全性。
下面的编程例子说明一个客户进程215与一容器服务220的绑定。TAGSS API的这一解释不需要区分共享的和非共享的容器,因为如果给出这一公开则本领域普通技术人员将会理解这些差别。下列代码段说明一个客户机如何绑定于单个容器服务(6)。如图3中所示,调度器服务200创建网络对象(对象1-对象8)。当一个网格对象(对象1-对象8)被创建时,客户进程215被绑定于给定的调度器服务200。当构建网格对象(对象1-对象8)时,TAGSS调度器200的网络地址和端口号被作为构造器变元而传送。一但网格对象(对象1-对象8)被创建,客户进程215能通过执行图2中的Grid.get Container()方法(1)用该网格对象绑定于若干容器服务300-301。
GridmyGrid=new Grid(“tagss_scheduler_hostname”,tagss_scheduler_port);
GridContainer myContainer=myGridContainer.getContainerO;
             代码段1:连接到一个网格提供器
关于创建对象(对象1-对象8),一旦客户进程215被绑定于容器服务300-301,便能创建其他服务。在Java API中,这些服务由Java对象代表。新对象的创建是由调用GridContainer.createObject方法()完成的。这一方法需要创建完全合格的对象名以及构造器参数。如图3中所示,网格对象阵列(8)指令指导TAGSS调度器200去创建八个对象。在容器300和301每个中创建三个对象(对象1-对象3;对象4-对象6),而在容器302中创建两个对象。构造器参数是使用Java ArrayList直接从编程环境中取出的。在内部,TAGSS API将使用JAVA反射类,以使传送到ArrayList中的对象序列匹配于给定方法的适当构造器。
  //construct a GridObject of type myObjectClass.

  //The constructor has the signature(Integer,Double,String);

  Integer arg1=new Integer(123);

  Double arg2=new Double(1.23);

  String arg3=“hello”

  ArrayList args=new ArrayList();
        <!-- SIPO <DP n="9"> -->
        <dp n="d9"/>
  args.add(arg1);

  args.add(arg2);

  args.add(arg3);

  GridObject myObject=

  myContainer.createObject(“myObjectClass”,args);
              代码段2:创建一个网格对象
得到的网格对象(GridObject)能被转换成任何用户定义的类类型。
就调用网格对象中的一方法来说,执行网格对象中的方法所需要的步骤与对象创建步骤相似。方法名称作为字符串被传送,而变元使用ArrayList传送。
  //assume that myObject was built as in Code Segment 2.

  //Prepare to invoke a method with the signature(int,real,String);

  Integer arg1=new Integer(123);

  Double arg2=new Double(1.23);

  String arg3=“hello”

  ArrayList args=new ArrayList();

  args.add(arg1);

  args.add(arg2);

  args.add(arg3);

  MyReturnObjectClass myResult=(myReturnObjectClass)

  myObject.invoke(“myMethod”,args);
            代码段3:调用一个网格对象上的方法
再次使用Java反射使方法签名匹配于适当的方法。该方法调用的结果作为一个新的网格对象返回。返回值可以被转换成该方法调用的预期类型。当前,还不能为返回结果使用参数变量。
关于服务器一侧高速缓存,TAGSS API提供一个GridObject.invoke()方法的变体,它实现先前讨论过的服务器一侧高速缓存特性。GridObject.invokeKeep()只返回一个到方法调用结果的引用指针,而结果本身被保持在该方法被调用的容器中。该结果可在以后用GridObject.getValue()方法检索。下列例子显示一个应用怎样将若干个调用拼接到GridObject.invokeKeep()方法,以最大限度地减少不得不在客户机和服务提供器之间传送的数据量。在下面的例子中,一个图像增强应用把由三个过滤器组成的序列应用于一个图像并且只提取其最终结果。没有任何中间结果回送到客户进程,节省了中间结果的整个来回旅程。这一技术对于管理大宗数据的应用(如图像处理)是重要的。
  //construct a GridObject of type myObjectClass.

  //The constructor has the signature(Integer,Double,String);

  Integer arg1=new Integer(123);

  Double arg2=new Double(1.23);

  String arg3=“hello”

  ArrayList args=new ArrayList();

  args.add(arg1);

  args.add(arg2);

  args.add(arg3);

  GridObject myObject=

  myContainer.createObject(“myObjectClass”,args);
      代码段4:使用网格对象中的持久状态
再次说明,返回值能被转换成任何用户定义的类类型。
关于更高级的结构,上文描述的基本原语提供了很灵活的接口,以管理网格环境中的各单个对象。然而,大多数网格应用为执行并行化任务而要求更高级的结构。TAGSS编程接口提供一组更高级原语用于并行操作。在一个实施示例中,本发明提供三个更高级操作:消息多路传播,障碍强化方法调用和分散/集合操作。这些功能是由TAGSS中的管理下文所述对象集合的附加原语提供的。
一个网格容器阵列(GridContainerArray)307代表容器300-302的集合。容器阵列实现容器的同样功能组,而在一个容器阵列中被调用的方法应用于作为该容器阵列一部分的每个容器。容器阵列工厂接口也由服务调度器实现,它由网格对象(对象1-对象8)代表。构造容器阵列的方法是Grid.getContainerArray()。这一方法取一个整数作为变元,代表所希望的容器个数。在资源短缺时,返回的实际容器数小于所希望的个数。通过调用GridContainerArray.getNumberContainers()能得到返回的实际容器数。如果传送值0(零)作为所希望的容器个数变元,则网格调度器将根据资源利用状态并根据该客户机的凭证返回全部可用容器。下例显示容器阵列构建器的语法:
GridContainerArray myContainerArray=Grid.getContainerArray(0);
int numberOfContainers=myContainerArray.getNumberContainers
           代码段5:创建一个网格容器阵列
如前所述,容器阵列307实现与单个容器类似的一组功能。如同一个容器是一个创建网格对象(对象1-对象8)的工厂,网格容器阵列307是类型为网格对象阵列306的对象的工厂。创建网格对象阵列(GridObjectArray)306的方法是GridContainerArray.createObject()。这一方法以要创建的对象类型名(类名)以及一个数据结构作为输入变元,该数据结构含有要被调用的每个构造器调用所用变元。该变元列表应有相同的签名,即在变元序列中以相同值索引的每个对象应该有相同的类类型。为了有助于构造变元列表以创建对象阵列,TAGSS接口使用一个辅助数据结构,称作网格数据集(GridDataSet)。网格数据集能够可视化为一个矩阵,它的每行是要应用于一个对象阵列中的一个构造器或方法调用的变元列表。所以,网格数据集的每列应含有相同数据类型的对象。例如,下列指令说明如何为调用签名整数、双精度数和字符串的构造器而构建网格数据集:
  //assume that the input values are in intArray,doubleArray,and StringArray

  GridDataSet myGridDataSet=new GridDataSet();

  ArrayList singleRow=new ArrayList();

  for(i=0;i<inputSize;i++)
        <!-- SIPO <DP n="12"> -->
        <dp n="d12"/>
  {

  singleRow.add(jntArray[i]);

  singleRow.add(doubleArray[i]);

  singleRow.add(StringArray[i]);

  myGridDataSet.addRow(singleRow);

  singleRow.clear()

  {
               代码段6:创建网络数据集
在网格数据集中的行数不需要与容器个数相同,指出这一点是重要的。本发明只是在容器的子集中构建对象,并通过在一个容器中创建不只一个对象事例来构建多于容器个数的对象,如图3中所示。更具体地说,图3显示一个客户机,它试图创建一个具有八个对象的网格对象阵列,这里只有三个容器可用。该客户机通过在可用容器内创建多个对象,仍然成功地创建了一个具有八个对象的网格对象阵列306。
当在对象阵列306中执行一个方法时,对象阵列306有与容器阵列307相似的语义。指向一个对象阵列306的方法调用在对象阵列306的每个对象实例中造成方法调用。这一多重方法调用的结果被返回到网格对象阵列,这里第i个元素是使用网格数据集的第i行的一个方法调用的结果。下列代码段说明在一个网格对象阵列上的一个方法调用:
  //create a Grid Object Array
  GridObjectArray myGridObjectArray=
    GridContainerArray.createObject(yGridDataSet);
  //assume that we loaded the input data in inputSet
  GridDataSet inputSet=loadDataSet();
  //invoke a method on a Grid array
  GridObject[]resultArray=
  myGridObjectArray.invoke(“methodName”,inputSet,invocation_mode);
      代码段7:在网格对象阵列上调用一个方法
下面描述在网格对象阵列306中方法调用的三种方式,使用变元TAGSSInvocationMode指定这三种方式:
第一种方式是TAGSS_INVOKE_MULTICAST。这一调用方式用于单个参数列表,不像下述其他两种方式那样使用网格数据集。在这一调用方式中,在网格对象阵列306的所有对象中,以在单个参数列表中包含的完全相同的参数集合来调用一个方法。这一调用方式用于向各对象发送同步消息。
另一种方式是TAGSS_INVOKE_EACH。这一调用方式指定应把网格数据集中的每一行应用于阵列中的相应对象。就是说,行0应用于对象0,行1应用于对象1,等等。这一方式要求网格数据集中指定的行数等于或小于阵列中的对象数。这一方法调用方式用于障碍强制(barrier enforced)方法调用。
再另一种调用方式是TAGSS_INVOKE_ANY。这一调用方式表明在网格数据集的各行与网格对象阵列306中的对象之间没有指定的映射要求。这一方式为底层调度基础设施提供了大的灵活性。例如,有可能告诉具有10个对象的对象阵列去调用具有1000行的网格数据集上的一个方法。如下所述,哪些对象将在哪些行上工作这种映射是由TAGSS中的底层调度基础设施在运行时完成的。这一调用方法用于分散/聚集编程模式中。上文描述的这三种调用方式实现了TAGSS中实现的三个基本的并行编程模式:消息多播、障碍强制方法调用以及分散/聚集。下文中将更详细讨论这三种编程模式。
消息多播模式是简单地向一个对象集合发送单个消息的一种编程模式。TAGSS API以提供一个方法调用函数来支持这一模式,该函数取单一变元列表并把它应用于网格对象阵列306中的所有对象:
GridObject[]result=myObjectArray.invoke(“methodName”,argList,
               TAGSS_INVOKE_MULTICAST);
               代码段8:使用消息多播编程模式
障碍强制并行方法调用是能用于实现若干并行编程方法的一种编程模式,这些方法需要多个对象工作前后紧接的数据。在对象400-403之间的前后紧接的操作示于图4。在这一调用中,所有对象在下一方法能被调用之前得要完成某一方法,就是说,存在一个隐含的障碍,它同步每个方法的执行。例如,下面一段代码实现一个流水线,它把先前计算的结果以移位(shiftcarry)方式重定向到阵列中的每个对象,使用障碍同步保证每个方法调用之前那些结果是完全的:
  //barrier synchronization example

  //assume the input is already loaded in GridDataSet

  //invoke 3 methods using a result pipeline that shifts to the right

  GridObject[]result=myGridObjectArray.invoke(“first_stage”,

                      inputDataSet,TAGSS_INVOKE_EACH);

  //shift the result to the right

  GridObject temp=result[result.sizeO;//keep the last element to wrap around
  for(i=0;i<result,size()-1;i++)

         result[i+1]=result[i];

  result[0]=temp;//wrap around

  //now call the second stage

  GridObject result 2=myGridObjectArray.invoke(“second_stage”,

                      InputDataSet,TAGSS_INVOKE_EACH);
           代码段9:实现移动-结果-障碍模式
例如,对四个对象执行上述代码将会建立图4中所示通信模式。
当指定TAGSS_INVOKE_ANY调用方式时,使用分散/聚集模式。在这种情况中,根据运行时条件,网格数据集的那些行被赋予任何网格对象。根据每个对象完成方法调用的能力进行行映射。运行时调度由一个内置调度代理完成,它是为了客户机应用在运行时创建的,称作TAGSS客户机调度器(或微调度器)500,如图5中所示。
微调度器500是一个小的多线程对象,它是在构建网格容器阵列307时被隐含构成的。每个网格容器阵列307有它自己的TAGSS客户机调度器500的实例。TAGSS微调度器500在网格对象阵列306中的各对象(对象1-对象8)之间分散各行,然后调度新行,这些新行是由对象(对象1-对象8)完成的任务。所以,如图5中所示,客户进程215通过一个数据集调用网格对象阵列306(11)。TAGSS调度器200通过该数据集调用一个指定方法(12)。TAGSS微调度器500调用到各对象(对象1-对象8)的数据集行,每个对象对这些行之一完成一个指定任务。一旦由各对象完成了这些任务,TAGSS微调度器500返回该网格对象(14)。
TAGSS客户机调度器对象的放置考虑了TAGSS总体结构,并根据网格拓扑来进行,考虑到TAGSS微调度器500产生大量网络传输和I/O处理。运行TAGSS客户机调度器500的容器300在消息多播和分散/聚集模式中都是中心坐标点。TAGSS微调度器500与对象阵列306中的所有对象(对象1-对象8)通信并恒定地传送用于方法调用的输入数据以及在一旦完成时聚集输出数据。
这些情况表明客户进程215是为放置TAGSS微调度器的一个不好的选择。这是因为在网格中的通常配置把客户机进程215放在网络的边缘,经由速度低于网络中央的网络连接。
为了为TAGSS微调度器500选择最佳位置,TAGSS体系结构把TAGSS微调度器500放在将提供最佳性能(与那个网格容器阵列中的其他容器相比)的容器中。容器的选择是根据创建容器阵列307时可得到的性能测量结果(例如处理速度、输入/输出的能力和容量等)。按照约定,TAGSS调度器服务200按服务客户机的下降顺序对容器排序,以编索引为0(零)的容器为该网格的最佳性能容器。当创建一个网格容器阵列307时,TAGSS微调度器500被创建在容器0(零)中。
关于批调用,运行时调度进程支持成批的调用。就是说,当一个客户机希望在发出一个大的并行请求之后退出时,TAGSS体系结构通过实现由GridObject.invokeAsync()方法提供的异步调用选择来提供那个功能。这一方法返回一个请求引用指针:网格批调用(GridBatch),它是对网格对象的一个持久性引用指针。客户进程能把这一引用指针保存在持久性存储器中并在以后检索该网格对象。客户进程能使用方法GridBatch.peek()查问是否完成一个网格匹调用,该方法在完成网格批调用时返回“真”,在此时能通过调用GridBatch.getResult()方法检索结果。这一处理的示例代码如下所示:
  //carry out three large operations in parallel,and then wait on all complete

  GridBatch batch1=gridObjectArray1.invokeAsync(“method1”,dataSet1);

  GridBatch batch2=gridObjectArray2.invokeAsync(“method2”,dataSet2);

  GridBatch batch3=gridObjectArray3.invokeAsync(“method3”,dataSet3);

  //check if batch 1 is complete

  Boolean isComplete=batch1.peek();

  //wait on batch 1 to be complete

  GridObject[]result=batch.waitOnComplete();

  //wait on both batches 2 and 3 to complete

  GridWaitCondition waitCondition=new GridWaitCondition(batch2);

  waitCondition.add(batch3);

  waitCondition.waitOnComplete();
             代码段11:使用等待条件来同步并行调用
本发明适用于交互的和离线的客户进程两种情况。上述编程范例不限于交互的客户进程。客户机请求能被离线提交。在这种情况中,执行该客户进程的代码本身需要作为离线作业请求被发送。然后,客户进程的执行将遵循该作业调度范例。一旦该客户进程被调度和发起,则建立具有调度资源的实时对话,然后调度进程正如前述那样实时地工作。
TAGSS体系结构还能在分布式环境中很好地工作。为了有最佳性能,具有相似特性的节点应分组到由单个服务调度器控制的一个极小调度域。极小调度域的大小将影响运行TAGSS微调度器500的节点的性能。
TAGSS体系结构提供一种简单的方式跨多个极小调度域分散任务。如前所述,任务调度是由TAGSS微调度器500完成的,它是在每个网格容器阵列307中的一个单独容器中创建的小型多线程对象。为了跨极小调度域进行调度,使用多个网格对象阵列构建一个组合网格对象阵列306。然后调度任务在每个网格对象阵列306中的TAGSS客户机调度器当中被分割。
这一强有力的特征对客户进程是透明的。正如TAGSS微调度器500对象是由TAGSS基础设施隐含构建的一样,根据上述对象创建和方法调用的语义,工作负荷在多个对象之间的分割也是隐含发生的。
为了在多个对象当中分散任务,一个客户机应用做的全部事情是构建一个组合网格对象。这是使用下述方法Grid.add()完成的。这一方法把该网格对象绑定于另一调度域的TAGSS调度器200。例如,在下文所示代码及图6中,创建了一个绑定于“网关1”600的网格对象阵列306,然后它又被使用Grid.add()方法绑定于“网关2”601。第二网关601连接于网格容器阵列308,它基本上与上文详细讨论的网格容器阵列306相似。网格容器阵列308利用不同的主机211并含有不同的但类似的网格对象阵列307,它由容器303-305内的对象9-对象16构成。主机211能在地理上与主机210分离。然而,优选地,多个主机211位于一个本地化网络(例如一个组织)之内,而多个主机210类似地位于它们自己的本地化网络内。如前所述,每个网格容器阵列需要它自己的TAGSS微调度器。所以,网格容器阵列308包括TAGSS微调度器501。网格容器阵列307和网格容器阵列308构成组合网格容器阵列608,它含有在所有网关处可得到的最大数量容器。图6还显示结果造成的组合网格对象阵列607,它是由网格对象阵列306和网格对象阵列307构成的。组合网格容器阵列608和组合网格对象阵列607跨过多个域(例如210和211),这些域可有基本上不同的计算能力。请注意,在语义学上或在组合网格对象阵列的API中没有区别,组合网格对象阵列跨越不只一个极小调度域这一事实对客户进程215是透明的。然后,下列代码例子使用指定0(零)容器的方法Grid.getContainerArray()的方法造成一个请求网络对象中所有容器的请求。
  //connect to the Service Scheduler in 2 different domains

  Grid grid1=new Grid(“gateway1”,1234);

  Gird1.add(“gateway2”,1234);

  //build a large Container Array 307 using containers from 2 different domains

  GridContainerArray bigContainerArray=grid1.getContainerArray(0);

  //create an Object Array that spans 2 domains

  GridObjectArray bigObjectArray=

      bigContainerArray.createObject(“objectType”,inputArgs);

  //invoke a method on the object array

  GridObjectArray bigResult=

      bigObjectArray.invoke(“methodName”,methodArgs);
                代码段12:使用组合网格容器
图6显示在一个示例多群集环境中使用上述代码构建的对象。图7包括网格门户700用于提高网关600、601之间的通信效率。应该指出,上述例子引入一个二层调度分层结构。利用本发明可得到多层分层结构,它利用中间进程作为到服务调度器的代理并构造组合网格对象阵列。例如,图8显示一个外包组织800,它包括一个网格门户,多个客户进程215、216以及多个调度器200、201,调度器200、201与其他网格门户700、702相连,网格门户700、702访问多个网格容器阵列307~309。在图8所示系统中,组合网格容器阵列307-309和组合网格对象阵列607生长为包括外包组织800控制下的所有对象和容器。
网格门户被配置成从若干个单个极小服务域收获容器。再有,因为该网格门户是对服务调度器200、201透明的代理,本发明能级联任何数量网格门户,造成深度分层结构。对于如何在一个网格环境中布置TAGSS体系结构,存在若干可能的配置,而上述建议是最简单的配置之一。为简化讨论,我们考虑用于一个组织的两个基本角色:它可以是服务提供者或服务外包者。我们的基本配置表明一个网格门户被配置成用于调整全部进入和外出服务请求流。这使得一个基础设置可能审查全部请求。外包组织的网格门户在指定的网格凭证下运行,它利用这一凭证从服务提供者组织的网格门户获取资源。
在一个实施例中,TAGSS进程是,由系统管理员启动和配置服务调度器200、201和网格门户700-702。另一个实现是根据要求代表单个客户机(用户或组织)启动这些进程。例如,在图8中,一个外包组织能向启动所请求的网格门户和服务调度器的那些外包组织提交作业请求(与应用代码一起)。以这种方式,即使该服务提供者组织没有安装TAGSS应用,该外包组织也能获取资源。利用这一途径,代表单个客户机创建了整个一组新的TAGSS进程。
TAGSS调度器能使用Globus 2.0工具箱布署在上述网格环境中。Globus工具箱受到本说明开头描述的基于作业的体系结构的强烈影响,而且基本上只支持作业提交模式。但是,如前文指出的那样,作业提交模式能把TAGSS软作进程作为作业来启动。只是这些“作业”是“寿命很长的”,而且它们又代表若干客户机在服务请求级调度任务。
换言之,本发明提供一个用于处理客户机请求的计算机系统。该系统包括与网格容器阵列相连的网格服务调度器。每个网格容器阵列包括驻留在不同主机中的持久性容器(如服务容器)以及微调度器。每个容器包括许多对象。在构成单个网格容器阵列的那些容器内的那些对象构成一个网格对象阵列。网格服务调度器透明地把一个客户机请求分割成多个任务并对每个微调度器赋予任务组。每个微调度器把从网格服务调度器接收的任务组中的各单个任务赋予它们相应的网格对象阵列内的对象。
该系统能包括额外的调度器分层结构级别,并包括网关,每个网关连接到不同的网格服务调度器。门户连接到网关,而且门户沿网关把客户机请求传送到网格服务调度器。
每个容器阵列驻留在一个局域网中,从而使一个网格容器阵列内的对象之间的通信成为局域通信。网格服务调度器以透明的方式分割客户机请求,使得客户机不知道对客户机请求的分割。容器是持久性服务容器,用于在跨越多个客户机请求的一个时间段内处理多个客户机的多个客户机请求。
本发明还提供一种方法,用于在主机计算机网络上处理客户机请求,该方法包括:在上机中创建持久性容器,在容器中创建对象,把容器分组构成网格容器阵列,把在单个网格容器阵列内的容器内的对象分组构成网格对象阵列,为每个网格容器阵列创建一个微调度器,把每个客户机请求分割成多个任务,以及把任务组赋予微调度器,其中微调度器把各个任务赋予对象。当微调度器回送完成后的任务组时本发明赋予这些微调度器其他的任务组。该方法还能包括通过网关向多个网格服务调度器传送客户机请求。
这样,上文描述的发明使用网格服务调度器把一个客户机请求分割成许多任务。该系统通过一个网格对象阵列中的多个对象执行所述任务,这些对象在构成一个网格容器阵列的那些容器之内,而该网格容器阵列由一个微调度器控制。
本发明提供一个关注拓扑网格服务调度器(TAGSS),它是用于网格的请求级调度的新的体系结构。这一体系结构是关注拓扑结构的,因为任务调度基础设施被设计成在由不同能力的计算主机和网络构成的多样计算环境中操作。在网格计算中这种多样的计算环境是常见的,这与群集计算中通常看到的均一环境成为对照。因此,在群集计算中使用的调度技术不适用于网格计算。TAGSS的另一重要特性在于它基于面向服务的体系结构。这与传统的群集调度成为鲜明对照,因为传统的群集调度器是基于面作业的体系结构。最近引入的开放网格服务体系结构(OGSA)把基于服务的体系结构带入网格计算世界,同时由它带来与网格中调度服务请求的任务有关的新挑战。上述公开的内容讨论了这些挑战,并把这些挑战与TAGSS体系结构中的特性关联起来。
尽管已经利用优选实施例描述了本发明,但本领域技术人员将会理解,本发明能在所附权利要求的精神和范围内加以修改来实现。

Claims (24)

1.一种处理客户机请求的计算机系统,所述系统包括:
与多个网格容器阵列相连的网格服务调度器,其中每个网格容器阵列包含:多个持久性容器,每个容器驻留在一个计算机主机中;以及在一个所述容器中的一个微调度器;其中每个所述容器包括多个对象,其中在构成一个网格容器阵列的那些容器内的对象构成一个网格对象阵列,其中所述网格服务调度器把一个客户机请求分割成多个任务并把所述任务组赋予每个微调度器,而且其中每个所述微调度器把从所述网格服务调度器接收的任务组中的各个任务赋予相应网格对象阵列中的那些对象。
2.权利要求1的系统,进一步包括多个网格服务调度器和网关,其中每个网关与不同的网格服务调度器相连接。
3.权利要求2的系统,进一步包括与所述网关相连接的门户,其中所述门户沿所述网关把所述客户机请求传送给所述网格服务调度器。
4.权利要求1中的系统,其中每个容器阵列驻留在一个局域网中,从而在一个网格容器阵列内对象之间的通信构成局域通信。
5.权利要求1中的系统,其中所述网格服务调度器以透明方式分割所述客户机请求,从而使客户机不知道所述客户机请求的分割。
6.权利要求1中的系统,其中所述容器包含服务容器并在跨越多个客户机请求的时间段上处理来自多个客户机的多个客户请求。
7.一种处理客户机请求的计算机系统,所述系统包含:与多个网格容器阵列相连的网格服务调度器,其中每个网格容器阵列包括:多个持久性容器,每个容器驻留在一个计算机主机中;以及一个微调度器,其中,在每个网格容器阵列中,所述微调度器在拓扑结构上位于所述网格容器阵列中的所有容器中性能最高的那个容器中;其中每个所述容器包括多个对象,其中在构成一个网格容器阵列的那些容器内的对象构成一个网格对象阵列,其中所述网格服务调度器把一个客户机请求分割成多个任务并把所述任务组赋予每个微调度器,而且其中每个所述微调度器把从所述网格服务调度器接收的任务组中的各个任务赋予相应网格对象阵列中的那些对象。
8.权利要求7中的系统,进一步包括网关,每个网关与不同的网格服务调度器相连接。
9.权利要求8中的系统,进一步包括与所述网关相连接的门户,其中所述门户沿所述网关把所述客户机请求传送给所述网格服务调度器。
10.权利要求7的系统,其中每个容器阵列驻留在一个局域网中,从而在一个网格容器阵列内对象之间的通信构成局域通信。
11.权利要求7的系统,其中所述网格服务调度器以透明方式分割所述客户机请求,从而使客户机不知道所述客户机请求的分割。
12.权利要求7的系统,其中所述容器包含持久性服务容器并在跨越多个客户机请求的时间段上处理多个客户机的多个客户机请求。
13.一种在主机计算机网络上处理客户机请求的方法,所述方法包括:在所述主机中创建持久性容器;在所述容器中创建对象;把所述容器分组构成网格容器阵列;把在单个网格容器阵列内的容器内的对象分组构成网格对象阵列;为每个网格容器阵列创建一个微调度器;把每个所述请求分割成多个任务;以及把所述任务组赋予所述微调度器,其中所述微调度器把各个任务赋予所述对象。
14.权利要求13中的方法,进一步包括:当所述微调度器回送完成后的任务组时赋予所述微调度器其他的任务组。
15.权利要求13的方法,进一步包括通过网关向多个网格服务调度器传送所述客户机请求。
16.权利要求13的方法,其中每个容器阵列驻留在一个局域网中,从而在一个网格容器阵列内对象之间的通信构成局域通信。
17.权利要求13的方法,其中所述分割是以透明方式进行的,从而使客户机不知道对所述客户机请求的分割。
18.权利要求13中的方法,其中所述容器包含服务容器并在跨越多个客户机请求的时间段上处理来自多个客户机的多个客户机请求。
19.一种在主机计算机网络上处理客户机请求的方法,所述方法包括:在所述主机中创建持久性容器;在所述容器中创建对象;把所述容器分组构成网格容器阵列;把在单个网格容器阵列内的容器内的对象分组构成网格对象阵列;为每个网格容器阵列创建一个微调度器;在拓扑结构上把所述微调度器放在所述网格容器阵列中的所有容器中性能最高的那个容器中;把每个所述请求分割成多个任务;以及把所述任务组赋予所述微调度器,其中所述微调度器把各个任务赋予所述对象。
20.权利要求19中的方法,进一步包括:当所述微调度器回送完成后的任务组时赋予所述微调度器其他的任务组。
21.权利要求19中的方法,进一步包括通过网关向多个网格服务调度器传送所述客户机请求。
22.权利要求19中的方法,其中每个容器阵列驻留在一个局域网中,从而在一个网格容器阵列内对象之间的通信构成局域通信。
23.权利要求19中的方法,其中所述分割是以透明方式进行的,从而使客户机不知道对所述客户机请求的分割。
24.权利要求19中的方法,其中所述容器包含持久性服务容器并在跨越多个客户机请求的时间段上处理来自多个客户机的多个客户机请求。
CN200310121564A 2002-12-23 2003-12-22 在主机计算机网络上处理客户机请求的系统和方法 Expired - Fee Related CN100576841C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/328,255 2002-12-23
US10/328,255 US7383550B2 (en) 2002-12-23 2002-12-23 Topology aware grid services scheduler architecture

Publications (2)

Publication Number Publication Date
CN1516419A true CN1516419A (zh) 2004-07-28
CN100576841C CN100576841C (zh) 2009-12-30

Family

ID=32594410

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200310121564A Expired - Fee Related CN100576841C (zh) 2002-12-23 2003-12-22 在主机计算机网络上处理客户机请求的系统和方法

Country Status (3)

Country Link
US (2) US7383550B2 (zh)
JP (1) JP2004206712A (zh)
CN (1) CN100576841C (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1298142C (zh) * 2003-08-29 2007-01-31 国际商业机器公司 用于提供网格服务生存期管理的方法和系统
CN100345111C (zh) * 2005-08-26 2007-10-24 南京邮电大学 一种用于网格计算的模型驱动方法
CN100377091C (zh) * 2006-03-16 2008-03-26 浙江大学 嵌入式操作系统分组硬实时任务调度的实现方法
CN1783121B (zh) * 2004-11-30 2011-07-20 国际商业机器公司 用于执行设计自动化的方法和系统
CN101420354B (zh) * 2008-11-26 2011-08-10 北京航空航天大学 面向广域网远程虚拟环境的组播扩展方法
CN1956457B (zh) * 2005-10-24 2014-06-25 国际商业机器公司 用于安排网格计算系统中的网格作业的方法和设备
CN111049915A (zh) * 2019-12-17 2020-04-21 书行科技(北京)有限公司 一种容器云下消息队列代理网格及方法
CN111078356A (zh) * 2019-11-22 2020-04-28 北京达佳互联信息技术有限公司 Gpu集群资源控制系统、方法、装置、设备及存储介质

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7171470B2 (en) * 2003-02-20 2007-01-30 International Business Machines Corporation Grid service scheduling of related services using heuristics
US7461166B2 (en) * 2003-02-21 2008-12-02 International Business Machines Corporation Autonomic service routing using observed resource requirement for self-optimization
US7404189B2 (en) 2003-12-30 2008-07-22 International Business Machines Corporation Scheduler supporting web service invocation
US7406691B2 (en) 2004-01-13 2008-07-29 International Business Machines Corporation Minimizing complex decisions to allocate additional resources to a job submitted to a grid environment
US7562143B2 (en) 2004-01-13 2009-07-14 International Business Machines Corporation Managing escalating resource needs within a grid environment
US7552437B2 (en) 2004-01-14 2009-06-23 International Business Machines Corporation Maintaining application operations within a suboptimal grid environment
US8782654B2 (en) 2004-03-13 2014-07-15 Adaptive Computing Enterprises, Inc. Co-allocating a reservation spanning different compute resources types
WO2005089239A2 (en) 2004-03-13 2005-09-29 Cluster Resources, Inc. System and method of providing a self-optimizing reservation in space of compute resources
CA2559603A1 (en) 2004-03-13 2005-09-29 Cluster Resources, Inc. System and method for providing advanced reservations in a compute environment
EP1735706A4 (en) 2004-03-13 2008-08-13 Cluster Resources Inc SYSTEM AND METHOD FOR CO-ASSIGNING RESERVATION ENGLOBING DIFFERENT TYPES OF CALCULATION RESOURCES
US7890629B2 (en) * 2004-03-13 2011-02-15 Adaptive Computing Enterprises, Inc. System and method of providing reservation masks within a compute environment
US7237062B2 (en) * 2004-04-02 2007-06-26 Seagate Technology Llc Storage media data structure system and method
US7596788B1 (en) 2004-05-11 2009-09-29 Platform Computing Corporation Support of non-trivial scheduling policies along with topological properties
US7266547B2 (en) * 2004-06-10 2007-09-04 International Business Machines Corporation Query meaning determination through a grid service
US7861246B2 (en) * 2004-06-17 2010-12-28 Platform Computing Corporation Job-centric scheduling in a grid environment
US20070266388A1 (en) 2004-06-18 2007-11-15 Cluster Resources, Inc. System and method for providing advanced reservations in a compute environment
EP1622009A1 (en) * 2004-07-27 2006-02-01 Texas Instruments Incorporated JSM architecture and systems
US8176490B1 (en) 2004-08-20 2012-05-08 Adaptive Computing Enterprises, Inc. System and method of interfacing a workload manager and scheduler with an identity manager
US8171474B2 (en) * 2004-10-01 2012-05-01 Serguei Mankovski System and method for managing, scheduling, controlling and monitoring execution of jobs by a job scheduler utilizing a publish/subscription interface
WO2006053093A2 (en) 2004-11-08 2006-05-18 Cluster Resources, Inc. System and method of providing system jobs within a compute environment
JP2006155187A (ja) * 2004-11-29 2006-06-15 Sony Corp 情報処理システム、情報処理装置および方法、記録媒体、並びにプログラム。
US7627655B2 (en) * 2004-12-13 2009-12-01 Sap Ag Increased performance of grid applications
US7590623B2 (en) 2005-01-06 2009-09-15 International Business Machines Corporation Automated management of software images for efficient resource node building within a grid environment
US7562035B2 (en) 2005-01-12 2009-07-14 International Business Machines Corporation Automating responses by grid providers to bid requests indicating criteria for a grid job
US7571120B2 (en) 2005-01-12 2009-08-04 International Business Machines Corporation Computer implemented method for estimating future grid job costs by classifying grid jobs and storing results of processing grid job microcosms
US7472079B2 (en) * 2005-01-12 2008-12-30 International Business Machines Corporation Computer implemented method for automatically controlling selection of a grid provider for a grid job
US7996455B2 (en) 2005-06-17 2011-08-09 Adaptive Computing Enterprises, Inc. System and method for providing dynamic roll-back reservations in time
US8863143B2 (en) 2006-03-16 2014-10-14 Adaptive Computing Enterprises, Inc. System and method for managing a hybrid compute environment
US9231886B2 (en) 2005-03-16 2016-01-05 Adaptive Computing Enterprises, Inc. Simple integration of an on-demand compute environment
US7774457B1 (en) * 2005-03-25 2010-08-10 Hewlett-Packard Development Company, L.P. Resource evaluation for a batch job and an interactive session concurrently executed in a grid computing environment
CA2603577A1 (en) 2005-04-07 2006-10-12 Cluster Resources, Inc. On-demand access to compute resources
US8468530B2 (en) * 2005-04-07 2013-06-18 International Business Machines Corporation Determining and describing available resources and capabilities to match jobs to endpoints
US20070006070A1 (en) * 2005-06-30 2007-01-04 International Business Machines Corporation Joining units of work based on complexity metrics
US7707579B2 (en) * 2005-07-14 2010-04-27 International Business Machines Corporation Method and system for application profiling for purposes of defining resource requirements
US7995474B2 (en) * 2005-09-13 2011-08-09 International Business Machines Corporation Grid network throttle and load collector
US8713179B2 (en) * 2005-10-04 2014-04-29 International Business Machines Corporation Grid computing accounting and statistics management system
US20070118839A1 (en) * 2005-10-24 2007-05-24 Viktors Berstis Method and apparatus for grid project modeling language
US7831971B2 (en) * 2005-10-24 2010-11-09 International Business Machines Corporation Method and apparatus for presenting a visualization of processor capacity and network availability based on a grid computing system simulation
US20070180451A1 (en) * 2005-12-30 2007-08-02 Ryan Michael J System and method for meta-scheduling
US20070255833A1 (en) * 2006-04-27 2007-11-01 Infosys Technologies, Ltd. System and methods for managing resources in grid computing
US20080049254A1 (en) * 2006-08-24 2008-02-28 Thomas Phan Method and means for co-scheduling job assignments and data replication in wide-area distributed systems
US8255915B1 (en) * 2006-10-31 2012-08-28 Hewlett-Packard Development Company, L.P. Workload management for computer system with container hierarchy and workload-group policies
US7937618B2 (en) * 2007-04-26 2011-05-03 International Business Machines Corporation Distributed, fault-tolerant and highly available computing system
US8041773B2 (en) 2007-09-24 2011-10-18 The Research Foundation Of State University Of New York Automatic clustering for self-organizing grids
JP5642338B2 (ja) * 2008-03-10 2014-12-17 富士通株式会社 ジョブ管理プログラムおよびジョブ管理方法
US8037122B2 (en) * 2008-09-19 2011-10-11 Oracle International Corporation Processing of service-oriented tasks within a grid computing environment
US8266477B2 (en) 2009-01-09 2012-09-11 Ca, Inc. System and method for modifying execution of scripts for a job scheduler using deontic logic
US11720290B2 (en) 2009-10-30 2023-08-08 Iii Holdings 2, Llc Memcached server functionality in a cluster of data processing nodes
US10877695B2 (en) 2009-10-30 2020-12-29 Iii Holdings 2, Llc Memcached server functionality in a cluster of data processing nodes
CN101958808B (zh) * 2010-10-18 2012-05-23 华东交通大学 一种服务于多网格接入的集群任务调度管理器
US9058219B2 (en) * 2012-11-02 2015-06-16 Amazon Technologies, Inc. Custom resources in a resource stack
US9307013B1 (en) * 2013-05-30 2016-04-05 Google Inc. Reducing batch completion time in a computer network with max-min fairness
WO2015101827A1 (en) * 2013-12-31 2015-07-09 Mosys, Inc. Integrated main memory and coprocessor with low latency
US9256467B1 (en) 2014-11-11 2016-02-09 Amazon Technologies, Inc. System for managing and scheduling containers
US10789080B2 (en) * 2015-07-17 2020-09-29 Microsoft Technology Licensing, Llc Multi-tier customizable portal deployment system
US9804895B2 (en) * 2015-08-28 2017-10-31 Vmware, Inc. Constrained placement in hierarchical randomized schedulers
US10133590B2 (en) 2015-09-29 2018-11-20 International Business Machines Corporation Container runtime support
US10261782B2 (en) 2015-12-18 2019-04-16 Amazon Technologies, Inc. Software container registry service
US10069869B2 (en) 2016-05-17 2018-09-04 Amazon Technologies, Inc. Versatile autoscaling
US10860373B2 (en) 2016-10-11 2020-12-08 Microsoft Technology Licensing, Llc Enhanced governance for asynchronous compute jobs
US10409642B1 (en) 2016-11-22 2019-09-10 Amazon Technologies, Inc. Customer resource monitoring for versatile scaling service scaling policy recommendations
US11669365B1 (en) 2019-08-26 2023-06-06 Amazon Technologies, Inc. Task pool for managed compute instances
CN111371678B (zh) * 2020-02-26 2021-12-31 北京天维信通科技有限公司 第三方服务运行方法和装置、网关设备及存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2743865B2 (ja) 1995-04-28 1998-04-22 日本電気株式会社 ジョブスケジューリング方式
US6345287B1 (en) * 1997-11-26 2002-02-05 International Business Machines Corporation Gang scheduling for resource allocation in a cluster computing environment
US6112225A (en) * 1998-03-30 2000-08-29 International Business Machines Corporation Task distribution processing system and the method for subscribing computers to perform computing tasks during idle time
US6571274B1 (en) * 1998-11-05 2003-05-27 Beas Systems, Inc. Clustered enterprise Java™ in a secure distributed processing system
US6701382B1 (en) * 1998-12-23 2004-03-02 Nortel Networks Limited Name service for transparent container objects
EP1107108A1 (en) 1999-12-09 2001-06-13 Hewlett-Packard Company, A Delaware Corporation System and method for managing the configuration of hierarchically networked data processing devices
US7143437B2 (en) 2001-01-12 2006-11-28 Siemens Medical Solutions Health Services Corporation System and user interface for managing user access to network compatible applications
US20030028275A1 (en) 2001-05-01 2003-02-06 Xerox Corporation Incremental distributed actuation for large assemblies of implementation units
US7650607B2 (en) * 2001-06-22 2010-01-19 Invensys Systems, Inc. Supervisory process control and manufacturing information system application having a layered architecture
US7093004B2 (en) * 2002-02-04 2006-08-15 Datasynapse, Inc. Using execution statistics to select tasks for redundant assignment in a distributed computing platform

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1298142C (zh) * 2003-08-29 2007-01-31 国际商业机器公司 用于提供网格服务生存期管理的方法和系统
CN1783121B (zh) * 2004-11-30 2011-07-20 国际商业机器公司 用于执行设计自动化的方法和系统
CN100345111C (zh) * 2005-08-26 2007-10-24 南京邮电大学 一种用于网格计算的模型驱动方法
CN1956457B (zh) * 2005-10-24 2014-06-25 国际商业机器公司 用于安排网格计算系统中的网格作业的方法和设备
CN100377091C (zh) * 2006-03-16 2008-03-26 浙江大学 嵌入式操作系统分组硬实时任务调度的实现方法
CN101420354B (zh) * 2008-11-26 2011-08-10 北京航空航天大学 面向广域网远程虚拟环境的组播扩展方法
CN111078356A (zh) * 2019-11-22 2020-04-28 北京达佳互联信息技术有限公司 Gpu集群资源控制系统、方法、装置、设备及存储介质
CN111049915A (zh) * 2019-12-17 2020-04-21 书行科技(北京)有限公司 一种容器云下消息队列代理网格及方法

Also Published As

Publication number Publication date
US20080168451A1 (en) 2008-07-10
US20040123296A1 (en) 2004-06-24
US8087023B2 (en) 2011-12-27
CN100576841C (zh) 2009-12-30
JP2004206712A (ja) 2004-07-22
US7383550B2 (en) 2008-06-03

Similar Documents

Publication Publication Date Title
CN1516419A (zh) 在主机计算机网络上处理客户机请求的系统和方法
Abramson et al. High performance parametric modeling with Nimrod/G: Killer application for the global grid?
Baduel et al. Programming, composing, deploying for the grid
CN1645330A (zh) 用于应用程序分布式管理的启用网格的虚拟机的方法和系统
CN101034362A (zh) 运用移动代理实现网格作业调度的方法
CN1836213A (zh) 服务器间的透明会话迁移
CN101946258A (zh) 基于计算机的业务过程在专用硬件上的基于模型的部署
CN101196832B (zh) 一种面向照明异构设备的资源代理器
CN1906580A (zh) 对于具有可移动对象的启用网格的虚拟机的方法和系统
CN102521024B (zh) 基于生物信息云平台的作业调度方法
CN101206568B (zh) 一种基于Web的网格应用程序接口系统
CN1805424A (zh) 一种网格模拟方法及其模拟器
CN1306407C (zh) 为动态提供而自主地自学习资源选择的方法和系统
CN1799059A (zh) 用于将提供商产品包自动转换成资源管理系统可执行的客户特定的服务环境定义的方法和系统
CN1731432A (zh) 基于内部工作流的网格服务构造方法
CN1835450A (zh) 网格作业管理器
Alonso et al. GMarte: Grid middleware to abstract remote task execution
Xue et al. DSM: a dynamic scheduling method for concurrent workflows in cloud environment
Kacsuk et al. Infrastructure aware scientific workflows and their support by a science gateway
Korala et al. Design and implementation of a platform for managing time-sensitive IoT applications
CN1667573A (zh) 基于服务体/执行流模型的操作系统
Tretola et al. Activity pre-scheduling in Grid workflows
WO2009082387A1 (en) Setting up development environment for computer based business process
Korkhov et al. VL-E: Approaches to design a Grid-based Virtual Laboratory
Guo et al. Research on integrated model based on XML, CORBA and agent

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091230

Termination date: 20181222

CF01 Termination of patent right due to non-payment of annual fee