云环境下基于动态博弈的资源调度方法与流程

文档序号:11250715阅读:761来源:国知局
云环境下基于动态博弈的资源调度方法与流程

本发明属于基于云计算的资源调度技术领域,具体涉及一种云环境下基于动态博弈的资源调度方法。



背景技术:

云计算是在网格计算、并行计算和p2p等技术基础上发展起来的一种新兴计算模型。它将存储在数据中心集群上的大量计算资源、存储资源与软件资源链接在一起(包括cpu,内存,硬盘等硬件资源,以及开发环境、应用程序等软件资源),进行集中统一管理,形成大规模的共享虚拟资源池,按需提供给用户使用,为其提供“召之即来,挥之即去”且似乎“能力无限”的云服务。随着分布式技术的飞速发展,云计算已经成为一个关键的研究领域。云计算是建立在体系结构(serviceorientedarchitecture,soa)之上,以服务的方式提供计算资源,用户可以按需获取云服务。

随着云计算的快速发展,海量资源融入云中,用户需求不断增加,云计算中心提供的服务不断增多,面临着巨大的资源调度压力。由于云计算系统处于一个动态的环境中,并且用户群体十分庞大,每个应用程序有着持续不断变化的资源需求,导致它的性能需要动态的被满足[8]。另一方面,云计算使用虚拟化技术屏蔽了底层硬件的复杂性,提高了灵活性。在多用户环境下,大量用户的应用程序运行在一台物理设备上,共享硬件和存储设备。云计算的按需资源供应和多用户资源共享,导致云计算资源调度问题成为继云计算中安全问题之后的第二大难题。

在云计算服务资源调度过程中,多个用户先后提交任务请求,根据请求的时间节点可以划分成多个用户组。它们要求使用同一类资源,但是调度过程中又要保证先提交的用户组不能独占该类资源,这就形成了不同用户组之间的资源竞争。为了满足每个用户组的需求,符合用户组提出的约束条件如任务完成时间、完成任务所需开销等等,同时达到资源的最合理有效的使用和配置,就需要建立基于动态博弈的竞争模型,设计一种公平有效的资源调度方法,用于解决云服务资源调度中多用户非同时申请资源的竞争问题,既提高资源调度效率又保证资源分配公平性。

现有技术一般采用基于智能优化算法的资源调度,从调度中心整体利益出发,把智能算法运用于云计算资源调度,提高了资源调度效率,保证了系统的性能。但不足之处是以调度中心整体利益为主,不能满足所有用户的资源需求,不能保证资源分配公平性。

另外一种是基于博弈论的资源调度,满足了个体理性与激励兼容特性,不足之处是过分追求云计算资源价格,未保证用户其他的需求,即未保证用户的服务质量qos(qualityofservice)。

博弈论是经济学最基本的理论之一,用于解决不同个体之间的竞争与相互制衡问题,在西方社会科学中被认为是20世纪社会科学领域取得的最大成果。而博弈论是用于解决不同个体之间的竞争与相互制衡问题,在西方社会科学中被认为是20世纪社会科学领域取得的最大成果。博弈论作为研究参与者竞争的理论,在对不同个体之间的竞争进行建模和分析方面具有非常高的价值。针对云服务资源调度中多用户非同时申请资源的竞争问题,本发明基于动态博弈论,提出一种合理有效的资源调度模型及方法,用于解决云环境中多用户资源竞争问题,提高资源调度效率。



技术实现要素:

本发明针对现有技术基于智能优化算法的资源调度存在以调度中心整体利益为主,不能满足所有用户的资源需求,不能保证资源分配公平性问题和基于博弈论的资源调度,存在过分追求云计算资源价格,未保证用户其他的需求,即未保证用户的服务质量问题,提出一种云环境下基于动态博弈的资源调度方法。

本发明的技术方案是:一种云环境下基于动态博弈的资源调度方法,包括以下步骤:

步骤1:构建云环境下基于动态博弈的资源调度模型;

步骤2:基于动态博弈的资源调度模型,根据各用户任务的属性高低分配选择资源的优先权;

步骤3:对任务属性相同的用户采取先申请先选择分配优先权的策略,并将各用户的收益定义为其qos的满意度;

步骤4:利用逆向归纳法求解博弈的纳什均衡解。

所述的云环境下基于动态博弈的资源调度方法,所述步骤1中云环境下资源调度是指在资源虚拟化基础上,资源调度中心动态地分配各用户执行任务所需的计算资源,为执行任务提供可行性环境;云环境下资源调度过程中,物理资源被云系统虚拟化成虚拟单元,作为执行任务的载体。

所述的云环境下基于动态博弈的资源调度方法,所述云环境动态博弈资源调度模型是一个五元组,即mced-grsm=(n,t,s,i,u),其中:n=(n1,n2,…,nn)是博弈的参与者集合,参与者是某一时间片段所有发送任务请求的用户;t=(t1,t2,…,tn)是参与者的行动顺序,即在某一时间片段用户选择资源的先后顺序;s=(s1,s2,…,sn)是参与者的策略空间,表示参与者ni的策略空间,每个参与者都应有1种以上的策略,即h≥1;

i=(i1,i2,…,in)是参与者的信息集,表示参与者ni的信息集,每个参与者都应有1种以上的策略,即k≥1;

u=(u1,u2,…,un)是参与者的收益函数集合,表示用户n在用户1,2,…,n-1行动之后选择策略sn的收益;收益函数表示参与者从博弈中可以得到的收益水平,由所有参与者的策略共同决定,参与者不同的策略组合所得到的收益不同。

所述的云环境下基于动态博弈的资源调度方法,所述调度模型满足三个假设,即:理性假设:假设各用户是完全理性的,不会因要获得最大收益而发送毫无意义、恶意占用资源的任务请求;类型假设:假设不同用户的需求不同,提出的qos不同;收益假设:假设所有用户的目标都是在满足自己qos的前提下,请求资源来完成任务,资源调度中心的目标是尽可能满足所有用户提出的需求,反馈资源完成其任务。

所述的云环境下基于动态博弈的资源调度方法,所述步骤3中用户的收益定义为其qos的满意度利用云环境资源调度博弈树来衡量,云环境资源调度博弈树用一个三元组表示(n,s,u)表示,其中n表示所有节点集合,代表资源调度中所有用户的集合;s是博弈树中有向边的集合,代表资源调度中用户的策略;u则是用户收益的集合,代表在不同策略下取得的收益。

所述的云环境下基于动态博弈的资源调度方法,所述qos的满意度用各用户的收益来衡量,即,ui(s1,…,si)=ε1q1+ε2q2+...+εnqn+…,其中q代表服务质量指标,ε1,ε2,…,εn代表用户对各类指标的权重,ε1,ε2,…,εn∈(0,1)。εiqi代表了用户对i类型资源服务质量的满意度;而资源调度中心的收益是所有用户的总收益,即:

所述的云环境下基于动态博弈的资源调度方法,所述步骤4具体为:从博弈终点节的直接前行节开始,然后通过博弈树逆向归纳的方法,被称为博弈中的逆向归纳法;求解是从扩展博弈树的底端开始,考虑用户n的子博弈,如果用户n-1选择策略则对于用户n来说选择策略优于选择其他任何一个策略,同样的,当用户n-1选择策略时,用户n的最优策略是各用户知道这些信息,因此用户n-1会选择策略来最大化自己的利益,这样,求解出子均衡博弈解以此类推,最终求解出均衡博弈解

所述的云环境下基于动态博弈的资源调度方法,所述云环境动态博弈资源调度模型中,策略是一个纳什均衡,如果对于所有的i∈n,的一个最优反应,也即对于所有的si∈si和所有的i∈n,有:其中,表示用户i在用户i-1行动之后选择最优策略的收益,表示用户i在用户i-1行动之后选择非最优策略si的收益。

本发明的有益效果是:本发明针对云环境下多个用户由于同时提交任务而引起的资源竞争问题,建立云环境动态博弈资源调度模型,利用动态博弈理论对各个用户之间的资源竞争进行建模和分析,尽可能地满足所有用户的qos需求;基于用户对各类指标的权重建立收益函数,全方位考虑了各用户对资源的类型及需求程度的差异;设计了最优资源选择策略,优先保障任务级别高的用户先选择任务资源,对于任务级别相同的用户采取先申请先选择的原则,从而在最大程度上满足各个用户的需求;利用逆向归纳法求解动态博弈模型的纳什均衡解,从而实现了资源最合理有效的配置。

附图说明

图1为本发明的调度方法框图;

图2为云环境资源调度博弈树结构示意图;

图3为云环境资源调度结构示意图;

图4为高级别任务的云环境资源调度博弈树结构示意图;

图5为低级别任务云环境资源调度博弈树结构示意图;

具体实施方式

实施例1:结合图1-图5,一种云环境下基于动态博弈的资源调度方法,包括以下步骤:

步骤1:构建云环境下基于动态博弈的资源调度模型;步骤2:基于动态博弈的资源调度模型,根据各用户任务的属性高低分配选择资源的优先权;步骤3:对任务属性相同的用户采取先申请先选择分配优先权的策略,并将各用户的收益定义为其qos的满意度;步骤4:利用逆向归纳法求解博弈的纳什均衡解。

具体的,步骤1中云环境下资源调度是指在资源虚拟化基础上,资源调度中心动态地分配各用户执行任务所需的计算资源,为执行任务提供可行性环境;云环境下资源调度过程中,物理资源被云系统虚拟化成虚拟单元,作为执行任务的载体。

具体的,云环境动态博弈资源调度模型是一个五元组,即mced-grsm=(n,t,s,i,u),其中:n=(n1,n2,…,nn)是博弈的参与者集合,参与者是某一时间片段所有发送任务请求的用户;t=(t1,t2,…,tn)是参与者的行动顺序,即在某一时间片段用户选择资源的先后顺序;s=(s1,s2,…,sn)是参与者的策略空间,表示参与者ni的策略空间,每个参与者都应有1种以上的策略,即h≥1;

i=(i1,i2,…,in)是参与者的信息集,表示参与者ni的信息集,每个参与者都应有1种以上的策略,即k≥1;

u=(u1,u2,…,un)是参与者的收益函数集合,表示用户n在用户1,2,…,n-1行动之后选择策略sn的收益;收益函数表示参与者从博弈中可以得到的收益水平,由所有参与者的策略共同决定,参与者不同的策略组合所得到的收益不同。

所述的云环境下基于动态博弈的资源调度方法,所述调度模型满足三个假设,即:理性假设:假设各用户是完全理性的,不会因要获得最大收益而发送毫无意义、恶意占用资源的任务请求;类型假设:假设不同用户的需求不同,提出的qos不同;收益假设:假设所有用户的目标都是在满足自己qos的前提下,请求资源来完成任务,资源调度中心的目标是尽可能满足所有用户提出的需求,反馈资源完成其任务。

具体的,步骤3中用户的收益定义为其qos的满意度利用云环境资源调度博弈树来衡量,云环境资源调度博弈树用一个三元组表示(n,s,u)表示,其中n表示所有节点集合,代表资源调度中所有用户的集合;s是博弈树中有向边的集合,代表资源调度中用户的策略;u则是用户收益的集合,代表在不同策略下取得的收益。

具体的,qos的满意度用各用户的收益来衡量,即,ui(s1,…,si)=ε1q1+ε2q2+...+εnqn+…,其中q代表服务质量指标,ε1,ε2,…,εn代表用户对各类指标的权重,ε1,ε2,…,εn∈(0,1)。εiqi代表了用户对i类型资源服务质量的满意度;而资源调度中心的收益是所有用户的总收益,即:

具体的,步骤4具体为:从博弈终点节的直接前行节开始,然后通过博弈树逆向归纳的方法,被称为博弈中的逆向归纳法;求解是从扩展博弈树的底端开始,考虑用户n的子博弈,如果用户n-1选择策略则对于用户n来说选择策略优于选择其他任何一个策略,同样的,当用户n-1选择策略时,用户n的最优策略是各用户知道这些信息,因此用户n-1会选择策略来最大化自己的利益,这样,求解出子均衡博弈解以此类推,最终求解出均衡博弈解

具体的,云环境动态博弈资源调度模型中,策略是一个纳什均衡,如果对于所有的i∈n,的一个最优反应,也即对于所有的si∈si和所有的i∈n,有:其中,表示用户i在用户i-1行动之后选择最优策略的收益,表示用户i在用户i-1行动之后选择非最优策略si的收益。

实施例2,结合图1-图5,一种云环境下基于动态博弈的资源调度方法,云环境下资源调度是指在资源虚拟化基础上,资源调度中心动态地分配各用户执行任务所需的计算资源,为执行任务提供可行性环境,是各类任务顺利实施的基础。即在云环境资源调度过程中,物理资源被云系统虚拟化成虚拟单元,作为执行任务的载体。用户执行任务往往对应一种最佳的虚拟单元类型,而任意充足的物理资源(如各类传感器、计算机、数据库等)都可以创建这些对应的虚拟单元,进而可以分配给各用户来完成其任务。但不同的创建方案直接影响用户获得的服务质量qos(qualityofservice),即影响用户执行任务的效率,因此qos是各用户争夺的主要目标。

动态博弈论是指参与人的行动有先后顺序,而且行动在后者可以观察到前者的选择,并据此做出相应的选择。而扩展博弈是通过树的形式来描述一组博弈序列,完全信息博弈是指在博弈的过程中,每个博弈参与者都了解其他参与者选择不同策略的收益情况,也知道之前所有发生过的决策。而多用户服务资源调度的特点如下:(1)用户根据各自的需求在不同时间节点提交任务请求,可以认为是先后顺序进行,根据用户的请求时间划分为不同的用户组;(2)虽然云计算资源池趋近无限大,但资源性能有差别。某个高性能资源如果被多个用户使用就会大大降低该资源性能,所以前一个用户的策略会影响后一个用户的策略选择,即用户策略相互制约;(3)云计算调度中心掌握用户申请的先后顺序、请求内容及收益函数。因此,多用户服务资源调度的过程可以看作是动态博弈中完全信息扩展博弈的过程,所以本发明是在云计算资源调度中心建立基于完全信息扩展博弈的多用户资源调度模型。

模型假设,假设1.理性假设:假设各用户是完全理性的,不会因要获得最大收益而发送毫无意义、恶意占用资源的任务请求。假设2.类型假设:假设不同用户的需求不同,提出的qos不同。假设3.收益假设:假设所有用户的目标都是在满足自己qos的前提下,请求资源来完成任务。资源调度中心的目标是尽可能满足所有用户提出的需求,反馈资源完成其任务。

模型定义

定义1、云环境动态博弈资源调度模型mced-grsm(militarycloudenvironmentdynamicgameresourceschedulingmodel)是一个五元组mced-grsm=(n,t,s,i,u),其中:

1)n=(n1,n2,…,nn)是博弈的参与者集合。参与者是参与博弈的独立决策、独立承担结果的个人或组织,在不同的场合中,参与者的定义是不同的。在本文中,参与者是某一时间片段所有发送任务请求的用户。

2)t=(t1,t2,…,tn)是参与者的行动顺序。即在某一时间片段用户选择资源的先后顺序,在云环境中首先根据任务属性高低进行资源选择排序,即任务级别高的用户先选择可用资源来完成任务;然后任务级别相同的用户采取先申请先选择的排序原则。

3)s=(s1,s2,…,sn)是参与者的策略空间。si表示参与者ni的策略空间,每个参与者都应有1种以上的策略,即h≥1。在云环境中,各用户的策略采取选择最优资源原则。

4)i=(i1,i2,…,in)是参与者的信息集。表示参与者ni的信息集,每个参与者都应有1种以上的策略,即k≥1。在本文中,用户选择资源时知道前一个用户的选择策略。

5)u=(u1,u2,…,un)是参与者的收益函数集合。表示用户n在用户1,2,…,n-1行动之后选择策略sn的收益。收益函数表示参与者从博弈中可以得到的收益水平,由所有参与者的策略共同决定,参与者不同的策略组合所得到的收益不同。在云环境中,参与者收益函数是用户qos的满意度。

定义2、云环境资源调度博弈树是常常用于表示调度过程中实现每个收益的策略路径表现形式。它具有一般树的结构,用一个三元组表示(n,s,u)表示,如图2所示。其中n表示所有节点集合,代表资源调度中所有用户的集合;s是博弈树中有向边的集合,代表资源调度中用户的策略;u则是用户收益的集合,代表在不同策略下取得的收益。

云环境下基于动态博弈的收益量化计算及均衡分析,包括,(1)收益量化计算:

云环境资源调度中用户收益的量化计算是后续调度博弈分析的基础,且直接影响资源调度的结果。因此,对各用户的策略进行合理地收益量化是非常有必要的。在实际的资源调度过程中,资源调度中心资源趋近无限多,资源性能有优良差别;申请不同任务的用户对资源性能权重不同。而资源调度中心是尽可能满足所有用户的qos,反馈资源执行其任务,从而获得收益。相反如果不能尽可能满足所有用户的qos,就会降低效益,得到损失。

本文认为各用户的收益是其qos的满意度,即:

ui(s1,…,si)=ε1q1+ε2q2+...+εnqn+…

其中q代表服务质量指标,例如响应时间、可靠性、保密性等等。ε1,ε2,…,εn代表用户对各类指标的权重,ε1,ε2,…,εn∈(0,1)。εiqi代表了用户对i类型资源服务质量的满意度。

而资源调度中心的收益是所有用户的总收益,即:

(2)均衡分析:任何一个用户申请资源都希望获得资源调度中心的优质资源,满足自己的qos,从而完成任务。如果资源调度中心不能满足其qos,就会降低用户效益。所以面对所有申请资源用户的不同qos,如何分配资源选取策略,尽可能满足所有用户的qos是云环境资源调度的关键问题。

在资源调度过程中,各用户根据提交任务的属性高低按序选择优质资源,后一个用户只能根据前一个用户行为来选择资源,以尽可能满足自己的qos,得到最大收益u。本发明采用博弈论中的逆向归纳法(backwardinductioningames)求解博弈的纳什均衡解。

定义3、逆向归纳法:从博弈终点节的直接前行节开始,然后通过博弈树逆向归纳的方法,被称为博弈中的逆向归纳法。求解是从扩展博弈树的底端开始。考虑用户n的子博弈,如果用户n-1选择策略则对于用户n来说选择策略优于选择其他任何一个策略。同样的,当用户n-1选择策略时,用户n的最优策略是各用户知道这些信息,因此用户n-1会选择策略来最大化自己的利益,这样,求解出子均衡博弈解以此类推,最终求解出均衡博弈解

定义4、在mced-grsm模型中,策略是一个纳什均衡,如果对于所有的i∈n,的一个最优反应,也即对于所有的si∈si和所有的i∈n,有:

其中,表示用户i在用户i-1行动之后选择最优策略的收益,表示用户i在用户i-1行动之后选择非最优策略si的收益。

具体来讲,云环境资源调度实例如图3所示。该实例描述了一个虚拟化云环境下资源调度问题,资源调度中心资源池趋近无限大,各用户的qos指标有响应时间、稳定性、保密性。某一时间片段有四个用户向资源调度中心提交任务,而每个用户的qos不同,即对不同类型资源的权重不同。资源调度中心在资源调度过程中首先根据任务属性的高低分配各用户选择资源的先后顺序,然后再对任务级别相同的用户采取先申请先选择原则分配先后顺序。而后一个用户只能根据前一个用户的行为来选择资源,以尽可能满足自己的qos。调度模型根据已有信息生成本次博弈数据表2。

表2云环境资源调度数据表

确定完本次云环境资源调度博弈数据之后计算各用户选择不同策略的收益量化,如表3、4。

表3云环境资源调度各用户收益(高级别任务)

表4云环境资源调度各用户收益(低级别任务)

经过收益量化计算后,将上述数据输入gambit博弈软件进行均衡分析。由此可得到博弈树如图4、5所示。

实验结果表示可分别从高低级别任务的博弈中找到唯一一个纳什均衡解,构成本次云环境资源调度的纳什均衡解,结果为:即四个用户均会选择第二个策略。

对上述纳什均衡可解释为:云环境资源调度过程中,首先保障高级别任务的资源分配,然后同一级别任务的各用户根据前一个用户的策略行动,尽可能选择优质资源来执行任务,使自己的收益最大。即在纳什均衡中,各用户均会选择最优资源来执行任务。以上结果表明,本发明所提出的云环境资源调度模型及方法可以更加合理、有效地反映策略收益对用户执行任务的影响,并且可以有效地进行最优的资源调度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1