监控虚拟机集群的方法和系统的利记博彩app

文档序号:9600682阅读:715来源:国知局
监控虚拟机集群的方法和系统的利记博彩app
【技术领域】
[0001]本申请涉及计算机技术领域,具体涉及计算机网络技术领域,尤其涉及监控虚拟机集群的方法和系统。
【背景技术】
[0002]随着当前互联网的高速发展,虚拟化与大数据处理越来越受到业界的重视,而二者的融合,更成为当前业界研究的热门方向。在虚拟化环境里部署运行大数据处理方案,可以极大的提高系统资源的使用率和配置的灵活性。然而,虚拟环境相对于物理环境,存在更大的不确定性,系统的高可用性显得尤其重要。
[0003]在现有技术中,为了保持虚拟系统的高可用性,通常会对虚拟机的物理宿主机进行监控,以确定宿主机是否发生故障。
[0004]然而,上述的对虚拟机的物理宿主机进行监控的方法,在宿主机发生故障时需要通过运维人员手动修复物理宿主机上的全部虚拟机,耗时较久,并且造成长时间服务中断,给用户带来损失。

【发明内容】

[0005]本申请的目的在于提出一种监控虚拟机集群的方法和系统,来解决以上【背景技术】部分提到的技术问题。
[0006]第一方面,本申请提供了一种监控虚拟机集群的方法,方法包括:第一物理机间隔第一预设时间向虚拟机集群中的虚拟机发送虚拟机状态参数查询指令;虚拟机响应于接收到查询指令,向第一物理机发送响应信息;第一物理机响应于响应信息中断第二预设时间,确定虚拟机发生故障,判断发生故障的虚拟机是否满足预设的重启条件,若发生故障的虚拟机满足预设的重启条件,发送重启虚拟机指令给运行发生故障的虚拟机的第二物理机;第二物理机根据重启虚拟机指令,重启发生故障的虚拟机。
[0007]第二方面,本申请提供了一种监控虚拟机集群的系统,系统包括:第一物理机,用于间隔第一预设时间向虚拟机集群中的虚拟机发送虚拟机状态参数查询指令,响应于响应信息中断第二预设时间,确定虚拟机发生故障,判断发生故障的虚拟机是否满足预设的重启条件,若发生故障的虚拟机满足预设的重启条件,发送重启虚拟机指令给运行发生故障的虚拟机的第二物理机;虚拟机,用于响应于接收到查询指令,向第一物理机发送响应信息;以及第二物理机,用于根据重启虚拟机指令,重启发生故障的虚拟机。
[0008]本申请提供的监控虚拟机集群的方法和系统,通过第一物理机间隔第一预设时间向虚拟机集群中的虚拟机发送虚拟机状态参数查询指令,而后通过虚拟机响应于接收到查询指令,向第一物理机发送响应信息,之后通过第一物理机响应于响应信息中断第二预设时间,确定虚拟机发生故障,判断发生故障的虚拟机是否满足预设的重启条件,若发生故障的虚拟机满足预设的重启条件,发送重启虚拟机指令给运行发生故障的虚拟机的第二物理机,最后通过第二物理机根据重启虚拟机指令,重启发生故障的虚拟机。该方法和系统可以实现对虚拟机的监控,在虚拟机发生故障时可以自动恢复,提高了虚拟机集群的可用性,减少了服务中断时间。
【附图说明】
[0009]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0010]图1是本申请可以应用于其中的示例性系统架构图;
[0011]图2示出了根据本申请实施例的监控虚拟机集群的方法的一个示意性流程图;
[0012]图3示出了根据本申请实施例的监控虚拟机集群的方法的又一个示意性流程图;
[0013]图4示出了根据本申请实施例的监控虚拟机集群的方法的第三个示意性流程图;
[0014]图5a示出了根据本申请实施例的虚拟机为管理节点的恢复流程示意图;
[0015]图5b示出了根据本申请实施例的虚拟机为计算节点的恢复流程示意图;
[0016]图6示出了根据本申请实施例的监控虚拟机集群的方法的第四个示意性流程图;
[0017]图7示出了用户应用本申请实施例的监控虚拟机集群的方法提交作业的流程图;
[0018]图8示出了根据本申请实施例的监控虚拟机集群的方法的第五个示意性流程图;
[0019]图9示出了根据本申请实施例的监控虚拟机集群的系统的示例性架构图;
[0020]图10示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
【具体实施方式】
[0021]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
[0022]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0023]图1示出了可以应用本申请实施例的监控虚拟机集群的方法的示例性系统架构100。
[0024]如图1所示,系统架构100可以包括终端设备101、部署虚拟机集群的服务器集群102和未部署虚拟机的服务器104。网络103用以在终端设备101、服务器集群102以及服务器104之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0025]用户110可以使用终端设备101通过网络103与服务器104交互以提交用户作业,服务器104可以通过网络103与服务器集群102交互,将用户提交的作业提交至服务器集群102上运行的虚拟机集群。终端设备101上可以安装有各种客户端应用,例如网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件、云平台应用等。
[0026]终端设备101可以是具有人机交互组件并且支持作业提交的各种电子设备,包括但不限于移动智能终端、平板电脑、膝上型便携计算机、台式计算机、多媒体播放器和电子阅读器等等。
[0027]服务器集群102可以由提供数据分析处理的多个服务器组成,其上可以运行由大量的虚拟机组成的虚拟机集群。其中,虚拟机集群中的虚拟机可以分为两类:管理节点和计算节点。管理节点负责整个集群的管理、资源调度和用户提交的作业管理,计算节点主要负责计算具体子任务的执行。
[0028]服务器104可以是提供数据分析处理的服务器,也可以是多个服务器组成的服务器集群。例如对终端设备101提交的用户作业进行分析处理的服务器。服务器104可以对服务器集群102上运行的虚拟机集群提供的运行数据进行分析处理,以将终端设备101提交的用户作业分派至服务器集群102上运行的虚拟机集群中的管理节点上,再由管理节点将提交的用户作业分派至虚拟机集群中的计算节点,之后管理节点获取计算节点对提交的用户作业的数据分析处理结果,并将该处理结果返回给服务器104,再由服务器104将提交的用户作业的数据分析处理结果返回给终端设备101。
[0029]需要说明的是,本申请实施例所提供的监控虚拟机集群的方法中的操作步骤一般由服务器集群102、运行于服务器集群102上的虚拟机集群和服务器104执行,向服务器104提交用户作业的操作步骤一般由终端设备101执行。
[0030]应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
[0031]继续参考图2,其示出了根据本申请实施例的监控虚拟机集群的方法的一个示意性流程图200。该监控虚拟机集群的方法200,包括以下步骤:
[0032]在步骤201中,第一物理机间隔第一预设时间向虚拟机集群中的虚拟机发送虚拟机状态参数查询指令。
[0033]在本实施例中,第一物理机是指未部署虚拟机的物理机,例如图1中的服务器104。虚拟机集群可以集中多个虚拟机一起进行同一种服务,在客户端看来就像是只有一个虚拟机。一个计算机上可以部署一个或多个虚拟机,多个计算机上部署的虚拟机形成虚拟机集群,虚拟机集群可以同时进行并行计算,从而获得很高的计算速度。
[0034]上述的第一预设时间是第一物理机向虚拟机发送查询指令的间隔时间,可以综合考虑物理机的参数、网络参数、虚拟机的参数、虚拟机系统资源使用率以及虚拟机系统配置的灵活性等进行设定。
[0035]上述的查询指令,可以为轮询虚拟机的健康状态的指令,例如:查询以下一项或多项虚拟机状态参数信息的指令:虚拟机磁盘使用率、虚拟机网络I/O负载和虚拟机CPU使用率等。
[0036]在步骤202中,虚拟机响应于接收到查询指令,向第一物理机发送响应信息。
[0037]在本实施例中,虚拟机在接收第一物理机发送的查询指令之后,通过运行于虚拟机上的服务进程向第一物理机发送响应信息。
[0038]在步骤203中,第一物理机响应于响应信息中断第二预设时间,确定虚拟机发生故障,判断发生故障的虚拟机是否满足预设的重启条件,若发生故障的虚拟机满足预设的重启条件,发送重启虚拟机指令给运行发生故障的虚拟机的第二物理机。
[0039]在本实施例中,第一物理机中预设了第二预设时间,第二预设时间为正常工作时允许的响应信息间隔的响应时间,若响应信息中断第二预设时间,则确定虚拟机发生故障。
[0040]若发生故障的虚拟机满足预设的重启条件,也即当发生故障的虚拟机虽影响到虚拟机集群的工作效率,但满足尝试修复的条件时,可以发送重启虚拟机指令给运行发生故障的虚拟机的第二物理机。例如,在一个可选的实现方式中,若发生故障的虚拟机的比例小于预设比例,可以发送重启虚拟机指令给第二物理机;在另一个可选的实现方式中,若发生故障的虚拟机距上一次重启或重建虚拟机的时间超过第三预设时间,
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1