虚拟化备份容错系统及方法

文档序号:9579156阅读:484来源:国知局
虚拟化备份容错系统及方法
【技术领域】
[0001]本发明涉及虚拟化热迀移技术领域,具体是涉及一种虚拟化备份容错系统及方法。
【背景技术】
[0002]随着信息应用数据的不断扩大,运行在单台物理服务器的应用给服务器带来较重的负担。一旦设备出现故障,服务器就会出现故障,业务就会中断,系统稳定性能较差,业务连续性能较弱。因此,虚拟化技术成为各大设备商家研究的热点。简单来说,虚拟化技术是指计算机相关模块在虚拟软件的基础上运行,并不是在真实独立的物理硬件基础上运行,将有限的、固定的资源根据不同需求进行重新规划,以达到最大利用率,达到简化管理、优化资源等目的。
[0003]热迀移又称在线迀移,虚拟机在不同物理设备之间迀移保持业务正常,而且迀移过程中停机时间很短。对于服务本身来说,主备切换的时间很短,对用户来说迀移过程是透明的,用户感知不到业务的中断。热迀移适用于服务可用性很高的场景。XEN是剑桥大学开发的一个开放源代码虚拟机监视器,XEN热迀移和KVM(Kernel-based Virtual Machine,基于内核的虚拟机)都是采用传统的迭代预拷贝策略,就是预先拷贝全部内存镜像到目的主机,此时源主机的虚拟机还没有冻结,目的主机还没启动,重复拷贝这个过程中被虚拟机写过的脏页内存,直到时机成熟,预拷贝循环结束。
[0004]NSF (Non-Stop Forwarding,路由器不间断转发)是一种设备级高可靠性技术,它可以在设备控制层面出现故障后,继续保持转发,并在较短时间内完全恢复设备功能,继续正常运行。但是,NSF技术主控故障恢复需要依赖于邻居设置的支持,如果网络中设备协作复杂,一旦有多个节点出现故障,NSF故障恢复需要花费很长的时间,网络拓扑恢复变的缓慢,导致NSF失效。
[0005]NSR(Non-Stop Routing,路由器不间断路由)是一种自包含技术,不需要邻居协助,不存在互通性问题,可以应用在任意组网环境下拥有AMB(Active Main Board,主用主控板,以下简称主用板)和SMB(Slave Main Board,备用主控板,以下简称备用板)的单台设备上,主用板、备用板同时运行,主用板发生故障时,协议控制平面无缝转移到备用板。NSR实现了控制平面倒换而邻居不感知,当多个节点发生故障时,系统依然运行在可控范围之内。对于单点接入运营商网络的情况,单点出现故障或者需要维护时,设备发生主备切换,若此时邻居不支持GR(Graceful Restart,平滑重启)或多个邻居节点在同一时间失效,会导致设备将无法重建路由信息。部署NSR则能够解决上述问题,给用户的关键业务提供不间断路由转发,给系统带来高可靠性保障。
[0006]虚拟化NSR就是采用虚拟化技术实现NSR的功能。对网络层相关模块进行修改,实现网络连接备份以保证网络连接不中断。要求控制层面运行在虚拟机内,将主用板内控制层虚拟机状态实时备份到备用板内,当主用板的控制层面发生故障时,启用备用板上的虚拟机接替,保证控制层面不间断运行。原始的虚拟化热迀移技术实现如下:主用板第一次向备用板同步所有内存数据,之后仅同步脏页数据,在同步完成后主用板关闭虚拟机,备用板的虚拟机进入运行状态。传统的虚拟化商家采用的是进程级保护,备用板只能接收一次主用板传送来的同步数据,当一个物理应用板发生故障时,会导致整个业务中断。

【发明内容】

[0007]本发明的目的是为了克服上述【背景技术】的不足,提供一种虚拟化备份容错系统及方法,主用板发生故障时,备用板通过恢复同步数据接替其工作,保证控制层业务不间断运行。
[0008]本发明提供一种虚拟化备份容错系统,包括主用板和备用板,主用板和备用板的结构相同,该系统还包括传输控制协议TCP同步通道,主用板通过TCP同步通道与备用板进行交互,该系统采用新的预拷贝策略:备用板将主用板同步成功的数据保存在内存中,并在本次同步成功后更新上一次同步数据,系统级备份数据每次同步迀移都是完整的内存数据;备用板实现多镜像点备份,将多个镜像存储在内存或硬盘中;对原始虚拟化热迀移功能进行扩展,采用系统级保护:主用板同步完成后不关闭虚拟机,保持运行状态;备用板在接收完同步数据后仍保持暂停状态,不进入运行状态;当主用板发生故障时,备用板选取最新的镜像恢复同步数据,代替主用板工作,保证控制层业务不间断运行。
[0009]在上述技术方案的基础上,所述主用板发生故障时,备用板通过心跳检查感知到主用板发生故障。
[0010]在上述技术方案的基础上,所述备用板感知到主用板发生故障时,备用板的虚拟化控制器恢复之前迀移成功的数据,备用板的虚拟化控制器通过模拟迀移备份数据,选取最新的镜像恢复同步数据。
[0011]在上述技术方案的基础上,所述主用板包括硬件、Linux操作系统和虚拟化控制器,主用板的虚拟化控制器通过TCP同步通道与备用板的虚拟化控制器交互。
[0012]在上述技术方案的基础上,所述Linux操作系统包括硬件管理模块,所述硬件管理模块用于管理主用板、备用板的上电信号以及其他信号。
[0013]在上述技术方案的基础上,所述TCP同步通道采用10千兆以太网。
[0014]本发明还提供一种虚拟化备份容错方法,包括以下步骤:
[0015]主用板和备用板上电,备用板等待冋步连接;主用板启动冋步命令,与备用板建立同步连接;主用板通过TCP同步通道向备用板发送同步数据,备用板接收同步数据,并存储在当前正在迀移数据的内存区域;
[0016]备用板接收到主用板发送的本次同步结束消息时,备用板保存本次同步数据,并更新上次同步完成的数据;对原始虚拟化热迀移功能进行扩展,采用系统级保护:主用板同步完成后不关闭虚拟机,保持运行状态;备用板在接收完同步数据后仍保持暂停状态,不进入运行状态;
[0017]采用系统级备份,通过多次热迀移形成可恢复镜像点,整个迀移过程对用户透明;如果系统没有关闭同步命令,主用板继续通过TCP同步通道向备用板发送同步数据,备用板接收同步数据,存储在当前正在迀移数据的内存区域内;直到系统关闭同步命令,备用板断开同步连接;
[0018]备用板感知到主用板发生故障时,备用板选取最新的镜像点恢复同步完成的数据,代替主用板工作,保证控制层业务不间断运行。
[0019]在上述技术方案的基础上,所述主用板和备用板使用相同的文件系统目录。
[0020]在上述技术方案的基础上,所述备用板通过心跳检查感知到主用板发生故障。
[0021]在上述技术方案的基础上,所述备用板感知到主用板发生故障时,备用板的虚拟化控制器恢复之前迀移成功的数据,备用板的虚拟化控制器通过模拟迀移备份数据,选取最新的镜像恢复同步数据。
[0022]与现有技术相比,本发明的优点如下:
[0023](1)本发明提供一种新的迀移同步与回放恢复方法,通过对原始虚拟化热迀移功能进行扩展,使主用板在同步完成之后一直处于运行状态,备用板在同步完成之后保持暂停状态。与传统的虚拟化商家采用进程级保护相比,本发明采用系统级保护:主用板同步完成后不关闭虚拟机,保持运行状态;备用板在接收完同步数据后不进入运行状态。本发明采用新的预拷贝策略:备用板将主用板同步成功的数据保存在内存中,并在本次同步成功后更新上一次同步数据,备用板可以反复多次接收主用板传送来的同步数据,而传统的仅能接收一次;系统级备份数据每次同步迀移都是完整的内存数据,主用板发生故障时,备用板通过恢复同步数据接替工作,保证控制层业务不间断运行。
[0024](2)本发明中的备用板实现多镜像点备份,备用板可以接收到主用板多次同步迀移数据,备用板在内存或硬盘存储多次迀移成功的数据镜像以及正在迀移同步的数据。本发明采用系统级备份,通过多次热迀移形成可恢复镜像点,整个迀移过程对用户是透明的。本发明中的系统具有加载迀移备份数据功能和故障触发恢复功能,备用板通过心跳检查感知到主用板发生故障,备用板选取最新的镜像点进行数据恢复,代替主用板工作。主用板和备用板之间只要有完整的同步迀移数据,主用板和备用板之间就能够反复切换工作,且业务不会中断,适用于虚拟化热迀移备份的大型数据通信设备之间、云存储领域产品。
【附图说明】
[0025]图1是本发明实施例中虚拟化备份容错系统的结构框图。
[0026]图2是本发明实施例中虚拟化备份容错方法的流程图。
【具体实施方式】
[0027]下面结合附图及
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1