一种可自愈的容错计算机系统的利记博彩app
【技术领域】
[0001]本发明属于飞机航空电子系统设计领域,是一种高可靠的机载容错计算机系统。
【背景技术】
[0002]机载计算机系统的容错是利用冗余的元件或者部件来屏蔽已发生故障对系统产生的影响。所以故障容错可定义为:若一个系统在出现运行性故障时,能依靠系统内驻的能力来保持系统连续正确地执行其预定的流程和输入输出功能,这个系统称作故障容错系统。通常容错系统在诊断出某一冗余部件或单元故障后会采剔除该故障部件或该部分功能,实现故障的隔离,这种方式可有效保证系统的可靠运行,避免故障部件的影响。随着技术的不断发展,对系统可靠性、经济性、重量的要求的不断提升,如果通过增加余度提高系统可靠性将会提高系统的复杂度与成本,因此增加余度数量已不符合容错技术发展的要求,通过对容错计算机系统的故障部件进行故障恢复和自愈,可有效提升容错系统的可靠性与可用性,也是当前容错计算机系统技术的发展趋势。
【发明内容】
[0003]为了解决【背景技术】中所存在的技术问题,本发明提出了一种可自愈的容错计算机系统,可适应当前再不增加系统余度数的情况下,将可靠性提升I个数量级。
[0004]本发明的技术解决方案:一种可自愈的容错计算机系统,其特征在于:所述系统包括三个构型相同的容错节点,每个容错节点除具备基本的计算机功能外,同时包括三模冗余的1接口容错与双处理器的比较监控功能;
[0005]三个节点同时并行工作,采用高速总线与外部设备交联,节点之间通过高速串行总线实现节点之间的数据交互;
[0006]节点内部的1接口数据经过三模冗余的硬件表决后提供给节点内的双处理器,双处理器同时工作,对运算结果进行比较监控;
[0007]容错节点指具备独立工作能力的计算机。
[0008]可自愈的容错计算机系统实现方法,其特征在于:所述方法包括以下步骤:
[0009]I)设计自愈系统,建立三模冗余1控制逻辑,对FPGA内部区域实现细粒度划分,保证自愈时间,即从故障发生到故障恢复小于50ms;
[0010]2)根据不同的故障类型进行相应得重构配置;
[0011 ]若为瞬态故障通过重构逻辑对FPGA故障部分进行重构恢复,若为永久故障采用对可重构逻辑器件重新配置的方法,避开产生错误的芯片区域,利用其周边的其他可重构逻辑资源组合替代原本在出错区域上实现的功能;
[0012]3)重构系统在重构过程中节点正常工作,利用1的冗余资源在故障发生到自愈完成,将发生的故障记录到非易失存储中;
[0013]4)系统中冗余节点之间的表决出现不一致节点时,冗余节点采用多数表决原则,确定故障节点,进行故障节点的隔离,进行控制逻辑切换;保证执行正确控制指令。
[0014]本发明的优点是:
[0015]1、本发明采用三节点的容错系统结构,是由三个独立的计算机组成的容错系统。
[0016]2、每个节点内部通过FPGA实现计算机三模冗余的接口处理逻辑,可实现对1接口的节点内故障诊断,同时利用FPGA的动态可重构功能实现故障的重构与恢复。对不可恢复的硬件故障通过余度降级实现节点的一次故障工作。
[0017]3、节点内处理器配置为双核处理器(一个命令处理器,一个监控处理器),保证节点内数据的完整可信。
【附图说明】
[0018]图1是本发明系统结构示意图;
[0019]图2是本发明自愈过程示意图;
图3是本发明节点间与节点内故障逻辑转换图;
【具体实施方式】
[0020]下面对本发明做进一步详细说明。
[0021]参见图1,本发明的可自愈容错计算机系统主要由三个同构型容错节点组成,每个节点内部由三模冗余的1接口与双处理器构成,物理上系统包含3台相同的容错节点。3个节点同时并行工作,采用高速容错总线与外部设备交联,节点之间通过高速串行总线实现节点之间的数据交互(CCDL),节点内部的1接口数据要经过三模冗余的硬件表决后提供给节点内的双处理器,双处理器同时工作,对运算结果进行比较监控,无故障时由主处理器参与节点之间的表决与监控,实现对应用系统的控制。当任何一个节点内的1出现故障时,对故障的1进行自愈重构,重构成功后实现恢复,处理器监控出现故障时,利用其他节点的数据信息定位故障处理器,并进行隔离,此时不降级容错节点。其特征在于:
[0022]计算机系统采用三节点容错结构,每个节点具备内部为三模冗余的1和双处理器保证节点信息的完整可靠;
[0023]利用FPGA的动态重构、局部重构并不影响其它电路的功能。设计建立故障自愈(self-healing)系统,故障自愈通过故障检测、修复/缓解故障,恢复系统故障前状态等任务,硬件故障检测可通过三模冗余1接口,硬件自监测发现,故障修复通过重构或复位实现。见图2。
[0024]设计专门的自愈系统,建立三模冗余1控制逻辑,对FPGA内部区域实现细粒度划分,保证自愈时间(从故障发生到故障恢复)小于50ms;
[0025]根据不同的故障类型进行相应得故障配置,若为粒子辐射故障通过重构逻辑对FPGA故障部分进行重构恢复,若为永久故障采用对可重构逻辑器件重新配置的方法,避开产生错误的芯片区域,利用其周边的其他可重构逻辑资源组合替代原本在出错区域上实现的功能。
[0026]重构系统在重构过程中节点正常工作,利用1的冗余资源在故障发生到自愈完成,对系统的正常工作不产生影响,仅将发生的故障记录到非易失存储中。
[0027]系统中各节点之间的表决出现永久故障后,节点采用多数表决原则,确定故障节点,进行故障节点的隔离,进行控制逻辑切换,保证执行正确控制指令。节点间与节点内故障逻辑转换见图3。
【主权项】
1.一种可自愈的容错计算机系统,其特征在于:所述系统包括三个构型相同的容错节点,每个容错节点除具备基本的计算机功能外,同时包括三模冗余的1接口容错与双处理器的比较监控功能; 三个节点同时并行工作,采用高速总线与外部设备交联,节点之间通过高速串行总线实现节点之间的数据交互; 节点内部的1接口数据经过三模冗余的硬件表决后提供给节点内的双处理器,双处理器同时工作,对运算结果进行比较监控; 容错节点指具备独立工作能力的计算机。2.可自愈的容错计算机系统实现方法,其特征在于:所述方法包括以下步骤: 1)设计自愈系统,建立三模冗余1控制逻辑,对FPGA内部区域实现细粒度划分,保证自愈时间,即从故障发生到故障恢复小于50ms; 2)根据不同的故障类型进行相应得重构配置; 若为瞬态故障通过重构逻辑对FPGA故障部分进行重构恢复,若为永久故障采用对可重构逻辑器件重新配置的方法,避开产生错误的芯片区域,利用其周边的其他可重构逻辑资源组合替代原本在出错区域上实现的功能; 3)重构系统在重构过程中节点正常工作,利用1的冗余资源在故障发生到自愈完成,将发生的故障记录到非易失存储中; 4)系统中冗余节点之间的表决出现不一致节点时,冗余节点采用多数表决原则,确定故障节点,进行故障节点的隔离,进行控制逻辑切换;保证执行正确控制指令。
【专利摘要】本发明提出了一种可自愈的容错计算机系统,包括三个构型相同的容错节点,每个容错节点除具备基本的计算机功能外,同时包括三模冗余的IO接口容错与双处理器的比较监控功能;三个节点同时并行工作,采用高速总线与外部设备交联,节点之间通过高速串行总线实现节点之间的数据交互;节点内部的IO接口数据经过三模冗余的硬件表决后提供给节点内的双处理器,双处理器同时工作,对运算结果进行比较监控。容错节点指具备独立工作能力的计算机。本发明提出了一种可自愈的容错计算机系统,可适应当前再不增加系统余度数的情况下,将可靠性提升1个数量级。
【IPC分类】G06F11/18
【公开号】CN105589768
【申请号】CN201510908703
【发明人】马小博, 林坚, 解文涛, 段小虎, 夏德天, 陈益
【申请人】中国航空工业集团公司西安航空计算技术研究所
【公开日】2016年5月18日
【申请日】2015年12月9日