一种获取云中心和数据中心信息系统的发掘迁移方法

文档序号:8512491阅读:217来源:国知局
一种获取云中心和数据中心信息系统的发掘迁移方法
【技术领域】
[0001] 本发明涉及一种获取云中心和数据中心信息发掘迀移的系统方法及子方法,属于 云计算,知识挖掘领域。
【背景技术】
[0002] 云计算在基于面向服务计算领域已经取得了极大的成功,并在计算基础设施方面 有着革命性的发展。当前的云计算特性,对各种企业用户都有着强烈的吸引力。但同时企 业的旧IT基础设施并不具备直接吸收云计算的能力。理论上,打包并迀移数据和应用到云 计算环境看起来很直接,企业可以很容易的利用云的计算能力为自己服务,应为无非就是 把数据,商业应用,及代码迀移到一个新的环境。但是,实际上迀移数据,应用和系统所涉及 的方面,要考虑的因素,和处理的问题错综复杂。其中,对于企业的关键商业应用来说,如何 合理的打包迀移这些数据应用,同时维护企业客户的良好运行,且不影响企业的其他业务 的正常运帷操作,是一个严肃重要的研宄课题。这需要大量的人力资源来管理可能涉及的 敏感数据,应用等等。而当前已有的数据系统迀移方案要耗费大量人力物力和时间来完成。

【发明内容】

[0003] 本发明提供了本发明涉及一种获取云中心和数据中心信息系统的发掘迀移方法, 属于云计算,知识挖掘领域,解决了现有系统迀移体系不完善,手工作业比重大,花费高,耗 时长的问题。
[0004] 本发明技术方案如下:
[0005] -种获取云中心和数据中心信息系统的发掘迀移方法,包括以下步骤,
[0006] S1,选取待发掘迀移的云中心和数据中心信息系统Si;
[0007] S2,触发系统Si迀移,通过模式识别寻找依赖系统S 所有相关系统,获取依赖于 系统Si的系统清单S \S2,…,Sn;
[0008] S3,信息收集:收集主机系统的系统日志、应用程序日志和网络活动日志;将收集 到的日志汇总;
[0009] S4,将当前系统清单S1,S2,…,Sn*已完成信息收集的系统信息(如,主机系统间 的依赖关系,关键应用程序在主机间的相互依赖关系,系统负荷等)与系统清单S 1,S2,… ,Sn建立映射,并归档;
[0010] S5,针对系统清单中的系统S' S%计算系统SW的迀移风险函数值R,其中 l〈j〈q〈n ;
[0011] S6,基于迀移风险函数值R值来创建迀移系统清单S1,S2,…,Sn的优先队列,并基 于所述优先队列顺序对系统清单S 1,S2,…,Sn中的系统启动迀移。
[0012] 本发明所米用基于 SVM(space vector machine)技术的 Active Learning 的算 法来模式识别系统迀移中可识别模式.所述通过模式识别基于概率SVM的主动学习 (SVM active Ierning)算法获得在模式数据库中已有的可识别模式;
[0013] 所述基于概率SVM的主动学习算法具体包括以下步骤:
[0014] (1)数据输入:将系统清单S\S2,…,Sn中已标示系统定义集合为D 1, ^为训练数 据集合,还未标示的集合为Du,计算步骤数T和在每一次迭代中采样数t ;
[0015] (2)获取分类下的所有子分类,具体包括以下步骤:
[0016] (2-a)当t < = T时,基于训练数据集合D1,训练获得多重标示SVM分类器;
[0017] (2-b)对于每一个在集合Du中的X,X e D u;
[0018] (2-c)利用损失抑制(loss reduction)方法预测标示向量集合Y ;
【主权项】
1. 一种获取云中心和数据中心信息系统的发掘迀移方法,其特征在于:包括以下步 骤, S1,选取待发掘迀移的云中心和数据中心信息系统Si; 52, 触发系统Si迀移,通过模式识别寻找依赖系统S 所有相关系统,获取依赖于系统 Si的系统清单S1JV^Sn; 53, 信息收集:收集主机系统的系统日志、应用程序日志和网络活动日志;将收集到的 日志汇总; 54, 将当前系统清单S1,S2,…,Sn中已完成信息收集的系统信息与系统清单S \ S2,…,Sn 建立映射,并归档; 55, 针对系统清单中的系统Sq,计算系统Sq的迀移风险函数值R,其中l〈j〈q〈n ; 56, 基于迀移风险函数值R值来创建迀移系统清单S1,S2,…,Sn的优先队列,并基于所 述优先队列顺序对系统清单S 1,S2,…,Sn中的系统启动迀移。
2. 根据权利要求1所述的一种获取云中心和数据中心信息系统的发掘迀移方法,其特 征在于: 所述通过模式识别基于概率SVM的主动学习算法获得在模式数据库中已有的可识别 模式; 所述基于概率SVM的主动学习算法具体包括以下步骤: (1) 数据输入:将系统清单S1,S2,…,Sn中已标示系统定义集合为D p D1为训练数据集 合,还未标示的集合为Du,计算步骤数T和在每一次迭代中采样数t ; (2) 获取分类下的所有子分类,具体包括以下步骤: (2-a)当t < = T时,基于训练数据集合D1,训练获得多重标示SVM分类器; (2-b)对于每一个在集合Du中的X,X e D u; (2-c)利用损失抑制方法预测标示向量集合Y ;
其中,fi (X)是与类i相关的分类器函数,分类器函数总共包括k个类;y为标示向量集 合Y的元素向量,为二维向量,且收敛于[一 1,1],DS为损失抑制方法计算时从Du*的取样 集合;公式(1)表示为满,
(2-d)基于标示向量集合Y,计算期望的降损score (X):
(2-e),对于所有在集合Du*存在的X,对score (X)降序排序; (2-f),从A中选取最大的scoreOc),作为样本集合S,同时更新训练数据集合 D/-z)/+D:,可识别模式基于新的Di更新。
3. 根据权利要求1所述的一种获取云中心和数据中心信息系统的发掘迀移方法,其特 征在于:所述迀移风险函数值R计算公式为: R(0, δ) = e*L(9, δ (X)) =/ L(0, δ (X))dP0(X) 其中,参数Θ为原始状态的固定值,δ为目的前移状态;X是从全部收集的系统数据 中随机抽取的向量空间集合;R(9, δ)为系统状态由原始状态Θ前移到δ状态的迀移风 险值,期望E由在全部数据集中出现的X计算;dP0 (X)为全部数据X的微分概率测量值; L ( θ,δ (X))为全部数据X的损失,经过在X的积分获得R ; 其中E的计算公式为:
其中P0 (X)为全部数据X的概率测量值。
【专利摘要】本发明公开了一种获取云中心和数据中心信息系统的发掘迁移方法,包括以下步骤,S1,选取待发掘迁移的云中心和数据中心信息系统Si;S2,获取依赖于系统Si的系统清单S1,S2,…,Sn;S3,信息收集;S4,将当前系统清单中已完成信息收集的系统信息与系统清单建立映射,并归档;S5,针对系统清单中的系统Sj、Sq,计算系统Sj、Sq的迁移风险函数值R;S6,基于迁移风险函数值R值来创建迁移系统清单的优先队列。本发明通过知识挖掘,在实际迁移系统时,将系统所涉及的子系统按照优先级排序,解决错综复杂的子系统前移问题,解决了现有系统迁移体系不完善,手工作业比重大,花费高,耗时长的问题。
【IPC分类】G06F9-48
【公开号】CN104834560
【申请号】CN201510173929
【发明人】白琨, 王飞, 陈文
【申请人】浙江奇道网络科技有限公司
【公开日】2015年8月12日
【申请日】2015年4月14日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1