一种测量随机数据非指数性的熵方法
【专利摘要】本发明公开了一种测量随机数据非指数性的熵方法,首先通过对数矩估计法确定随机数据对应的Mittag-Leffler分布的参数,然后分别计算随机数据的实际熵和预测熵,最后通过相对熵指标及其判别准则,确定随机数据的非指数性。Mittag-Leffler分布是指数分布的推广,参数的物理意义明确。本发明可用于确定随机数据的非指数性,进而利用该特性进行数据挖掘,具有重要的工程应用价值。
【专利说明】一种测量随机数据非指数性的熵方法
【技术领域】
[0001] 本发明属于随机数据挖掘领域,具体涉及一种测量随机数据非指数性的熵方法。
【背景技术】
[0002] 目前,非指数性随机数据已广泛存在于水文、网络、生化、金融和土建等复杂系统。 这类随机数据的最大特点是其概率分布或尾部分布不服从传统的指数分布或指数衰减。而 随机数据的非指数统计性质很大程度上决定着整个系统的稳定性。因此,测量随机数据的 非指数性是十分必要的。
[0003] 现有测量随机数据非指数性的方法中,经验累积分布的尾部估计法是最常用的方 法。该方法在双对数坐标下,描绘经验累积分布的右尾。如其右尾近似为一条直线,则被测 量的随机数据具有非指数性。该方法简单且直观,但仅是一种定性的方法,而且样本的大小 直接影响其精度。熵是一种测量随机系统不确定性的有力工具。目前,香农熵已应用于风 险管理、肿瘤诊断和信息通信等领域。但是,香农熵依赖随机数据直方图分组区间的大小或 需要计算复杂的积分,计算成本大且精度较低。
[0004] 在国内外,已有多项专利技术涉及熵方法,如专利CN103886186A "一种确定钢管 混凝土承载力设计误差分布的熵方法",通过结合稳定分布的累计分布函数计算累计熵, 选择误差分布的概型;CN102622649A "一种基于信息熵的改进进化多目标优化方法",结 合高斯函数,利用传统的香农熵进行目标优化;US20140189792 "Method and system for electronic content storage and retrieval using Galois Fields and information entropy on cloud computing networks",同样采用传统的香农熵用于云网络计算。
[0005] 因此,需要一种新的测量随机数据非指数性的方法以解决上述问题。
【发明内容】
[0006] 本发明的目的是针对现有技术中测量随机数据非指数性的缺陷,提供一种测量随 机数据非指数性的熵方法。
[0007] 为实现上述发明目的,本发明测量随机数据非指数性的熵方法可采用如下技术方 案:
[0008] -种测量随机数据非指数性的熵方法,包括如下步骤:
[0009]1)、获取分析对象的随机数据;
[0010] 2)、利用对数矩估计法计算步骤1)得到的随机数据对应的Mittag-Leffler分布 的参数,Mittag-Leffler分布包括以下两个参数:
【权利要求】
1. 一种测量随机数据非指数性的熵方法,其特征在于:包括如下步骤: 1) 、获取分析对象的随机数据; 2) 、利用对数矩估计法计算步骤1)得到的随机数据对应的Mittag-Leffler分布的参 数,Mittag-Leffler分布包括以下两个参数:
其中,d是Mittag-Leff ler分布的稳定指数,f是Mittag-Leff ler分布的尺度参数, U为随机数据X的对数变换log(X)的均值,〇 Slog(X)的标准差,C为欧拉常数; 3) 、计算随机数据的实际熵; 4) 、利用步骤2)得到的随机数据对应的Mittag-Leffler分布计算随机数据的预测 熵; 5) 、结合步骤3)的实际熵和步骤4)的预测熵,计算相对熵指标,其中,相对熵指标R为 预测熵与实际熵比的绝对值; 6) 、当相对熵指标R小于等于0. 01时,则表明随机数据具有非指数性。
2. 如权利要求1所述的测量随机数据非指数性的熵方法,其特征在于:步骤3)中利用 分数阶矩法和/或对数矩法计算随机数据的实际熵。
3. 如权利要求2所述的测量随机数据非指数性的熵方法,其特征在于:分数阶矩法通 过下式计算随机数据的实际熵:
其中,\为第i个随机数据,n为随机数据X的长度,p为分数阶矩法的阶数,p大于0 且小于0. 4。
4. 如权利要求2所述的测量随机数据非指数性的熵方法,其特征在于:对数矩法通过 下式计算随机数据的实际熵:
其中,\为第i个随机数据,n是随机数据X的长度。
5. 如权利要求1所述的测量随机数据非指数性的熵方法,其特征在于:步骤4)中利用 Mittag-Leffler分布对应的分数阶矩法和/或对数矩法计算随机数据预测熵。
6. 如权利要求5所述的测量随机数据非指数性的熵方法,其特征在于:步骤4)中利用 Mittag-Leffler分布对应的分数阶矩法计算随机数据预测熵的表达式为:
其中,Xml为Mittag-Leffler分布的随机变量,n为随机数据X的长度,p为分数阶矩法 的阶数,P大于〇且小于〇. 4, 和}^分别为Mittag-Leffler分布的稳定指数和尺度参数。
7. 如权利要求5所述的测量随机数据非指数性的熵方法,其特征在于:步骤4)中利用 Mittag-Leffler分布对应的对数矩法计算随机数据预测熵的表达式为: //(log.Y",) = log(f)-C 其中,Xmi为Mittag-Leffler分布的随机变量,f分别为Mittag-Leffler分布的尺度 参数,C为欧拉常数。
8. 如权利要求1所述的测量随机数据非指数性的熵方法,其特征在于:步骤3)中利用 分数阶矩法计算随机数据的实际熵,分数阶矩法通过下式计算随机数据的实际熵:
其中,\为第i个随机数据,n为随机数据X的长度,p为分数阶矩法的阶数,p大于0 且小于0. 4 ; 步骤4)中利用Mittag-Leffler分布对应的分数阶矩法计算随机数据预测熵,利用 Mittag-Leffler分布对应的分数阶矩法计算随机数据预测熵的表达式为:
其中,Xml为Mittag-Leffler分布的随机变量,n为随机数据X的长度,p为分数阶矩法 的阶数,P大于〇且小于〇. 4, (X和f分别为Mittag-Leffler分布的稳定指数和尺度参数,
9. 如权利要求1所述的测量随机数据非指数性的熵方法,其特征在于:步骤3)中利用 对数矩法计算随机数据的实际熵,对数矩法通过下式计算随机数据的实际熵:
其中,\为第i个随机数据,n是随机数据X的长度; 步骤4)中利用Mittag-Leffler分布对应的对数矩法计算随机数据预测熵的表达式 为: H{\〇gXml) = \og(y)-£ 其中,Xmi为Mittag-Leffler分布的随机变量,f分别为Mittag-Leffler分布的尺度 参数,C为欧拉常数;
10. 如权利要求1所述的测量随机数据非指数性的熵方法,其特征在于:步骤3)中利 用分数阶矩法和对数矩法分别计算随机数据的实际熵,步骤4)中利用Mittag-Leffler分 布对应的分数阶矩法和对数矩法计算随机数据预测熵,分数阶矩法通过下式计算随机数据 的实际熵:
其中,Xi为第i个随机数据,n为随机数据X的长度,p为分数阶矩法的阶数,p大于0 且小于0. 4 ; 对数矩法通过下式计算随机数据的实际熵:
其中,\为第i个随机数据,n是随机数据X的长度; 利用Mittag-Leffler分布对应的对数矩法计算随机数据预测熵的表达式为: //(log Xm,) = log(y) - C 其中,Xmi为Mittag-Leffler分布的随机变量,;P分别为Mittag-Leffler分布的尺度 参数,C为欧拉常数;
其中,Xml为Mittag-Leffler分布的随机变量,n为随机数据X的长度,p为分数阶矩法 的阶数,P大于〇且小于〇. 4,在和f分别为Mittag-Leffler分布的稳定指数和尺度参数;
【文档编号】G06F19/00GK104346534SQ201410626199
【公开日】2015年2月11日 申请日期:2014年11月7日 优先权日:2014年11月7日
【发明者】陈文 , 梁英杰 申请人:河海大学