基于bp网络和基尼系数定权重的用水数据离散化方法
【专利摘要】本发明公开了一种基于BP网络和基尼系数定权重的用水数据离散化方法,包括:获得基本计算单元;获得基本计算单元和行政单元空间要素数据集;对生活用水、工业用水和农业用水采用定额法补充,对生态环境用水量采用相关因子分摊法进行补充;对生态环境用水量计算公式中的权重系数采用基尼系数法确定;经过模拟计算得到基本计算单元上离散预测结果;进行结果修正;按基本计算单元的水资源分区属性逐级汇总得到相应的用水数据。本发明提出的基于BP网络和基尼系数定权重的用水数据离散化方法,可获得全国各级水资源分区经济社会及用水数据,有助于水资源综合管理。
【专利说明】基于BP网络和基尼系数定权重的用水数据离散化方法
【技术领域】
[0001]本发明涉及水利科学【技术领域】,特别是指一种基于BP网络和基尼系数定权重的用水数据离散化方法。
【背景技术】
[0002]经济社会用水数据主要按行政单元统计而来,而其边界与水资源区边界不重合,导致水资源区用水数据的获得十分困难。现有的经济社会用水数据还存在共享困难、统计困难与统计数据多样等问题。利用计算机技术获得水资源区经济社会用水数据,对于完善水资源数据基础以支撑水资源行政区域与流域统一管理和减小人力普查投入十分重要。
[0003]用水是指为了某种经济或社会目的,使用水资源某种属性的行为,是通过水资源开发,用水主体运用和使用已开发水资源的方式与方法的总称。经济社会用水指采用取水、输水工程措施,从河流、湖泊、水库和地下水层将水引至用水地区,满足城乡生产和生活需要的水量,包括生活用水、工业用水、农业用水和生态环境用水四项。
[0004]水资源区是根据水资源的自然、社会和经济属性,按照开发、利用、治理、配置、节约、保护要求,将流域水系划分而得来。水资源分区主要包括水资源一级区、水资源二级区和水资源三级区。根据全国水资源分区标准,水资源一级区主要包括我国境内的10个大型流域,将各个水资源一级区细分为水资源二级区,各二级区再细分为水资源三级区。由于水资源区与行政区边界不重叠,导致一个县级行政区被多个水资源三级区分割。目前,按各级水资源分区统计的用水数据十分匮乏。
[0005]综上所述,提出一种可靠的经济社会用水数据统计方法,以获得各水资源区上用水数据的分布情况是急待解决的问题。
【发明内容】
[0006]有鉴于此,本发明的目的在于提出一种基于BP网络和基尼系数定权重的用水数据离散化方法,以获得各水资源区上用水数据的分布情况,从而获得全国各级水资源分区经济社会及用水数据,有助于水资源综合管理。
[0007]基于上述目的本发明提供的基于BP网络和基尼系数定权重的用水数据离散化方法,包括:
[0008]将县级行政区与水资源三级区矢量图进行叠加嵌套,获得每个县级行政单元所属不同水资源三级区部分的基本空间单元,作为基本计算单元;
[0009]将各类土地利用数据和DEM数据统计到各基本计算单元和行政单元空间上,获得基本计算单元和行政单元空间要素数据集;
[0010]根据各级行政单元经济社会用水数据,对县级行政单元生活用水、工业用水和农业用水采用定额法补充,对生态环境用水量采用相关因子分摊法进行补充;
[0011]对生态环境用水量采用相关因子分摊法进行补充得到的计算公式中的权重系数采用基尼系数法确定;[0012]基于BP人工神经网络模型,利用数据指标间相关关系,经过模拟计算得到基本计算单元上离散预测值,从而将县级行政单元经济社会用水数据展布到基本计算单元上;
[0013]以各基本计算单元预测值作为权重由所属县级行政单元总值向下分摊进行结果修正;
[0014]将修正后的经济社会和用水数据值,按基本计算单元的水资源分区属性逐级汇总得到相应的用水数据。
[0015]在一些实施方式中,所述将县级行政区与水资源三级区矢量图进行叠加嵌套,获得每个县级行政单元所属不同水资源三级区部分的基本空间单元,作为基本计算单元的步骤包括:
[0016]采用地理信息系统软件Arc GIS,对县级行政区与水资源三级区矢量图进行叠加嵌套,获得每个县级行政单元所属不同水资源三级区部分的基本空间单元,作为基本计算单元;
[0017]将小于所在县级行政区面积10%的基本计算单元向邻近面积最大的基本计算单元合并。
[0018]在一些实施方式中,所述将各类土地利用数据和DEM数据统计到各基本计算单元和行政单元空间上,获得基本计算单元和行政单元空间要素数据集的步骤包括:
[0019]利用获得基本计算单元矢量图和包括各类土地利用数据和DEM数据的空间数据,基于Arc GIS区域统计(Zonal Statistics)模块,将各类土地利用数据和DEM数据统计到各基本计算单元上;
[0020]利用行政区单元矢量图统计获得各级行政单元各类土地利用和DEM数据;
[0021]获得基本计算单元和行政单元空间要素数据集,用于空间离散化分析。
[0022]在一些实施方式中,所述基于BP人工神经网络模型,利用数据指标间相关关系,经过模拟计算得到基本计算单元上离散预测值,从而将县级行政单元经济社会用水数据展布到基本计算单元上的步骤包括:
[0023]根据人工神经网络理论,构建经济社会用水数据空间离散化BP人工神经网络三层网络拓扑结构;数据空间离散化神经网络包括输入层、隐含层和输出层三层;
[0024]影响指标数据作为自变量进入输入层,同时影响指标向量维数决定了输入层节点的个数m,输出层节点数n,即为模拟的因变量的结果;隐含层的输出函数为Sigmoid变换函数,输入和输出函数为线性函数;
[0025]正向传播过程中,输入信息从输入层经隐含层逐层处理,每一层节点的状态只影响下一层节点的状态;如果在输出层不能得到期望的输出,则转入反向传播,将误差信号沿原来的连接通路返回,通过修改各层节点的权值,使误差最小;
[0026]将任意2/3的数据样本进行训练学习,模拟因变量与其相关的自变量间复杂的非线性关系;
[0027]将另外1/3的样本作为验证数据,以验证训练学习效果;
[0028]分别计算训练学习阶段和验证阶段模拟结果与实测样本间的相关系数Rl2和R22,当两者均大于常数α (0〈α〈I)时认为训练效果合格,取α =0.7?0.8 ;
[0029]以验证合格的神经网络预测模型,输入基本计算单元上与因变量相关的自变量指标数据,经过模拟计算得到基本计算单元上离散预测结果。[0030]在一些实施方式中,所述以各基本计算单元预测值作为权重由所属县级行政单元总值向下分摊进行结果修正的步骤包括:
[0031]采用计算公式
【权利要求】
1.一种基于BP网络和基尼系数定权重的用水数据离散化方法,其特征在于,包括: 将县级行政区与水资源三级区矢量图进行叠加嵌套,获得每个县级行政单元所属不同水资源三级区部分的基本空间单元,作为基本计算单元; 将各类土地利用数据和DEM数据统计到各基本计算单元和行政单元空间上,获得基本计算单元和行政单元空间要素数据集; 根据各级行政单元经济社会用水数据,对县级行政单元生活用水、工业用水和农业用水采用定额法补充,对生态环境用水量采用相关因子分摊法进行补充; 对生态环境用水量采用相关因子分摊法进行补充得到的计算公式中的权重系数采用基尼系数法确定; 基于BP人工神经网络模型,利用数据指标间相关关系,经过模拟计算得到基本计算单元上离散预测值,从而将县级行政单元经济社会用水数据展布到基本计算单元上; 以各基本计算单元预测值作为权重由所属县级行政单元总值向下分摊进行结果修正; 将修正后的经济社会和用水数据值,按基本计算单元的水资源分区属性逐级汇总得到相应的用水数据。
2.根据权利要求1所述的方法,其特征在于,所述将县级行政区与水资源三级区矢量图进行叠加嵌套,获得每个县级行政单元所属不同水资源三级区部分的基本空间单元,作为基本计算单元的步骤包括:采用地理信息系统软件Arc GIS,对县级行政区与水资源三级区矢量图进行叠加嵌套,获得每个县级行政单元所属不同水资源三级区部分的基本空间单元,作为基本计算单元;将小于所在县级行政区面积10%的基本计算单元向邻近面积最大的基本计算单元合并。
3.根据权利要求1所述的方法,其特征在于,所述将各类土地利用数据和DEM数据统计到各基本计算单元和行政单元空间上,获得基本计算单元和行政单元空间要素数据集的步骤包括: 利用获得基本计算单元矢量图和包括各类土地利用数据和DEM数据的空间数据,基于Arc GIS区域统计(Zonal Statistics)模块,将各类土地利用数据和DEM数据统计到各基本计算单元上; 利用行政区单元矢量图统计获得各级行政单元各类土地利用和DEM数据; 获得基本计算单元和行政单元空间要素数据集,用于空间离散化分析。
4.根据权利要求1所述的方法,其特征在于,所述基于BP人工神经网络模型,利用数据指标间相关关系,经过模拟计算得到基本计算单元上离散预测值,从而将县级行政单元经济社会用水数据展布到基本计算单元上的步骤包括: 根据人工神经网络理论,构建经济社会用水数据空间离散化BP人工神经网络三层网络拓扑结构;数据空间离散化神经网络包括输入层、隐含层和输出层三层; 影响指标数据作为自变量进入输入层,同时影响指标向量维数决定了输入层节点的个数m,输出层节点数n,即为模拟 的因变量的结果;隐含层的输出函数为Sigmoid变换函数,输入和输出函数为线性函数; 正向传播过程中,输入信息从输入层经隐含层逐层处理,每一层节点的状态只影响下一层节点的状态;如果在输出层不能得到期望的输出,则转入反向传播,将误差信号沿原来的连接通路返回,通过修改各层节点的权值,使误差最小; 将任意2/3的数据样本进行训练学习,模拟因变量与其相关的自变量间复杂的非线性关系; 将另外1/3的样本作为验证数据,以验证训练学习效果; 分别计算训练学习阶段和验证阶段模拟结果与实测样本间的相关系数Rl2和R22,当两者均大于常数α (0〈α〈I)时认为训练效果合格,取α =0.7~0.8 ; 以验证合格的神经网络预测模型,输入基本计算单元上与因变量相关的自变量指标数据,经过模拟计算得到基本计算单元上离散预测结果。
5.根据权利要求1所述的方法,其特征在于,所述以各基本计算单元预测值作为权重由所属县级行政单元总值向下分摊进行结果修正的步骤包括: 采用计算公式=
6.根据权利要求1所述的方法,其特征在于,所述将修正后的经济社会和用水数据值,按基本计算单元的水资源分区属性逐级汇总得到相应的用水数据的步骤包括:
采用计算公式
7.根据权利要求1至6任意一项所述的方法,其特征在于,所述对生态环境用水量采用相关因子分摊法进行补充的步骤包括: 生态环境用水需求的影响因素包括林地、草地、水域、城镇用地、GDP和非农业人口,各级行政单元生态环境用水量计算公式为
8.根据权利要求7所述的方法,其特征在于,所述对生态环境用水量采用相关因子分摊法进行补充得到的计算公式中的权重系数采用基尼系数法确定的步骤包括: 对各指标样本数据进行归一化处理,计算公式为
9.根据权利要求8所述的方法,其特征在于,所述对生态环境用水量采用相关因子分摊法进行补充得到的计算公式中的权重系数采用基尼系数法确定的步骤还包括: 在补充后数据的基础上,以下级行政单元值作为权重由上级行政单元总值逐级向下分摊进行数据补充,计算公式为
10.根据权利要求9所述的方法,其特征在于,所述对县级行政单元生活用水、工业用水和农业用水采用定额法补充的步骤包括: 对县级行政单元生活用水量的补充: 假设上一级行政区单元生活用水综合定额与其下一级行政单元生活用水综合定额相同,并满足计算公式
【文档编号】G06F19/00GK103886220SQ201410140946
【公开日】2014年6月25日 申请日期:2014年4月10日 优先权日:2014年4月10日
【发明者】许新宜, 杨中文, 鱼京善, 王红瑞, 孙文超, 陈华鑫, 宾零陵 申请人:北京师范大学