本发明涉及利用互联网地图数据进行地表覆盖变化检测的方法及系统。
背景技术:
地表覆盖及变化是环境变化研究、地理世情监测、可持续发展规划等不可或缺的重要基础信息和关键参量,对于研究地球系统的能量平衡、碳循环及其他生物地球化学循环、气候变化等有着十分重要的意义。传统的地表覆盖变化检测方法主要基于遥感影像,通过对比不同时期遥感影像中的光谱信息,提取地表覆盖类型及其变化信息。该方法耗时耗力、生产周期长,无法满足地表覆盖产品快速更新的需求。因此,需要发展一种新的地表覆盖变化快速检测方法。
目前,已经出现了诸多应用众源地理数据进行地表覆盖变化检测的方法。例如,“johnson,briana.,andkotaroiizuka."integratingopenstreetmapcrowdsourceddataandlandsattime-seriesimageryforrapidlanduse/landcover(lulc)mapping:casestudyofthelagunadebayareaofthephilippines."appliedgeography67(2016):140-149.”中利用openstreetmap中的建筑物、水体、绿地数据,作为地表覆盖变化的参考数据,并用于遥感数据中地表覆盖类型的变化检测。“fonte,cidáliacosta,etal."generatingup-to-dateanddetailedlanduseandlandcovermapsusingopenstreetmapandglobeland30."isprsinternationaljournalofgeo-information6.4(2017):125.”中将所有osm中的数据类型分为不同的地表覆盖类型,对globeland30中2010年的地表覆盖数据进行变化检测。上述研究通过利用众源地理数据,实现了地表覆盖的快速变化检测。然而,由于众源地理数据大多来自未经过训练的志愿者,其数据质量无法保证,并且其覆盖范围为志愿者主要活动区域,数据更新也无法保证。因此,将其做为数据源进行地表覆盖变化检测,在一定程度上影响了精度。
近年来,随着互联网地图公司的兴起,以及商用互联网地图的广泛应用,出现了诸如百度地图、高德地图等互联网地图数据。这些数据来源于专业的商业公司,其精度高、更新实时、覆盖面广,也包含了大量能够反映地表覆盖类型的信息。因此,将商用互联网地图数据应用于地表覆盖变化检测是一条可行途径。
技术实现要素:
本发明的目的就是为了解决上述问题,提供利用互联网地图数据进行地表覆盖变化检测的方法及系统,由于互联网数据包含了点、线、面等多种不同的数据类型,同时其文本信息类型多样,无法直接应用于地表覆盖变化检测。
为了实现上述目的,本发明采用如下技术方案:
利用互联网地图数据进行地表覆盖变化检测的方法,包括如下步骤:
步骤a:将地表覆盖区域划分为若干个栅格单元,利用每个栅格单元中内互联网地图数据的位置信息,将互联网地图数据与划分后的栅格单元进行空间位置叠加;
步骤b:对互联网地图数据中的文本信息进行分类,使互联网地图数据的文本信息与地表覆盖类型相对应;
步骤c:对每个栅格单元进行地表覆盖类型的变化检测。
优选的,所述步骤a中地表覆盖区域的栅格单元划分:依据需要进行变化检测的地表覆盖产品的分辨率,将地表覆盖区域划分n个与分辨率相同的栅格单元ri,j,其中,r为划分的栅格单元,i为栅格单元r的行数,j为栅格单元r的列数。
优选的,所述步骤b中,对互联网地图数据中的文本信息进行分类:提取每个栅格单元中互联网地图数据的文本信息,利用层次狄利克雷过程算法,对每个栅格单元内的文本信息进行自动分类。
优选的,所述步骤c:首先,依据需要进行变化检测的地表覆盖产品,提取每个栅格单元中包含的原有地表覆盖类型cl;继而,依据步骤b中的文本信息分类结果,提取每个栅格单元内文本信息类型ct;如果cl=ct,则保留需要进行变化检测的地表覆盖产品的类型;如果cl≠ct,则保留互联网地图数据的文本信息类型,作为新的地表覆盖类型,去除原有地表覆盖产品的类型,从而完成地表覆盖的变化检测。
步骤b例如,互联网地图数据中的“购物商场”归类为地表覆盖中的“人造地表”类型,“高尔夫球场”归类为“草地”。
所述步骤b包括:
步骤b1:提取每个栅格单元中互联网地图数据的文本信息,将每个栅格单元内的文本信息作为一个文档di;所有文档定义为d∈{d1,d2,d3....dn},其中,n为所有地表覆盖栅格单元的数量;
步骤b2:利用层次狄利克雷过程算法,对每个栅格单元内的文本信息进行自动分类,使其与地表覆盖类型相对应:
利用层次狄利克雷过程算法计算得到每种地表覆盖类型的分类概率gj,取概率最大的类型为最终的分类类型:
g0~dp(γ,h);(1)
gj~dp(α,g0);(2)
其中,g0、gj为两个狄利克雷过程,h为假设的度量空间的一个分布,γ、α分别为满足公式(1)(2)中狄利克雷分布的两个参数,由经验值取得;
其中,狄利克雷过程g的计算公式如下:
其中,dir(·)为狄利克雷分布,计算公式为:
其中,b(α)为对于参数α的b(·)函数,计算公式为:
其中,γ(·)为gamma函数,表示为αi的阶乘。
利用互联网地图数据进行地表覆盖变化检测的系统,包括:
叠加模块:将地表覆盖区域划分为若干个栅格单元,利用每个栅格单元中内互联网地图数据的位置信息,将互联网地图数据与划分后的栅格单元进行空间位置叠加;
分类模块:对互联网地图数据中的文本信息进行分类,使互联网地图数据的文本信息与地表覆盖类型相对应;
检测模块:对每个栅格单元进行地表覆盖类型的变化检测。
优选的,所述叠加模块中地表覆盖区域的栅格单元划分:依据需要进行变化检测的地表覆盖产品的分辨率,将地表覆盖区域划分n个与分辨率相同的栅格单元ri,j,其中,r为划分的栅格单元,i为栅格单元r的行数,j为栅格单元r的列数。
优选的,所述分类模块中,对互联网地图数据中的文本信息进行分类:提取每个栅格单元中互联网地图数据的文本信息,利用层次狄利克雷过程算法,对每个栅格单元内的文本信息进行自动分类。
优选的,所述检测模块:首先,依据需要进行变化检测的地表覆盖产品,提取每个栅格单元中包含的原有地表覆盖类型cl;继而,依据步骤b中的文本信息分类结果,提取每个栅格单元内文本信息类型ct;如果cl=ct,则保留需要进行变化检测的地表覆盖产品的类型;如果cl≠ct,则保留互联网地图数据的文本信息类型,作为新的地表覆盖类型,去除原有地表覆盖产品的类型,从而完成地表覆盖的变化检测。
本发明的有益效果是:首先,依照需要进行变化检测的地表覆盖产品的分辨率,划分地表覆盖区域的栅格单元;继而,提取每个栅格单元的中互联网地图数据的文本信息,利用层次狄利克雷过程算法,对每个栅格单元进行地表覆盖分类;最后,将分类后每个栅格单元的地表覆盖类型与需要进行变化检测的地表覆盖产品的类型进行对比,以达到地表覆盖变化检测的目的。
附图说明
图1为地表覆盖变化检测方法示意图;
图2为北京市部分区域的高德地图数据与地表覆盖栅格单元叠加示意图;
图3(a)-图3(b)为北京市部分地区地表覆盖单元及地表覆盖分类结果图;
图4(a)-图4(b)为地表覆盖变化检测结果图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
为了对本发明的技术特征、目的和效果有更加清楚的理解,现以北京市局部互联网地图数据集为例,对照附图说明本发明的具体实施方式。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
本发明所提出的一种基于poi数据的地表覆盖分类方法,如图1所示,所述方法基于互联网地图数据进行地表覆盖变化检测;所述地表覆盖检测方法包括地表覆盖区域的栅格单元划分和基于层次狄利克雷过程算法的互联网地图数据的文本信息分类;所述方法包括如下步骤:
为了对本发明的技术特征、目的和效果有更加清楚的理解,本专利的互联网地图选用2016年高德地图,选取了北京市作为实施区域,应用到了高德地图中的建筑物、水体、绿地、poi图层。高德地图数据作为变化检测数据,变化前的地表覆盖数据选用2010年globeland30地表覆盖数据。
a:地表覆盖区域的栅格单元划分。依据需要进行变化检测的地表覆盖产品的分辨率,将地表覆盖区域划分n个与其分辨率相同的栅格单元ri,j,其中,r为划分的栅格单元,i、j为栅格单元r的行数和列数。利用每个栅格单元中内互联网地图数据的位置信息,将互联网地图数据与与划分后的栅格单元进行空间位置叠加;
图2为北京市部分区域的高德地图数据与地表覆盖栅格单元叠加示意图,共计得到3718个地表覆盖栅格单元。
b:对互联网地图数据中的文本信息进行分类。提取每个栅格单元中互联网地图数据的文本信息,利用层次狄利克雷过程算法,对每个栅格单元内的文本信息进行自动分类,使其与地表覆盖类型相对应。例如,互联网地图数据中的“购物商场”归类为地表覆盖中的“人造地表”类型,“高尔夫球场”归类为“草地”。
a:提取每个栅格单元中互联网地图数据的文本信息,将每个栅格单元内的文本信息作为一个文档di。所有文档定义为d∈{d1,d2,d3....dn},其中,n为所有地表覆盖栅格单元的数量。
以图2的研究区域为例,提取地表覆盖栅格单元的文本信息d,其中,每个栅格单元的文本信息作为文档di,图3(a)为北京市部分地区的地表覆盖栅格单元示意图。
b:利用层次狄利克雷过程算法,对每个栅格单元内的文本信息进行自动分类,使其与地表覆盖类型相对应。层次狄利克雷过程算法计算得到每种地表覆盖类型的分类概率,取其概率最大的类型为其最终的分类类型。其公式如下:
g0~dp(γ,h)(1)
gj~dp(α,g0)(2)
其中,g0、gj为两个狄利克雷过程dp,h为假设的度量空间的一个分布,γ、α为满足公式(1)(2)中狄利克雷分布的两个参数,由经验值取得。其中,狄利克雷过程g的计算公式如下:
其中,d为步骤b1所述文档,dir(·)为狄利克雷分布,其计算公式如下:
其中,b(α)为对于参数α的b(·)函数。其计算公式为:
其中,γ(·)为gamma函数,表示为αi的阶乘。
为了将高德地图数据归类为人造地表、绿地、水体和耕地等地表覆盖类型,利用层次狄利克雷过程算法,计算每个栅格单元中文本信息的地表覆盖分类概率,提取概率最大的地表覆盖类型,作为每个栅格单元的地表覆盖类型。图3(b)为北京市部分地区地表覆盖分类结果示意图。
c:对每个栅格单元进行地表覆盖类型的变化检测。首先,依据需要进行变化检测的地表覆盖产品,提取每个栅格单元中其包含的原有地表覆盖类型cl。继而,依据步骤b中的文本信息分类结果,提取每个栅格单元内文本信息类型ct。若cl=ct,则保留需要进行变化检测的地表覆盖产品的类型;若cl≠ct,则保留互联网地图数据的文本信息类型,作为新的地表覆盖类型,去除原有地表覆盖产品的类型。即完成了地表覆盖的变化检测。
本专利将2010年globeland30中草地和林地归类为绿地,提取每个地表覆盖栅格单元中的globeland30地表覆盖类型。若globeland30的地表覆盖类型与步骤b分类所得地表覆盖类型一致,则保留该区域globeland30的地表覆盖类型。若地表覆盖类型不一致,则保留该区域内高德地图分类所得地表覆盖类型。图4(a)为北京市部分地区的地表覆盖变化检测示意图图,图4(b)为北京市地表覆盖变化检测示意图。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。