基于缓冲区相似性度量的舰船轨迹层次聚类分析方法

文档序号:8361874阅读:796来源:国知局
基于缓冲区相似性度量的舰船轨迹层次聚类分析方法
【技术领域】
[0001] 本发明涉及线状轨迹聚类分析方法,特别是涉及一种基于缓冲区相似性度量的舰 船轨迹层次聚类分析方法。
【背景技术】
[0002] 航道是港口间船舶轨迹形成的带状区域。实际航道的掌控有益海上监管部门发现 船舶活动规律,监控海上交通,改善航道环境,保障航道安全。现存的舰船轨迹多来源于船 舶自动识别系统(AIS)的自动报告,然而,AIS数据库中纷繁复杂的海量船舶轨迹数据,加 之大量的船舶轨迹噪声,导致其难以彰显区域海上主要航道分布的特征。因此,如何对既存 舰船轨迹进行合理聚类,化繁为简,去伪存真,从而获取实际航道?这是一个亟待解决的问 题。
[0003] 船舶轨迹聚类过程是根据最大化类内相似性、最小化类间相似性的原则,找出具 有相似船舶运动的轨迹簇。轨迹聚类的关键是根据时空轨迹数据的特点,设计与定义不同 轨迹间的相似性度量,之后应用各种聚类分析方法对轨迹线聚类。
[0004] 目前轨迹线相似度主要利用空间属性的距离函数进行度量。在国外,Andrienko G.等人在 2007 年 International Journal of Geographical Information Science 期干丨J 上发表的《Geovisual Analytics for Spatial Decision Support:Setting the Research Agenda》一文中提出了几种适合航迹线聚类的距离函数;Rinzivillo S.等人在2008年 的 Information Visualization 期干丨J上发表的《Visually Driven Analysis of Movement Data by Progressive Clustering》一文中,采用了不同的距离函数来描述不同的轨迹属 性。在国内,袁冠等人在2011年的通信学报上发表的《基于结构相似度的轨迹聚类算法》 一文中,提出了基于结构相似度的轨迹聚类算法并分析轨迹的内外部特征;陈锦阳等人在 2012年的计算机工程上发表《基于改进Hausdorff距离的轨迹聚类算法》一文中,给出一种 新的轨迹子段距离度量方法,计算轨迹子段之间的相似度,由此实现聚类。但是,这种基于 距离函数度量相似性度量一方面计算量大,并不适用于大型数据集;另一方面,这种方法可 能因某种量测属性选择不恰当造成不符合预期结果。
[0005] 现今常用的聚类分析方法包括划分方法(k均值算法、k中心点算法等)、层次方法 (自底向上法、自顶向下法)、基于密度、网格、模型的方法等。划分方法将所有对象按照其 临近程度分为指定数目的类,对异常检测不敏感,不能检验船舶轨迹线中的个别船舶航线 噪声。层次聚类方法中异常对象单独成类,可用于检测并清除噪声,较适用于数据量大且情 况复杂的船舶轨迹线中。

【发明内容】

[0006] 本发明要解决的技术问题是:克服现有技术的上述缺陷,提出一种基于缓冲区相 似性度量的舰船轨迹层次聚类分析方法,生成矢量舰船轨迹线空间聚类结果,规避了现有 聚类方法对异常检测不敏感且噪声大的缺点,给出的针对航道轨迹线的一种基于缓冲区分 析的相似性度量,克服了传统方法计算量大且可能因某种度量属性选取不当造成结果不符 合预期的弱点。
[0007] 为了解决上述技术问题,本发明提出的技术方案是:基于缓冲区相似性度量的舰 船轨迹层次聚类分析方法,其特征在于,包括如下步骤:
[0008] 步骤1、依据指定区域和指定时间区段内的志愿观测船数据,获取舰船轨迹线分布 图;
[0009] 步骤2、针对所有舰船轨迹线建立缓冲区,缓冲区半径设置为30海里;
[0010] 步骤3、计算每两条舰船轨迹线之间基于缓冲区的相似性度量,轨迹线a与轨迹线 b之间基于缓冲区的相似性度量s (a, b) = (Aa (? Ab) / (Aa U Ab),Aa为轨迹线a的缓冲区 面积,Ab为轨迹线b的缓冲区面积;
[0011] 步骤4、将相似性度量最大的两根舰船轨迹线进行聚为一类,并将该聚类内的轨迹 线缓冲区的并集作为新的缓冲区参与到下一次相似性度量计算和聚类中中去,两个缓冲区 之间的相似性度量计算方法参见步骤3 ;
[0012] 步骤5、不断循环步骤3至步骤4,直到两聚类的舰船轨迹线簇之间的相似性最大 值小于簇间相似性阈值St,至此完成舰船轨迹线聚类;其中,两聚类的舰船轨迹线簇之间的 相似性计算方法如下:
【主权项】
1. 基于缓冲区相似性度量的舰船轨迹层次聚类分析方法,其特征在于,包括如下步 骤: 步骤1、依据指定区域和指定时间区段内的志愿观测船数据,获取舰船轨迹线分布图; 步骤2、针对所有舰船轨迹线建立缓冲区,缓冲区半径设置为30海里; 步骤3、计算每两条舰船轨迹线之间基于缓冲区的相似性度量,轨迹线a与轨迹线b之 间基于缓冲区的相似性度量s (a, b) = (Aa (? Ab) / (Aa U Ab),Aa为轨迹线a的缓冲区面积, Ab为轨迹线b的缓冲区面积; 步骤4、将相似性度量最大的两根舰船轨迹线进行聚为一类,并将该聚类内的轨迹线缓 冲区的并集作为新的缓冲区参与到下一次相似性度量计算和聚类中中去,两个缓冲区之间 的相似性度量计算方法参见步骤3 ; 步骤5、不断循环步骤3至步骤4,直到两聚类的舰船轨迹线簇之间的相似性最大值小 于簇间相似性阈值St,至此完成舰船轨迹线聚类;其中,两聚类的舰船轨迹线簇之间的相似 性计算方法如下:
式中,s(Ci, cp表示舰船轨迹线簇(^与舰船轨迹线簇q之间的相似性,S xy为舰船轨迹 线簇Ci中的第X条舰船轨迹线到舰船轨迹线簇C」中第y条舰船轨迹线的距离,X为从1到 Hi的自然数;y为从1到η」的自然数,n i、分别为舰船轨迹线簇C i,舰船轨迹线簇Cj中的 舰船轨迹线数目; 步骤6、对簇间相似性阈值St做敏感性分析,调节簇间相似性阈值S τ,并观察舰船轨迹 线的聚类效果,当聚类效果达到较理想时,将主要的舰船轨迹线簇区分开来,从而生成矢量 航道轨迹线聚类分析结果。
2. 根据权利要求1所述的基于缓冲区相似性度量的舰船轨迹层次聚类分析方法,其特 征在于:本发明步骤1中,依据指定区域和指定时间区段内的志愿观测船数据,获取舰船轨 迹线分布图的方法如下: 步骤a、VOS数据读取一一获取指定区域和指定时间区段内的志愿观测船数据,抽取时 间、经炜度、船名作为待分析对象,生成关于舰船轨迹点的图层; 步骤b、舰船轨迹点航次识别一一同时满足以下三个条件的舰船轨迹点归为同一航 次; 条件1 :舰船轨迹点的船名相同; 条件2 :相邻舰船轨迹点的时间间隔小于Tp,Tp的取值范围为[8h,16h]; 条件3:以时间先后为序,连续三个舰船轨迹点的连线夹角大于θ,Θ的取值范围为 [70。 , 110。]; 步骤c、舰船轨迹点数据清理一一删去同一航次内的重复舰船轨迹点和无效的舰船轨 迹点,所述重复的轨迹点是指同一航次内经炜度相同的轨迹点,所述无效的舰船轨迹点是 指同一航次内有效的舰船轨迹点数量少于N的所有舰船轨迹点,N的取值范围为[4, 6]; 步骤d、舰船轨迹线连接一一以时间为序,逐次连接同一航次内的所有舰船轨迹点,获 得该航次的舰船轨迹线; 步骤e、轨迹线连接校正一一如果相邻舰船轨迹点之间的连线与障碍物相交,所述障碍 物是指陆地或岛屿,则将这两个相邻舰船轨迹点之间绕过障碍物的最短路径作为校正后的 舰船轨迹线。
3. 根据权利要求2所述的基于缓冲区相似性度量的舰船轨迹层次聚类分析方法,其特 征在于:TP的取值为12h,Θ的取值为90°,N的取值为5。
4. 根据权利要求1所述的基于缓冲区相似性度量的舰船轨迹层次聚类分析方法,其特 征在于:簇间相似性阈值St的调节取值为0. 2、0. 3、0. 4、0. 5、0. 6、0. 7。
5. 根据权利要求1所述的基于缓冲区相似性度量的舰船轨迹层次聚类分析方法,其特 征在于:、簇间相似性阈值St的最佳取值为0. 6。
【专利摘要】本发明提出了一种基于缓冲区相似性度量舰船轨迹的层次聚类分析方法,给出了利用缓冲区分析对航道轨迹线聚类的相似性度量,克服了传统方法计算量大,聚类效果不稳健的弱点;同时考虑了船舶轨迹线数量巨大且包含噪声的情况,采用了高效且易于去噪的层次聚类方法,并展现了的阈值选择的流程。应用本发明能够对区域海上海量舰船轨迹线进行层次聚类,进而掌控主要航线分布,为发现船舶活动规律,监控海上交通,改善航道环境,保障航道安全等方面奠定基础。
【IPC分类】G06K9-62
【公开号】CN104680187
【申请号】CN201510121346
【发明人】刘永学, 王加胜, 孙超, 张思宇, 周旻曦, 段曰蔚, 蒋洁, 杨育浩
【申请人】南京大学
【公开日】2015年6月3日
【申请日】2015年3月19日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1