一种轨迹压缩及解压缩方法

文档序号:7546664阅读:485来源:国知局
一种轨迹压缩及解压缩方法
【专利摘要】本发明公开了一种轨迹压缩方法,包括:S1.对待压缩的轨迹进行扫描,获得待压缩的轨迹中的定点;轨迹为一个运动物体在空间中运动所产生的路径,定点为轨迹的起点、路段交叉点或者终点;S2.查询预先配置的频繁后继表,判断定点在待压缩的轨迹中的后继定点是否为定点的最频繁后继定点;后继定点为定点相邻的下一个定点;若是,则执行步骤S3;S3.将最频繁后继定点用负数进行表示,获得定点与负数的集合,定点与负数的集合即为压缩轨迹。相应的,本发明还提供一种应用上述的轨迹压缩方法得到的压缩轨迹的解压缩方法。采用本发明实施例,能够利用轨迹特性来对轨迹进行高压缩率、高效率的无损压缩。
【专利说明】一种轨迹压缩及解压缩方法

【技术领域】
[0001] 本发明涉及信息【技术领域】,尤其涉及一种轨迹压缩及解压缩方法。

【背景技术】
[0002] 近几年来,大数据及其相关研究已经成为计算机界最热问题,并逐渐成为主流研 究方向。人们开始意识到潜藏在数据中的信息带来的价值,并开始越来越重视对于数据 的研究。而随着技术的发展,各种能够收集有价值数据的技术与相关装置设备也在不断产 生。其中,非常典型的一类设备就是能够进行轨迹数据探测与收集的设备,如GPS(Global Positioning System,全球定位系统)、智能手机、RFID (Radio Frequency Identification, 无线射频识别)标签等等。这种轨迹数据一般具有三个维度,即表示物体位置的经度、纬 度,以及表示某个位置的时间点的时间戳。由于这些轨迹数据具有时间和空间的双重特性, 也被称为时空数据。这些时空轨迹数据往往体现着不同实体的运动规律甚至行为模式,从 这些规律中又能衍生出许多相关的研究,其潜在价值极高。
[0003] 然而,时空轨迹数据的规模是很大的。以GPS全球定位系统为例,在定位技术高度 发达的今时今日,生活中各个方面都可能需要定位或者导航,如驾驶车辆,旅游,寻物,甚至 是简单的在某个不熟悉的地方约见。每天有无数来自于全球各地的导航、定位等服务请求, 而这些服务请求都将会产生相应的时空轨迹数据。可见,时空轨迹数据的规模是巨大的。
[0004] 如此巨大的数据规模必然会带来一些问题。具体来说,大规模增长速度快的轨迹 数据带来的问题有三点。第一,巨大的数据量会极大地压榨有限的存储空间,使得时空轨 迹数据存储成为一个难题。由于其每个轨迹点间的时间间隔较小,时空轨迹数据会产生大 量的冗余数据,这些冗余会浪费大量的存储空间,并且增加I/Odnput/Output,输入输出端 口)时间。例如,我们以10秒的时间间隔检测4000个运动物体的运动情况,如果不加以压 缩,每天就会产生1GB的数据增量。而GPS服务产生的数据往往是涵盖范围极广的,物体数 量远远超过千甚至万数量级,其数据增加速度十分可观。因此,存储问题是显而易见的。第 二,对如此巨大规模的数据进行传输、查询等处理是昂贵且耗时的。将大规模数据通过蜂窝 网络或者卫星网络进行传输会花费大量经费。第三,当轨迹数据规模过于巨大,从中提取有 用信息等会变得非常困难,如分析运动模式。数据压缩可以大大减少提取有用信息的时间。 因此,对时空数据轨迹进行压缩是十分必要的。
[0005] 时空轨迹数据压缩也是建立运动实体数据库数据管理的关键部分。然而,基于信 息论的传统压缩方法虽然是无损压缩,但会将时空数据与其他数据同等对待,即使用同样 的压缩方法。这种压缩方法未考虑时空轨迹数据的特殊性质,必然无法达到最好效果。并 且,压缩后的数据不可使用,如需要对压缩后的数据进行进一步分析则必须解压整个文件, 对于巨大的时空数据来说,解压整个文件需要消耗很多时间和计算资源。并且,许多的轨迹 压缩算法都是基于轨迹点的删除,实际上是有损压缩,压缩后便无法还原成原始数据,从而 导致算法的错误或压缩过程中的误删都会对之后的数据分析有很大影响。


【发明内容】

[0006] 本发明实施例提出一种轨迹压缩及解压缩方法,能够利用轨迹特性来对轨迹进行 高压缩率、高效率的无损压缩。
[0007] 本发明实施例提供一种轨迹压缩方法,包括:
[0008] S1、对待压缩的轨迹进行扫描,获得所述待压缩的轨迹中的定点;所述轨迹为一 个运动物体在空间中运动所产生的路径,所述定点为所述轨迹的起点、路段交叉点或者终 占.
[0009] S2、查询预先配置的频繁后继表,判断所述定点在所述待压缩的轨迹中的后继定 点是否为所述定点的最频繁后继定点;所述后继定点为所述定点相邻的下一个定点;若 是,则执行步骤S3 ;所述频繁后继表记录各个定点及其最频繁后继定点的对应关系;
[0010] S3、将所述最频繁后继定点用负数进行表示,获得所述定点与所述负数的集合,所 述定点与所述负数的集合即为压缩轨迹。
[0011] 进一步地,所述步骤S3具体包括:
[0012] S31、计算连续出现最频繁后继定点的个数n,并将连续出现的最频繁后继定点用 负数进行表示;所述负数的绝对值为η ;
[0013] S32、获得所述定点与所述负数的集合,所述定点与所述负数的集合即为压缩轨 迹。
[0014] 相应地,本发明实施例还提供一种应用上述的轨迹压缩方法得到的压缩轨迹的解 压缩方法,包括:
[0015] S01、对压缩轨迹进行扫描,获得所述压缩轨迹中的定点和负数;
[0016] S02、根据所述定点和频繁后继表,将所述负数还原为最频繁后继定点;
[0017] S03、获得所述定点和所述最频繁后继定点的集合,所述定点和所述最频繁后继定 点的集合即为压缩前的轨迹。
[0018] 进一步地,所述步骤S01具体包括:
[0019] 根据所述定点和频繁后继表,将所述负数还原为连续出现的m个最频繁后继定 点;m为所述负数的绝对值。
[0020] 实施本发明实施例,具有如下有益效果:
[0021] 本发明实施例提供的轨迹压缩及解压缩方法能够利用轨迹的特性,将轨迹表示为 独立定点的集合,通过对每个定点的最频繁后继定点进行压缩来完成轨迹的压缩,不会由 于压缩对原数据产生损伤,最大程度地保持了数据的完整性、真实性;通过建立的频繁后继 表,对轨迹中的定点进行快速压缩,具有高压缩率、高效率和高实用性;根据定点和定点的 前定点来确定轨迹的运动方向,从而更加明确该定点的最频繁后继定点,使数据具有更好 的压缩率和可用性;采用霍夫曼编码算法,对轨迹进行进一步地的压缩,同时达到无损压缩 的目的;压缩后的轨迹仍为可读的文本文件,而并非二进制文件,从而可实现对压缩后的轨 迹进行查询和分析;轨迹为定点集合,可根据定点的经纬度信息对轨迹的数据进行快速、准 确的局部还原分析,无需解压整个压缩文件。

【专利附图】

【附图说明】
[0022] 图1是本发明提供的轨迹压缩方法的一个实施例的流程示意图;
[0023] 图2是本发明提供的轨迹压缩方法中的路网轨迹的一个实施例的示意图;
[0024] 图3是本发明提供的轨迹压缩方法中的路网轨迹的另一个实施例的示意图;
[0025] 图4是本发明提供的解压缩方法的一个实施例的流程示意图。

【具体实施方式】
[0026] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0027] 参见图1,是本发明提供的轨迹压缩方法的一个实施例的流程示意图,包括步骤 S1至步骤S3,具体如下:
[0028] S1、对待压缩的轨迹进行扫描,获得所述待压缩的轨迹中的定点;所述轨迹为一个 运动物体在空间中运动所产生的路径,所述定点为所述轨迹的起点、路段交叉点或者终点。
[0029] S2、查询预先配置的频繁后继表,判断所述定点在所述待压缩的轨迹中的后继定 点是否为所述定点的最频繁后继定点;所述后继定点为所述定点相邻的下一个定点;若 是,则执行步骤S3 ;所述频繁后继表记录各个定点及其最频繁后继定点的对应关系。
[0030] S3、将所述最频繁后继定点用负数进行表示,获得所述定点与所述负数的集合,所 述定点与所述负数的集合即为压缩轨迹。
[0031] 对待压缩轨迹中的定点逐一进行扫描,将每一个定点的后继定点与频繁后继表进 行匹配,从而判断该定点的后继定点是否为该定点的最频繁后继定点,若是,则将最频繁后 继定点用负数进行表示,若不是,则保留该后继定点。
[0032] 进一步地,所述步骤S3具体包括:
[0033] S31、计算连续出现最频繁后继定点的个数n,并将连续出现的最频繁后继定点用 负数进行表示;所述负数的绝对值为η ;
[0034] S32、获得所述定点与所述负数的集合,所述定点与所述负数的集合即为压缩轨 迹。
[0035] 在完成待压缩轨迹中的所有定点的扫描后,计算待压缩轨迹中的连续出现最频繁 后继定点的个数η。若只出现一个最频繁后继定点,即η = 1,则用-1来代替该最频繁后继 定点;若连续出现多个最频繁后继定点,即η > 1,则用η的相反数来代替连续出现的多个 最频繁后继定点。
[0036] 进一步地,在所述步骤S1之前还包括步骤S101至步骤S103,具体如下:
[0037] S101、将路网中的轨迹用定点的集合来表示。
[0038] 需要说明的是,轨迹是用一系列的定点来进行表示的,且一系列的定点是按照轨 迹运行的方向来排列的,即集合中的第一个定点为轨迹的起点,最后一个定点为轨迹的终 点,中间部分的定点为轨迹依次经过的路段交叉点。
[0039] S102、对路网中所有轨迹进行扫描,获得所有轨迹中的定点。
[0040] S103、根据所有轨迹中的定点,建立频繁后继表。
[0041] 在一个优选地实施方式中,所述根据所有轨迹中的定点,建立频繁后继表,具体包 括:
[0042] 统计每个定点的所有后继定点出现的频率,将每个定点和每个定点的最频繁后继 定点的对应关系保存在频繁后继表中;所述最频繁后继定点为在定点的所有后继定点中出 现频率最1?的后继定点。
[0043] 在某个路网中,一个定点必有若干相邻定点与它相连,在任意轨迹中,一个定点的 后继定点为其相邻定点之一。而路网中轨迹具有周期性,如每天上下班车辆的轨迹,每天的 轨迹是很相似的。因此,一些定点的使用必然比其他定点的使用频率高,如城市主干道中的 定点。通过对路网中所有轨迹的定点进行扫描,统计出定点的最频繁后继定点。对于单向 路段中的定点来说,一个定点具有唯一的最频繁后继定点。
[0044] 下面基于图2所示的路网中的单向路段的轨迹,对本发明实施例提供的轨迹压缩 方法进行详细描述。
[0045] 如图2所示,当路网中具有3条轨迹T1、T2和T3时,对3条轨迹T1、T2和T3的压 缩流程如下:
[0046] S201、根据定点的经纬度信息,对路网中的所有定点进行编号,如Ρ1、Ρ2……Ρη。
[0047] S202、将轨迹ΤΙ、Τ2和Τ3用定点的集合进行表示,则ΤΙ = (Ρ1,Ρ2, Ρ3, Ρ6),Τ2 = (P1,P2,P5),T3 = (Ρ4,Ρ2,Ρ5)。
[0048] S203、对轨迹ΤΙ、Τ2和Τ3进行扫描,获得轨迹ΤΙ、Τ2和Τ3中的所有定点PI、Ρ2、 Ρ3、Ρ4、Ρ5 和 Ρ6。
[0049] S204、统计每个定点的所有后继定点出现的频率,获得每个定点的最频繁后继定 点。
[0050] 在轨迹Τ1、Τ2和Τ3中,定点Ρ2的后继定点Ρ3出现次数为1,后继定点Ρ5出现次 数为2,则后继定点Ρ5为定点Ρ2的最频繁后继定点。同理,Ρ1的最频繁后继定点为Ρ2,Ρ3 的最频繁后继定点为Ρ6, Ρ4的最频繁后继定点为Ρ2。将每个定点和每个定点的最频繁后 继定点的对应关系保存在频繁后继表中,如表1 :

【权利要求】
1. 一种轨迹压缩方法,其特征在于,包括: 51、 对待压缩的轨迹进行扫描,获得所述待压缩的轨迹中的定点;所述轨迹为一个运动 物体在空间中运动所产生的路径,所述定点为所述轨迹的起点、路段交叉点或者终点; 52、 查询预先配置的频繁后继表,判断所述定点在所述待压缩的轨迹中的后继定点是 否为所述定点的最频繁后继定点;所述后继定点为所述定点相邻的下一个定点;若是,则 执行步骤S3 ;所述频繁后继表记录各个定点及其最频繁后继定点的对应关系; 53、 将所述最频繁后继定点用负数进行表示,获得所述定点与所述负数的集合,所述定 点与所述负数的集合即为压缩轨迹。
2. 如权利要求1所述的轨迹压缩方法,其特征在于,所述步骤S3具体包括: 531、 计算连续出现最频繁后继定点的个数n,并将连续出现的最频繁后继定点用负数 进行表示;所述负数的绝对值为η ; 532、 获得所述定点与所述负数的集合,所述定点与所述负数的集合即为压缩轨迹。
3. 如权利要求1所述的轨迹压缩方法,其特征在于,在所述步骤S1之前还包括: 将路网中的轨迹用定点的集合来表示; 对路网中所有轨迹进行扫描,获得所有轨迹中的定点; 根据所有轨迹中的定点,建立频繁后继表。
4. 如权利要求3所述的轨迹压缩方法,其特征在于,所述根据所有轨迹中的定点,建立 频繁后继表,具体包括: 统计每个定点的所有后继定点出现的频率,将每个定点和每个定点的最频繁后继定点 的对应关系保存在频繁后继表中;所述最频繁后继定点为在定点的所有后继定点中出现频 率最1?的后继定点。
5. 如权利要求3所述的轨迹压缩方法,其特征在于,所述根据所有轨迹中的定点,建立 频繁后继表,具体包括: 统计每个定点在具有相同前定点时的所有后继定点出现的频率,将每个定点和每个定 点在具有相同前定点时的最频繁后继定点的对应关系保存在频繁后继表中;所述前定点为 所述定点相邻的前一个定点。
6. 如权利要求3至5任一项所述的轨迹压缩方法,其特征在于,所述定点的集合具体为 定点编号的集合,在所述步骤S1之前还包括: 根据定点的经纬度信息,对路网中的所有定点进行编号。
7. 如权利要求1所述的轨迹压缩方法,其特征在于,在所述步骤S3之后还包括: 根据霍夫曼编码算法,对所述压缩轨迹进一步压缩,获得无损压缩轨迹。
8. -种应用如权利要求1至6任一项所述的轨迹压缩方法得到的压缩轨迹的解压缩方 法,其特征在于,包括 : 501、 对压缩轨迹进行扫描,获得所述压缩轨迹中的定点和负数; 502、 根据所述定点和频繁后继表,将所述负数还原为最频繁后继定点; 503、 获得所述定点和所述最频繁后继定点的集合,所述定点和所述最频繁后继定点的 集合即为压缩前的轨迹。
9. 如权利要求8所述的解压缩方法,其特征在于,所述步骤S02具体包括: 根据所述定点和频繁后继表,将所述负数还原为连续出现的m个最频繁后继定点;m为 所述负数的绝对值。
10.如权利要求8所述的解压缩方法,其特征在于,在所述步骤SOI之前还包括: 根据霍夫曼解码算法,对无损压缩轨迹进行解码,获得压缩轨迹;所述无损压缩轨迹是 根据霍夫曼编码算法对压缩轨迹进行进一步压缩而得到的。
【文档编号】H03M7/30GK104242949SQ201410455230
【公开日】2014年12月24日 申请日期:2014年9月9日 优先权日:2014年9月9日
【发明者】谭浩宇, 高民, 丁烨 申请人:广州市香港科大霍英东研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1