一种数据挖掘系统和方法

文档序号:6507601阅读:261来源:国知局
一种数据挖掘系统和方法
【专利摘要】本发明提供了一种数据挖掘系统,其包括:数据采集单元,用于采集用户的位置数据;地理信息单元,其预先保存地理数据相关的信息;数据分析单元,用于基于地理信息单元的信息,分析用户的位置数据,以获得关于所述用户的个体分析信息;以及数据挖掘单元,用于根据数据挖掘需求,对全部用户的个体分析信息进行数据挖掘,以获得目标信息。本发明还提供了一种相应的数据挖掘方法。本发明针对同一类型的个人行为进行数据分析和挖掘,从宏观角度得出统计结果,相比于传统调查统计方式,具有处理信息量巨大、节时省力、准确性高等优点。
【专利说明】一种数据挖掘系统和方法
【技术领域】
[0001]本发明涉及一种数据挖掘系统和方法。
【背景技术】
[0002]艾媒市场咨询综合数据显示,欧洲移动定位服务市场在2009年的营业收入为
3.20亿美元,而到了 2015年,营业收入将达到6.1亿美元,年复合增长率将达到12%。在国内,移动定位服务亦开始成为大型网站的标配。据介绍,目前国内移动定位签到服务已经有30万用户。尽管由于智能手机应用还不够广泛等缘故,LBS(Location Based Service,基于位置服务)业务跟庞大的手机用户数量比较并不高,但随着智能手机越来越普及,利用手机移动上网的用户也越来越多,LBS业务的发展前景非常诱人。
[0003]移动定位通常指的是手机定位,也就是通过无线终端(手机)和无线网络的配合,确定移动用户的实际位置信息(经纬度坐标数据,包括三维数据),并通过SMS (短消服务)、MMS(多媒体短信服务)、语音发给用户或以此为基础提供某种增值服务。按照实现移动定位的方式,大体上可以分两类,一类是依赖通信运营商的基站定位;另一类是依赖全球卫星定位系统(Global PositioningSystem)的GPS客户端接收机定位。现在手机定位服务主要应用到地理信息支持:方便查询所需的地理目标(周边搜索)及提供路线导航功能,汽车救援,医疗急救等方面。
[0004]对于依赖通信运营商(比如联通、移动等)的定位,通常需要消耗数据流量(比如GPRS等),靠手机与通信塔台之间的通信实现定位,定位结果误差不超过600米,适合普通的步行或者逛街,这类定位功能的实现大部分依赖软件,并且这些软件基本绑定有路线搜素的功能,比较方便,时间短,反应快。典型的应用实现有:谷歌地图、百度地图、贝多移动基站等。
[0005]但上述的手机定位技术,均是针对单个个体的个人服务,无法宏观地统计出同一类型人群的行为特征,也即无法实现基于移动定位的数据挖掘。

【发明内容】

[0006]本发明针对上述问题,提出了一种数据挖掘系统和方法,旨在实现基于移动定位的数据挖掘,分析出有价值的信息,为政府部门或公司企业的决策提供依据。
[0007]在一个方面,本发明提供了一种数据挖掘系统,其特征在于,包括:
[0008]数据采集单元,用于采集用户的位置数据;
[0009]地理信息单元,其预先保存地理数据相关的信息;
[0010]数据分析单元,用于基于地理信息单元的信息,分析用户的位置数据,以获得关于所述用户的个体分析信息;以及
[0011]数据挖掘单元,用于根据数据挖掘需求,对全部用户的个体分析信息进行数据挖掘,以获得目标信息。
[0012]在另一个方面,本发明提供了一种数据挖掘方法,其特征在于,包括步骤:[0013]采集用户的位置数据;
[0014]基于地理信息,分析用户的位置数据,以获得关于所述用户的个体分析信息;以及
[0015]根据数据挖掘需求,对全部用户的个体分析信息进行数据挖掘,以获得目标信息。
[0016]本发明不针对单个个体的定位信息,而是针对同一类型的个人行为进行数据分析和挖掘,从而能从宏观角度,得出统计结果,对政府部门和商业公司均有参考价值,有助于作出统筹全局的重大决策。相比于使用调查问卷、访谈等的传统调查统计方式,本发明具有处理的信息量巨大,节时省力的特点,并且还提高了调查统计的准确性。
【专利附图】

【附图说明】
[0017]下面将参照附图描述本发明的具体实施例,其中:
[0018]图1示出本发明的数据挖掘系统的整体框图;
[0019]图2示出本发明的数据挖掘系统的工作流程图;
[0020]图3示出本发明的数据挖掘系统中地理位置标识物的地理信息网格存储方式的示意图;并且
[0021]图4示出本发明的数据挖掘方法。
【具体实施方式】
[0022]为了使本发明的技术方案及优点更加清楚明白,以下结合附图对本发明的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本发明的一部分实施例,而不是所有实施例的穷举。
[0023]如图1所不,在移动终端设备101的持有者打开移动定位功能时,移动终端设备101根据GPS卫星定位系统102或移动设备基站103,得到自身的位置信息,再将自身的位置信息通过无线网络发送给交换机104,最终交换机104将该数据发送到数据挖掘系统2。在数据挖掘系统2中,将对这些位置信息进行存储和处理,以便得出期望的最终结果。
[0024]具体地,数据挖掘系统2包括数据采集单元202、地理信息单元203、数据分析单元204以及数据挖掘单元205。这些单元共同使用同一套数据库集群,即公共数据库201。在数据处理的整个流程中,这些单元202-205扮演不同的角色,承担不同的任务。它们相互配合,各自发挥着自己的作用。
[0025]下面,结合图2详细描述各个单元202-205所承担的任务。数据采集单元202负责采集用户的位置数据,并将位置数据发送到公共数据库201的基础数据库2011且存储于此。在本实施例中,用户的位置数据通过获取用户的移动终端设备101的位置数据来获得。也就是说,数据采集单元202采集移动终端设备101的位置数据以作为用户的数据。地理信息单元203预先保存了地理数据相关的信息,这些信息通常需要借助于测绘仪器301通过测绘得到。这些信息包括,比如:地图信息以及地图上的商家信息。并且,由于地理信息一直都在变化,所以需要进行定期或不定期的更新。数据分析单元204结合数据采集单元202和地理信息单元203中的数据,根据不同的数据挖掘任务需要,提取出相应的数据,并以利于挖掘任务的方式存储到公共数据库201的分析数据库2012中。数据分析单元204实际上是对数据进行清洗、过滤或优化,仅仅提取出有价值的数据。数据挖掘单元205根据用户304的需要,对分析数据库2012中的数据进行数据挖掘,将挖掘到的具有利用价值的信息呈现给用户304,作为用户决策的参考。
[0026]下面,针对每个单元分别详细阐述。
[0027]数据采集单元202
[0028]通过手机的定位技术,采集某一手机账号在某一时间段内的移动信息。比如:某手机账号在2012/9/24 8:40:00到2012/9/24 8:55:00从天通苑居民区移动到上地中关村软件园。在该手机账号的移动距离达到10米时,记录移动10米前后的时间点和位置信息,以及停止移动两个状态切换点的时间和位置
[0029]数据库表设计如下:.字段名 P类型说明 I
【权利要求】
1.一种数据挖掘系统,其特征在于,包括: 数据采集单元(202),用于采集用户的位置数据; 地理信息单元(203),其预先保存地理数据相关的信息; 数据分析单元(204),用于基于地理信息单元(203)的信息,分析用户的位置数据,以获得关于所述用户的个体分析信息;以及 数据挖掘单元(205),用于根据数据挖掘需求,对全部用户的个体分析信息进行数据挖掘,以获得目标信息。
2.如权利要求1所述的数据挖掘系统,其特征在于,还包括公共数据库(201),用于保存用户的位置数据以及数据分析单元(204)的分析结果数据。
3.如权利要求1所述的数据挖掘系统,其特征在于,所述用户的位置数据通过采集所述用户的移动终端设备(101)的位置数据来获得。
4.如权利要求1所述的数据挖掘系统,其特征在于,所述地理信息单元(203)采用网格信息存储方式来存储地理位置标识物的地理信息。
5.如权利要求1所述的数据挖掘系统,其特征在于,其用于挖掘城市交通状况或城市规划。
6.一种数据挖掘方法,其特征在于,包括步骤: 采集用户的位置数据; 基于地理信息,分析用户的位置数据,以获得关于所述用户的个体分析信息;以及 根据数据挖掘需求,对全部用户的个体分析信息进行数据挖掘,以获得目标信息。
7.如权利要求6所述的数据挖掘方法,其特征在于,采集所述用户的移动终端设备(101)的位置数据作为所述用户的位置数据。
8.如权利要求6所述的数据挖掘方法,其特征在于,所述地理信息预先保存于地理信息单元(203)中。
9.如权利要求6所述的数据挖掘方法,其特征在于,其用于挖掘城市交通状况或城市规划。
【文档编号】G06F17/30GK103440278SQ201310350067
【公开日】2013年12月11日 申请日期:2013年8月12日 优先权日:2013年8月12日
【发明者】龚福才, 宋怀明, 苗艳超, 刘新春, 邵宗有 申请人:曙光信息产业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1