基于地点挖掘的用户行为评估方法

文档序号:9911821阅读:304来源:国知局
基于地点挖掘的用户行为评估方法
【技术领域】
[0001] 本发明涉及一种基于地点挖掘的用户行为评估方法,属于数据挖掘领域。
【背景技术】
[0002] 随着移动互联网的不断发展,手机等移动设备已逐渐普及。目前手机等移动设备 都配备了GPS,或者具有网络定位功能,方便用户自动记录每天的行程。用户每天不同时间 段在不同地点的停留时间分布,反映了该用户的行为规律。
[0003] 基于用户轨迹数据的数据挖掘技术正在不断的发展中,一般应用在热门地点推荐 等领域,企业领域的应用还比较少,例如,2013年《昆明理工大学》公开的基于手机定位数据 的用户出行规律分析。
[0004] 通过挖掘用户轨迹数据,企业可以方便地评估员工的工作行为。这种技术不仅仅 局限在企业管理,也可以应用在任何需要轨迹数据做支撑的用户行为评估领域。但现有传 统企业考核员工在外工作表现一般是通过考勤打卡来实现,这种方法需要人工维护记录, 采用指纹机等方案还需要投入额外硬件成本,能够识别的地点也受到限制。

【发明内容】

[0005] 本发明的目的在于克服现有技术存在的上述问题,提供一种基于地点挖掘的用户 行为评估方法。本发明可以从用户原始杂乱的轨迹数据中,得到用户的行为模式,准确反应 出用户每天的行为规律,大大降低了传统的考勤打卡违规作弊的可能。
[0006] 为实现上述目的,本发明采用的技术方案如下:
[0007] -种基于地点挖掘的用户行为评估方法,其特征在于:利用轨迹数据挖掘用户的 行为模式,分析用户的行为规律,对用户行为进行评估。
[0008] 所述方法具体包括如下步骤:
[0009] a、获取位置信息得到轨迹数据,并对轨迹数据预处理;
[0010] b、通过轨迹数据获取用户不同时间段在不同地点的时间分布,得到用户的行为模 式;
[0011] C、利用用户行为模式的历史记录更新用户偏好模型,根据用户偏好模型判断是否 为异常行为,计算用户行为得分。
[00?2]所述步骤&中,移动设备上报轨迹数据为L= {li,12,…,In},其中li= (lati,longi, timed表示经炜度和时间,首先去除轨迹数据中的重复点,再通过Kalman滤波过滤速度异 常点,平滑轨迹数据,使轨迹数据更接近真实的行程轨迹。
[0013] 所述步骤b中,采用基于时间序列的聚类算法,获取用户不同时间段在不同地点的 时间分布,得到用户的行为模式。
[0014] 所述步骤b具体包括:
[0015] bl、选取两个参数值地点最大范围Dmax和有效地点时间跨度T;
[0016] b2、依次对轨迹数据进行以下处理:当相邻两个轨迹点的距离小于地点范围阈值D 时,两个轨迹点合并为一个新轨迹点,新轨迹点参与下一次处理;当相邻两个轨迹点的距离 大于地点范围阈值DmaJt,且前一个轨迹点的时间跨度大于有效地点时间阈值T时,该轨迹 点为一有效地点,表示p = {lat,lng,start_ts,end_ts};
[0017] b3、用户有效地点数目为M,一天划分为N个时间段,用户行为模式表示为MXN矩阵 P=[fu],每一行表示用户的某个有效地点,每一列表示一天中的某个时间段,表示在第 j个时间段停留在第i个地点的概率。
[0018] 所述步骤c中,用户偏好模型通过下述方法得出:
[0019] cl、通过夹角余弦系数,定义用户行为模式距离函数。对于行为模式X和行为模式 Y,第i个时间段的地点分布向量为Xi = {χι,Χ2,···,xm}和Yi = {yi,y2,···,yM},M为有效地点数 目,N为时间段总数,则有
[0020]
[0021]
[0022] c2、利用行为模式距离函数,对用户行为模式的历史记录进行DBSCAN聚类,得到K 个类别,取同一类行为模式的平均值作为类中心,则这K个行为模式为用户偏好模型。
[0023] 所述步骤c中,根据用户偏好模型判断是否为异常行为:利用行为模式距离函数计 算用户行为模式与用户偏好模型的相似度,当相似度低于阈值时,判断用户某天的行为为 异常行为,则该用户行为得分直接判为负分。
[0024] 所述步骤c中,结合用户业务行为数据选取C类评价指标,C类评价指标权重
V,.计算用户行为得分,其中81为单项评价指标 得分,根据用户行为得分得出评估结果。
[0025]所述评价指标选择用户移动总距离Len、用户停留次数Count、用户有效停留数 ECount,有效停留数为在停留地点用户有业务数据操作的停留点数目。
[0026]采用本发明的优点在于:
[0027] 1、采用本发明后,无需使用额外的考勤打卡设备,降低了部署开销,有利于企业推 广使用。
[0028] 2、采用本发明后,可以从用户原始杂乱的轨迹数据中,得到用户的行为模式,准确 反应出用户每天的行为规律,大大降低了传统的考勤打卡违规作弊的可能。
[0029] 3、本发明通过结合用户历史行为模式,判断用户异常行为。
[0030] 4、本发明根据选定的评价指标计算用户行为得分,建立统一的评价标准,客观反 映出用户的工作完成情况和工作效率。
【附图说明】
[0031]图1为本发明流程不意图
[0032] 图2为本发明轨迹数据和有效地点示意图
【具体实施方式】
[0033] 实施例1
[0034] -种基于地点挖掘的用户行为评估方法,其特征在于:利用轨迹数据挖掘用户的 行为模式,分析用户的行为规律,对用户行为进行评估。
[0035]所述方法具体包括如下步骤:
[0036] a、获取位置信息得到轨迹数据,并对轨迹数据预处理;
[0037] b、通过轨迹数据获取用户不同时间段在不同地点的时间分布,得到用户的行为模 式;
[0038] c、利用用户行为模式的历史记录更新用户偏好模型,根据用户偏好模型判断是否 为异常行为,计算用户行为得分。
[0039]所述步骤a中,移动设备上报轨迹数据为L= {li,h,…,In},其中li= (lati,longi, timei)表示经炜度和时间,首先去除轨迹数据中的重复点,再通过Kalman滤波过滤速度异 常点,平滑轨迹数据,使轨迹数据更接近真实的行程轨迹。
[0040]所述步骤b中,采用基于时间序列的聚类算法,获取用户不同时间段在不同地点的 时间分布,得到用户的行为模式。
[0041 ]所述步骤b具体包括:
[0042] bl、选取两个参数值地点最大范围Dmax和有效地点时间跨度T;
[0043] b2、依次对轨迹数据进行以下处理:当相邻两个轨迹点的距离小于地点范围阈值D 时,两个轨迹点合并为一个新轨迹点,新轨迹点参与下一次处理;当相邻两个轨迹点的距离 大于地点范围阈值DmaJt,且前一个轨迹点的时间跨度大于有效地点时间阈值T时,该轨迹 点为一有效地点,表示p = {lat,lng,start_ts,end_ts};
[0044] b3、用户有效地点数目为M,一天划分为N个时间段,用户行为模式表示为MXN矩阵 P=[fu],每一行表示用户的某个有效地点,每一列表示一天中的某个时间段,表示在第 j个时间段停留在第i个地点的概率。
[0045] 所述步骤c具体包括:
[0046] cl、通过夹角余弦系数,定义用户行为模式距离函数。对于行为模式X和行为模式 Y,第i个时间段的地点分布向量为Xi = {χι,Χ2,···,xm}和Yi = {yi,y2,···,yM},M为有效地点数 目,N为时间段总数,则有
[0047]
[0048]
[0049] c2、利用行为模式距离函数,对用户的行为模式的历史记录进行DBSCAN聚类,得到 K个类别,取同一类行为模式的平均值作为类中心,则这K个行为模式为用户偏好模型;
[0050] c3、根据用户偏好模型判断是否为异常行为:利用行为模式距离函数计算用户行 为模式与用户偏好模型的相似度,当相似度低于阈值时,判断用户某天的行为为异常行为, 则该用户行为得分直接判为负分;
[0051 ] 〇3、结合用户ik务行遞m取谈iff介指t示,iff介指标i

4计算用户行为得分,其中si为单项评价指标得分,根据用户行为得分得出评估 结果。
[0052]
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1