网络用户定位方法、装置及终端的利记博彩app

文档序号:10572649阅读:327来源:国知局
网络用户定位方法、装置及终端的利记博彩app
【专利摘要】一种网络用户定位方法、装置及终端,所述网络用户定位方法包括:获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;根据所述多个地理位置之间的距离对所述多个地理位置进行聚类;基于聚类的结果确定所述IP地址的位置信息。本发明技术方案提高了网络用户定位的准确性。
【专利说明】
网络用户定位方法、装置及终端
技术领域
[0001]本发明涉及数据挖掘领域,尤其涉及一种网络用户定位方法、装置及终端。
【背景技术】
[0002]随着互联网技术的发展以及大数据领域的不断扩张,互联网用户数据日益剧增。其中,在网络平台,可以统计到互联网用户的数据,用户数据包括用户的年龄、性别、职业等用户信息,则可以通过计算不同性别网民的地域分布,以及年龄、职业、消费能力等地域分布,可以有效的帮助公司和政府做出经济决策或市场定位。
[0003]现有技术中,确定网络用户的地理位置有以下方式,一种是利用用户上网时的IP地址,根据IP地址可以查到上网用户对应的地理区域,例如,IP地址为[210.22.119.158]对应的地理区域为上海市浦东新区;另一种是通过采集用户上网时的cookie信息,然后从cookie信息中筛选出用户当前的经玮度信息。
[0004]但是,现有技术中,通过IP地址获取到的用户位置为地理区域,精确性低;而通过cookie信息筛选出的经玮度信息,由于网络互联的复杂多样性,同一个IP会筛选到多个地理位置,用户定位的精准性依然很低。

【发明内容】

[0005]本发明解决的技术问题是如何提高网络用户定位的准确性。
[0006]为解决上述技术问题,本发明实施例提供一种网络用户定位方法,网络用户定位方法包括:获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;根据所述多个地理位置之间的距离对所述多个地理位置进行聚类;基于聚类的结果确定所述IP地址的位置信息。
[0007]可选的,获取用户的所述网络行为信息之后还包括:过滤所述地理位置。
[0008]可选的,过滤所述地理位置包括:基于所述IP地址所属的地域范围,剔除所述地域范围以外的所述地理位置。
[0009]可选的,所述网络用户定位方法按照设定时间周期性地执行。
[0010]可选的,所述网络用户定位方法还包括:将所述IP地址和所述位置信息进行存储,形成可查询的定位数据库。
[0011 ]可选的,所述地理位置采用经玮度的形式表示。
[0012]可选的,根据所述多个地理位置之间的距离对所述多个地理位置进行聚类包括:形成第一集合,所述第一集合内的数据点为所述IP地址对应的所述多个地理位置,将所述第一集合列入集合列表;计算所述第一集合内的数据点两两之间的距离,为距离最大的两个数据点分别建立新集合并列入所述集合列表;剔除所述第一集合内的距离最大的两个数据点;遍历所述第一集合内的数据点,确定所述数据点与所述第一集合内的其他数据点之间的最大距离,并计算所述数据点与所述集合列表中每一集合的距离,所述数据点与所述集合的距离为所述数据点与所述集合内每一数据点的距离的最大值,所述最大距离小于所述数据点与所述集合列表中每一集合的距离时,为所述数据点建立新集合并列入所述集合列表,否则将所述数据点加入与所述集合列表中距离最小的集合内。
[0013]可选的,基于聚类的结果确定所述IP地址的位置信息包括:确定所述集合列表中每一集合包含的所述数据点的数量,将所述数据点的数量最大的集合作为目标集合;将所述目标集合的中心点或所述目标集合中出现频次最大的所述数据点作为所述位置信息。
[0014]可选的,对所述多个地理位置进行聚类后得到多个集合,每一集合包括一个或多个所述地理位置;基于聚类的结果确定所述IP地址的所述位置信息包括:确定所述多个集合中每一集合包含的所述地理位置的数量,将所述地理位置的数量最大的集合作为目标集合;将所述目标集合的中心点或所述目标集合中出现频次最大的所述地理位置作为所述位置信息。
[0015]为解决上述技术问题,本发明实施例还公开了一种网络用户定位装置,所述网络用户定位装置包括:采集单元,适于获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;聚类单元,适于根据所述多个地理位置之间的距离对所述多个地理位置进行聚类;判定单元,适于基于聚类的结果确定所述IP地址的位置信息。
[0016]可选的,所述网络用户定位装置还包括:过滤单元,适于在所述采集单元获取所述网络行为信息之后过滤所述地理位置。
[0017]可选的,所述过滤单元适于基于所述IP地址所属的地域范围,剔除所述地域范围以外的所述地理位置。
[0018]可选的,所述网络用户定位装置还包括:控制单元,适于控制所述采集单元、所述聚类单元和所述判定单元周期性地工作。
[0019]可选的,所述网络用户定位装置还包括:存储单元,适于将所述IP地址和所述位置信息进行存储,形成可查询的定位数据库。
[0020]可选的,所述地理位置采用经玮度的形式表示。
[0021 ]可选的,所述聚类单元包括:集合形成子单元,适于形成第一集合,所述第一集合内的数据点为所述IP地址对应的所述多个地理位置,将所述第一集合列入集合列表;距离计算子单元,适于计算所述第一集合内的数据点两两之间的距离,并为距离最大的两个数据点分别建立新集合并列入所述集合列表;剔除子单元,适于剔除所述第一集合内的距离最大的两个数据点;遍历子单元,适于遍历所述第一集合内的数据点,确定所述数据点与所述第一集合内的其他数据点之间的最大距离,并计算所述数据点与所述集合列表中每一集合的距离,所述数据点与所述集合的距离为所述数据点与所述集合内每一数据点的距离的最大值,所述最大距离小于所述数据点与所述集合列表中每一集合的距离时,为所述数据点建立新集合并列入所述集合列表,否则将所述数据点加入与所述集合列表中距离最小的集合内。
[0022]可选的,所述判定单元包括:第一确定子单元,确定所述集合列表中每一集合包含的所述数据点的数量,将所述数据点的数量最大的集合作为目标集合;第一位置计算子单元,适于将所述目标集合的中心点或所述目标集合中出现频次最大的所述数据点作为所述位置信息。
[0023]可选的,所述聚类单元对所述多个地理位置进行聚类后得到多个集合,每一集合包括一个或多个所述地理位置;所述判定单元包括:第二确定子单元,适于确定所述多个集合中每一集合包含的所述地理位置的数量,将所述地理位置的数量最大的集合作为目标集合;第二位置计算子单元,适于将所述目标集合的中心点或所述目标集合中出现频次最大的所述地理位置作为所述位置信息。
[0024]为解决上述技术问题,本发明实施例还公开了一种终端,所述终端包括所述网络用户定位装置。
[0025]与现有技术相比,本发明实施例的技术方案具有以下有益效果:
[0026]本发明实施例的网络用户定位方法通过获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;根据所述多个地理位置之间的距离对所述多个地理位置进行聚类;基于聚类的结果确定所述IP地址的位置信息。通过采集用户的网络行为信息,并基于IP地址对多个地理位置进行聚类处理,基于聚类的结果确定IP地址对应的位置信息,也就是确定了用户的位置信息,提高了网络用户定位的准确性。
[0027]进一步,所述网络用户定位方法按照设定时间周期性地执行,在提高了网络用户定位的准确性的基础上,可以实现实时获取网络用户的地理位置信息。
【附图说明】
[0028]图1是本发明实施例一种网络用户定位方法的流程图;
[0029]图2是本发明实施例另一种网络用户定位方法的流程图;
[0030]图3是本发明实施例一种地理位置聚类方法的流程图;
[0031 ]图4是本发明实施例一种网络用户定位装置的结构示意图;
[0032]图5是本发明实施例另一种网络用户定位装置的结构示意图。
【具体实施方式】
[0033]如【背景技术】中所述,现有技术中,通过IP地址获取到的用户位置为地理区域,精确性低;而通过cookie信息筛选出的经玮度信息,由于网络互联的复杂多样性,同一个IP会筛选到多个地理位置,用户定位的精准性依然很低。
[0034]本发明实施例中,IP地址是指互联网协议地址(Internet Protocol Address) 0IP地址是IP协议提供的一种统一的地址格式,为互联网上的每一个网络和每一台主机分配一个逻辑地址,以此来屏蔽物理地址的差异。网络用户在产生网络行为时,会对应一个IP地址,本发明的网络用户定位方法是基于IP地址进行定位的。
[0035]本发明通过采集用户的网络行为信息,并基于IP地址对多个地理位置进行聚类处理,基于聚类的结果确定IP地址对应的位置信息,也就是确定了用户的位置信息,提高了网络用户定位的准确性。
[0036]为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
[0037]图1是本发明实施例一种网络用户定位方法的流程图,下面结合图1对所述网络用户定位方法做详细的说明。
[0038]所述网络用户定位方法包括,步骤SlOl:获取用户的网络行为信息。其中,所述网络行为信息包括IP地址及其对应的多个地理位置。
[0039]在具体实施中,可以按照网络入口规则获取用户的网络行为信息,例如,网络入口可以是,用户使用WIF1、有线网络或移动基站上网,获取用户网络行为的入口 IP地址;采集用户在上网时产生的cookie信息或URL信息,筛选出地理位置。同时由于网络互联的复杂性,采集到的每个IP地址对应多个地理位置,所以,对网络用户进行精准的定位时,可以对多个地理位置进行处理。
[0040]具体地,所述地理位置可以采用经玮度的形式表示。经玮度精度可以由用户进行自定义配置,例如经玮度精度可以是小数点第五位;所述经玮度可以是在GPS坐标系,也可以是其他任意可实施的卫星坐标体系。当然,地理位置的表示形式并不限于经玮度,还可以采用其他任何适当的方式来表示。
[0041]可以理解的是,本发明实施例获取到的网络行为信息,是用户在一定的上网时间内产生的。例如,网络行为信息可以是在多天内采集到的,其中,对所述地理位置进行天内去重,保留跨天相同的地理位置。由此,采集到的多个地理位置是有可能重合的。
[0042]步骤S102:根据所述多个地理位置之间的距离对所述多个地理位置进行聚类。
[0043]本实施例中,在每个IP地址对应多个地理位置时,根据多个地理位置之间的距离对所述多个地理位置进行聚类处理,将多个地理位置聚类为距离相近的多个集合。也可以说,对所述多个地理位置进行聚类后得到多个集合,每一集合包括一个或多个所述地理位置。具体地,当所述地理位置为经玮度时,两个地理位置之间的距离可以采用经玮度数值进行计算,例如可以米用公式S = r Xarccos[sin(yI) X sin(y2) X cos(xl-x2)+cos(yl) X cos(y2)]来计算,其中,S表示距离,r表示地球半径,xl表示其中一个地理位置的经度,yl表示其中一个地理位置的玮度,x2表示另一个地理位置的经度,y2表示另一个地理位置的玮度。
[0044]可以理解的是,对所述多个地理位置进行聚类的过程可以采用任意可实施的算法。
[0045]步骤S103:基于聚类的结果确定所述IP地址的位置信息。
[0046]本实施例中,根据聚类结果,确定包括地理位置的数量最多的集合,计算所述集合的中心点作为网络用户的所述位置信息,由于IP地址对应的所述地理位置未做去重处理,由此,也可以确定所述集合中出现频率最大的地理位置,作为网络用户的所述位置信息。
[0047]具体实施中,确定所述多个集合中每一集合包含的所述地理位置的数量,将所述地理位置的数量最大的集合作为目标集合;将所述目标集合的中心点或所述目标集合中出现频次最大的所述地理位置作为网络用户的所述位置信息。
[0048]本发明实施例通过采集用户的网络行为信息,并基于IP地址对多个地理位置进行聚类处理,基于聚类的结果确定IP地址对应的位置信息,也就是确定了用户的位置信息,提高了网络用户定位的准确性。
[0049]具体地,所述网络用户定位方法按照设定时间周期性地执行。由此,所述用户的位置信息也可以进行周期性的更新,在提高了网络用户定位的准确性的基础上,可以实现实时获取网络用户的地理位置信息。
[0050]图2是本发明实施例另一种网络用户定位方法的流程图,下面结合图2对所述网络用户定位方法做详细的说明。
[0051]所述网络用户定位方法包括,步骤S201:获取用户的网络行为信息。其中,所述网络行为信息包括IP地址及其对应的多个地理位置。
[0052]本实施例中,获取到用户的网络行为信息后,过滤出所述IP地址及其对应的多个地理位置,剔除脏数据。
[0053]步骤S202:过滤所述地理位置。
[0054]本实施例中,基于IP地址对地理位置进行过滤,基于所述IP地址所属的地域范围,剔除所述地域范围以外的所述地理位置,也就是说,基于同一个IP地址,剔除偏离的不可信的地理位置。网络用户的行为信息中IP地址仅对应一个地理位置时,对于网络用户的定位得到的位置信息仅存在一个地理位置,准确性低,故也可以剔除只对应一个地理位置的网络行为信息。
[0055]步骤S203:根据所述多个地理位置之间的距离对所述多个地理位置进行聚类。
[0056]具体实施中,根据所述多个地理位置之间的距离对所述多个地理位置进行聚类,聚类后得到多个集合,每一集合包括一个或多个所述地理位置。其中,每个集合中每个地理位置与同一集合内其他地理位置之间的距离小于每个地理位置与其他集合的距离,所述地理位置与其他集合的距离为所述地理位置与其他集合内每一地理位置的距离的最大值。
[0057]可以理解的是,对所述多个地理位置进行聚类的算法,可以采用任意可实施的方式,本发明实施例对此不做限制,
[0058]步骤S204:基于聚类的结果确定所述IP地址的位置信息。
[0059]本实施例中,根据聚类结果,确定包括地理位置的数量最多的集合,计算所述集合的中心点作为网络用户的所述位置信息,由于IP地址对应的所述地理位置未做去重处理,由此,也可以确定所述集合中出现频率最大的地理位置,作为网络用户的所述位置信息。
[0060]进一步地,确定包括地理位置的数量最多的集合后,根据预设覆盖半径对上述集合进行筛选,例如可以是,在两个地理位置之间的距离大于预设覆盖半径时,剔除所述两个地理位置。从而在减小计算量的同时,进一步提高了定位的准确性。
[0061]步骤S205:将所述IP地址和所述位置信息进行存储,形成可查询的定位数据库。
[0062]具体实施中,确定所述IP地址的位置信息后,将所述IP地址和所述位置信息进行存储,形成可查询的定位数据库。由此,用户可以通过IP地址查询对应的位置信息。具体地,所述网络用户定位方法按照设定时间周期性地执行。由此,所述用户的位置信息也可以进行周期性的更新,也就是说,定位数据库中IP地址对应的所述位置信息可以进行周期性的更新,进一步提高了网络用户定位的准确性。
[0063]本发明实施例的【具体实施方式】可参照前述相应实施例,此处不再赘述。
[0064]图3是本发明实施例一种地理位置聚类方法的流程图,下面结合图3对所述地理位置聚类方法做详细的说明。
[0065]所述地理位置聚类方法可以包括:步骤S301:形成第一集合。其中,所述第一集合内的数据点为所述IP地址对应的所述多个地理位置,将所述第一集合列入集合列表。
[0066]步骤S302:计算所述第一集合内的数据点两两之间的距离,为距离最大的两个数据点分别建立新集合并列入所述集合列表。
[0067]本实施例中,将多个地理位置以数据点的形式形成集合,并计算多个数据点之间的距离。具体地,当所述地理位置为经玮度时,两个数据点之间的距离可以采用经玮度数值进行计算,例如可以采用公式S = r Xarccos[sin(yI) X sin(y2) X cos(xl-x2)+cos(yl) Xcos(y2)]来计算,其中,S表示距离,r表示地球半径,xl表示其中一个数据点的经度,yl表示其中一个数据点的玮度,x2表示另一个数据点的经度,y2表示另一个数据点的玮度。
[0068]步骤S303:剔除所述第一集合内的距离最大的两个数据点。
[0069]步骤S304:遍历所述第一集合内的数据点,确定所述数据点与所述第一集合内的其他数据点之间的最大距离,并计算所述数据点与所述集合列表中每一集合的距离,所述数据点与所述集合的距离为所述数据点与所述集合内每一数据点的距离的最大值,所述最大距离小于所述数据点与所述集合列表中每一集合的距离时,为所述数据点建立新集合并列入所述集合列表,否则将所述数据点加入与所述集合列表中距离最小的集合内。
[0070]具体实施中,将IP地址对应的多个地理位置形成第一集合S,多个地理位置为数据点11,12,13,...,1N,数据点的数量为N,N为大于等于2的正整数。具体地,第一集合S中的数据点可以天内去重,保留跨天相同的数据点。
[0071]可以理解的是,对于地理位置的去重处理,可以由用户根据实际的应用环境做自定义配置,本发明实施例对此不做限制。
[0072]例如,计算各个数据点11,12,13,...,1N之间的距离,得到第一集合S中距离最大的两个点,例如可以是数据点11和数据点12,建立形成新集合为Sl(Il)和S2(12),加入集合列表LS[S1,S2],并将数据点11和数据点12从S中剔除。计算得到数据点13和第一集合S中的数据点13,...,1N的最大距离maxD,数据点13与新集合SI和S2的距离,分别为maxDXl和maxDX2,例如可以是,计算13与SI中每个数据点的距离,取最大距离作为maxDXI,计算13与S2中每个数据点的距离,取最大距离作为maxDX2。比较maxD、maxDXl和maxDX2的大小,如果maxD)(l>maxDX且maxDX2>maxDX,则建立形成新集合为S3(13),加入集合列表LS[S1,S2,S3],并将数据点13从第一集合S中剔除;如果maxDX I < = maxDX且maXDX2>maXDX,则将数据点13放入集合SI中,生成SI (II,13),将数据点13从第一集合S中剔除;如果maxDXDmaxDX且maxDX2
<= maxDX,则将数据点13放入集合S2中,生成S2(12,13),将数据点13从第一集合S中剔除;如果 maxDX I〈=maxDX 且 maxDX2〈=maxDX,则取 DXI 和 DX2 的最小值mi n [maxDX I, maxDX2 ]对应的集合,例如可以是SI,生成Sl(ll,13),将数据点13从第一集合S中剔除。形成的集合列表LS和下与第一集合S中的数据点14…IN继续上述步骤,直至遍历完第一集合S中的所有数据点,也就是说,当第一集合S为空时,迭代完成,可以进行下一步的操作。
[0073]具体实施中,聚类完成后,得到聚类的结果,即集合列表1^[51,52,-_,5111],其中,111
<= N。确定所述集合列表LS中每一集合[SI,S2,...,Sm]包含的所述数据点的数量,将所述数据点的数量最大的集合作为目标集合,将所述目标集合的中心点作为所述位置信息,或将所述目标集合中出现频次最大的所述数据点作为所述位置信息。具体地,为了提高精准度,可以剔除集合列表LS中数据点的数量为I的集合。具体地,还可以设置所述位置信息的有效期为24小时,在24小时后,所述位置信息被重新计算,也就是说,所述网络用户定位方法按照设定时间24小时周期性地执行。
[0074]需要说明的是,所述位置信息的有效期或者所述设定时间可以根据实际的应用环境进行适应性修改和调整,本发明实施例对此不做限制。
[0075]图4是本发明实施例一种网络用户定位装置的结构示意图。下面结合图4对所述网络用户定位装置做详细的说明。
[0076]所述网络用户定位装置包括:采集单元401、聚类单元402和判定单元403。
[0077]其中,采集单元401适于获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;聚类单元402适于根据所述多个地理位置之间的距离对所述多个地理位置进行聚类;判定单元403适于基于聚类的结果确定所述IP地址的位置信息。
[0078]本实施例中,采集单元401按照网络入口规则获取用户的网络行为信息,例如,网络入口可以是,用户使用WIF1、有线网络或移动基站上网,获取用户网络行为的入口 IP地址;采集用户在上网时产生的cookie信息或URL信息,筛选出地理位置。同时由于网络互联的复杂性,采集到的每个IP地址对应多个地理位置,所以,对网络用户进行精准的定位时,可以对多个地理位置进行处理。具体地,所述地理位置可以采用经玮度的形式表示。经玮度精度可以由用户进行自定义配置,例如经玮度精度可以是小数点第五位;所述经玮度可以是在GPS坐标系,也可以是其他任意可实施的卫星坐标体系。
[0079]具体实施中,在每个IP地址对应多个地理位置时,聚类单元402根据多个地理位置之间的距离对所述多个地理位置进行聚类处理,将多个地理位置聚类为距离相近的多个集合。也可以说,聚类单元402对所述多个地理位置进行聚类后得到多个集合,每一集合包括一个或多个所述地理位置。具体地,当所述地理位置为经玮度时,两个地理位置之间的距离可以采用经玮度数值进行计算。
[0080]具体实施中,判定单元403确定所述多个集合中每一集合包含的所述地理位置的数量,将所述地理位置的数量最大的集合作为目标集合;将所述目标集合的中心点或所述目标集合中出现频次最大的所述地理位置作为网络用户的所述位置信息。
[0081]本发明实施例通过采集用户的网络行为信息,并基于IP地址对多个地理位置进行聚类处理,基于聚类的结果确定IP地址对应的位置信息,也就是确定了用户的位置信息,提高了网络用户定位的准确性。
[0082]具体地,所述网络用户定位方法按照设定时间周期性地执行。由此,所述用户的位置信息也可以进行周期性的更新,在提高了网络用户定位的准确性的基础上,可以实现实时获取网络用户的地理位置信息。
[0083]图5是本发明实施例另一种网络用户定位装置的结构示意图。下面结合图5对所述网络用户定位装置做详细的说明。
[0084]所述网络用户定位装置包括:采集单元501、过滤单元502、聚类单元503、集合形成子单元504、距离计算子单元505、剔除子单元506、遍历子单元507、判定单元508、存储单元509和控制单元510。
[0085]具体地,所述网络用户定位装置按照设定时间周期性地执行网络用户定位方法。
[0086]其中,采集单元501适于获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;过滤单元502适于在所述采集单元501获取所述网络行为信息之后过滤所述地理位置。具体地,在采集单元501采集到的数据量大的情况下,为了减小聚类单元503在聚类时的运算量,减小运算时间,同时提高定位的精准度,过滤单元502适于基于所述IP地址所属的地域范围,剔除所述地域范围以外的所述地理位置。过滤单元502还可以在所述IP地址仅对应一个所述地理位置时,剔除所述IP地址和所述地理位置。具体地,聚类单元503在对过滤后的多个地理位置进行聚类后,可以得到多个集合,每一集合包括一个或多个所述地理位置;判定单元508根据聚类单元503的聚类结果确定IP地址的位置信息。
[0087]具体实施中,判定单元508可以包括:第二确定子单元(图未示)和第二位置计算子单元(图未示)。第二确定子单元确定所述多个集合中每一集合包含的所述地理位置的数量,将所述地理位置的数量最大的集合作为目标集合;第二位置计算子单元将所述目标集合的中心点或所述目标集合中出现频次最大的所述地理位置作为所述位置信息。
[0088]本实施例中,聚类单元503可以包括集合形成子单元504、距离计算子单元505、剔除子单元506和遍历子单元507 ο具体地,集合形成子单元504形成第一集合,所述第一集合内的数据点为所述IP地址对应的所述多个地理位置,将所述第一集合列入集合列表;距离计算子单元505计算所述第一集合内的数据点两两之间的距离,并为距离最大的两个数据点分别建立新集合并列入所述集合列表;剔除子单元506适于剔除所述第一集合内的距离最大的两个数据点;遍历子单元507遍历所述第一集合内的数据点,确定所述数据点与所述第一集合内的其他数据点之间的最大距离,并计算所述数据点与所述集合列表中每一集合的距离,所述数据点与所述集合的距离为所述数据点与所述集合内每一数据点的距离的最大值,所述最大距离小于所述数据点与所述集合列表中每一集合的距离时,为所述数据点建立新集合并列入所述集合列表,否则将所述数据点加入与所述集合列表中距离最小的集合内。
[0089]具体地,所述判定单元508可以包括:第一确定子单元(图未示)和第一位置计算子单元(图未示)。第一确定子单元确定所述集合列表中每一集合包含的所述数据点的数量,将所述数据点的数量最大的集合作为目标集合;第一位置计算子单元将所述目标集合的中心点或所述目标集合中出现频次最大的所述数据点作为所述位置信息。
[0090]本实施例中,存储单元509适于将所述IP地址和确定的所述位置信息进行存储,形成可查询的定位数据库。由此,用户可以通过IP地址查询对应的位置信息。
[0091]具体实施中,控制单元510可以控制所述采集单元501、所述聚类单元503和所述判定单元508周期性地工作;也可以是,控制单元510控制所述采集单元501、过滤单元502、所述聚类单元503和所述判定单元508周期性地工作。由此,所述用户的位置信息也可以进行周期性的更新,也就是说,定位数据库中IP地址对应的所述位置信息可以进行周期性的更新,进一步提高了网络用户定位的准确性。
[0092]本发明实施例还公开了一种终端,所述终端包括所述网络用户定位装置。所述终端可以是计算机设备、平台等,可以支持配置所述网络用户定位装置,执行所述网络用户定位方法。
[0093]本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于以计算机可读存储介质中,存储介质可以包括:R0M、RAM、磁盘或光盘等。
[0094]虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
【主权项】
1.一种网络用户定位方法,其特征在于,包括: 获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置; 根据所述多个地理位置之间的距离对所述多个地理位置进行聚类; 基于聚类的结果确定所述IP地址的位置信息。2.根据权利要求1所述的网络用户定位方法,其特征在于,获取用户的所述网络行为信息之后还包括: 过滤所述地理位置。3.根据权利要求2所述的网络用户定位方法,其特征在于,过滤所述地理位置包括: 基于所述IP地址所属的地域范围,剔除所述地域范围以外的所述地理位置。4.根据权利要求1所述的网络用户定位方法,其特征在于,所述网络用户定位方法按照设定时间周期性地执行。5.根据权利要求1所述的网络用户定位方法,其特征在于,还包括: 将所述IP地址和所述位置信息进行存储,形成可查询的定位数据库。6.根据权利要求1至5任一项所述的网络用户定位方法,其特征在于,所述地理位置采用经玮度的形式表示。7.根据权利要求1所述的网络用户定位方法,其特征在于,根据所述多个地理位置之间的距离对所述多个地理位置进行聚类包括: 形成第一集合,所述第一集合内的数据点为所述IP地址对应的所述多个地理位置,将所述第一集合列入集合列表; 计算所述第一集合内的数据点两两之间的距离,为距离最大的两个数据点分别建立新集合并列入所述集合列表; 剔除所述第一集合内的距离最大的两个数据点; 遍历所述第一集合内的数据点,确定所述数据点与所述第一集合内的其他数据点之间的最大距离,并计算所述数据点与所述集合列表中每一集合的距离,所述数据点与所述集合的距离为所述数据点与所述集合内每一数据点的距离的最大值,所述最大距离小于所述数据点与所述集合列表中每一集合的距离时,为所述数据点建立新集合并列入所述集合列表,否则将所述数据点加入与所述集合列表中距离最小的集合内。8.根据权利要求7所述的网络用户定位方法,其特征在于,基于聚类的结果确定所述IP地址的位置信息包括: 确定所述集合列表中每一集合包含的所述数据点的数量,将所述数据点的数量最大的集合作为目标集合; 将所述目标集合的中心点或所述目标集合中出现频次最大的所述数据点作为所述位置信息。9.根据权利要求1所述的网络用户定位方法,其特征在于,对所述多个地理位置进行聚类后得到多个集合,每一集合包括一个或多个所述地理位置; 基于聚类的结果确定所述IP地址的所述位置信息包括: 确定所述多个集合中每一集合包含的所述地理位置的数量,将所述地理位置的数量最大的集合作为目标集合; 将所述目标集合的中心点或所述目标集合中出现频次最大的所述地理位置作为所述位置信息。10.一种网络用户定位装置,其特征在于,包括: 采集单元,适于获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置; 聚类单元,适于根据所述多个地理位置之间的距离对所述多个地理位置进行聚类; 判定单元,适于基于聚类的结果确定所述IP地址的位置信息。11.根据权利要求10所述的网络用户定位装置,其特征在于,还包括: 过滤单元,适于在所述采集单元获取所述网络行为信息之后过滤所述地理位置。12.根据权利要求11所述的网络用户定位装置,其特征在于,所述过滤单元适于基于所述IP地址所属的地域范围,剔除所述地域范围以外的所述地理位置。13.根据权利要求10所述的网络用户定位装置,其特征在于,还包括: 控制单元,适于控制所述采集单元、所述聚类单元和所述判定单元周期性地工作。14.根据权利要求10所述的网络用户定位装置,其特征在于,还包括: 存储单元,适于将所述IP地址和所述位置信息进行存储,形成可查询的定位数据库。15.根据权利要求10至14任一项所述的网络用户定位装置,其特征在于,所述地理位置采用经玮度的形式表示。16.根据权利要求10所述的网络用户定位装置,其特征在于,所述聚类单元包括: 集合形成子单元,适于形成第一集合,所述第一集合内的数据点为所述IP地址对应的所述多个地理位置,将所述第一集合列入集合列表; 距离计算子单元,适于计算所述第一集合内的数据点两两之间的距离,并为距离最大的两个数据点分别建立新集合并列入所述集合列表; 剔除子单元,适于剔除所述第一集合内的距离最大的两个数据点; 遍历子单元,适于遍历所述第一集合内的数据点,确定所述数据点与所述第一集合内的其他数据点之间的最大距离,并计算所述数据点与所述集合列表中每一集合的距离,所述数据点与所述集合的距离为所述数据点与所述集合内每一数据点的距离的最大值,所述最大距离小于所述数据点与所述集合列表中每一集合的距离时,为所述数据点建立新集合并列入所述集合列表,否则将所述数据点加入与所述集合列表中距离最小的集合内。17.根据权利要求16所述的网络用户定位装置,其特征在于,所述判定单元包括: 第一确定子单元,确定所述集合列表中每一集合包含的所述数据点的数量,将所述数据点的数量最大的集合作为目标集合; 第一位置计算子单元,适于将所述目标集合的中心点或所述目标集合中出现频次最大的所述数据点作为所述位置信息。18.根据权利要求10所述的网络用户定位装置,其特征在于,所述聚类单元对所述多个地理位置进行聚类后得到多个集合,每一集合包括一个或多个所述地理位置; 所述判定单元包括: 第二确定子单元,适于确定所述多个集合中每一集合包含的所述地理位置的数量,将所述地理位置的数量最大的集合作为目标集合; 第二位置计算子单元,适于将所述目标集合的中心点或所述目标集合中出现频次最大的所述地理位置作为所述位置信息。19.一种终端,其特征在于,包括如权利要求10至18任一项所述的网络用户定位装置。
【文档编号】H04L29/06GK105933294SQ201610224580
【公开日】2016年9月7日
【申请日】2016年4月12日
【发明人】汤奇峰, 陈兵强
【申请人】晶赞广告(上海)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1