互联网用户信息采集方法和装置制造方法

文档序号:7776347阅读:231来源:国知局
互联网用户信息采集方法和装置制造方法
【专利摘要】本发明公开了一种互联网用户信息采集方法和装置。该互联网用户信息采集方法包括获取网页中的JSP代码;以及利用JSP代码获取访问网页的用户信息。通过本发明,能够达到准确采集用户访问信息的效果。
【专利说明】互联网用户信息采集方法和装置
【技术领域】
[0001]本发明涉及互联网领域,具体而言,涉及一种互联网用户信息采集方法和装置。
【背景技术】
[0002]传统分析服务器的网页上插入Javascript脚本采集数据,插入的Javascript代码在用户终端浏览器中运行,为不同的访问用户生成携带独特访问信息的图像链接,该链接地址指向Web站访问分析平台。用户浏览器将自动下载该图像,使分析平台收集到完整的用户行为信息。
[0003]传统网络分析系统是在被分析服务器的网页上插入Javascript脚本采集数据,插入的Javascript代码在用户终端浏览器中运行,为不同的访问用户生成携带独特访问信息的图像链接,但是该链接地址指向WAP站访问分析平台时会产生三大问题:
[0004]第一,Javascript脚本很难收集到用户手机号等用户信息,对分析系统当中一些维度与实际情况差距很大。
[0005]第二,现存大部分手机浏览器不能完善支持Javascript带来的原有js脚本插码方式失效。
[0006]第三,传统Javascript脚本是通过cookie来标识访问者,但是目前很多用户使用的浏览器当中没有记录cookie功能。
[0007]针对现有技术中采集用户访问信息不准确的问题,目前尚未提出有效的解决方案。

【发明内容】

[0008]本发明的主要目的在于提供一种互联网用户信息采集方法和装置,以解决现有技术中采集用户访问信息不准确的问题。
[0009]为了实现上述目的,根据本发明的一个方面,提供了一种互联网用户信息采集方法。根据本发明的互联网用户信息采集方法包括:获取网页中的JSP代码;以及利用JSP代码获取访问网页的用户信息。
[0010]进一步地,利用JSP代码获取访问网页的用户信息之前,采集方法包括:接收用户访问网页的信号;在接收到用户访问信号之后,JSP代码生成携带用户访问信息的<img>标签;通过浏览器对网页的所有的<img>标签进行下载;记录用户访问<img>标签时携带的访问信息;将记录的信息返回给浏览器。
[0011]进一步地,通过浏览器对页面的所有的<img>标签进行下载包括:获取<img>标签中的src携带的url及参数;以及根据获取的url及参数对页面的所有的<img>标签进行下载。
[0012]进一步地,将记录的信息返回给浏览器包括:将记录的信息生成gif文件;以及将gif文件返回给浏览器。
[0013]为了实现上述目的,根据本发明的另一方面,提供了一种互联网用户信息采集装置。根据本发明的互联网用户信息采集装置包括:第一获取单元,用于获取网页中的JSP代码;以及第二获取单元,用于利用JSP代码获取访问网页的用户信息。
[0014]进一步地,第二获取单元包括:接收模块,用于接收用户访问网页的信号;生成模块,用于在接收到用户访问信号之后,JSP代码生成携带用户访问信息的<img>标签;下载模块,用于通过浏览器对网页的所有的<img>标签进行下载;记录模块,用于记录用户访问<img>标签时携带的访问信息;返回模块,用于将记录的信息返回给浏览器。
[0015]进一步地,下载模块包括:获取子模块,用于获取<img>标签中的src携带的url及参数;以及下载子模块,用于根据获取的url及参数对页面的所有的<img>标签进行下载。
[0016]进一步地,返回模块包括:生成子模块,用于将记录的信息生成gif文件;以及返回子模块,用于将gif文件返回给浏览器。
[0017]通过本发明,采用获取网页中的JSP代码;以及利用JSP代码获取访问网页的用户信息,解决了现有技术中采集用户访问信息不准确的问题,进而达到了准确采集用户访问信息的效果。
【专利附图】

【附图说明】
[0018]构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0019]图1是根据本发明第一实施例的互联网用户信息采集方法的流程图;
[0020]图2是根据本发明第二实施例的互联网用户信息采集方法的流程图;
[0021]图3是根据本发明第一实施例的互联网用户信息采集方法的流程图;以及
[0022]图4是根据本发明第二实施例的互联网用户信息采集装置的示意图。
【具体实施方式】
[0023]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
[0024]为了使本【技术领域】的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0025]本发明实施例提供了一种互联网中用户信息采集方法,该采集方法可以运行在计算机处理装置上。
[0026]图1是根据本发明第一实施例的互联网用户信息采集方法的流程图,如图所示,该互联网用户信息采集方法包括如下步骤:
[0027]步骤S101,获取网页中的JSP代码。在网页中插入JSP代码,JSP代码能够在用户访问网页时生成携带用户访问信息的图像链接,用户浏览器自动下载该图像,从而服务器能够采集用户访问信息。
[0028]JSP (java server pages)是一种动态网页技术标准,JSP是在传统网页HTML文件中插入Java程序段和JSP标记,从而形成JSP文件,用JSP开发的Web应用是跨平台的,既能在Linux下运行,也能在其他操作系统上运行。
[0029]JSP脚本还可以标识手机用户信息,手机用户使用手机浏览器访问网页时,可以将手机用户手机号作为用户身份的唯一标识信息,从而在用户再次访问该网站时,利用该用户的手机号确定该用户的身份。
[0030]步骤S101,利用JSP代码获取访问网页的用户信息。在用户访问带有JSP代码的网页之后,JSP代码自动运行以获取访问网页的用户信息。对于手机用户,采集用户的手机号码,对于PC用户,可以赋予PC用户唯一的身份标识,从而确定用户的访问信息。
[0031]通过上述方法,能够使插入JSP代码的网页手机用户的手机号等用户信息,并且对手机浏览器的适用度较高,从而准确获取访问网页的用户信息。
[0032]图2是根据本发明第二实施例的互联网用户信息采集方法的流程图,如图所示,在利用JSP代码获取访问网页的用户信息之前,该互联网用户信息采集方法包括如下步骤:
[0033]步骤S201,接收用户访问网页的信号。用户访问的网页可以是插入JSP脚本的网页,也可以是插入JS脚本的网页,如果用户访问了插有JSP脚本的网页,可以利用JSP脚本中的第一代码标识手机用户和PC用户。
[0034]步骤S202,在接收到用户访问信号之后,JSP代码生成携带用户访问信息的<img>标签。如果检测到用户访问的网页带有JSP脚本,那么运行JSP脚本,并生成携带用户访问信息的〈img>标签。该用户访问信息的〈img>标签可以记录访问用户的用户信息。
[0035]步骤S203,通过浏览器对网页的所有的<img>标签进行下载。浏览器下载页面的所有<img>标签,该<img>标签携带了用户访问信息。
[0036]步骤S204,记录用户访问<img>标签时携带的访问信息。记录用户访问<img>标签时携带的访问信息,在用户再次访问该网页时可以根据记录的访问信息确定该用户为老用户,无需再次发送携带用户访问信息的<img>标签。
[0037]步骤S205,将记录的信息返回给浏览器。将记录的信息返回给浏览器,标记该用户的唯一身份标识。
[0038]进一步地,通过浏览器对页面的所有的<img>标签进行下载包括:
[0039]通过浏览器对页面的所有的<img>标签进行下载包括如下步骤:
[0040]步骤S2031,获取<img>标签中的src携带的url及参数。<img>标签包含了访问源src,src携带的地址url指向具有存储和计数功能的服务器,服务器可以存储用户的访问信息,并且能够对访问次数进行计数。用户可以根据src携带的url和参数访问网页页面。
[0041]步骤S2032,根据获取的url及参数对页面的所有的<img>标签进行下载。用户浏览器根据获取的url及参数对页面的所有的<img>标签进行下载,从而获得用户身份标识。
[0042]进一步地,将记录的信息返回给浏览器包括:将记录的信息生成gif文件,将gif文件返回给浏览器。
[0043]从以上的描述中,可以看出,本发明通过在一个网页中插入JSP脚本,在用户利用手机浏览器访问网页时采集用户信息。
[0044]本发明实施例还提供了一种互联网用户信息采集装置。[0045]本发明实施例的互联网用户信息采集方法可以通过本发明实施例所提供的互联网用户信息采集装置来执行,本发明实施例的互联网用户信息采集装置也可以用于执行本发明实施例所提供的互联网用户信息采集方法。
[0046]本发明实施例还提供了一种互联网中用户信息采集装置。
[0047]图3是根据本发明第一实施例的互联网用户信息采集方法的流程图,如图所示,该互联网用户信息采集装置包括第一获取单元10和第二获取单元20。
[0048]第一获取单元10用于获取网页中的JSP代码。在网页中插入JSP代码,JSP代码能够在用户访问网页时生成携带用户访问信息的图像链接,用户浏览器自动下载该图像,从而服务器能够采集用户访问信息。
[0049]JSP (java server pages)是一种动态网页技术标准,JSP是在传统网页HTML文件中插入Java程序段和JSP标记,从而形成JSP文件,用JSP开发的Web应用是跨平台的,既能在Linux下运行,也能在其他操作系统上运行。
[0050]JSP脚本还可以标识手机用户信息,手机用户使用手机浏览器访问网页时,可以将手机用户手机号作为用户身份的唯一标识信息,从而在用户再次访问该网站时,利用该用户的手机号确定该用户的身份。
[0051]第二获取单元20用于利用JSP代码获取访问网页的用户信息。在用户访问带有JSP代码的网页之后,JSP代码自动运行以获取访问网页的用户信息。对于手机用户,采集用户的手机号码,对于PC用户,可以赋予PC用户唯一的身份标识,从而确定用户的访问信
肩、O
[0052]通过上述装置,能够使插入JSP代码的网页手机用户的手机号等用户信息,并且对手机浏览器的适用度较高,从而准确获取访问网页的用户信息。
[0053]图4是根据本发明第二实施例的互联网用户信息采集装置的示意图。如图所示,该互联网用户信息采集装置包括第一获取单元10和第二获取单元20,第二获取单元20包括接收模块201、生成模块202、下载模块203、记录模块204和返回模块205。
[0054]该图所示实施例中的第一获取单元10和第二获取单元20与图3所示实施例的第一获取单元10和第二获取单元20的功能相同,在此不作赘述。
[0055]接收模块201用于接收用户访问网页的信号。用户访问的网页可以是插入JSP脚本的网页,也可以是插入JS脚本的网页,如果用户访问了插有JSP脚本的网页,可以利用JSP脚本中的第一代码标识手机用户和PC用户。
[0056]生成模块202用于在接收到用户访问信号之后,JSP代码生成携带用户访问信息的<img>标签。如果检测到用户访问的网页带有JSP脚本,那么运行JSP脚本,并生成携带用户访问信息的〈img>标签。该用户访问信息的〈img>标签可以记录访问用户的用户信息。
[0057]下载模块203用于通过浏览器对网页的所有的<img>标签进行下载。浏览器下载页面的所有<img>标签,该<img>标签携带了用户访问信息。
[0058]记录模块204用于记录用户访问<img>标签时携带的访问信息。记录用户访问<img>标签时携带的访问信息,在用户再次访问该网页时可以根据记录的访问信息确定该用户为老用户,无需再次发送携带用户访问信息的<img>标签。
[0059]返回模块205用于将记录的信息返回给浏览器。将记录的信息返回给浏览器,标记该用户的唯一身份标识。[0060]进一步地,下载模块203包括:
[0061]获取子模块,用于获取<img>标签中的src携带的url及参数。<img>标签包含了访问源src,src携带的地址url指向具有存储和计数功能的服务器,服务器可以存储用户的访问信息,并且能够对访问次数进行计数。用户可以根据src携带的url和参数访问网页页面。
[0062]下载子模块,用于根据获取的url及参数对页面的所有的<img>标签进行下载。用户浏览器根据获取的url及参数对页面的所有的<img>标签进行下载,从而获得用户身份标识。
[0063]进一步地,返回模块205包括:生成子模块,用于将记录的信息生成gif文件,返回子模块,用于将gif文件返回给浏览器。
[0064]从以上的描述中,可以看出,本发明通过在一个网页中插入JSP脚本,在用户利用手机浏览器访问网页时采集用户信息。
[0065]本发明实施例还提供了一种计算机存储介质。该计算机存储介质可存储有程序,该程序用于执行上述的互联网用户信息采集方法中的部分或全部步骤。
[0066]需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
[0067]在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0068]在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
[0069]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0070]另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0071]所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM, Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0072]以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种互联网用户信息采集方法,其特征在于,包括: 获取网页中的JSP代码;以及 利用所述JSP代码获取访问所述网页的用户信息。
2.根据权利要求1所述的采集方法,其特征在于,利用所述JSP代码获取访问所述网页的用户信息之前,所述采集方法包括: 接收用户访问所述网页的信号; 在接收到用户访问信号之后,所述JSP代码生成携带用户访问信息的<img>标签; 通过浏览器对所述网页的所有的<img>标签进行下载; 记录所述用户访问所述<img>标签时携带的访问信息; 将记录的信息返回给所述浏览器。
3.根据权利要求2所述的采集方法,其特征在于,通过所述浏览器对所述页面的所有的<img>标签进行下载包括: 获取所述<img>标签中的src携带的url及参数;以及 根据获取的所述url及参数对所述页面的所有的<img>标签进行下载。
4.根据权利要求2所述的采集方法,其特征在于,将记录的信息返回给所述浏览器包括: 将记录的信息生成gif文件;以及 将所述gif文件返回给所述浏览器。
5.一种互联网用户信息采集装置,其特征在于,包括: 第一获取单元,用于获取网页中的JSP代码;以及 第二获取单元,用于利用所述JSP代码获取访问所述网页的用户信息。
6.根据权利要求5所述的采集装置,其特征在于,所述第二获取单元包括: 接收模块,用于接收用户访问所述网页的信号; 生成模块,用于在接收到用户访问信号之后,所述JSP代码生成携带用户访问信息的<img>标签; 下载模块,用于通过浏览器对所述网页的所有的<img>标签进行下载; 记录模块,用于记录所述用户访问所述<img>标签时携带的访问信息; 返回模块,用于将记录的信息返回给所述浏览器。
7.根据权利要求6所述的采集装置,其特征在于,所述下载模块包括: 获取子模块,用于获取所述<img>标签中的src携带的url及参数;以及 下载子模块,用于根据获取的所述url及参数对所述页面的所有的<img>标签进行下载。
8.根据权利要求6所述的采集装置,其特征在于,所述返回模块包括: 生成子模块,用于将记录的信息生成gif文件;以及 返回子模块,用于将所述gif文件返回给所述浏览器。
【文档编号】H04L12/26GK103560935SQ201310565777
【公开日】2014年2月5日 申请日期:2013年11月13日 优先权日:2013年11月13日
【发明者】柳振宇, 谢光辉 申请人:北京国双科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1