一种基于功能图片识别仿冒网站的方法及系统的利记博彩app
【技术领域】
[0001]本发明涉及网络安全技术领域,尤其涉及一种基于功能图片识别仿冒网站的方法及系统。
【背景技术】
[0002]目前,存在一些用于发现仿冒网站的现有技术,包括:1、使用浏览器访问仿冒网站,在相同分辨率下对网站进行截图,而后通过对已经保存的同分辨率网页截图进行哈希比对,进而识别出哪些网站是仿冒网站。2、通过对网站的访问,获取到网站头像(S卩ICO图标),将网站头像提取出多张图片得到图片集合,通过对图片集合的识别判断图片集合与现有的网站是否相似,若相似则为仿冒网站。
[0003]以上方法受限于网站的版面大小与截图中分辨率的大小,如果版面过大在相同分辨率下一次截图很难完成,可能需要多次截图,同时要保证截图的完整性;对于读取网页头像(S卩ICO图标)的方法由于紧紧局限于网页中含有网站头像的,当网站中没有网站头像该方法就不能够实现检测仿冒网站的目的。
[0004]通过对大量现有的仿冒网站进行研究,发现为了使网站更像被仿冒网站的真实网站,仿冒者通常采用感官上的仿冒,也就是说无论仿冒网站的源代码多么混乱以及不专业,甚至文字也只是一张图片,那么对于实际访问的用户来说最主要的就是感官上的真而已。所以,无论如何仿冒的网站一定要带上被仿冒的网站的功能图片,使得网站从感官上让人难以区分真伪。
【发明内容】
[0005]本发明所述的技术方案通过采集待识别网站中能够显示而在网页源码中有迹可循的网站功能图片,作为用于识别网站是否为仿冒网站的基础。收集待识别网站的功能图片生成功能图片集,并基于功能图片集生成哈希序列,与相应的授信网站的哈希序列对比,若相似度超过设定阈值,则认为是仿冒网站。本发明所述技术方案能够克服传统识别仿冒网站所存在的问题,能够高效准确地识别仿冒网站。
[0006]本发明采用如下方法来实现:一种基于功能图片识别仿冒网站的方法,包括: 获取待识别网站的功能图片,并形成功能图片集;
基于所述功能图片集生成哈希序列;
将所述哈希序列与预先生成的对应授信网站的功能图片集的哈希序列对比,判断相似度是否超过设定阈值,若是,则判定是仿冒网站,否则待进一步检测;其中,所述功能图片为网站基于美化需要设置的功能性图片。
[0007]进一步地,所述功能图片,包括:图片超链接或者图片按钮。
[0008]更进一步地,所述获取待识别网站的功能图片,包括:
获取<a>标签下〈img>标签下的图片文件;或者,
获取〈button〉标签下<img>标签下的图片文件;或者, 获取〈input〉标签中的图片文件。
[0009]其中,所述获取待识别网站的功能图片后,还包括:过滤广告图片或者自带展示图片。
[0010]本发明采用如下系统来实现:一种基于功能图片识别仿冒网站的系统,包括:功能图片集生成模块,用于获取待识别网站的功能图片,并形成功能图片集;
哈希序列生成模块,用于基于所述功能图片集生成哈希序列;
仿冒网站判定模块,用于将所述哈希序列与预先生成的对应授信网站的功能图片集的哈希序列对比,判断相似度是否超过设定阈值,若是,则判定是仿冒网站,否则待进一步检测;其中,所述功能图片为网站基于美化需要设置的功能性图片。
[0011]进一步地,所述功能图片,包括:图片超链接或者图片按钮。
[0012]更进一步地,所述获取待识别网站的功能图片,包括:
获取<a>标签下〈img>标签下的图片文件;或者,
获取〈button〉标签下<img>标签下的图片文件;或者,
获取〈input〉标签中的图片文件。
[0013]其中,所述获取待识别网站的功能图片后,还包括:过滤广告图片或者自带展示图片。
[0014]综上,本发明给出一种基于功能图片识别仿冒网站的方法及系统,通过获取待识别网站的所有功能图片,并基于收集到的功能图片生成哈希序列,将所述哈希序列与预先生成的对应授信网站的功能图片集的哈希序列对比,若相似度超过设定阈值,则判定待识别网站为仿冒网站。
[0015]有益效果为:本发明所述的方法及系统,有别于传统基于网页头像或者网站徽标来识别仿冒网站的方法,基于待识别网站的各种功能性图片来识别是否是仿冒网站,从而克服了传统方法的准确性一定程度上受限于版面大小或者分辨率大小的问题。利用本发明所述技术方案能够识别超大网页以及没有网站徽标的仿冒网站。
【附图说明】
[0016]为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017]图1为本发明提供的一种基于功能图片识别仿冒网站的方法实施例流程图;
图2为本发明提供的一种基于功能图片识别仿冒网站的系统实施例结构图。
【具体实施方式】
[0018]本发明给出了一种基于功能图片识别仿冒网站的方法及系统实施例,为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明中技术方案作进一步详细的说明:
本发明首先提供了一种基于功能图片识别仿冒网站的方法实施例,如图1所示,包括: SlOl获取待识别网站的功能图片,并形成功能图片集;
S102基于所述功能图片集生成哈希序列;其中,所述哈希序列可以是基于全哈希算法或者感知哈希算法生成的哈希序列;
S103将所述哈希序列与预先生成的对应授信网站的功能图片集的哈希序列对比,判断相似度是否超过设定阈值,若是,则判定是仿冒网站,否则待进一步检测;其中,所述功能图片为网站基于