本发明涉及电子邮件技术领域,尤其涉及一种反垃圾邮件的方法及系统。
背景技术:
垃圾电子邮件一般指接受者不愿意接受而发送者强行发送到接受者邮箱的邮件。随着国际互联网的高速发展,垃圾电子邮件已经以不可控制的势头发展成为网络上的一大公害。垃圾电子邮件不仅骚扰邮件用户,而且还会极大地占用网络服务提供商的带宽资源,影响网络服务质量,带来重大的损失。目前反垃圾邮件方法大概可分为以下三种:黑名单方案、白名单方案、内容过滤方案。
对于黑名单方案,需要邮箱用户事先人工设置好,只能防范同一个发件者重复发来的垃圾邮件。对首次发来的垃圾邮件,仍然无法防范。如果垃圾邮件发送者每次发送垃圾邮件后换一个发件箱地址发送,这个防范方法就无效了,而这对于垃圾邮件的发件者来说很容易做到的。
对于白名单方案,只能对接收熟人的多次来往的邮件有效。其无法接收许多朋友的第一次发送来的邮件。该方案在反垃圾邮件的同时往往会将非垃圾邮件也屏蔽过滤掉。
而内容过滤方案的可靠性不高。垃圾邮件过滤系统总是分析了现有的垃圾邮件特征后才制定的。垃圾邮件发送者可以很容易地针对现有的过滤系统不断变换策略,躲过过滤系统的规律规则将垃圾成功发送到用户邮箱中。虽然许多邮箱服务商声明其邮件系统已经过滤掉了大部分垃圾邮件,但许多用户收到的垃圾邮件还是远高于有用邮件。
技术实现要素:
本发明实施例所要解决的技术问题在于,提供一种反垃圾邮件的方法及系统,以使不易被垃圾邮件突破,提高垃圾邮件屏蔽的可靠性。
为了解决上述技术问题,本发明实施例提出了一种反垃圾邮件的方法,包括:
信誉度检查步骤:将收到的邮件的发件人ip及域名与预设的ip及域名信誉度进行对比检查,并判断对应的信誉度是否符合预设要求,不符合的退回邮件;
名单检查步骤:将邮件的发件人地址与预设的黑/白名单内的发件人地址信息进行对比检查,并判断是否通过检查,不通过则将邮件发送至垃圾箱;
内容清洗步骤:对邮件的内容以模拟收件人可视化的方式进行清洗,并输出清洗掉加扰数据的内容;
特征检查步骤:将输出的内容的特征与预设的垃圾邮件内容特征进行对比检查,并判断是否包含垃圾邮件内容特征,不包含则将邮件发送至收件箱,包含则发送至垃圾箱。
相应地,本发明实施例还提供了一种反垃圾邮件的系统,包括:
信誉度检查模块:将收到的邮件的发件人ip及域名与预设的ip及域名信誉度进行对比检查,并判断对应的信誉度是否符合预设要求,不符合的退回邮件;
名单检查模块:将邮件的发件人地址与预设的黑/白名单内的发件人地址信息进行对比检查,并判断是否通过检查,不通过则将邮件发送至垃圾箱;
内容清洗模块:对邮件的内容以模拟收件人可视化的方式进行清洗,并输出清洗掉加扰数据的内容;
特征检查模块:将输出的内容的特征与预设的垃圾邮件内容特征进行对比检查,并判断是否包含垃圾邮件内容特征,不包含则将邮件发送至收件箱,包含则发送至垃圾箱。
本发明实施例通过提出一种反垃圾邮件的方法及系统,所述方法包括信誉度检查步骤、名单检查步骤、内容清洗步骤及特征检查步骤,通过采用模拟收件人可视化的方式对原始邮件进行渲染后输出清洗后的内容,解决了容易被垃圾邮件突破的问题,进而提高了垃圾邮件屏蔽的可靠性。
附图说明
图1是本发明实施例的反垃圾邮件的方法的流程示意图。
图2是本发明实施例的邮件清洗前的内容的示意图。
图3是本发明实施例的邮件清洗后的内容的示意图。
图4是本发明实施例的反垃圾邮件的系统的结构示意图。
图5是本发明实施例的内容清洗模块的结构示意图。
附图标号说明
信誉度检查步骤s1
名单检查步骤s2
内容清洗步骤s3
特征检查步骤s4
投诉处理步骤s5
回复监测步骤s6
垃圾邮件处理步骤s7。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本发明作进一步详细说明。
本发明实施例中若有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,在本发明中若涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。
请参照图1,本发明实施例的反垃圾邮件的方法主要包括信誉度检查步骤s1、名单检查步骤s2、内容清洗步骤s3及特征检查步骤s4。
信誉度检查步骤s1:将收到的邮件的发件人ip及域名与预设的ip及域名信誉度进行对比检查,并判断对应的信誉度是否符合预设要求,不符合的退回邮件。
名单检查步骤s2:对收到的邮件报文进行解析,获得发件人地址信息,将发件人地址与预设的黑/白名单内的发件人地址信息进行对比检查,并判断是否通过检查,不通过则将邮件发送至垃圾箱。
内容清洗步骤s3:对收到的邮件报文进行解析,获得邮件的内容,对邮件的内容以模拟收件人可视化的方式进行清洗,并输出清洗掉加扰数据的内容。优选地,采用小型化的网页浏览器对原始邮件进行渲染后输出清洗后的内容。
特征检查步骤s4:将输出的内容的特征与预设的垃圾邮件内容特征进行对比检查,并判断是否包含垃圾邮件内容特征,不包含则将邮件发送至收件箱,包含则发送至垃圾箱。例如,传统的邮件内容过滤功能主要通过特定的关键词识别是否是垃圾邮件,垃圾邮件发件人可以通过在原文关键词中随机插入一些加扰的字符干扰,使邮件内容中的关键词被混淆,导致邮件内容过滤模块无法识别垃圾邮件的关键词,从而突破过滤;而无论加扰前后,收件人看到的内容是一样的,只是为了骗过邮件内容的过滤程序;如图2所示,垃圾邮件数据库中的关键词“xraxxestore.com”被用<spanclass=“mmpn”>…</span>标签方式加扰了,如果直接扫描原始邮件是无法匹配到这个关键词的,躲过了基于内容扫描的垃圾邮件过滤模块的检测;如图3所示,渲染、清洗后邮件内容,收件人(人类)视觉可见的内容一致,垃圾邮件特征关键字匹配“xraxxestore.com”这个词能成功匹配,因此这封邮件被检测为垃圾邮件。
作为一种实施方式,内容清洗步骤s3包括构建框架子步骤、渲染内容子步骤及输出内容子步骤。
构建框架子步骤:根据邮件内容格式解析邮件内容,并构建内容的框架,将内容分段,分为多个区块。大部分邮件(包括垃圾邮件)的内容格式都是html格式,把内容提提取出来后,根据html标签框架构建内容的框架,例如<head>区块、<body>区块、<div>区块等,每个区块存储在内存空间中。
渲染内容子步骤:根据邮件内容格式的样式逐个渲染所述区块内的对应内容,过滤干扰信息。根据邮件内容格式的样式(例如,html格式邮件的css样式)逐个渲染每个区块,具体的,通过把区块包含的标签及文字填入内存中区块内部,如果内部嵌套有区块,以同样的方式递归式的处理。渲染区块的时候,如果遇到渲染样式属性,则根据样式的内容对对应的区块内容进行渲染,例如颜色、透明度、是否隐藏等处理。
输出内容子步骤:输出渲染后与视觉可见的内容一致的邮件内容。内存中的各个区块构成的渲染后内容,即清洗后的邮件内容,可以把各种垃圾邮件的混淆机器用的多余标签和信息都过滤掉,只保留与收件人(人类)视觉可见的内容一致的信息。
作为一种实施方式,特征检查步骤s4后还包括:
投诉处理步骤s5:将收件人投诉的邮件的发件人地址保存至预设的黑名单内;降低所述投诉的邮件的发件人ip及域名的信誉度;提取所述投诉的邮件的内容特征并将其增加到预设的垃圾邮件内容特征内。
作为一种实施方式,特征检查步骤s4后还包括:
回复监测步骤s6:监测收件人未投诉的邮件的回复信息,如果收件人回复所述未投诉的邮件,则将所述未投诉的邮件的发件人地址保存至预设的白名单内,并提高所述未投诉的邮件的发件人ip及域名的信誉度;如果收件人未回复所述未投诉的邮件,则提高所述未投诉的邮件的发件人ip及域名的信誉度。
作为一种实施方式,特征检查步骤s4后还包括:
垃圾邮件处理步骤s7:降低垃圾箱内邮件的发件人ip及域名的信誉度,提取所述垃圾箱内邮件的内容特征并将其增加到预设的垃圾邮件内容特征内。
请参照图4,本发明实施例的反垃圾邮件的系统主要包括信誉度检查模块、名单检查模块、内容清洗模块及特征检查模块。
信誉度检查模块:将收到的邮件的发件人ip及域名与预设的ip及域名信誉度进行对比检查,并判断对应的信誉度是否符合预设要求,不符合的退回邮件;
名单检查模块:将邮件的发件人地址与预设的黑/白名单内的发件人地址信息进行对比检查,并判断是否通过检查,不通过则将邮件发送至垃圾箱;
内容清洗模块:对邮件的内容以模拟收件人可视化的方式进行清洗,并输出清洗掉加扰数据的内容;
特征检查模块:将输出的内容的特征与预设的垃圾邮件内容特征进行对比检查,并判断是否包含垃圾邮件内容特征,不包含则将邮件发送至收件箱,包含则发送至垃圾箱。
作为一种实施方式,内容清洗模块包括构建框架子模块、渲染内容子模块及输出内容子模块,请参照图5。
构建框架子模块:根据邮件内容格式解析邮件内容,并构建内容的框架,将内容分段,分为多个区块。
渲染内容子模块:根据邮件内容格式的样式逐个渲染所述区块内的对应内容,过滤干扰信息。
输出内容子模块:输出渲染后与视觉可见的内容一致的邮件内容。
作为一种实施方式,反垃圾邮件的系统还包括投诉处理模块:将收件人投诉的邮件的发件人地址保存至预设的黑名单内;降低所述投诉的邮件的发件人ip及域名的信誉度;提取所述投诉的邮件的内容特征并将其增加到预设的垃圾邮件内容特征内。
作为一种实施方式,反垃圾邮件的系统还包括回复监测模块:监测收件人未投诉的邮件的回复信息,如果收件人回复所述未投诉的邮件,则将所述未投诉的邮件的发件人地址保存至预设的白名单内,并提高所述未投诉的邮件的发件人ip及域名的信誉度;如果收件人未回复所述未投诉的邮件,则提高所述未投诉的邮件的发件人ip及域名的信誉度。
作为一种实施方式,反垃圾邮件的系统还包括垃圾邮件处理模块:降低垃圾箱内邮件的发件人ip及域名的信誉度,提取所述垃圾箱内邮件的内容特征并将其增加到预设的垃圾邮件内容特征内。
另外,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同范围限定。