一种url重定向方法、装置及系统的利记博彩app
【专利摘要】本发明公开了一种URL重定向方法、装置及系统。所述URL重定向方法包括:获取客户端请求的URL,从该URL中获取请求路径的一级目录;根据获取的一级目录从数据字典中查找与该一级目录相关联的重定向规则集合,所述数据字典包括一个或者多个数据条目,每一数据条目包括目录名称和相关联的重定向规则集合;以及将请求的URL中的请求路径与查找到的重定向规则集合进行正则匹配,并根据匹配到的重定向规则对URL进行重定向。本发明提高了服务器端进行URL重定向的处理速度,进而提高了客户端访问服务器中资源的速度。
【专利说明】-种URL重定向方法、装置及系统
【技术领域】
[0001] 本发明涉及互联网领域,具体涉及一种URL重定向方法、装置及系统。
【背景技术】
[0002] URL (Uniform Resource Locator,统一资源定位符)是因特网上标准的资源地址, 用于完整地描述因特网上的网页和其他资源。URL由一系列字符组成,格式为protocol:// [username:password]@host[/path] [? query]。其中,protocol 域指定传输协议; username和password域指定连接到服务器所需的用户名和密码;host域指定存放资源的 服务器的主机名或IP地址;path域指定主机上资源的存储路径;query域指定给动态网页 传递的参数。客户端请求访问服务器的信息资源时,需要确定请求使用的协议、请求的服务 器、请求资源的存储路径(本发明中称之为请求路径)等信息,上述信息都由URL地址提 供。
[0003] URL重定向又称为URL重写(URL Rewrite),是指服务器截取传入的URL地址,将 该URL地址重定向到其他URL的过程。比如浏览器发送的URL地址为www. autohome. com. cn/364/,服务器根据URL重定向的配置文件,自动将这个URL地址重定向到www. autohome, com. cn/XXX. aspx ? id = 364,客户端看到的还是发出请求时的URL地址,但实际访问的 是重定向后的URL地址(对于该URL地址中的资源存储路径,本发明中称之为应用路径)。 URL重定向的优点在于:缩短URL地址的长度,隐藏实际路径提高安全性;易于用户记忆和 键入;易于被搜索引擎收录;便于网站更新。
[0004] 现有URL重定向的实现方案为,首先获取URL重定向的配置文件,例如为:
[0005] <R c w r i t c rC ο η Π g> <Rulcs> <RcwriterRulc> <LookFor>?,/aaa.xml</Lool<For> <ScndTo>~/aaa/bbb.aspx</ScndTo> </RcwritcrRulc> <RcwritcrRulc> < L ο o k F o r>~/( a 1 j a2 j a3 )/\ad {6} /(\d+) 12\. h t m 1 </ L ο o k F o r> <ScndTo>~/mmm/ddd.aspx?id=$2</ScndTo> </RewrilcrRule> </ R c w r i 1c rC ο η Π g>
[0006] 上述配置文件为xml文件,该xml文件中包括多条重定向规则(为正则表达式 规则),每条重定向规则由〈RewriterRule〉元素表达,每个〈RewriterRule〉元素包括 〈LookFor〉元素和〈SendTo〉元素,要在被请求的URL中查找的模式由〈LookFor〉元素表示, 要替换所找到的模式的字符串由〈SendTo〉元素表示。
[0007] 然后,服务器截获到文件请求例如aaa. xml时,在配置文件中从上向下寻找匹配 的重定向规则,采用正则表达式(regular expression)匹配,结果匹配到了上述的一条重 定向规则,因此将aaa. xml重定向到/aaa/bbb. aspx。
[0008] 正则表达式是指用一个"字符串"来描述一个特征,以验证另一个"字符串"是否 符合这个特征。例如表达式"mn*"描述一个字符串的特征,该特征由一个"m"和任意个"η" 组成,如果待验证的字符串是"mn"、"mnn"或"mnnnnnn",则这些字符串均符合这个特征。
[0009] 但是,采用正则表达式匹配的速度较慢,且消耗的系统资源也较高。特别是对于复 杂的网站,其用于URL重定向的配置文件中的重定向规则很多,采用正则表达式匹配的方 式进行URL重定向会使得客户端访问服务器资源的速度较慢,使得用户的体验效果不佳。
【发明内容】
[0010] 鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上 述问题的URL重定向方法、装置及系统。
[0011] 根据本发明的一个方面,提供了一种URL重定向方法,包括:
[0012] 获取客户端请求的URL,从该URL中获取请求路径的一级目录;
[0013] 根据获取的一级目录从数据字典中查找与该一级目录相关联的重定向规则集合, 所述数据字典包括一个或者多个数据条目,每一数据条目包括目录名称和相关联的重定向 规则集合;以及
[0014] 将请求的URL中的请求路径与查找到的重定向规则集合进行正则匹配,并根据匹 配到的重定向规则对URL进行重定向。
[0015] 可选地,所述方法还包括步骤:根据URL重定向的配置文件生成所述数据字典,包 括:
[0016] 从配置文件中逐条读取重定向规则;
[0017] 对于读取到的每条重定向规则,将该重定向规则的请求路径的一级目录与该重定 向规则相关联的添加到数据字典中。
[0018] 可选地,所述根据URL重定向的配置文件生成所述数据字典,包括:从配置文件中 逐条读取重定向规则;对于读取到的每条重定向规则,将该重定向规则的请求路径的一级 目录与该重定向规则相关联的添加到数据字典中。
[0019] 可选地,所述将该重定向规则的请求路径的一级目录与该重定向规则相关联的添 加到数据字典中,包括:判断请求路径的一级目录是否存在于数据字典中;当该一级目录 不存在于数据字典中时,将该一级目录以及该重定向规则作为一个数据条目添加到数据字 典中;当该一级目录存在于数据字典中时,将该重定向规则添加到数据字典中与该一级目 录相关联的重定向规则集合中。
[0020] 可选地,当配置文件的重定向规则的请求路径为多个一级目录构成的一级目录集 合时,所述将该重定向规则的请求路径的一级目录与该重定向规则相关联的添加到数据字 典中为,分别将一级目录集合中每个一级目录与该重定向规则相关联的添加到数据字典 中。
[0021] 可选地,所述将请求的URL中的请求路径与查找到的重定向规则集合进行正则匹 配,并根据匹配到的重定向规则对URL进行重定向,包括:从查找到的重定向规则集合中逐 条取出重定向规则,将该请求路径与该重定向规则进行正则匹配;当匹配到某条重定向规 则时,将该请求路径重定向到重定向规则中的应用路径;当所有重定向规则均不匹配时,不 对该URL进行重定向。
[0022] 根据本发明的另一方面,提供了一种URL重定向装置,包括:
[0023] -级目录获取单元,适于获取客户端请求的URL,从该URL中获取请求路径的一级 目录;
[0024] 字典查找单元,适于根据获取的一级目录从数据字典中查找与该一级目录相关联 的重定向规则集合,所述数据字典包括一个或者多个数据条目,每一数据条目包括目录名 称和相关联的重定向规则集合;以及
[0025] 重定向单元,适于将请求的URL中的请求路径与查找到的重定向规则集合进行正 则匹配,并根据匹配到的重定向规则对URL进行重定向。
[0026] 可选地,所述装置还包括数据字典生成单元,适于:
[0027] 从配置文件中逐条读取重定向规则;
[0028] 对于读取到的每条重定向规则,将该重定向规则的请求路径的一级目录与该重定 向规则相关联的添加到数据字典中。
[0029] 可选地,所述数据字典生成单元进一步适于:判断请求路径的一级目录是否存在 于数据字典中;当该一级目录不存在于数据字典中时,将该一级目录以及该重定向规则作 为一个数据条目添加到数据字典中;当该一级目录存在于数据字典中时,将该重定向规则 添加到数据字典中与该一级目录相关联的重定向规则集合中。
[0030] 可选地,当配置文件的重定向规则的请求路径为多个一级目录构成的一级目录集 合时,所述数据字典生成单元分别将一级目录集合中每个一级目录与该重定向规则相关联 的添加到数据字典中。
[0031] 可选地,所述重定向单元进一步适于:从查找到的重定向规则集合中逐条取出重 定向规则,将该请求路径与该重定向规则进行正则匹配;当匹配到某条重定向规则时,将该 请求路径重定向到重定向规则中的应用路径;当所有重定向规则均不匹配时,不对该URL 进行重定向。
[0032] 根据本发明的又一方面,提供了一种URL重定向系统,包括多个客户端、为这些客 户端提供各种网络资源的服务器端,客户端和服务器端经由互联网络而相互通信,其中,所 述服务器端包括上述的URL重定向装置。
[0033] 本发明通过预先将配置文件中的重定向规则按照请求路径的一级目录进行归类, 并采用数据字典进行保存,在进行URL重定向时,先通过数据字典查找一级目录,查找到了 再进行正则表达式匹配,否则不进行正则表达式匹配,避免了直接进行正则表达式匹配失 败的情况,从而提高了匹配命中的效率,进而提高了 URL重定向的处理速度和客户端访问 服务器中资源的速度。而且,进行正则表达式匹配的仅是所有重定向规则的一个子集,进一 步提高了 URL重定向的处理速度。
[0034] 上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段, 而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够 更明显易懂,以下特举本发明的【具体实施方式】。
【专利附图】
【附图说明】
[0035] 通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通 技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明 的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0036] 图1示出了根据本发明一个实施例的URL重定向系统的结构图;
[0037] 图2示出了根据本发明一个实施例的URL重定向装置的结构图;以及
[0038] 图3示出了根据本发明一个实施例的URL重定向方法的流程图。
【具体实施方式】
[0039] 下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开 的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例 所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围 完整的传达给本领域的技术人员。
[0040] 图1示出了根据本发明一个实施例的URL重定向系统的结构图。如图1所示,URL 重定向系统包括多个客户端110 (图中示出了 3个)、为这些客户端110提供各种网络资源 的服务器端120,客户端110和服务器端120经由互联网络而相互通信。
[0041] 在本发明实施例中,客户端110可以是本领域任何可以呈现从服务器端120获取 的网络资源的设备,包括但不限于桌面型计算机、笔记本式计算机、个人数字助理、智能移 动终端和平板电脑等。客户端110具有操作系统,操作系统上运行有浏览器,所述浏览器能 够呈现从服务器端120获取的网络资源,例如网页文件。
[0042] 服务器端120应客户端110的请求(例如http请求)而将所请求的网络资源返 回给客户端110。客户端110请求访问服务器端120的网络资源时,需要确定请求使用的协 议、请求的服务器、请求资源的存储路径(本发明中称之为请求路径)等信息,上述信息都 由 URL 地址提供。例如,客户端 110 的请求 URL 为 http://www. autohome· com. cn/aaa/20/ article, html,则该URL中的请求路径为/aaa/20/article. html,且该请求路径的一级目 录为/aaa〇
[0043] 在一些情况下,服务器端120需要对客户端110所请求的URL进行重定向,即将 URL中的请求路径重写为服务器端120中的其他路径(本发明中称之为应用路径),因此, 服务器端120还包括URL重定向装置200,由URL重定向装置200来执行URL的重定向。例 如,URL 重定向装置 200 将上述的 URL 重定向为 http ://www. autohome· com. cn/ccc. aspx ? id = 20,即将请求路径/aaa/20/article. html重定向到应用路径/ccc. aspx ? id = 20。 经 URL 重定向后,客户端 110 实际访问的 URL 为 http: //www. autohome· com. cn/ccc. aspx ? id = 20,客户端 110 看到 URL 的仍然是 http://www. autohome· com. cn/aaa/20/article. html,这样,就缩短了用户输入的URL地址的长度,隐藏了实际路径从而提高了网络资源的 安全性。
[0044] 图2示出了根据本发明一个实施例的URL重定向装置200的结构图。所述URL重 向装置200设置在服务器端120中,适于对客户端110所请求的URL进行重定向。
[0045] 参照图2,所述URL重定向装置200包括数据字典生成单元210、一级目录获取单 元220、字典查找单元230和重定向单元240。
[0046] 数据字典生成单元210适于根据URL重定向的配置文件生成数据字典。所生成的 数据字典包括一个或多个数据条目,每一数据条目包括目录名称和与该目录名称相关联的 重定向规则(为基于正则表达式的规则)集合,所述目录名称为配置文件的重定向规则中 请求路径的一级目录,与该目录名称相关联的重定向规则集合为配置文件中具有该一级目 录的请求路径对应的重定向规则的集合,该集合为配置文件所包括的所有重定向规则的一 个子集。也就是说,数据字典生成单元210将配置文件中的重定向规则按照请求路径的一 级目录进行归类,将一级目录相同的请求路径对应的重定向规则归为一类,并将其存储为 数据字典的一个数据条目。
[0047] 服务器端120例如网站服务器中存储有用于进行URL重定向的配置文件,所述配 置文件中包括一些重定向规则,所述重定向规则为基于正则表达式的重定向规则。该配置 文件例如可以由网站设计人员设置好后,存储到网站服务器中。
[0048] 例如,服务器端120中存储的配置文件如下:
[0049] <RcwritcrConng > <Rulcs> <RcwritcrRulc> < L ο o 1< F o r> ?/aaa/(\d+)/ </ L ο o k F o r> <ScnclTo>-/bbb.aspx? id=$ 1 </ScndTo>
[0050] </RcwritcrRulc> <RcwritcrRulc> <LookFor> ?/aaa/(\d+)/article.hlml</LookFor> <SendTo>-/ccc.aspx?id=$ !</ScndTo> </RcvvritcrRulc> <RcwritcrRule> <LookFor>?/ddd/(\d+)/article,html</Lool<For> <SendTo>-/ddcl.aspx?id=$ 1 </ScndTo> </RcwritcrRulc> <RcwritcrRulc> <LookFor> ?/(a 1 |a2|a3)/\ad j 61 /(\d+)12\.html</LookFor> <ScndTo>-/mmm/ddd.aspx?id=$2</ScndTo> </RcwrilcrRulc> </RewriterC onfi g >
[0051] 上述配置文件为xml文件,该xml文件中包括4条重定向规则(为正则表达式 规则),每条重定向规则由〈RewriterRule〉元素表达,每个〈RewriterRule〉元素包括 〈LookFor〉元素和〈SendTo〉元素,要在被请求的URL中查找的模式由〈LookFor〉元素表示, 要替换所找到的模式的字符串由〈SendTo〉元素表示。
[0052] 例如,在上述配置文件中,第一条重定向规则的〈LookFor〉元素中"?/aaa/ (\d+) /"表示要查找的模式为:URL请求路径的一级目录为/aaa/,二级目录为A\d+),其中 "\d+"表示一个或多个数字;第一条重定向规则的〈SendTo〉元素中"?/bbb. aspx ? id = $1"表示当URL请求路径与"?/aaaA\d+) /"匹配时,将该URL种的请求路径替换为应用 路径"/bbb. aspx ? id = $1",其中$1表示"?/aaa/(\d+)/"中第一个括号中正则表达式 的值。
[0053] 数据字典生成单元210可以按照如下方式来根据URL重定向的配置文件生成数据 字典:从配置文件中逐条读取重定向规则;对于读取到的每条重定向规则,将该重定向规 则的请求路径的一级目录与该重定向规则相关联的添加到数据字典中。具体地,对于读取 到的每条重定向规则,首先判断该重定向规则的请求路径的一级目录是否存在于数据字典 中(即判断数据字典中是否存在与该请求路径对应的数据条目);然后,当该一级目录不存 在于数据字典中时,将该一级目录以及该重定向规则的关联关系作为一个数据条目添加到 数据字典中;当该一级目录存在于数据字典中时,将该重定向规则添加到数据字典中与该 一级目录相关联的重定向规则集合中(即更新数据字典中与该一级目录对应的数据条目, 将该重定向规则添加到该数据条目所包括的重定向规则集合中)。
[0054] 另外,所述配置文件中的重定向规则的请求路径可能为多个一级目录构成的一级 目录集合。例如,对于上述配置文件中的最后一条重定向规则的〈LookFor〉元素中,请求路 径的第一部分Aal|a2|a3)即为3个一级目录构成的集合,分别为/al、/a2和/a3。此种 情况下,数据字典生成单元210是分别将一级目录集合中每个一级目录与该重定向规则相 关联的添加到数据字典中,即对于上述例子,在数据字典中添加3个数据条目,这三个数据 条目的目录名称分别为/al、/a2和/a3,相关联的重定向规则均为:
[0055] 〈LookFor〉?/ (al | a2 | a3)八ad {6} / (\d+) 12\· html〈/LookFor>
[0056] 〈SendTo〉?/mmm/ddd· aspx ? id = $2〈/SendTo>
[0057] 另外,所述配置文件中的重定向规则的请求路径的一级目录还可能为数字字符串 变量,例如为八\(1+),此种情况下,数据字典中数据条目的目录名称为该数字字符串变量。
[0058] 数据字典中的数据条目具体可以以键-值(key-value)对方式存储。例如,根据 上述配置文件生成的数据字典对应的key分别为:aaa、ddd、al、a2、a3, aaa对应的value 包括两条重定向规则,分别为:
[0059] <RcwriicrRulc> <LookFor>-/aaa/(\d+)/</LookFor> <ScndTo>'/bbb,aspx? id=$ 1 </SendTo> </RcwritcrRulc> <RcwrilcrRulc> <LookFor>?/aaa/(\d+)/articlc.html</Lool<For> <ScndTo>-/ccc.aspx?id=$ l</ScndTo>
[0060] </RcwritcrRulc>
[0061] ddd对应的value包括一条重定向规则,如下:
[0062] <RcwrilcrRulc> <LookFor>?/ddd/(\d+)/article.html</Loc)l<For> <ScndTo>-/ddd.aspx?id=$ 1 </ScndTo> </RcwrilcrRulc>
[0063] al、a2、a3对应的value相同,包括一条重定向规则,如下:
[0064] <RewritcrRulc> <LookFor>-/(a 1 |a2|a3)/\ad {6! /(\d+) 12\.html</LookFor> <ScndTo>-/mmm/ddd.aspx?id=$2</ScndTo> </RcwritcrRulc>
[0065] 一级目录获取单元220适于获取客户端110请求的URL,从该URL中获取请求路径 的一级目录。客户端110需要访问服务器端120中的网络资源时,发送请求(例如http请 求)到服务器端120,该请求中包括该网络资源对应的URL,一级目录获取单元220可以获 取该URL中的请求路径,并获取该请求路径中的一级目录。
[0066] 例如,客户端110请求的URL中的请求路径为/mmm/20/,则对应的一级目录为 _n ;又例如,客户端110请求的URL中的请求路径为/aaa/20/article. html,贝U对应的一 级目录为aaa。
[0067] 字典查找单元230适于根据一级目录获取单元220获取的一级目录从数据字典中 查找相关联的重定向规则集合。例如,当获取到的一级目录为mmm时,根据mmm查找数据字 典,数据字典中不存在目录名称为_的数据条目,则查找失败;又例如,当获取到的一级 目录为aaa时,根据aaa查找数据字典,数据字典中存在目录名称为aaa的数据条目,该数 据条目中与aaa关联的重定向规则集合包括两条重定向规则,如下 :
[0068] <RcwritcrRulc> < L ο 〇 k F 〇 r> ?/aaa/(\d+ )/</ L ο 〇 丨< F 〇 r> <ScndTo>-/bbb.aspx? id=$ I </ScndTo> </RcwrilcrRulc> <RcwrilcrRulc>
[0069] <LookFor> ?/aaa/(\d+)/aniclc.html</Lool<F〇i*> <ScndTo>-/ccc.aspx?id=$ 1 </ScndTo> </RcwritcrRulc>
[0070] 另外,当所获取到的一级目录为数字字符串时,则该数字字符串直接与数据字典 中的数字字符串变量匹配。
[0071] 重定向单元240适于将请求的URL中的请求路径与查找到的重定向规则集合进行 正则匹配(正则表达式匹配),并根据匹配到的重定向规则对URL进行重定向。重定向单 元240可以从查找到的重定向规则集合中逐条取出重定向规则,将该请求路径与该重定向 规则进行正则匹配;当匹配到某条重定向规则时,将该请求路径重定向到所匹配到的重定 向规则中的应用路径;当所有重定向规则均不匹配时,不对该URL进行重定向。
[0072] 当然,如果字典查找单元230根据一级目录获取单元220获取的一级目录查找数 据字典时,如果查找失败,则重定向单元240也不对该URL进行重定向。
[0073] 例如,客户端110请求的URL中的请求路径为/mmm/20/,根据一级目录mmm查找失 败,则不对该URL进行重定向。
[0074] 又例如,客户端110请求的URL中的请求路径为/aaa/20/article. html,根据一级 目录aaa查找到的上述两条重定向规则进行正则表达式匹配,结果匹配到第二条重定向规 则:
[0075] <RcwritcrRulc> <LookFor> ?/aaa/(\d+)/arliclc.hlml</LookFor> <ScndTo>-/ccc.aspx?id=$ l</ScndTo> </RcwrilcrRule>
[0076] 于是,根据该第二条重定向规则,将请求的URL中的请求路径/aaa/20/article. html重定向到应用路径/ccc. aspx ? id = 20。
[0077] 根据本发明实施例的URL重定向装置,预先将配置文件中的重定向规则按照请求 路径的一级目录进行归类,并采用数据字典进行保存,在进行URL重定向时,先通过数据字 典查找一级目录,查找到了再进行正则表达式匹配,否则不进行正则表达式匹配,避免了直 接进行正则表达式匹配失败的情况,从而提高了匹配命中的效率,进而提高了 URL重定向 的处理速度和客户端访问服务器中资源的速度。而且,进行正则表达式匹配的仅是所有重 定向规则的一个子集,进一步提高了 URL重定向的处理速度。
[0078] 例如,对于上述包括请求路径为/mmm/20/的URL,根据现有的URL重定向方案,即 使配置文件中不存在与/mmm/20/对应的重定向规则,也需要对配置文件中的所有重定向 规则依次进行正则表达式匹配处理过程,浪费了大量的服务器处理资源,并造成了客户端 访问服务器中网络资源的速度也较慢;而根据本发明实施例的URL重定向方案,在根据数 据字典查找不到与一级目录mmm对应的正则表表达式集合时,不继续进行正则表达式的匹 配,直接决定不对该URL进行重定向,显著提高了 URL重定向的处理速度。
[0079] 需要说明的是,上述的数据字典生成单元210为可选单元,即所述URL重定向装置 200中可以不包括所述数据字典生成单元210,数据字典可以预先配置好后输入到服务器 端120,由URL重定向装置200使用。
[0080] 图3示出了根据本发明一个实施例的URL重定向方法的流程图,该URL重定向方 法由服务器端执行。
[0081] 参照图3,该URL重定向方法始于步骤S302。在步骤S302中,根据URL重定向的 配置文件生成数据字典。所生成的数据字典包括一个或多个数据条目,每一数据条目包括 目录名称和与该目录名称相关联的重定向规则(为基于正则表达式的规则)集合,所述目 录名称为配置文件的重定向规则中请求路径的一级目录,与该目录名称相关联的重定向规 则集合为配置文件中具有该一级目录的请求路径对应的重定向规则的集合,该集合为配置 文件所包括的所有重定向规则的一个子集。也就是说,是将配置文件中的重定向规则按照 请求路径的一级目录进行归类,将一级目录相同的请求路径对应的重定向规则归为一类, 并将其存储为数据字典的一个数据条目。
[0082] 在步骤S302中,可以按照如下方式来根据URL重定向的配置文件生成数据字典: 从配置文件中逐条读取重定向规则;对于读取到的每条重定向规则,将该重定向规则的请 求路径的一级目录与该重定向规则相关联的添加到数据字典中。具体地,对于读取到的每 条重定向规则,首先判断该重定向规则的请求路径的一级目录是否存在于数据字典中(即 判断数据字典中是否存在与该请求路径对应的数据条目);然后,当该一级目录不存在于 数据字典中时,将该一级目录以及该重定向规则的关联关系作为一个数据条目添加到数据 字典中;当该一级目录存在于数据字典中时,将该重定向规则添加到数据字典中与该一级 目录相关联的重定向规则集合中(即更新数据字典中与该一级目录对应的数据条目,将该 重定向规则添加到该数据条目所包括的重定向规则集合中)。
[0083] 另外,所述配置文件中的重定向规则的请求路径可能为多个一级目录构成的一级 目录集合。此种情况下,是分别将一级目录集合中每个一级目录与该重定向规则相关联的 添加到数据字典中。另外,所述配置文件中的重定向规则的请求路径的一级目录还可能为 数字变量变量,例如为A\d+),此种情况下,数据字典中数据条目的目录名称为该数字变量 变量。其中,数据字典中的数据条目具体可以以键-值(key-value)对方式存储。
[0084] 需要说明的是,步骤S302中所执行的处理与数据字典生成单元210所执行的处理 相同,具体可参照上文对数据字典生成单元210的描述,这里不做赘述。
[0085] 通过步骤S302预先生成了数据字典之后,方法进入步骤S304。在步骤S304中,获 取客户端请求的URL,从该URL中获取请求路径的一级目录。需要说明的是,步骤S304中所 执行的处理与一级目录获取单元220所执行的处理相同,具体可参照上文对一级目录获取 单元220的描述,这里不做赘述。
[0086] 在获取到请求路径的一级目录之后,方法进入步骤S306。在步骤S306中,根据获 取的一级目录从数据字典中查找相关联的重定向规则集合。
[0087] 需要说明的是,步骤S306中所执行的处理与字典查找单元230所执行的处理相 同,具体可参照上文对字典查找单元230的描述,这里不做赘述。
[0088] 在查找到相关联的重定向规则集合之后,方法进入步骤S308。在步骤S308中,将 请求的URL中的请求路径与查找到的重定向规则集合进行正则匹配,并根据匹配到的重定 向规则对URL进行重定向。可以从查找到的重定向规则集合中逐条取出重定向规则,将该 请求路径与该重定向规则进行正则匹配;当匹配到某条重定向规则时,将该请求路径重定 向到所匹配到的重定向规则中的应用路径;当所有重定向规则均不匹配时,不对该URL进 行重定向。当然,如果在步骤S304中查找失败时,则在步骤S306中也不对该URL进行重定 向。
[0089] 需要说明的是,步骤S308中所执行的处理与重定向单元240所执行的处理相同, 具体可参照上文对重定向单元240的描述,这里不做赘述。
[0090] 根据本发明实施例的URL重定向方法,预先将配置文件中的重定向规则按照请求 路径的一级目录进行归类,并采用数据字典进行保存,在进行URL重定向时,先通过数据字 典查找一级目录,查找到了再进行正则表达式匹配,否则不进行正则表达式匹配,避免了直 接进行正则表达式匹配失败的情况,从而提高了匹配命中的效率,进而提高了 URL重定向 的处理速度和客户端访问服务器中资源的速度。而且,进行正则表达式匹配的仅是所有重 定向规则的一个子集,进一步提高了 URL重定向的处理速度。
[0091] 需要说明的是,上述的步骤S302为可选步骤,即所述URL重定向方法可以不包括 所述步骤S302,数据字典可以预先配置好后输入到服务器端中,由所述URL重定向方法使 用。
[0092] 根据本发明实施例的URL重定向方法及装置,为便于代码的实现,在进行网站设 计时,可以将该网站对应的用于URL重定向的配置文件中的一级目录限定为:
[0093] 1、数字字符串变量:例如为(\d+)。
[0094] 2、字符串常量(一般由数字和字母构成):
[0095] (1)集合
[0096] 文件集合:以 "· " 为文件特征,例如,(news_site. xml | bbs_site. xml) (news. xml)。
[0097] 目录集合:例如,(photo I newbran)、(audi)。
[0098] (2)非集合(单个)
[0099] 单个文件:以"为文件特征,例如,a.html,a. Xml。
[0100] 单个目录:例如,chezhan,ExpertBlog。
[0101] 在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。 各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求 的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种 编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发 明的最佳实施方式。
[0102] 在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施 例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构 和技术,以便不模糊对本说明书的理解。
[0103] 类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在 上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施 例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保 护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面 的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此, 遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】,其中每个权利要求本身 都作为本发明的单独实施例。
[0104] 本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地 改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单 元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或 子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任 何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开 的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴 随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代 特征来代替。
[0105] 此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例 中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的 范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任 意之一都可以以任意的组合方式来使用。
[0106] 本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行 的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用 微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的URL重定向装置中的一些 或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一 部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本 发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样 的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0107] 应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领 域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中, 不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词"包含"不排除存在 未列在权利要求中的元件或步骤。位于元件之前的单词"一"或"一个"不排除存在多个这 样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来 实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件 项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为 名称。
【权利要求】
1. 一种URL重定向方法,包括: 获取客户端请求的URL,从该URL中获取请求路径的一级目录; 根据获取的一级目录从数据字典中查找与该一级目录相关联的重定向规则集合,所述 数据字典包括一个或者多个数据条目,每一数据条目包括目录名称和相关联的重定向规则 集合;以及 将请求的URL中的请求路径与查找到的重定向规则集合进行正则匹配,并根据匹配到 的重定向规则对URL进行重定向。
2. 如权利要求1所述的URL重定向方法,还包括步骤: 根据URL重定向的配置文件生成所述数据字典,包括: 从配置文件中逐条读取重定向规则; 对于读取到的每条重定向规则,将该重定向规则的请求路径的一级目录与该重定向规 则相关联的添加到数据字典中。
3. 如权利要求2所述的URL重定向方法,其中,所述将该重定向规则的请求路径的一级 目录与该重定向规则相关联的添加到数据字典中,包括: 判断请求路径的一级目录是否存在于数据字典中; 当该一级目录不存在于数据字典中时,将该一级目录以及该重定向规则作为一个数据 条目添加到数据字典中; 当该一级目录存在于数据字典中时,将该重定向规则添加到数据字典中与该一级目录 相关联的重定向规则集合中。
4. 如权利要求3所述的URL重定向方法,其中,当配置文件的重定向规则的请求路径为 多个一级目录构成的一级目录集合时,所述将该重定向规则的请求路径的一级目录与该重 定向规则相关联的添加到数据字典中为,分别将一级目录集合中每个一级目录与该重定向 规则相关联的添加到数据字典中。
5. 如权利要求1所述的URL重定向方法,其中,所述将请求的URL中的请求路径与查找 到的重定向规则集合进行正则匹配,并根据匹配到的重定向规则对URL进行重定向,包括 : 从查找到的重定向规则集合中逐条取出重定向规则,将该请求路径与该重定向规则进 行正则匹配; 当匹配到某条重定向规则时,将该请求路径重定向到重定向规则中的应用路径; 当所有重定向规则均不匹配时,不对该URL进行重定向。
6. -种URL重定向装置,包括: 一级目录获取单元,适于获取客户端请求的URL,从该URL中获取请求路径的一级目 录; 字典查找单元,适于根据获取的一级目录从数据字典中查找与该一级目录相关联的重 定向规则集合,所述数据字典包括一个或者多个数据条目,每一数据条目包括目录名称和 相关联的重定向规则集合;以及 重定向单元,适于将请求的URL中的请求路径与查找到的重定向规则集合进行正则匹 配,并根据匹配到的重定向规则对URL进行重定向。
7. 如权利要求6所述的URL重定向装置,其中,还包括数据字典生成单元,适于: 从配置文件中逐条读取重定向规则; 对于读取到的每条重定向规则,将该重定向规则的请求路径的一级目录与该重定向规 则相关联的添加到数据字典中。
8. 如权利要求7所述的URL重定向装置,其中,所述数据字典生成单元进一步适于: 判断请求路径的一级目录是否存在于数据字典中; 当该一级目录不存在于数据字典中时,将该一级目录以及该重定向规则作为一个数据 条目添加到数据字典中; 当该一级目录存在于数据字典中时,将该重定向规则添加到数据字典中与该一级目录 相关联的重定向规则集合中。
9. 如权利要求8所述的URL重定向装置,其中,当配置文件的重定向规则的请求路径为 多个一级目录构成的一级目录集合时,所述数据字典生成单元分别将一级目录集合中每个 一级目录与该重定向规则相关联的添加到数据字典中。
10. -种URL重定向系统,包括多个客户端、为这些客户端提供各种网络资源的服务器 端,客户端和服务器端经由互联网络而相互通信,其中,所述服务器端包括如权利要求6至 9中任一项所述的URL重定向装置。
【文档编号】H04L29/08GK104065736SQ201410314533
【公开日】2014年9月24日 申请日期:2014年7月3日 优先权日:2014年7月3日
【发明者】廖青松 申请人:车智互联(北京)科技有限公司