一种个性化网页排版的方法及装置的制造方法
【技术领域】
[0001] 本发明涉及互联网信息技术处理领域,特别涉及一种个性化网页排版的方法及装 置。
【背景技术】
[0002] 随着互联网技术的不断发展,人们对智能化及个性化服务的需求愈加强烈,如何 改进用户体验为用户提供更好的服务已经成为互联网领域每个产品都需要解决的关键问 题。移动智能终端关注焦点突出、个体标识强烈、具有先天的个性化优势;传统网页大而全 的信息展示方式,往往让用户无法准确获取所需信息,极大地降低用户使用效率。在以用户 为中心的涉及理念深入人心的互联网时代,传统网页排版也急需跟上个性化智能服务的步 伐,为不同用户提供适合用户使用习惯的网页排版及内容。
[0003] 现有个性化网页排版大都只是简单的页面形式组合,用户可根据个人喜好对网页 的位置、大小、颜色等页面属性而进行设置,从而达到表达个性特征的需求;用户可对系统 页面中独立划分的模块进行拖拽重组,从而方便用户使用相关功能。归结起来,这些排版方 式都需要用户人工参与进行设置或操作,只是基于网页布局形式的不同展现,没有涉及内 容语义等更深层次的理解。另外一种常见的个性化页面排版,是针对页面预留的小部分固 定元素进行个性化显示,有针对性地进行内容投放,如最常见的页面广告位展示。这种方法 进一步分析了用户特性,达到了对不同用户的智能信息推荐,然而对于网页核心内容的排 版技术却始终没有突破性创新。针对门户网站首页、新闻首页等综合信息页面,信息量巨大 又不易于查看,用户对网页个性化排版的需求更加强烈。
[0004] 大数据分析和分布式计算的普及,使得针对用户行为特征数据的分析更 加精准细致,为每个用户提供个性化服务成为应用趋势。模型-视图-控制器 MVC(model-view-controller)编程模式的广泛使用,使得WEB服务构建时业务逻辑、数据 和界面显示分离,网页内容和展现形式的分开管理维护,让面向不同用户进行独立的网页 内容组织变得更加容易。而互联网前端科技的成熟,使得网页排版细化丰富,版面更加精致 可控,从而可实现页面模块的多层拆分和重组。页面个性化排版已经成为改进人机交互、提 升用户体验的重要组成部分,计算机网络、数据挖掘、视觉设计等多个技术领域的发展都为 其奠定了基础。
[0005] 现有网页个性化排版方法的缺点:
[0006] 1)现有网页个性化排版方法多注重界面展示形式的细枝末节,只是简单对网页的 位置、大小、颜色等页面表面属性进行自定义,而对网页版面及内容的整体构建方法上几乎 没有涉及。
[0007] 2)现有网页个性化排版方法无一例外都需要人工手动设置,或进行版面重构的拖 拽操作,没有做到无需用户感知参与过程便实现自适应网页排版,智能性远远达不到人们 的需求。
[0008] 3)现有网页个性化排版方法中还对网页的部分固定元素进行了有针对性的内容 推送,然而对于网页核心内容的整体架构却始终没有突破性创新,无法达到提升用户使用 体验的目的。
【发明内容】
[0009] 本发明的目的在于提供一种个性化网页排版的方法及装置,为不同用户准确有效 的传递所需页面信息,使用中动态变化网页框架和内容来适应用户行为变化,真正做到了 网页排版智能化和个性化。
[0010] 为了达到上述目的,本发明实施例提供一种个性化网页排版的方法,应用于服务 器侧,包括:
[0011] 获取网页的源内容信息,对所述源内容信息进行主题分类处理,得到多个主题板 块;
[0012] 获取客户端发送的用户浏览网页的行为特征,分析得出所述用户感兴趣的网页主 题和所述用户感兴趣的网页内容;
[0013] 根据得到的所述用户感兴趣的网页主题设置每个所述主题板块的排版权重值, 并根据得到的所述用户感兴趣的网页内容设置所述主题板块内每个主题内容的排版权重 值;
[0014] 根据所述主题板块的排版权重值和所述主题板块内每个主题内容的排版权重值 自动进行网页页面的排版,并将排版得到的网页页面发送至所述客户端。
[0015] 其中,所述方法还包括:
[0016] 获取所述用户实时浏览所述主题内容的实时行为特征和所述主题内容的内容特 征,分析得到所述主题内容的实时排版权重值;
[0017] 根据所述主题内容的实时排版权重值,自动进行所述主题板块内所述主题内容的 实时更新排版。
[0018] 其中,所述获取网页的源内容信息,对所述源内容信息进行主题分类处理,得到多 个主题板块,包括:
[0019] 获取网页的源内容信息,所述源内容信息采用文档格式显示;
[0020] 对所述文档格式的源内容信息采用文档分类的方法进行主题分类处理,得到多个 主题板块。
[0021] 其中,所述获取客户端发送的用户浏览网页的行为特征,分析得出所述用户感兴 趣的网页主题和所述用户感兴趣的网页内容,包括:
[0022] 获取客户端发送的预设周期内用户浏览网页的行为特征,生成用户网页使用日 志,所述用户网页使用日志包括:用于标识用户身份的编码、所述用户查看的内容所属的主 题板块的编码和所述用户查看的内容的网页的编码:
[0023] 对所述用户的网页使用日志进行统计分析,得到所述用户感兴趣的网页主题和所 述用户感兴趣的网页内容。
[0024] 其中,所述获取所述主题内容的内容特征,包括:
[0025] 对不同的所述主题内容的源内容信息进行相似度分析,得到主题内容间的相似度 值;
[0026] 根据所述主题内容间的相似度值,确定所述主题内容的内容特征。
[0027] 其中,所述对不同的所述主题内容的源内容信息进行相似度分析,得到网页内容 间的相似度值,包括:
[0028] 对不同的所述主题内容的源内容信息进行预处理,确定所述主题内容之间的距 离;
[0029] 根据所述主题内容之间的距离,得到所述主题内容间的相似度值。
[0030] 其中,所述获取所述用户实时浏览所述主题内容的实时行为特征和所述主题内容 的内容特征,分析得到所述主题内容的实时排版权重值,包括:
[0031] 获取所述用户实时浏览主题内容的实时行为特征;
[0032] 根据所述实时行为特征和所述主题内容间的相似度值,获取所述主题内容的实时 排版权重值,其中,所述主题内容的实时排版权重值与所述主题内容间的相似度值成正比。
[0033] 本发明实施例还提供一种个性化网页排版的装置,应用于服务器侧,包括:
[0034] 分类模块,用于获取网页的源内容信息,对所述源内容信息进行主题分类处理,得 到多个主题板块;
[0035] 第一分析模块,用于获取客户端发送的用户浏览网页的行为特征,分析得出所述 用户感兴趣的网页主题和所述用户感兴趣的网页内容;
[0036] 设置模块,用于根据得到的所述用户感兴趣的网页主题设置每个所述主题板块的 排版权重值,并根据得到的所述用户感兴趣的网页内容设置所述主题板块内每个主题内容 的排版权重值;
[0037] 排版模块,用于根据所述主题板块的排版权重值和所述主题板块内每个主题内容 的排版权重值自动进行网页页面的排版,并将排版得到的网页页面发送至所述客户端。
[0038] 其中,所述装置还包括:
[0039] 第二分析模块,用于获取所述用户实时浏览所述主题内容的实时行为特征和所述 主题内容的内容特征,分析得到所述主题内容的实时排版权重值;
[0040] 更新模块,用于根据所述主题内容的实时排版权重值,自动进行所述主题板块内 所述主题内容的实时更新排版。
[0041] 其中,所述分类模块包括:
[0042] 第一分类子模块,用于获取网页的源内容信息,所述源内容信息采用文档格式显 示;
[0043] 第二分类子模块,用于对所述文档格式的源内容信息采用文档分类的方法进行主 题分类处理,得到多个主题板块。
[0044] 其中,所述第一分析模块包括:
[0045] 第一分析子模块,用于获取客户端发送的预设周期内用户浏览网页的行为特征, 生成用户网页使用日志,所述用户网页使用日志包括用于标识用户身份的编码、所述用户 查看的内容所属的主题板块的编码和所述用户查看的内容的网页的编码:
[0046] 第二分析子模块,用于对所述用户的网页使用日志进行统计分析,得到所述用户 感兴趣的网页主题和所述用户感兴趣的网页内容。
[0047] 其中,所述第二分析模块包括:
[0048] 相似模块,用于对不同的所述主题内容的源内容信息进行相似度分析,得到主题 内容间的相似度值;
[0049] 确定模块,用于根据所述主题内容间的相似度值,确定所述主题内容的内容特征。
[0050] 其中,所述相似模块包括:
[0051] 处理模块,用于对不同的所述主题内容的源内容信息进行预处理,确定所述主题 内容之间的距离;
[0052] 相似子模块,用于根据所述主题内容之间的距离,得到所述主题内容间的相似度 值。
[0053] 其中,所述第二分析模块包括