一种个性化网页排版的方法及装置的制造方法_3

文档序号:9911016阅读:来源:国知局
属板块的编码,每个排版页面维护一张板块ID映射表,板块增删变化时,以表 中板块信息为主进行相关分析;内容ID对应着用户点击查看内容的编码,方便定位网页分 析结果。
[0094] 根据用户长期使用行为总结页面浏览习惯;从用户的长期使用行为中可总结出用 户浏览网页内容的偏好,在预设周期TUSCT内,对用户点击查看内容所属板块情况进行统计 分析,得到页面板块的排版权重,权重大小代表用户对板块内容感兴趣程度。周期T USCT应为 10天、1个月等较长时间段,短时间内用户行为随机性强变化大,而长期行为具有一定的偏 好分布特征。用户长期行为特征分析不仅让板块排版符合每个用户的关注焦点,还保证用 户的网页结构框架不会频繁变动。
[0095] 页面板块在周期TUSCT内使用情况统计:针对每位用户,统计给出该用户对页面每 个板块在周期内的使用情况数据,包括内容CUSCT= {用户ID,板块ID,使用总次数,···}; 针对所有用户,综合得出页面内容周期内用户总体使用情况,包括内容C_tlcm = {内容ID, 板块ID,使用总人数,使用总次数,…}。综合分析每个周期内的板块使用情况,首先必须 满足用户的浏览习惯,使用个人数据排序板块重要程度,针对用户使用极少或使用情况相 同的板块,使用总体使用情况补充缺失信息。总的来说,主题板块权重的赋值思路就是使用 得越多表明用户对相应板块越感兴趣权重也就越大。
[0096] 综上,本发明的具体实施例中,用户点击查看页面内容的操作信息提交到服务器 端,形成长期的用户行为特征集(用户网页使用日志);从用户网页使用日志中挖掘出用 户对页面各主题板块的偏好程度,为页面板块赋权值来决定构建顺序;这不仅让排版样式、 内容易于管理,也完全遵循了用户的使用习惯,个性化排版不突兀片面,保障了用户感观体 验。
[0097] 本发明上述实施例中,如图3所示,所述获取所述主题内容的内容特征,包括:
[0098] 步骤31,对不同的所述主题内容的源内容信息进行相似度分析,得到主题内容间 的相似度值;
[0099] 步骤32,根据所述主题内容间的相似度值,确定所述主题内容的内容特征。
[0100] 具体的,步骤31包括:
[0101] 步骤311,对不同的所述主题内容的源内容信息进行预处理,确定所述主题内容之 间的距离;
[0102] 步骤312,根据所述主题内容之间的距离,得到所述主题内容间的相似度值。
[0103] 本发明具体应用中,所述主题内容的内容特征具体指所述主题内容间的相似度 值,计算主题内容间的相似度,可帮助用户挖掘感兴趣的相关内容,通过分析用户点击查看 网页内容,为用户准确提供关注的相关信息。相关内容挖掘不仅丰富了用户内容排版的个 性化信息,同时也提高了个性化排版效率,及时反应用户查看内容变化。由于主题分类中也 用到文档间距离,只用计算一次便完成内容分析两方面需求,减少了计算的复杂程度。
[0104] 使用余弦相似度公式计算主题内容相似度,其中?:和?为上文中对网页内容处理 后得到的文本特征向量:
[0105]
[0106] 分别对文档的标题和正文计算文本向量的余弦值,加权得到最终的文本相似度, 其中α+β = i,可根据标题和正文的重要程度调节相应权重。公式如下:
[0107]
[0108] 设文档间相似度阈值为σ sin,从而筛选出每个文档的相似文档信息,Isini = {{内 容皿,相似度σ 1},{内容ID2,相似度σ 2},…}。
[0109] 本发明的上述实施例中,如图4所示,步骤15包括:
[0110] 步骤151,获取所述用户实时浏览主题内容的实时行为特征;
[0111] 步骤152,根据所述实时行为特征和所述主题内容间的相似度值,获取所述主题内 容的实时排版权重值,其中,所述主题内容的实时排版权重值与所述主题内容间的相似度 值成正比。
[0112] 本发明的具体应用中,通常使用页面内容创建时间来排版各主题板块内的主题内 容,优先推出最新资讯,为了反映用户个性化浏览需求,针对用户每次点击浏览行为,借助 页面内容分析中的内容相似度更新相关内容排版权重,实现快速调整内容排版顺序。例如, 用户在点击查看内容Α后,对相关内容Β的排版权重进行调整,设内容Α和内容Β的相似度 为σ,贝IJ用户对内容B感兴趣的概率也为σ,内容A的排版权重为P A,内容B的排版权重为 PB,相应增加 B内容的权重为ΡΒ+σ ·ρΑ。发生点击查看行为后更新所有相关内容的排版 权重,缺少用户操作相关内容信息的内容,可使用用户总体使用信息来补充内容排版顺序, 为用户优先提供近期的热门信息。
[0113] 综上,服务器侧将结合网页内容分析和用户行为分析结果对每位用户进行自适应 用户行为的页面内容排版,为个性化排版提供语义层次的文本分析支撑,排版处理模块则 按照一定的策略使用这些结果数据,得到最终的个性化排版结果,并将结果返回客户端,通 过显示模块将符合不同用户喜好的页面结果呈现给用户。
[0114] 用户长期的网页点击查看行为数据是进行页面架构组织的主要参数,通过计算得 到用户对页面各板块的喜好权重,主题板块的排版顺序主要由这部分数据决定。根据板块 信息对用户的重要程度,把用户感兴趣的板块放到用户方便查看的地方,便于用户浏览所 需信息。挖掘得到的网页内容特征为排版提供相应主题板块及用户感兴趣的内容信息,从 语义层面调整页面内容排版,使版面更加符合用户使用行为。页面内容更新按创建时间优 先推出最新资讯,通过主题查看行为和点击相关内容调整推出顺序,让用户准确有效的获 得更多感兴趣的内容。
[0115] 为了更好的实现上述目的,如图5所示,本发明实施例还提供一种个性化网页排 版的装置,应用于服务器侧,包括:
[0116] 分类模块51,用于获取网页的源内容信息,对所述源内容信息进行主题分类处理, 得到多个主题板块;
[0117] 第一分析模块52,用于获取客户端发送的用户浏览网页的行为特征,分析得出所 述用户感兴趣的网页主题和所述用户感兴趣的网页内容;
[0118] 设置模块53,用于根据得到的所述用户感兴趣的网页主题设置每个所述主题板块 的排版权重值,并根据得到的所述用户感兴趣的网页内容设置所述主题板块内每个主题内 容的排版权重值;
[0119] 排版模块54,用于根据所述主题板块的排版权重值和所述主题板块内每个主题内 容的排版权重值自动进行网页页面的排版,并将排版得到的网页页面发送至所述客户端。
[0120] 本发明上述实施例中,所述装置还包括:
[0121] 第二分析模块,用于获取所述用户实时浏览所述主题内容的实时行为特征和所述 主题内容的内容特征,分析得到所述主题内容的实时排版权重值;
[0122] 更新模块,用于根据所述主题内容的实时排版权重值,自动进行所述主题板块内 所述主题内容的实时更新排版。
[0123] 具体的,本发明上述实施例中,所述分类模块51包括:
[0124] 第一分类子模块,用于获取网页的源内容信息,所述源内容信息采用文档格式显 示;
[0125] 第二分类子模块,用于对所述文档格式的源内容信息采用文档分类的方法进行主 题分类处理,得到多个主题板块。
[0126] 具体的,本发明上述实施例中,所述第一分析模块52包括:
[0127] 第一分析子模块,用于获取客户端发送的预设周期内用户浏览网页的行为特征, 生成用户网页使用日志,所述用户网页使用日志包括用于标识用户身份的编码、所述用户 查看的内容所属的主题板块的编码和所述用户查看的内容的网页的编码:
[0128] 第二分析子模块,用于对所述用户的网页使用日志进行统计分析,得到所述用户 感兴趣的网页主题和所述用户感兴趣的网页内容。
[0129] 具体的,本发明上述实施例中,所述第二分析模块包括:
[0130] 相似模块,用于对不同的所述主题内容的源内容信息进行相似度分析,得到主题 内容间的相似度值;
[0131] 确定模块,用于根据所述主题内容间的相似度值,确定所述主题内容的内容特征。
[0132] 具体的,本发明上述实施例中,所述相似模块包括:
[0133] 处理模块,用于对不同的所述主题内容的源内容信息进行预处理,确定所述主题 内容之间的距离;
[0134] 相似子模块,用于根据所述主题内容之间的距离,得到所述主题内容间的相似度 值。
[0135] 具体的,本发明上述实施例中,所述第二分析模块包括:
[0136] 第三分析子模块,用于获取所述用户实时浏览主题内容的实时行为特征;
[0137] 第四分析子模块,用于根据所述实时行为特征和所述主题内容间的相似度值,获 取所述主题内容的实时排版权重值,其中,所述主题内容的实时排版权重值与所述主题内 容间的相似度值成正比。
[0138] 本发明上述实施例中,服务器侧的装置将页面整体框架结构细分为通用模块和多 个内容主题板块,通用模块确定了页面主体样式布局,各内容主题板块更加细致地管理维 护了板块排版形式和内容展现,板块间则可灵活拆分重组,
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1