一种个性化网页排版的方法及装置的制造方法_2

文档序号：9911016阅读：来源：国知局

：
[0054] 第三分析子模块，用于获取所述用户实时浏览主题内容的实时行为特征；
[0055] 第四分析子模块，用于根据所述实时行为特征和所述主题内容间的相似度值，获取所述主题内容的实时排版权重值，其中，所述主题内容的实时排版权重值与所述主题内容间的相似度值成正比。
[0056] 本发明的上述技术方案至少具有如下有益效果：
[0057] 本发明实施例的个性化网页排版的方法及装置中，通过挖掘用户浏览网页的行为特征，分析得出用户感兴趣的网页主题和内容，以主题划分自动完成页面排版及内容更新；本发明实施例根据用户的使用习惯自动完成页面的排版，整个过程不需要用户参与，而是在使用中动态变化网页框架和内容来适应用户的行为变化，实现了网页排版智能化、个性化。
【附图说明】
[0058] 图1表示本发明实施例的个性化网页排版的方法的基本步骤示意图；
[0059] 图2表示本发明实施例的个性化网页排版的方法应用的客户端和服务器端构成的系统图；
[0060] 图3表示本发明实施例的个性化网页排版的方法中分析用户感兴趣主题及网页内容的具体步骤示意图；
[0061] 图4表示本发明实施例的个性化网页排版的方法中主题内容的内容特征的具体获取方法示意图；
[0062] 图5表示本发明实施例的个性化网页排版的方法中主题内容的实时排版权重值的获取方法示意图；
[0063] 图6表示本发明实施例的个性化网页排版的装置的结构示意图；
[0064] 图7表示本发明实施例的个性化网页排版的具体流程示意图。
【具体实施方式】
[0065] 为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。
[0066] 本发明针对现有技术中网页排版方法未涉及网页版面及内容的整体构建方法且现有网页排版需要用户设置，达不到智能性的问题，提供一种个性化网页排版的方法及装置中，通过挖掘用户浏览网页的行为特征，分析得出用户感兴趣的网页主题和内容，以主题划分自动完成页面排版及内容更新；本发明实施例根据用户的使用习惯自动完成页面的排版，整个过程不需要用户参与，而是在使用中动态变化网页框架和内容来适应用户的行为变化，实现了网页排版智能化、个性化。
[0067] 如图1所示，本发明实施例提供一种个性化网页排版的方法，应用于服务器侧，包括：
[0068] 步骤11，获取网页的源内容信息，对所述源内容信息进行主题分类处理，得到多个主题板块；
[0069] 本发明实施例中，网页的源内容信息可通过人工编辑获得，也可通过服务器自动挖掘得到，不限于一固定形式；该源内容信息是所有可能在综合信息网页展示的相关内容，通过对源内容信息进行分析，为网页主题板块及时提供相应显示信息。在服务器端进行网页内容的存储分析，为排版提前准备好内容数据，提升了整个系统的计算效率。
[0070] 步骤12,获取客户端发送的用户浏览网页的行为特征，分析得出所述用户感兴趣的网页主题和所述用户感兴趣的网页内容；
[0071] 本发明上述实施例中，如图2所示，客户端部分包含一用户行为数据采集模块，该用户行为数据采集模块记录下用户浏览网页的行为，供服务器端进行用户行为特征分析。引入服务器端的用户行为特征分析，不仅满足了排版的个性化要求，获取到不同用户的独特行为数据，还让用户长期行为特征挖掘成为现实，减轻了客户端对用户行为数据存储和计算的压力。使用用户长期页面浏览数据确定用户对网页主题板块的偏好，帮助页面框架按用户习惯重构版面。
[0072] 步骤13，根据得到的所述用户感兴趣的网页主题设置每个所述主题板块的排版权重值，并根据得到的所述用户感兴趣的网页内容设置所述主题板块内每个主题内容的排版权重值；
[0073] 本发明的上述实施例中，主题板块的排版权重的赋值思路就是使用得越多表明用户对相应的板块越感兴趣，则该主题板块的排版权重值也就越大；对主题内容的排版权值的赋值思路与上述思路一致，即用户越感兴趣，则排版权重值越大。
[0074] 步骤14,根据所述主题板块的排版权重值和所述主题板块内每个主题内容的排版权重值自动进行网页页面的排版，并将排版得到的网页页面发送至所述客户端。
[0075] 本发明的上述实施例中，网页页面的排版需遵照排版权重值越大，其显示页面越大或其显示位置越靠近页面上部，使得用户能够十分方便的获取到其感兴趣的内容。服务器端将排版得到的网页页面发送至客户端，如图2所示，客户端还包含一显示模块，用于将个性化排版结果呈现给用户，使得用户得到适合自己阅览喜好的排版结果。
[0076] 本发明实施例通过划分主题板块，根据用户的感兴趣程度对所述主题板块进行排版实现了网页框架的灵活布局，不仅有利于针对不同用户进行主题板块的拆分、重组和管理，还遵循了用户熟悉的排版形式，保障了用户使用体验。同时本发明实施例借助服务器端的分析数据，将特征数据的收集挖掘与排版处理分离，从而在增加特征和改进排版方法的同时，不影响客户端系统的性能和效率，使得系统的可扩展性、通用性增强。
[0077] 本发明上述实施例中，所述方法还包括：
[0078] 步骤15,获取所述用户实时浏览所述主题内容的实时行为特征和所述主题内容的内容特征，分析得到所述主题内容的实时排版权重值；
[0079] 步骤16,根据所述主题内容的实时排版权重值，自动进行所述主题板块内所述主题内容的实时更新排版。
[0080] 本发明具体实施例中，服务器端根据用户每次点击内容调整主题板块内的主题内容信息。用户点击查看主题内容表明关注相应内容，对相关内容感兴趣的概率较大，应该将相似内容的排版优先级提高，达到适应用户喜好的目的。具体的，在用户点击查看主题内容后，对相关内容的排版权重值进行更新，再根据新的排版权重值对主题内容排版即可。
[0081] 较佳的，根据用户的实时行为特征和所述主题内容的内容特征，自动调整主题板块内主题内容的推出顺序，让用户准确有效的获得更多感兴趣的内容。
[0082] 本发明上述实施例中，步骤11包括：
[0083] 步骤111，获取网页的源内容信息，所述源内容信息采用文档格式显示；
[0084] 步骤112,对所述文档格式的源内容信息采用文档分类的方法进行主题分类处理，得到多个主题板块。
[0085] 本发明具体实施例中，为了便于版面管理、排版，将网页页面划分为不同主题板块，可对主题板块进行增减操作，但总的来说，排版前已有确定的板块信息。由于板块数量、主题的相对固定，可采用文档分类的方法将源内容信息准确推送到相应主题板块下。对内容进行主题分类不仅减少人工参与编辑的工作量，还提高了板块获取相应内容的效率。目前基于机器学习的文本自动分类已经取得很好的效果，常见的分类方法有：κ-近邻算法、朴素贝叶斯分类算法、决策树算法、支持向量机等。
[0086] 在进行文档分类之前首先需要将网页内容的标题和正文进行分词处理，然后通过去停用词去除无意义词语，达到降维目的抽取出网页的文档特征，最后使用向量空间模型 (VSM)表示文本。每篇文档的标题和正文被分别表示为特征权重向量：: ω1; t2: ω2，… ，tn: ωη}，其中％表示特征项h的权重。权重计算公式采用统计方法TF-IDF，文档i中特征项j的权重为：
[0087]
[0088] 其中，匕表示文档i中特征项j的频次，匕表示文档i中的特征总频次，D表示页面内容处理周期内的文档总数，而Dj则表示特征项j出现过的文档数，页面内容处理周期视处理量及需求而定。接下来，对文本进行分类，为每个主题板块提供准确的内容支撑。
[0089] 文档分类需要训练数据进行学习，以往的页面分类信息可以作为训练集，或对内容逐步标注迭代完善训练数据。以K-近邻算法为例，计算已知类别数据中每篇文档与带分类文档的距离，选取与待分类文档距离最小的K个点，统计前K个点中每个类别的样本出现的频率，返回前K个点出现频率最高的类别作为待分类文档的预测分类。其中，文档间距离计算可以使用余弦相似度、修正余弦相似度或皮尔森相似度。内容分类结果信息为：I_con ={内容ID，板块ID，内容创建时间，…}。
[0090] 本发明的上述实施例中，如图2所示，步骤12包括：
[0091] 步骤121，获取客户端发送的预设周期内用户浏览网页的行为特征，生成用户网页使用日志，所述用户网页使用日志包括：用于标识用户身份的编码、所述用户查看的内容所属的主题板块的编码和所述用户查看的内容的网页的编码：
[0092] 步骤122,对所述用户的网页使用日志进行统计分析，得到所述用户感兴趣的网页主题和所述用户感兴趣的网页内容。
[0093] 本发明具体实施例中，用户网页使用日志主要记录了用户点击查看页面内容的相关信息，每次浏览操作服务器端都会记录下相应的日志信息，其内容包括C= {用户ID，板块ID，内容ID，操作时间，…}。其中，用户ID是唯一标识用户身份的编码；板块ID是用户查看内容所

完整全部详细技术资料下载

当前第2页1 2 3 4