一种视频推荐方法及系统的利记博彩app
【专利摘要】本发明公开了一种视频推荐方法及系统,方法包括:服务器获取各个视频的视频信息,利用聚类算法将视频分成不同的类别,计算各个视频在对应类别中的类别权重并存储;智能电视采集用户行为数据后上传至服务器,服务器根据用户行为数据计算出用户偏好数据,根据用户偏好数据计算出用户未观看过的视频节目的初步推荐结果;服务器根据类别权重及用户偏好数据计算各个视频在各个时间段的属性和权值,将视频在各个时间段的属性和权值与初步推荐结果结合后生成最终推荐结果,并将最终推荐结果发送至智能电视进行显示。本发明可评估用户对已经看过的视频的兴趣度,并根据时间段推荐相关视频,尽量满足家庭成员的观看需求,降低了用户的时间成本。
【专利说明】
一种视频推荐方法及系统
技术领域
[0001 ]本发明涉及智能电视技术领域,尤其涉及一种视频推荐方法及系统。
【背景技术】
[0002] 随着三网融合的发展,智能电视成为"智能与视频"融合和变革的代表产品。随着 智能电视的发展和普及,智能电视平台上的多媒体内容在不断丰富,数据量不断膨胀面对 如此海量的多媒体内容,智能电视用户仅凭自己的手段,要找到自己感兴趣的内容,如同大 海捞针。因此,个性化推荐系统成为一种重要的手段,它不仅能帮助用户从海量的视频库中 找到他们可能感兴趣的电影或视频,同时也能与用户建立稳定的长期关系,提高用户对网 站的忠诚度,防止用户流失。而传统的视频推荐系统一般应用在视频网站或者像豆瓣电影 这类类似社区的网站中。对用户而言,他们不仅需要从互联网中获取自己感兴趣的视频内 容,同时,他们也需要观看广播电视网中正在直播的视频节目。
[0003] 传统的视频推荐系统只是针对互联网视频网站中的单用户,而智能电视所面向的 用户群是家庭成员群体,在家庭成员群体中每个人的年龄、兴趣等各不相同。因此,对于电 视用户而言面临着以下特点:
[0004] 1.用户行为随时间变化:用户在不同的时间会对不同的节目感兴趣,例如一个用 户在中午和晚上会对不同的节目感兴趣,在周末又可能对另一类节目感兴趣。
[0005] 2.电视节目具有周期性:电视通常以一天或者一周为周期推出同种类型的节目。 用户的观看行为可能具有周期性。
[0006] 3.电视平台是共享的,多用户的:电视不同于其他内容消费平台,在一台电视机前 通常有多人观看,因此,一台电视机的用户日志不是代表一个用户的行为,而是一组用户的 行为。
[0007] 现有技术无法根据电视用户的上述三个特点进行对应的推荐,推荐的针对性不 强。当用户在搜索节目时,无法有效获取与自己感兴趣的节目信息,增加了用户的时间成 本,为用户带来了不便。
[0008] 因此,现有技术还有待于改进和发展。
【发明内容】
[0009] 鉴于现有技术的不足,本发明目的在于提供一种视频推荐方法及系统。
[0010]本发明的技术方案如下:
[0011] -种视频推荐方法,其中,方法包括;
[0012] A、服务器获取各个视频的视频信息,利用聚类算法将视频分成不同的类别,计算 各个视频在对应类别中的类别权重并存储;
[0013] B、智能电视采集用户行为数据后上传至服务器,服务器根据用户行为数据计算出 用户偏好数据,根据用户偏好数据计算出用户未观看过的视频节目的初步推荐结果;
[0014] C、服务器根据类别权重及用户偏好数据计算各个视频在各个时间段的属性和权 值,将视频在各个时间段的属性和权值与初步推荐结果结合后生成最终推荐结果,并将最 终推荐结果发送至智能电视进行显示。
[0015] 所述的视频推荐方法,其中,所述步骤A具体包括:
[0016] A1、服务器从互联网中获取各个视频的视频信息;
[0017] A2、服务器对视频信息进行预处理后,建立视频信息参数的向量空间模型;
[0018] A3、使用聚类迭代算法对视频信息参数的向量空间模型进行计算,根据计算结果 得出各个视频在对应类别中的类别权重后,将各个视频的类别权重进行存储。
[0019] 所述的视频推荐方法,其中,所述步骤B具体包括:
[0020] B1、智能电视采集用户行为数据后上传至服务器,服务器对用户行为数据进行预 处理,并根据预先设置的模型计算出用户偏好数据;
[0021] B2、利用用户偏好数据计算出视频的第一相似度并存储;
[0022] B3、获取用户未观看过的视频与观看过的视频间的第二相似度;
[0023] B4、根据第二相似度计算出用户未观看过的视频节目的初始推荐值并存储。
[0024] 所述的视频推荐方法,其中,所述步骤C具体包括:
[0025] C1、服务器根据类别权重及用户偏好数据计算各个视频在各个时间段的属性和权 值存储到数据库中;
[0026] C2、服务器检测智能电视播放视频所在的时间段,将各个视频在对应的时间段的 权值通过计算叠加在各视频在类别权重后,生成各个视频的最终推荐值;
[0027] C3、将视频按照最终推荐值从高到低进行排序,获取排序序列中的前N个视频,并 将最终推荐结果发送至智能电视进行显示。
[0028] 上述任一项所述的视频推荐方法,其中,所述用户行为数据包括:用户设备ID、设 备IP、电视节目ID、节目点播开始时间、节目点播结束时间、节目总时长。
[0029] -种视频推荐系统,其中,系统包括:
[0030] 类别权重计算模块,用于服务器获取各个视频的视频信息,利用聚类算法将视频 分成不同的类别,计算各个视频在对应类别中的类别权重并存储;
[0031] 初步推荐结果生成模块,用于智能电视采集用户行为数据后上传至服务器,服务 器根据用户行为数据计算出用户偏好数据,根据用户偏好数据计算出用户未观看过的视频 节目的初步推荐结果;
[0032] 最终推荐结果生成模块,用于服务器根据类别权重及用户偏好数据计算各个视频 在各个时间段的属性和权值,将视频在各个时间段的属性和权值与初步推荐结果结合后生 成最终推荐结果,并将最终推荐结果发送至智能电视进行显示。
[0033] 所述的视频推荐系统,其中,所述类别权重计算模块具体包括:
[0034] 视频信息获取单元,用于服务器从互联网中获取各个视频的视频信息;
[0035]视频信息处理单元,用于服务器对视频信息进行预处理后,建立视频信息参数的 向量空间模型;
[0036]类别权重计算单元,用于使用聚类迭代算法对视频信息参数的向量空间模型进行 计算,根据计算结果得出各个视频在对应类别中的类别权重后,将各个视频的类别权重进 行存储。
[0037]所述的视频推荐系统,其中,所述初步推荐结果生成模块具体包括:
[0038]偏好数据获取单元,用于智能电视采集用户行为数据后上传至服务器,服务器对 用户行为数据进行预处理,并根据预先设置的模型计算出用户偏好数据;
[0039]第一相似度计算单元,用于利用用户偏好数据计算出视频的第一相似度并存储;
[0040] 第二相似度计算单元,用于获取用户未观看过的视频与观看过的视频间的第二相 似度;
[0041] 初始推荐值生成单元,用于根据第二相似度计算出用户未观看过的视频节目的初 始推荐值并存储。
[0042] 所述的视频推荐系统,其中,所述最终推荐结果生成模块具体包括:
[0043] 时间段属性及权值计算单元,用于服务器根据类别权重及用户偏好数据计算各个 视频在各个时间段的属性和权值存储到数据库中;
[0044] 最终推荐值生成单元,用于服务器检测智能电视播放视频所在的时间段,将各个 视频在对应的时间段的权值通过计算叠加在各视频在类别权重后,生成各个视频的最终推 荐值;
[0045] 最终推荐结果发送单元,用于将视频按照最终推荐值从高到低进行排序,获取排 序序列中的前N个视频,并将最终推荐结果发送至智能电视进行显示。
[0046] 上述任一项所述的视频推荐系统,其中,所述用户行为数据包括:用户设备ID、设 备IP、电视节目ID、节目点播开始时间、节目点播结束时间、节目总时长。
[0047] 本发明提供了一种视频推荐方法及系统,本发明可通过用户观看电视的行为数据 来评估用户对已经看过的视频的兴趣度,并根据时间段推荐相关视频,尽量满足家庭成员 的观看需求,提高了推荐的准确度,降低了用户的时间成本,增加了自动推荐功能。
【附图说明】
[0048] 图1为本发明中一种视频推荐方法的较佳实施例的体系架构图。
[0049] 图2为本发明中一种视频推荐方法的较佳实施例的流程图。
[0050] 图3为本发明中一种视频推荐方法的具体应用实施例文本聚类流程示意图。
[0051 ]图4为本发明中一种视频推荐方法的具体应用实施例推荐过程的流程示意图。 [0052]图5为本发明的一种视频推荐系统的较佳实施例的功能原理框图。
【具体实施方式】
[0053]为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说 明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0054]本发明是通过智能电视终端与服务器进行数据通信,其中服务器包括算法层、计 算层、和存储层,具体地,如图1所示,智能电视即为电视终端,主要用于用户数据采集和推 荐结果展示,算法层是用于视频分类(聚类)以及推荐,计算层包括Spark和YARN统一资源管 理与调度平台,Spark是开源的通用并行框架,Spark中间输出结果可以保存在内存中,因此 Spark能更好地适用于数据挖掘与机器学习等需要迭代的算法。YARN统一资源管理与调度 平台,是一个通用资源管理系统,可为其他应用提供统一的资源管理和调度。存储层包括 HDFS和Mongodb,HDFS是Hadoop分布式文件系统,HDFS是一个高度容错性的系统。其中 Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开 源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算。HDFS能提供高 吞吐量的数据访问,非常适合大规模数据集上的应用。Mongodb是一个面向文档的数据库。 [0055] 存储层和算法层通过ETL工具进行数据交换,ETL是Extract-Transform-Load的缩 写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端 的过程。ETL常用在数据仓库,但其对象并不限于数据仓库。
[0056]本发明还提供了一种视频推荐方法的较佳实施例的流程图,如图2所示,其中,方 法包括:
[0057]步骤S100、服务器获取各个视频的视频信息,利用聚类算法将视频分成不同的类 另IJ,计算各个视频在对应类别中的类别权重并存储。
[0058]具体地,智能电视与服务器进行连接,并通过服务器进行控制。服务器将采集各种 视频及视频简介等信息,利用文本聚类方法,分别得到各个视频属于每个类别的权重。具体 实施时,服务器采用基于spark的分布式计算框架和分布式存储系统,可实现高效、实用,非 常方便的处理海量数据挖掘及海量数据存储的需求,同时实现高效分布式且兼顾了未来系 统可扩展性的特点。其中spark是开源类通用的一种并行计算框架,是基于映射锐减map reduce算法实现的分布式计算,可以将工作Job中间输出和结果保存在内存中,从而不再需 要读写Hadoop分布式文件系统。进一步实施时,所述步骤S100具体包括:
[0059]步骤S101、服务器从互联网中获取各个视频的视频信息;
[0060]步骤S102、服务器对视频信息进行预处理后,建立视频信息参数的向量空间模型;
[0061] 步骤S103、使用聚类迭代算法对视频信息参数的向量空间模型进行计算,根据计 算结果得出各个视频在对应类别中的类别权重后,将各个视频的类别权重进行存储。
[0062] 具体实施时,首先从互联网通过爬虫工具获取视频的基本信息,作为视频分类的 源数据。视频信息包括电视台节目时间表、视频简介、演员等信息。如图3所示,是本发明一 种视频推荐方法的具体应用实施例文本聚类流程示意图。其中文本聚类包括文本集合、文 本数据预处理、建立向量空间模型、聚类迭代。本发明中以Kmeans聚类迭代为例时行介绍。 文本数据预处理包括数据清洗、分词、停词。
[0063]首先对文本数据进行清洗,因为从互联网上采集的文本数据有可能包含一些我们 认为的噪声数据,比如:数字、网址以及一些特殊字符等,这些类型的数据对我们的文本分 类没有什么用处,应该去除。
[0064] 其次,对文本数据集中的文本进行中文分词。目前有比较多的开源中文分词工具, 比如:中科院的ICTCLAS、基于j ava语言开发的轻量级的中文分词工具包IKAna 1 y z er、 Paoding等。在本设计中我们采用IKAnalyzer特有的"正向迭代最细粒度切分算法",比如: 对"成都市长途汽车站"进行分词的结果为"成都市I成都I市长I长途I长途汽车I汽车I汽车 丄μ,, ?占。
[0065] 最后是停词。因为文本经过分词后,会存在一些我们的常用语和一些停用词,比 如:"的"、"我们"、"然而"等,为了提高聚类的准确性和降低计算量,我们需求把这些词从文 本中去掉。
[0066] 建立向量空间模型的过程为:计算文本中各个词在本文本中出现的次数C(wi),则 TF(i) =C(wi)/sum(wi···]!)。统计文本集合中出现词wi的文本数量doc_C(wi),贝iJIDF(i)= log(doc_sum/doc_C(wi)) Jdoc^sum为总文本数)根据上述两步骤,可以得到文本i,单词wj 的TF-IDF的权值W[ i ] [ j] =TF( j )*IDF( j)。其中i为文本,wj是文本i中的特征词。所以每个 文本的向量可表示为W[i][ j](j = 1 ···]!)。
[0067] 其中Kmeans聚类迭代具体为:
[0068] S1、确定聚类的个数K,从文本集中选取K个文本作为聚类的类中心。
[0069] S2、计算文本i与K个聚类中心的距离。
[0070] S3、将文本i与K个聚类中心距离最近的类确定为该文本所属的类。
[0071] S4、将所有的文本重复步骤S2、S3,确定每个文本的类别。
[0072] S5、重新计算每个类别的中心(类中各个样本的平均值)。
[0073] S6、判断迭代是否结束,如果没有结束则跳到步骤S2。
[0074] Kmeans聚类算法的计算过程的距离度量采用文本(向量)之间的相似度,采用余弦 定理计算向量相似度的公式如下:
[0076]其中,Di是文本集中的一个文本,w[i][ j]为文本Di的向量中的第j个元素,sim (D1,D2)为文本D1和D2的相似度,向量之间的夹角越小相似度越大。
[0077] 根据文本聚类的结果,得出各个视频的属性权值,存放到数据库中。
[0078] 步骤S200、智能电视采集用户行为数据后上传至服务器,服务器根据用户行为数 据计算出用户偏好数据,根据用户偏好数据计算出用户未观看过的视频节目的初步推荐结 果。
[0079] 具体实施时,智能电视采集用户打开智能电视后的行为数据并上传到服务器,而 服务器根据用户行为数据计算初步推荐结果。用户行为数据包括:用户设备ID、设备IP、电 视节目ID、节目点播开始时间、节目点播结束时间、节目总时长。
[0080] 具体地,步骤S200具体包括:
[0081] 步骤S201、智能电视采集用户行为数据后上传至服务器,服务器对用户行为数据 进行预处理,并根据预先设置的模型计算出用户偏好数据;
[0082]步骤S202、利用用户偏好数据计算出视频的第一相似度并存储;
[0083]步骤S203、获取用户未观看过的视频与观看过的视频间的第二相似度;
[0084] 步骤S204、根据第二相似度计算出用户未观看过的视频节目的初始推荐值并存 储。
[0085] 具体实施时,依据用户行为数据计算初步推荐结果,主要包括以下两个流程:训练 流程、推荐流程。
[0086] 训练流程主要要是对收集的用户行为数据进行分析,通过建立用户兴趣模型,得 到用户的偏好数据,然后计算出视频之间的相似度。
[0087] 用户行为数据是在智能电视终端上收集的,用户行为数据是建立用户偏好模型和 计算推荐结果的数据源。同时,收集的用户行为数据的类型和质量会直接影响建立用户兴 趣模型的方法和计算用户兴趣和偏好的准确度。通过对用户的行为分析,计算出用户的兴 趣。进而向用户推荐他们可能感兴趣的视频。综合智能电视的使用情况,系统需要具体采集 包括以下数据(主要是本系统中需要的数据,可能由于以后扩展的需求会收集更多的数 据):用户设备ID,设备IP(地域信息),节目ID,节目点播开始时间,节目点播结束时间,节目 的总时长。
[0088] 用户行为数据清洗、分析首先清洗用户行为日志,合并对同个节目的观看记录,剔 除观看时间少于30秒的记录,将周期性节目(电视剧、综艺节目等)和非周期性节目(电影 等)分类。
[0089] 用户行为数据清洗的关键是去除噪声数据,由于用户对节目的爱好是隐式获取 的,其中不可避免有很多干扰信息。由于用户在观看电视时,通常会频繁地切换频道,在切 换频道时短暂的观看记录在本文中被认作是噪声数据,因此,在前期的数据清洗阶段会清 洗掉用户行为日志中观看时间低于一定时间的记录。同时,在电视节目中经常会插播广告, 许多用户可能会切换节目,在过一段时间之后切回继续观看。因此,用户日志中很可能存在 用户对同一节目的多个观看行为,在前期的数据清洗阶段,我们将会对于同一节目多条记 录的观看时间累计合并成一条记录。
[0090] 根据分类后的信息,分别计算用户对周期性以及非周期性节目的偏好度,最后,将 周期性以及非周期性节目的偏好度归一到同一量级。
[0091 ]电视终端收集的数据主要包括每个电视节目的播放时间和停停播时间,因此我们 假设用户观看一个节目时间的长短,能够表现出用户对这个节目的喜爱程度,定义用户对 单次节目i的接受系数:
[0093] 中为用户从观看节目i开始到退出过程中所收看实际时间长度;为 节目i的总时间长度。由邱勺物理意义可知,用户对视频的偏好程度与邱勺值成正比。假如,对 一个节目的评分最高为10,我们可以定义用户的偏好程度:
[0094] wi= 10β?
[0095] 基于用户偏好数据得到稀疏矩阵。每一行表示所有用户对这个视频的偏好程度, 如果用户没观看过这个视频,在矩阵中表示为空。根据矩阵计算Item之间的关系,即相似 度,并将数据存储在数据库中。
[0096] 推荐流程主要是计算初步推荐结果。从用户偏好数据库中,查找这个用户还没有 看过的视频(集合A,由所有视频剔除用户之前已经看过的视频),以及看过的视频(集合B) (即偏好的产品,并查出偏好值),前者集合A是推荐运算的根据,后者集合B作为一个产生推 荐Item的集合;
[0097] 查找这两个集合之间的关系,这是一对多的关系:一个没有被看过的视频(A中的 一个Item)与该用户所有看过的视频(B中的所有Item)间的关系,用值来衡量这个关系叫相 dissimilarity ;
[0098]得到这个一对多的关系后,计算这个视频对于这个用户的推荐值.similarity_i-x(关系数据)表示Item_i (集合A)与Item_x(集合B)之间的相似度,即为第二相似度,Item_x 是该用户偏好过的,该用户对其偏好值记为value_x(用户偏好数据);Item_i与该用户偏好 过的所有物品以此做以上运算后,得到的值取平均值便是Item_i的初始推荐值,公式如下:
[0100] Sij表示Item_i (集合A)与Item_j (集合B)之间的相似度,其中η值需要通过测试来 确定,它代表了和视频i最相似的η个视频。
[0101]最后计算出该用户没有观看过的视频节目的初始推荐值,并存储到数据库中。
[0102] 步骤S300、服务器根据类别权重及用户偏好数据计算各个视频在各个时间段的属 性和权值,将视频在各个时间段的属性和权值与初步推荐结果结合后生成最终推荐结果, 并将最终推荐结果发送至智能电视进行显示。
[0103] 具体实施时,根据预先算出的各个视频在各个类别中的权重及根据用户行为数据 获取的用户偏好数据,计算各个视频在各个时间段的属性和权值,将视频在各个时间段的 属性和权值与初始推荐值结合,得到最终推荐结果,交将最后的推荐结果发送给智能电视, 智能电视显示给用户供,供用户选择。
[0104] 具体地,所述步骤S300具体包括:
[0105]步骤S301、服务器根据类别权重及用户偏好数据计算各个视频在各个时间段的属 性和权值存储到数据库中;
[0106] 步骤S302、服务器检测智能电视播放视频所在的时间段,将各个视频在对应的时 间段的权值通过计算叠加在各视频在类别权重后,生成各个视频的最终推荐值;
[0107] 步骤S303、将视频按照最终推荐值从高到低进行排序,获取排序序列中的前Ν个视 频,并将最终推荐结果发送至智能电视进行显示。
[0108] 具体实施时,在得到初步的推荐值后,我们还不能根据这个推荐值向用户推荐视 频。因为在本文中的用户是一个用户群体,并不是单一用户。我们得到的这个推荐值也是针 对这个用户群体的,在这个用户群体中每个人的兴趣爱好各不相同,所以我们还需要针对 这个用户群体中的每个用户单独进行推荐值计算。
[0109]通过前面的文本聚类计算视频分类权重,以及计算初步的推荐结果,可得到三类 数据:视频属性权值、用户偏好数据、初步推荐结果。
[0110]根据视频属性权值和用户偏好数据计算各个时间段属性权值并将其存储到数据 库中。
[0112] Ai:标签Α在i时间段的权重,
[0113] A出:在i时间段被观看的视频j属于标签A的权重。
[0114] 在计算最终推荐值的时候考虑被推荐视频要播放时间段的标签权重。如果在某个 时刻,用户的标签和视频的标签相匹配,则奖励该视频的推荐值。下式为最终推荐结果的计 算。判断用户的标签和视频的标签匹配则说明该时间段,当前用户的偏好数据的标签和当 前视频的标签相同。其中标签是指对于视频信息提取的简介。
[0116] 〇为要推荐的视频与该时间段的匹配度,同时也是视频的奖励权.
[0117] 〇=XffAj*Ai
[0118] WAj:视频j属于标签A的权重值,Ai:标签A在时间段i的权重值,
[0119] 最后将得到的最终推荐结果值从高到低排序,选择前Τ0Ρ-Ν的视频进行推荐。其中 N可根据需要进行设定,具体实施时,N的值设置在10~50之间。
[0120] 本发明还提供了一种视频推荐方法的具体应用实施例推荐过程的流程示意图,如 图4所示,该视频推荐系统的流程主要包括三部分。
[0121] 部分A负责得到视频的属性权值。它主要通过从互联网中采集各个视频的简介,利 用文本聚类方法,得到各个视频属于每个类别的权重。
[0122] 具体地,服务器获取互联网数据,获取视频信息,利用文本聚类得到视频属性权 值。
[0123] 部分B负责具体的推荐计算。它通过分析用户的行为数据得到用户偏好数据,然后 根据基于物品的推荐算法得到初步推荐结果。
[0124] 具体地,用户行为日志数据库采集用户行为数据,对日志数据预处理,生成用户偏 好数据,根据用户偏好数据进行视频特征向量计算,得到关系数据,根据关系数据进行初始 推荐计算,生成初始推荐结果。
[0125] 部分C负责最终推荐结果的计算。它根据A、B部分得到的结果计算出最终推荐结 果。
[0126] 具体地,根据视频属性权值和用户偏好数据计算各个时间段属性、权值,获取时间 段属性、权值。根据视频属性权值、时间段属性和权值以及初始推荐结果,计算最终推荐结 果,生成最终推荐结果。
[0127] 本发明还提供了一种视频推荐系统的较佳实施例的功能原理框图,如图5所示,其 中,系统包括:
[0128] 类别权重计算模块100,用于服务器获取各个视频的视频信息,利用聚类算法将视 频分成不同的类别,计算各个视频在对应类别中的类别权重并存储;具体如上方法实施例 所述。
[0129] 初步推荐结果生成模块200,用于智能电视采集用户行为数据后上传至服务器,月艮 务器根据用户行为数据计算出用户偏好数据,根据用户偏好数据计算出用户未观看过的视 频节目的初步推荐结果;具体如上方法实施例所述。
[0130] 最终推荐结果生成模块300,用于服务器根据类别权重及用户偏好数据计算各个 视频在各个时间段的属性和权值,将视频在各个时间段的属性和权值与初步推荐结果结合 后生成最终推荐结果,并将最终推荐结果发送至智能电视进行显示;具体如上方法实施例 所述。
[0131]所述的视频推荐系统,其中,所述类别权重计算模块具体包括:
[0132] 视频信息获取单元,用于服务器从互联网中获取各个视频的视频信息;具体如上 方法实施例所述。
[0133] 视频信息处理单元,用于服务器对视频信息进行预处理后,建立视频信息参数的 向量空间模型;具体如上方法实施例所述。
[0134] 类别权重计算单元,用于使用聚类迭代算法对视频信息参数的向量空间模型进行 计算,根据计算结果得出各个视频在对应类别中的类别权重后,将各个视频的类别权重进 行存储;具体如上方法实施例所述。
[0135] 所述的视频推荐系统,其中,所述初步推荐结果生成模块具体包括:
[0136] 偏好数据获取单元,用于智能电视采集用户行为数据后上传至服务器,服务器对 用户行为数据进行预处理,并根据预先设置的模型计算出用户偏好数据;具体如上方法实 施例所述。
[0137] 第一相似度计算单元,用于利用用户偏好数据计算出视频的第一相似度并存储; 具体如上方法实施例所述。
[0138] 第二相似度计算单元,用于获取用户未观看过的视频与观看过的视频间的第二相 似度;具体如上方法实施例所述。
[0139] 初始推荐值生成单元,用于根据第二相似度计算出用户未观看过的视频节目的初 始推荐值并存储;具体如上方法实施例所述。
[0140] 所述的视频推荐系统,其中,所述最终推荐结果生成模块具体包括:
[0141] 时间段属性及权值计算单元,用于服务器根据类别权重及用户偏好数据计算各个 视频在各个时间段的属性和权值存储到数据库中;具体如上方法实施例所述。
[0142] 最终推荐值生成单元,用于服务器检测智能电视播放视频所在的时间段,将各个 视频在对应的时间段的权值通过计算叠加在各视频在类别权重后,生成各个视频的最终推 荐值;具体如上方法实施例所述。
[0143] 最终推荐结果发送单元,用于将视频按照最终推荐值从高到低进行排序,获取排 序序列中的前N个视频,并将最终推荐结果发送至智能电视进行显示;具体如上方法实施例 所述。
[0144] 上述任一项所述的视频推荐系统,其中,所述用户行为数据包括:用户设备ID、设 备IP、电视节目ID、节目点播开始时间、节目点播结束时间、节目总时长;具体如上方法实施 例所述。
[0145] 综上所述,本发明提供了一种视频推荐方法及系统,方法包括:服务器获取各个视 频的视频信息,利用聚类算法将视频分成不同的类别,计算各个视频在对应类别中的类别 权重并存储;智能电视采集用户行为数据后上传至服务器,服务器根据用户行为数据计算 出用户偏好数据,根据用户偏好数据计算出用户未观看过的视频节目的初步推荐结果;月艮 务器根据类别权重及用户偏好数据计算各个视频在各个时间段的属性和权值,将视频在各 个时间段的属性和权值与初步推荐结果结合后生成最终推荐结果,并将最终推荐结果发送 至智能电视进行显示。本发明可通过用户观看电视的行为数据来评估用户对已经看过的视 频的兴趣度,并根据时间段推荐相关视频,尽量满足家庭成员的观看需求,降低了用户的时 间成本。
[0146] 应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可 以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保 护范围。
【主权项】
1. 一种视频推荐方法,其特征在于,方法包括; A、 服务器获取视频的视频信息,利用聚类算法将视频分成不同的类别,计算各个视频 在对应类别中的类别权重并存储; B、 智能电视采集用户行为数据后上传至服务器,服务器根据用户行为数据计算出用户 偏好数据,根据用户偏好数据计算出用户未观看过的视频节目的初步推荐结果; C、 服务器根据类别权重及用户偏好数据计算视频在各个时间段的属性和权值,将视频 在各个时间段的属性和权值与初步推荐结果结合后生成最终推荐结果,并将最终推荐结果 发送至智能电视进行显示。2. 根据权利要求1所述的视频推荐方法,其特征在于,所述步骤A具体包括: A1、服务器从互联网中获取各个视频的视频信息; A2、服务器对视频信息进行预处理后,建立视频信息参数的向量空间模型; A3、使用聚类迭代算法对视频信息参数的向量空间模型进行计算,根据计算结果得出 各个视频在对应类别中的类别权重后,将各个视频的类别权重进行存储。3. 根据权利要求2所述的视频推荐方法,其特征在于,所述步骤B具体包括: B1、智能电视采集用户行为数据后上传至服务器,服务器对用户行为数据进行预处理, 并根据预先设置的模型计算出用户偏好数据; B2、利用用户偏好数据计算出视频的第一相似度并存储; B3、获取用户未观看过的视频与观看过的视频间的第二相似度; B4、根据第二相似度计算出用户未观看过的视频节目的初始推荐值并存储。4. 根据权利要求3所述的视频推荐方法,其特征在于,所述步骤C具体包括: C1、服务器根据类别权重及用户偏好数据计算各个视频在各个时间段的属性和权值存 储到数据库中; C2、服务器检测智能电视播放视频所在的时间段,将各个视频在对应的时间段的权值 通过计算叠加在各视频在类别权重后,生成各个视频的最终推荐值; C3、将视频按照最终推荐值从高到低进行排序,获取排序序列中的前N个视频作为最终 推荐结果,并将最终推荐结果发送至智能电视进行显示。5. 根据权利要求1~4任一项所述的视频推荐方法,其特征在于,所述用户行为数据包 括:用户设备ID、设备IP、电视节目ID,节目点播开始时间、节目点播结束时间、节目总时长。6. -种视频推荐系统,其特征在于,系统包括: 类别权重计算模块,用于服务器获取各个视频的视频信息,利用聚类算法将视频分成 不同的类别,计算各个视频在对应类别中的类别权重并存储; 初步推荐结果生成模块,用于智能电视采集用户行为数据后上传至服务器,服务器根 据用户行为数据计算出用户偏好数据,根据用户偏好数据计算出用户未观看过的视频节目 的初步推荐结果; 最终推荐结果生成模块,用于服务器根据类别权重及用户偏好数据计算各个视频在各 个时间段的属性和权值,将视频在各个时间段的属性和权值与初步推荐结果结合后生成最 终推荐结果,并将最终推荐结果发送至智能电视进行显示。7. 根据权利要求6所述的视频推荐系统,其特征在于,所述类别权重计算模块具体包 括: 视频信息获取单元,用于服务器从互联网中获取各个视频的视频信息; 视频信息处理单元,用于服务器对视频信息进行预处理后,建立视频信息参数的向量 空间模型; 类别权重计算单元,用于使用聚类迭代算法对视频信息参数的向量空间模型进行计 算,根据计算结果得出各个视频在对应类别中的类别权重后,将各个视频的类别权重进行 存储。8. 根据权利要求7所述的视频推荐系统,其特征在于,所述初步推荐结果生成模块具体 包括: 偏好数据获取单元,用于智能电视采集用户行为数据后上传至服务器,服务器对用户 行为数据进行预处理,并根据预先设置的模型计算出用户偏好数据; 第一相似度计算单元,用于利用用户偏好数据计算出视频的第一相似度并存储; 第二相似度计算单元,用于获取用户未观看过的视频与观看过的视频间的第二相似 度; 初始推荐值生成单元,用于根据第二相似度计算出用户未观看过的视频节目的初始推 荐值并存储。9. 根据权利要求8所述的视频推荐系统,其特征在于,所述最终推荐结果生成模块具体 包括: 时间段属性及权值计算单元,用于服务器根据类别权重及用户偏好数据计算各个视频 在各个时间段的属性和权值存储到数据库中; 最终推荐值生成单元,用于服务器检测智能电视播放视频所在的时间段,将各个视频 在对应的时间段的权值通过计算叠加在各视频在类别权重后,生成各个视频的最终推荐 值; 最终推荐结果发送单元,用于将视频按照最终推荐值从高到低进行排序,获取排序序 列中的前N个视频,并将最终推荐结果发送至智能电视进行显示。10. 根据权利要求6~9任一项所述的视频推荐系统,其特征在于,所述用户行为数据包 括:用户设备ID、设备IP、电视节目ID、节目点播开始时间、节目点播结束时间、节目总时长。
【文档编号】H04N21/466GK106028071SQ201610329608
【公开日】2016年10月12日
【申请日】2016年5月17日
【发明人】冯研
【申请人】Tcl集团股份有限公司