一种基于移动互联网社交图片预测用户上下文信息的方法
【技术领域】
[0001]本发明涉及移动互联网技术,具体涉及一种基于移动互联网社交图片预测用户上下文信息的方法。
【背景技术】
[0002]在移动互联网时代,图片成为了人们日常生活的一部分,用户不再习惯于通过文字表达情感,而更倾向于把周围所发生的事以图片的形式展示出来。图片逐步取代文字,更多的内容创作将会向图片倾斜,图片更能符合移动互联网时代的时间碎片化、行为移动化以及体验极致等时代特性。
[0003]社交网上的图片与用户的上下文信息密切相关,用户的上下文信息在移动互联网应用中扮演着重要角色。目前用户上下文信息多数是静态感知的,通过移动终端的硬件设备来获取,而通过图片数据来获取的方法还是很少,本发明就提供了一种通过图片数据预测用户上下文信息的方法。用户上下文信息预测就是通过分析用户上传到移动互联网上的图片来预测用户的性别、爱好、职业、活动场景以及天气状等上下文信息。本发明对用户上下文信息的研究主要集中在用户上传到移动互联网的社交图片上。采取的分类方法主要是KNN(k-NearestNeighbor)算法和 SVM(Support Vector Machine)算法。
【发明内容】
[0004]本发明的目的是提供一种基于移动互联网社交图片预测用户上下文信息的方法。使用本发明提供的实施例,可以通过分析用户上传到移动互联网上的图片对用户的上下文信息进行预测。
[0005]本发明通过分析用户上传到移动互联网上的图片,预测用户的性别和活动场景、天气状况等上下文信息。从用户智能手机安装的社交APP (Applicat1n)出发,根据社交APP提供的公共交流平台(如朋友圈),获取用户在移动互联上发表的图片数据,记录每张图片的发图用户信息、图片描述的内容信息,包括图片中的天气状况、活动场景、地理位置以及时间等。将获取到的图片进行预处理;然后通过灰度矩阵、颜色矩阵、灰度共生矩阵等提取图片的若干特征。由于不同类型的用户或者用户在不同场景下所发表的图片具有不同的数字特征,同一类型的用户在类似的场景下的图片具有类似的数字特征,故本发明以此为依据来预测用户的上下文信息。
[0006]具体计算过程如下:分别计算每张图片的灰度矩阵、灰度共生矩阵、颜色矩阵,并在每个矩阵上提取数学统计特征,得到一组数字特征。一张图片的所有数字特征组成图片特征向量。图片ID(Identity)对应该图片的特征向量,用户ID对应用户的上下文信息。关联用户ID和图片ID,可得到图片特征向量与用户上下文信息之间的关联关系。分析图片特征向量与用户上下文信息之间的关系,从而达到依据用户发表的图片预测用户上下文信息的目的。可采用SVM和KNN模型实现对用户的上下文信息的分类预测。本发明将用户的性另IJ、活动场景等作为二分类问题处理,天气状况、图片内容等作为多分类问题处理。
[0007]该方法的步骤包括:
[0008]1、使用用户在移动终端安装的社交软件,通过社交软件提供的公共交流平台,获取用户上传到移动互联网上的图片,并记录图片和对应的用户上下文信息;
[0009]2、对图片预处理,构建提取特征所用的灰度矩阵、灰度共生矩阵和颜色矩阵;
[0010]3、在上述的各矩阵上统计分析,计算并提取图片的数字特征。每个矩阵提取若干个特征值,每张图片总共提取m个特征值,构成图片特征向量P(图片ID,特征值1,特征值2,…,特征值m)1Xni;
[0011]4、每个用户发表p张图片,共η个用户,可得到特征值矩阵R(用户ID,图片特征向
P) (n*p) Xm,
[0012]5、通过关键字图片ID和用户ID,将图片的特征值矩阵和用户的上下文信息关联,将用户的上下文信息设置为类标;
[0013]6、用训练数据分别训练SVM和KNN分类模型;
[0014]7、训练好的SVM和KNN模型分类预测测试样本;
[0015]8、输出对测试样本的测试结果,并比较得出最终结果。
[0016]最后,实施本发明具有以下有益效果:通过分析用户智上传到移动互联网上的图片可以对用户的性别、活动场景、图片内容等用户上下文信息做出预测,经过实验能够获得有效的预测效果。
【附图说明】
[0017]为清楚阐述本发明的内容,将使用如下附图作为辅助说明之用:
[0018]图1是获取用户上下文信息和图片特征数据集的流程图;
[0019]图2是数据集预测用户上下文信息的算法流程图。
【具体实施方式】
[0020]为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
[0021]在本实施例中,如图1所示,提供本发明提出的方法的特征数据集获取的算法流程:
[0022]步骤101、通过社交软件获取用户上传到移动互联网上的图片。在测试用户的移动终端登录登陆社交软件,通过社交软件提供的公共交流平台,下载其好友在最近的一段时间内发到移动互联网上的照片。
[0023]步骤102、记录图片内容信息和图片对应的用户上下文信息。记录图片所描述的场景、天气状况以及是室内还是室外等内容信息,并记录发图用户的ID、爱好、职业、性别等基础信息。
[0024]步骤103、图片预处理,构建灰度、颜色等矩阵和灰度矩阵。将下载到的图片进行预处理操做,并把图片转换成基于像素点的灰度矩阵、颜色矩阵、灰度共生矩阵等形式,以便于计算。
[0025]步骤104、对各个矩阵统计分析,计算并提取数据特征。在上述各个矩阵上统计分析,计算并提取数字特征,每个矩阵提取若干个特征值,每张图片总共提取m个特征值,m个特征值和图片ID组成图片特征向量P (图片ID,特征值1,特征值2,…,特征值m)丨Χηι。
[0026]步骤105、总共有η个用户,每个用户发p张图片,将所有图片向量和用户ID转化成图片特征值矩阵。每张图片得到的数字特征不同,所对应的用户上下文信息也不同。将所有的图片特征向量和用户ID组合,得到图片特征值矩阵R(用户ID,图片特征向量Ρ) (_)Χηι。
[0027]步骤106、通过图片ID和用户ID,得到用户的上下文信息,将其设为类标。通过图片ID取得图片的内容信息,如图片上的天气、场景等,通过用户ID取得用户信息,如性别、爱好等,这些信息即是用户的上下文信息,每张图片对应一个用户上下文信息。将用户上下文信息设为类标,通过图片ID关联图片特征值矩阵,形成数据集。其中,用户上下文信息中的性别为男和女两类,用户的活动场景分为室内和室外两类,天气状况分为晴、阴、雨、雪四类,图片描述内容分为人物、景物、食物等多类。
[0028]在本实施例中,如图2所示,提供本发明提出的预测用户上下文信息方法的算法流程:
[0029]步骤201、将数据随机等分为训练集和测试集。数据随机分为训练集和测试集,训练集是测试集的4倍,训练集用于训练SVM和KNN分类模型。
[0030]步骤202、训练集用于训练SVM和KNN分类模型。对于不同的用户上下文信息分别训练出性别分类模型、活动场景分类模型和图片内容分类模型等,用于预测的时候使用。其中SVM采用Linear核函数。
[0031 ] 步骤203、训练好的SVM模型和KNN模型分别预测测试集。用SVM训练出的分类模型使用对应的SVM预测算法测试测试集数据;KNN训练出的分类模型使用对应的KNN预测算法测试测试集数据。
[0032]步骤204、输出对测试样本的预测测试结果,并比较结果,得出最终预测的结果。
[0033]尽管上面对本发明说明性的【具体实施方式】进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于【具体实施方式】的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利求限定和确定的本发明精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
【主权项】
1.一种基于移动互联网社交图片预测用户上下文信息的方法,其特征在于:首先在用户所使用社交工具上,获取用户一段时间内上传到移动互联网上的图片数据;对发图用户的上下文信息进行标记;计算并提取图片的数字特征,得到特征向量(用户ID,图像ID,特征值1,特征值2,…,特征值η),将所有图片数据的特征向量(用户ID,图像ID,特征值1,特征值2,…,特征值η)转化为图片特征值矩阵;通过图片ID、用户ID关联图片特征向量和发图用户的上下文信息,将用户的上下文信息作为类标;将数据随机的分为训练集和测试集,使用SVM、kNN等算法对训练集中发图用户的上下文信息训练预测模型,并对测试集中用户的上下文信息进行预测,最后输预测结果。
【专利摘要】本发明通过分析用户上传到移动互联网上的图片数据,预测图片的内容、用户的性别、天气状况以及活动场景等用户上下文信息。获取用户上传到移动互联网上的图片数据,对图片进行统计分析,并计算相应数字特征。将一张图片的所有数字特征作为图片特征向量,通过图片ID和用户ID将用户的上下文信息和图片特征向量关联起来,分析图片数据与用户上下文信息之间的关系,从而达到依据图片数据预测用户的上下文信息的目的。采用SVM和KNN模型实现对用户的上下文信息的分类预测。本发明将用户的性别、活动场景等作为二分类问题处理,天气状况、图片内容等作为多分类问题处理。本发明实施例的有益效果是,通过分析用用户上传到移动互联网上的图片数据可以对用户的性别、活动场景、图片内容、天气状况等上下文信息做出预测,经过实验能够获得有效的预测效果。
【IPC分类】G06F17/30, G06K9/62, G06Q50/00
【公开号】CN105279266
【申请号】CN201510701199
【发明人】秦臻, 任怀贵, 余林芳
【申请人】电子科技大学
【公开日】2016年1月27日
【申请日】2015年10月26日