本发明涉及应用在政府、企业的全球媒体形象分析技术,尤其涉及全球媒体形象分析方法、装置和系统。
背景技术:
伴随着信息全球化的历史进程,建构良好的全球媒体形象已成为政企对外发展合作的重要目标。全球媒体形象是基于海量信息、数据搜索,并经专业分析获得的具有决策参考意义的坐标。它可以快速让政府、机构、企业在这一坐标中找准自己的定位,明确自身的媒体形象与影响力,从而为未来的品牌推广、招商引资、举办大型活动提供清晰参考。
全球媒体涵盖了全世界各语种媒体,如将全球媒体分为三大类:大陆媒体,即中国31个省(市)地区的媒体;港澳台媒体,即中国香港、中国澳门和中国台湾地区媒体;国际媒体,即中国以外国家或地区的媒体。此外,中国港澳台媒体和国际媒体合称为境外媒体。
如何更全面、综合地了解全球媒体对自身的报道和主要观点、价值主张,在树立良好的政企形象和对外合作发展应对策略、更好的传播自身思想、文化、产品和价值观念成为政企日益关注的问题。而在急速变化的时代,政府、企业要想在浩如烟海的天量信息中,搜索整理并勾勒出自身的全球媒体形象,面临巨大的人力、物力以及专业知识的门槛。
技术实现要素:
为了克服现有技术的不足,本发明的目的在于提供全球媒体形象分析方法、装置和系统,其能提供媒体形象清晰全面且准确真实的数据参考。
本发明的目的之一采用以下技术方案实现:
全球媒体形象分析方法,包括如下步骤:
s1、获取媒体报道内容;
s2、对媒体报道内容提取内容关键词,根据识别模型和内容关键词,对媒体报道内容进行评分;
s3、按照预设维度将媒体报道内容分类成若干个维度,预设维度包括:产品形象、组织形象、人员形象和品牌竞争力;
s4、对每个维度的媒体报道内容提取内容关键词,根据识别模型和每个维度的内容关键词,对每个维度进行评分,得到子评分;
s5、根据媒体报道内容的评分、预设维度以及子评分形成可视化分析报告。
作为优选,识别模型的建立包括如下步骤:
获取海量全球媒体报道内容信息,利用tf-idf算法提取情绪关键词;计算每个关键词出现的次数,建立情绪关键词典矩阵,以此作为神经网络模型的输入项;
获取全球媒体报道内容信息对应表达的观点正负面倾向程度对应正负面的区间数据,并建立正负区间输出矩阵;以此作为神经网络模型的输出项,进行训练。
本发明的目的之二采用以下技术方案实现:
全球媒体形象分析装置,包括:
获取模块,用于获取媒体报道内容;
第一评分模块,用于对媒体报道内容提取内容关键词,根据识别模型和内容关键词,对媒体报道内容进行评分;
分类模块,用于按照预设维度将媒体报道内容分类成若干个维度,预设维度包括:产品形象、组织形象、人员形象和品牌竞争力;
第二评分模块,用于对每个维度的媒体报道内容提取内容关键词,根据识别模型和每个维度的内容关键词,对每个维度进行评分,得到子评分;
生成模块,用于根据媒体报道内容的评分、预设维度以及子评分形成可视化分析报告。
作为优选,识别模型的建立包括:
获取海量全球媒体报道内容信息,利用tf-idf算法提取情绪关键词;计算每个关键词出现的次数,建立情绪关键词典矩阵,以此作为神经网络模型的输入项;
获取全球媒体报道内容信息对应表达的观点正负面倾向程度对应正负面的区间数据,并建立正负区间输出矩阵;以此作为神经网络模型的输出项,进行训练。
本发明的目的之三采用以下技术方案实现:
全球媒体形象分析方法,包括如下步骤:
s1、获取媒体报道内容;
s2、对媒体报道内容提取内容关键词,根据识别模型和内容关键词,对媒体报道内容进行评分;
s3、按照预设维度将媒体报道内容分类成若干个维度,预设维度包括:企业家关注度、名人关注度和机构关注度;
s4、对每个维度的媒体报道内容提取内容关键词,根据识别模型和每个维度的内容关键词,对每个维度进行评分,得到子评分;
s5、根据媒体报道内容的评分、预设维度以及子评分形成可视化分析报告。
作为优选,识别模型的建立包括如下步骤:
获取海量全球媒体报道内容信息,利用tf-idf算法提取情绪关键词;计算每个关键词出现的次数,建立情绪关键词典矩阵,以此作为神经网络模型的输入项;
获取全球媒体报道内容信息对应表达的观点正负面倾向程度对应正负面的区间数据,并建立正负区间输出矩阵;以此作为神经网络模型的输出项,进行训练。
本发明的目的之四采用以下技术方案实现:
全球媒体形象分析装置,包括:
获取模块,用于获取媒体报道内容;
第一评分模块,用于对媒体报道内容提取内容关键词,根据识别模型和内容关键词,对媒体报道内容进行评分;
分类模块,用于按照预设维度将媒体报道内容分类成若干个维度,预设维度包括:企业家关注度、名人关注度和机构关注度;
第二评分模块,用于对每个维度的媒体报道内容提取内容关键词,根据识别模型和每个维度的内容关键词,对每个维度进行评分,得到子评分;
生成模块,用于根据媒体报道内容的评分、预设维度以及子评分形成可视化分析报告。
作为优选,识别模型的建立包括:
获取海量全球媒体报道内容信息,利用tf-idf算法提取情绪关键词;计算每个关键词出现的次数,建立情绪关键词典矩阵,以此作为神经网络模型的输入项;
获取全球媒体报道内容信息对应表达的观点正负面倾向程度对应正负面的区间数据,并建立正负区间输出矩阵;以此作为神经网络模型的输出项,进行训练。
本发明的目的之五采用以下技术方案实现:
全球媒体形象分析系统,用于执行全球媒体形象分析方法。
相比现有技术,本发明的有益效果在于:从互联网信息中获取海量数据,通过机器抓取分析与目标政企相关的全球媒体资讯报道,通过相关关键词、正负面语义分析,从热词、企业、机构、名人、企业家、关注度、媒体报道情绪态度曲线等多个维度对企业全球媒体形象予以界定得出全球媒体形象报告,快速让企业、机构明确自身的媒体形象与影响力数据,从而为未来的品牌推广、招商引资、举办大型活动提供清晰全面、准确真实的数据参考。
附图说明
图1为本发明全球媒体形象分析方法的流程图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述:
全球媒体形象分析方法,如图1所示,包括如下步骤:
步骤101、从网络获取媒体报道内容;具体的:通过关键字,利用网络爬虫技术从网络上获取媒体报道内容;关键字包括政企关键字、相关产品、人名和地区关键词等,媒体报道内容包括全球媒体报道内容中与政府、企业相关的指定单位时间段内的媒体报道内容信息。
网络爬虫是一种自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。
步骤102、对媒体报道内容提取内容关键词,根据识别模型和内容关键词,对媒体报道内容进行评分。
具体的,提取媒体报道内容的内容关键词,统计每个内容关键词出现的次数,根据内容关键词及其出现的次数形成该媒体报道内容的特征向量,根据建立好的识别模型中的情绪词典矩阵和该特征向量,分析该媒体报道内容的正负面,并对媒体报道内容进行评分。
步骤103、按照预设维度将媒体报道内容分类成若干个维度,如果分析的对象是企业,则预设维度包括:产品形象、组织形象、人员形象和品牌竞争力;如果分析的对象是政府,则预设维度包括:企业家关注度、名人关注度和机构关注度;
全球媒体形象主要分析对象为政府和企业,需要针对各主体设置分析的维度,建立各维度关键词库对信息归类,使用不同的分析统计方法。
产品形象包括产品质量、产品款式、产品服务三方面数据量和正负面倾向分析,可以帮助相关企业的研发人员找出问题所在,设计人员知晓目标客户的需求和品位,服务端员工看到改进方向。具体为产品的质量口碑,产品款式上的进步与改变,产品的售前、售中、售后服务品质三方面信息的媒体报道数量和倾向数据分析。
组织形象从制度、效益、信用、实力4部分相关信息为政企画像,分析得出媒体报道的方向和报道量变化情况,通过上述4部分相关关键词组合、内容的正负面倾向分析,直观地让政企看到自身组织形象的优势与弱点,并采取相应措施。其一,给管理层提供详实精准的参考,有利于在工作中取长补短,其二,采取正确的公关应对策略,包括舆情应对、专业人士建言等。
人员形象根据全球媒体报道信息数据提取关键词进行分析,为对企业管理层及普通员工画像。管理层、掌舵本企业的企业家(如董事长、总经理)的全球媒体关注度,可以帮助企业认知自己在传播方面的优劣势,针对性的在做品牌推广、广告等活动时,充分考虑灵活运用自己的强项、巧妙避开自己的弱项,大大节省成本。普通员工的群像刻画体现了企业的文化、价值观以及管理模式的真实影响。
品牌竞争力反映了企业在行业中,在客户中,在消费者中的地位和排名,这一关注度指标的强弱与变化,为企业、竞争对手的媒体曝光量数据对比和趋势分析。
企业家关注度为地域范围内的最受关注企业家统计数据,它可以帮助政府清晰认知到本地域的企业优、劣势、产业优、劣势,了解对外宣传、招商时,可以充分灵活运用的资源数据。
制度为企业的管理制度解读,这种管理制度同时也塑造了企业文化和企业价值观。效益为企业的社会效益和经济效益,以及社会责任的履行,包括解决就业、纳税等内容信息。信用为在经营活动中形成的口碑,在资本市场中的公信力。实力为现有资产、人才队伍、资源、研发能力的总体呈现。
名人关注度:名人从文化上而言,对于当地的知名度有极大的帮助,这一指数的强弱,实际上反映了当地的软实力。名人关注度数据为地域范围内受关注的名人的资讯统计数据和报道倾向分析,内容包括名人与当地的开放度、历史发展密切相关的媒体报道。
机构关注度:机构是包括教育资源、企业资源以及其他商业实体在内的一种统称,反映了当地实体经济的发展实力、品牌影响力以及教育资源对社会的正面影响力,这一关注度指标的强弱与变化,对于客户具有极为重要的参考意义。
步骤104、对每个维度的媒体报道内容提取内容关键词,根据识别模型和每个维度的内容关键词,对每个维度进行评分,得到子评分。
以及统计每个维度的内容关键词出现的频率,生成每个维度对应的关键词关注度排行数据。
具体的,对每个维度的媒体报道内容提取内容关键词,统计每个内容关键词出现的次数,根据内容关键词及其出现的次数形成该维度的媒体报道内容的特征向量,根据建立好的识别模型中的情绪词典矩阵和该媒体报道内容的特征向量,分析该维度的媒体报道内容的正负面,计算该维度的评分;每个维度的媒体报道内容包括对应该维度的文章和报道等内容。
设置各个指数评价总分为100分,0分对应为趋于完全负面的情绪区间,100分为趋近完全正面积极的情绪区间。将每篇内容的情绪判断区间结果数据对应计算各维度的评分。
识别模型将媒体报道情绪对应分为正面和负面,通过百分比区间来表示正负面,0为负面情绪,100为正面情绪,越悲观绝望则越趋近于0,满意高兴则趋近于100%。将海量的网络全球媒体报道内容对应到正负面百分比各个区间进行识别训练,根据判断结果不断调整以建立识别模型。
正面情绪:反映的是媒体观点对现状较认同、满意,对事情抱有的正面希望,如给力、高兴、期待。
负面情绪:反映的是媒体观点对现状批判、不满,对将来解决问题不报期望,如悲伤、坑爹、绝望。
识别模型的建立过程包括如下步骤:
获取海量互联网的全球媒体报道内容信息,利用tf-idf算法提取情绪关键词;计算每个关键词出现的次数,建立情绪关键词典矩阵,以此作为神经网络模型的输入项;
获取全球媒体报道内容信息对应表达的观点正负面倾向程度对应正负面的区间数据,并建立正负区间输出矩阵;以此作为神经网络模型的输出项,进行训练。
根据识别结果通过反复调整参数进行训练,从而建立识别模型。
步骤105、根据媒体报道内容的评分、预设维度以及子评分形成可视化分析报告。可视化分析报告包括媒体态度格式件周期变化曲线图表。
具体的,预设维度还包括总体指数、年(月)度关注度、地理关注度、媒体关注度、热词关注度和媒体报道情绪态度曲线。
可视化分析报告还包括全球媒体形象的总体指数分析;组合政企相关关键词和预设的全球地域关键词库,分析信息所涉及的地域、国家、城市,统计信息报道的相关媒体以及报道总量数据,根据总体指数、媒体报道内容的评分和子评分,形成全球媒体形象的总体指数分析。
可视化分析报告还包括各时间周期趋势分析图表;统计对比年(月)度时间周期内的媒体报道信息量、所涉及的地域、国家、城市、媒体出处数据,得到多个单位时间内媒体关注度变化数据分析结果,根据媒体报道内容的评分和子评分,并形成各时间周期趋势分析图表。
可视化分析报告还包括媒体形象的地理关注度分析结果;根据地域来源统计报道信息量最高的国家、地区、城市信息,根据媒体报道内容的评分、子评分以及地理关注度,列出排行榜,并以地图形式予以展现上述信息。得到政企媒体形象的地理关注度分析结果。
可视化分析报告还包括媒体关注度指标结果数据;根据媒体介质统计各传播渠道上的数据量、媒体报道内容的评分和子评分;从而进一步得到媒体介质对应的受众人群属性,分析主要的关注人群及他们的年龄、收入、性别等信息;通过上述分析得到媒体关注度指标结果数据。
其中,总体指数:通过机器抓取政企单位时间段内全球的相关信息,组合政企相关关键词和全球地域关键词库,分析得出信息所涉及的地域、国家、城市,统计信息报道的相关媒体以及报道总量数据,分析报道的正负面倾向,快速完成对客户全球媒体形象的总体勾勒,并由此判断其全球媒体形象是处于哪一区间。
年(月)度关注度:单位时间内的媒体关注度变化分析,包括报道数据量、正负面倾向变化对比数据。以对比数据显示政企全球媒体形象的趋势,观察其是上升、下跌还是平缓。
地理关注度:哪些国家、地区、城市对政企保持关注度,在全球范围内收集授权政企的全部信息,对其进行总量统计、正负面倾向分析,以地图形式予以展现,并列出排行榜,这是一条横向的对比轴。主要划分为:中国内地、港澳台、海外三部分。可以在地域上快速标注关注授权政企的区域,对决策提供直观参考。确认政企在中国内地、港澳台、海外的影响力数据,可以初步判断其影响力的辐射范围。
媒体关注度:主要媒体介质为纸媒、电视、广播、传统网站、移动媒体、户外媒体、其他媒体。统计目标政企在各传播渠道上的数据量和报道正负面倾向;同时统计主要的关注人群,包括他们的年龄、收入、性别等。这是介质层面分析可以得出的初步结论。
热词关注度:为单位时间段内,媒体报道中提及最多的相关联的关键词对比数据。热词是综合性指标,如何扬长避短,如何快速达成目标,热词都是关键参考指数。对企业,它是企业在全球媒体形象这一坐标中最为重要的综合性参数,它超越地域、行业、时空,只以数据实证企业的热词到底是哪些,对于客户精确把握自身优势有非常重要的参考意义,如手机、用户、智能、市场、产品。对政府,它与当地的文化、经济、政治有着紧密关联,它只以数据实证当地的热词(关键词)到底是哪些,对于政府精确把握自身优势有非常重要的参考意义,如改革、美食、制造业。
媒体报道情绪态度曲线:媒体报道多数时候有一定的倾向性,或者说有一定的“情绪态度”,把握梳理“情绪态度曲线”的变化,可以发现客户媒体形象存在的问题,然后施以相应解决方案。情绪态度曲线能够勾勒出客户在媒体报道中的动态变化,热词解决精确度的问题,情绪态度曲线解决趋势的问题。明白了趋势,才能采取相应措施,加以引导、修补。
全球媒体形象分析装置,包括:
获取模块,用于获取媒体报道内容;
第一评分模块,用于对媒体报道内容提取内容关键词,根据识别模型和内容关键词,对媒体报道内容进行评分;
分类模块,用于按照预设维度将媒体报道内容分类成若干个维度,如果分析对象是企业,则预设维度包括:产品形象、组织形象、人员形象和品牌竞争力;如果分析对象是政府,则预设维度包括:企业家关注度、名人关注度和机构关注度;
第二评分模块,用于对每个维度的媒体报道内容提取内容关键词,根据识别模型和每个维度的内容关键词,对每个维度进行评分,得到子评分;
生成模块,用于根据媒体报道内容的评分、预设维度以及子评分形成可视化分析报告。
本发明采用机器学习的方式,自动抓取互联网中政企相关全球媒体报道信息,利用识别模型判断全球媒体报道情绪的正负面,通过相关关键词、正负面语义分析,从热词、企业、机构、名人、企业家、关注度、媒体报道情绪态度曲线等多个维度对政府、企业全球媒体形象予以界定得出全球媒体形象报告。
对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。