互联网和大数据技术发展使得社会舆情治理出现新的治理形态,也使得网络舆情的治理方式得到了改变。在这种社会治理新方式的背景下,从属于社会舆情管理的民族关系舆情的治理也得到了改变。将大数据技术与网络舆情的监测相结合,通过实时监测网络民族关系舆情,对民族关系舆情进行预警。
(一)大数据背景下的网络舆情监测大数据来源众多,除了互联网上的数据信息,各个企业内部也拥有大量用户信息,如电子平台和移动商务拥有大量的实时交易数据、实时评论数据,搜索公司拥有大量的用户关注点的数据,微博、微信则包含了众多的舆情信息。大数据挖掘技术可以将隐含其中的一些知识及信息挖掘出来,为决策者提供依据,不仅有利于提高社会舆情的监管能力与相关部门的决策水平,还有利于营造和谐共处的互联网舆情环境与健康的社会舆情环境。具体来说,大数据在民族关系舆情监测预警中的应用如下:
1.民族舆情信息的智能化收集与处理。大数据技术能有效降低舆情监测预警中的信息采集成本,并能提高信息的准确率,提高民族舆情信息收集的智能化程度。基于大数据爬虫技术的数据可自动收集和处理,并实现数据资料与预警系统的实时化递交,对舆情信息的文档进行实时分析。对于预警系统中与民族相关的资料,可运用大数据的文档解析方法来提取关键要素,并使用文档存储服务将这些数据文档存在民族舆情数据库中,实时监测预警舆情发展动态,实现大数据技术对监测预警系统的辅助能力,从而实现民族舆情信息的智能化收集与处理。
2.民族关系和谐性舆情监测预警过程。将大数据应用于民族关系监测预警,就是利用大数据收集及爬虫技术对网络上的海量信息进行爬取、分类、监测、聚焦及文本情感倾向性分析,找出关键词以实现舆情信息自动收集、自动存储、自动处理和预警,并以大数据可视化技术将预警结果及实施过程以图展示,为民族事务部门提供决策支持,了解舆情发展的动态。
3.民族关系网络舆情信息的大数据分析。以网络上涉及民族关系的热点话题、热门事件、意见领袖和涉及群体作为针对性的分析对象,运用大数据技术与手段对网络民族关系舆情信息进行分析,为采取主动调控措施提供决策支持与依据。采取大数据技术识别民族关系网络热点事件,并对网络个体行为进行情感倾向性算法的分析,以挖掘和预测整个群体对舆情信息行为的影响。
4.跨部门民族舆情管理。通过构建大数据基础下的民族关系舆情知识库,利用大数据挖掘技术与机器学习算法分析舆情扩散中政府各部门间的工作任务的相关关系,协调各部门的职责和分工,结合大数据技术建立智能舆情监控预警决策支持系统,为各个部门提供智能化的决策服务。
由上可以看出大数据在民族关系网络舆情监测预警中具有应用空间。政府相关部门拥有大量的民族信息资源,但这些大多处于休眠状态,而大数据技术可以改变这种现象,为民族网络舆情监测预警与管理提供良好的决策支持能力。
(二)民族关系网络舆情的情感分析流程
民族关系问题是社会管理领域的重要问题之一,尤其是在多民族的国家,有关民族关系问题的社会事件非常容易受到大家的关注,在网络上引起大量转发和评论,从而形成社会热点话题。民族问题热点事件的公众情绪是民族关系和谐性的重要反映,因此与民族关系相关的网络舆情监测对促进民族关系的和谐发展具有重要意义。结合民族关系舆情监测预警的一般过程,基于文本情感倾向性分析技术提出了民族关系问题的网络舆情情感倾向监测预警的详细流程,主要包括民族问题热点事件的识别、文本数据收集、网络评论文本情感倾向性分析以及情绪指数计算与分级预警四个阶段。
1.民族问题热点事件的识别。社会热点事件往往由一个突发事件引起,并受到广大网民的关注,在互联网会有大量的转发和评论。因此,可以根据新闻发布的权威度、转发次数、评论数量和评论时间密集程度等参数,识别出特定时间段内的热门话题。对于特定领域问题的识别,可以利用关键字布控和语义分析,识别敏感话题。在民族关系问题的热点事件识别中,可以设定少数民族民族地区民族自治民族政策民族矛盾和民族冲突等关键词来缩小识别范围,再根据转发量、评论量和持续时间等参数来识别具体热点话题或事件。
2.文本数据收集和处理阶段。在热点事件识别的基础上,可利用网络爬虫工具获取网络评论文本资料,并经过预处理后按规定格式存入数据库。文本预处理具体包含去掉无关文本和重复项,并且删除带有URL、@与#等符号的内容;利用中文分词软件将文本进行分解,标注词性并去掉停用词。
文本数据是自然语言的表达,它与关系型数据库不同,属于非结构化数据,复杂程度较高,难以用简单数据分析方法进行处理。因此,有必要通过文本抽取技术确定文本的元数据为文本的特征代表,并将其转变成标准的具有内容特征的文本模型。常用的文本特征表示方法有向量空间模型、布尔模型及概率模型。向量空间模型把文本数据抽取成特征项作为基本的语言单位。文本被视为特征项的一个N维空间的向量,并将此向量表示为此文档的向量。布尔模型是基于集合论和布尔代数的一种检索模型,每个文档都有关键词的集合构成,K=(k1,k2,,kn),检索结果被表示为布尔的关键词组合,用或、与、非逻辑符号链接,以括号表示次序。文档要能被检索出来,必须满足布尔代数检索形式。布尔代数的缺点在于忽略文档中单词的频数,遗失部分信息。为消除布尔模型中的不确定性而提出了概率模型,它补偿了布尔模型值只存储特征值信息的缺陷,还存储了特征值频数的信息。
3.网络评论文本情感倾向性分析。网络评论文本情感倾向分析是指判断网络用户发表文本所表达观点的情绪是积极、消极还是中立的,情感分析方法主要有基于情感词典和机器学习的两种方法。语义文本情感倾向分析法对文本中表述情感的词进行积极或消极的语义分析来判断文本的情感倾向,或者利用情感词库,将分词后的网络文本与情感词库匹配,并根据程度词库配以相应权重,对文本情感进行量化分析,可得到文本的综合情感倾向。
4.情绪指数计算与分级预警。情感分析又称观点挖掘,是利用自然语言处理技术对文本进行语义分析,挖掘文本中所包含的情感倾向或观点。情感倾向一般表现为积极、消极和中立这3种态度,分别统计三种情感倾向的评论数量,按照某种机器学习算法或指标集的综合评价方法,将计算出的情绪分数(-1,1)按照预警等级分为五级:Ⅰ级(-1,-0.6)、Ⅱ级(-0.6,-0.4)、Ⅲ级(-0.4,-0.2)、Ⅳ级(-0.2,0.2)、Ⅴ级(0.2,1)。I级、II级表示民族关系舆情警情严重:I级表示国内外网络媒体(如微博等)与网民对该民族关系舆情关注度极高,并且网民多持负面的评价,传播速度较快,影响扩散范围广,民族关系舆情即将转化为群体性行为舆论,群体性事件发生的可能性较大;II级表示国内主流网络媒体与网站关注度高,此时境外媒体开始关注,传播速度快,舆情影响扩散到很大范围,有转化为行为舆论的可能。
(三)民族关系网络舆情预警机制的运行
民族关系网络舆情预警系统的及时性和精确性是民族关系问题得以解决的关键。考虑到网络舆情的动态性和不确定性,民族事务工作人员应建立持续追踪监测系统、分析判断系统、预警警报系统以及事后处理系统,用来确保预警系统真正发挥相应作用。而且整个预警系统离不开计算机技术的支持,包括网络数据信息挖掘和网络内容动态分析方法等。
持续追踪监测系统不仅强调对网民的民情民意进行追踪记录、及时分析,尤其关注那些发帖量、评论数以及点赞数最高的民族事件,还需关注政府监测部门的执行力以及意见领袖的号召力,提高相关工作人员的积极性,充分发挥政府的监测预警作用。分析判断系统是在民族关系舆情信息资源库和案例库的基础上运作的,舆情信息库为分析判断提供各类实时信息,有利于及时掌握民族关系舆情的发展方向,了解网民对民族事件的情感倾向;而民族关系案例库则为民族事件发生后提供待参考的解决方案,并将一些拥有丰富预警工作经验的专家意见加入数据库,提高准确性和说服力,在这个过程中还需不断丰富完善资源库的内容。
预警警报系统是在分析判断的基础上设置的,根据网络舆情的发展态势和其是否超出政府的可控范围来判断是否需要发出警报,为相关部门提供足够时间准备应急策略,其中关键部分在于已设定的指标体系是否能正确反映网络舆情的现状。事后处理系统一般在应急处理民族网络舆情事件后启动,主要在政府引导、媒体支持以及公众参与的情况下进行,其中包括对舆情事件中受到伤害的人员进行相应的补偿和心理咨询,对民族网络舆情事件的起因、过程、影响、教训等进行调查和总结,并按照实际情况开展恢复工作。来源:《青海社会科学》2019年第4期 作者:张劲松 黄华 章凤君 节选:基于网络舆情情感分析的民族关系监测预警研究
公关公司导航:危机公关 上海公关公司 北京公关公司 深圳公关公司 广州公关公司 杭州公关公司 成都公关公司 关于倍酸公关