互联网舆情分析关键技术的研究与实现

互联网舆情分析关键技术的研究与实现

论文摘要

随着互联网用户爆炸式的增长,受众群体越来越广。在缺乏有效管理的互联网上,对一些敏感案件和突发事件的不实言论和恶意煽动,误导和欺骗了广大人民群众,扩大了人民群众的不满情绪,影响和破坏了社会的和谐稳定。互联网信息的健康程度已引起各级政府的高度重视,有必要对互联网上涉及意识形态安全的议题和言论进行有效地监管。互联网网页每天都以指数级的方式增长,要人工去甄别每个网页所含的信息,并加以分析统计是不现实的。只有采用计算机自动处理技术,使其自动地对互联网舆情进行分析、整理,才能建立起全面、有效、快速的舆情监测预警机制,使互联网得以健康、快速的发展。因此,对互联网舆情的获取与分析技术的研究已成为一项紧迫而又重要的课题。本文对文本的语义倾向性分析这一关键技术进行了深入地研究,通过分析现有语义倾向性识别技术的优缺点,结合隐马尔科夫模型在文本处理方面的良好表现,将本文研究的文本语义倾向性分析方法应用到互联网舆情分析系统中,对舆情信息进行分析,并提供舆情预警功能。文本的语义倾向性分析的目的是判断文本针对评价对象所持有的情感倾向是支持、反对还是中立。由于相似的评论文本,其内容必定有一定的内在联系。互联网舆情信息的表现方式多种多样,本文以网络评论为研究对象,试图将隐马尔科夫模型从已经成功应用的模式识别领域推广到语义倾向性分析系统。与传统倾向性识别系统不同的是,此理论通过建立隐马尔科夫分类模型,将未知文本进行状态序列化,得到文本中所有具有语义倾向的词语所对应的倾向性,然后选定多数词的倾向性来作为文本的总体语义倾向。本文实验系统采用Myeclipse7.0平台的集成开发环境开发,分为语料采集、构建模型和语义识别三个模块。语料采集模块为其它两个模块提供数据支持。构建模型模块将采集得到的数据作为语料进行训练,得到语义识别模型;语义识别模块完成对指定的文本的语义倾向性识别。本文通过对腾讯新闻论坛的数据分别进行封闭测试和开放测试,结果表明,该分析模型可以很好地识别各种未知文本的语义倾向性,并且当训练数据越全面,规模越大时,获得的识别率更高、更稳定。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 引言
  • 1.2 舆情相关理论研究现状
  • 1.2.1 国外研究现状
  • 1.2.2 国内研究现状
  • 1.3 研究的目的与意义
  • 1.4 论文的主要内容
  • 1.4.1 论文的章节组织
  • 第2章 互联网舆情分析理论
  • 2.1 网络舆情基本概念
  • 2.2 网络舆情特点
  • 2.3 舆情分析系统功能
  • 2.4 舆情分析的作用
  • 2.5 本章小结
  • 第3章 基于隐马尔科夫模型的语义倾向性分析理论
  • 3.1 文本语义倾向性理论
  • 3.2 隐马尔科夫模型
  • 3.2.1 隐马尔科夫模型的由来
  • 3.2.2 Markov过程和Markov链
  • 3.2.3 HMM的基本概念
  • 3.2.4 HMM的三个问题及典型算法
  • 3.3 文本语义倾向性分析技术
  • 3.4 基于HMM文本语义倾向性分析技术
  • 3.4.1 建立HMM初始参数
  • 3.4.2 语义倾向识别
  • 3.5 本章小结
  • 第4章 互联网舆情分析系统设计
  • 4.1 相关工具介绍
  • 4.1.1 网页抓取工具-Heritrix
  • 4.1.2 网页解析工具-HtmlParser
  • 4.1.3 中文分词系统-ICTCLAS4J
  • 4.1.4 建模工具-Jahmm
  • 4.2 系统整体设计
  • 4.2.1 语料采集模块设计
  • 4.2.2 构建模型模块设计
  • 4.2.3 语义识别模块设计
  • 4.3 实验与分析
  • 4.4 本章小结
  • 第5章 总结与展望
  • 5.1 论文总结
  • 5.2 研究展望
  • 致谢
  • 参考文献
  • 攻读硕士学位期间发表的论文情况
  • 附录A
  • 相关论文文献

    • [1].基于微博数据的“新冠肺炎”互联网舆情分析[J]. 今日科苑 2020(02)
    • [2].基于天翼云的互联网舆情大数据系统建设研究[J]. 江苏通信 2020(02)
    • [3].大数据时代民族地区互联网舆情预警与控制机制研究[J]. 未来与发展 2019(07)
    • [4].高校互联网舆情监管及其对策研究[J]. 世纪桥 2018(10)
    • [5].基于大数据的互联网舆情监管系统设计与实现[J]. 广播与电视技术 2017(10)
    • [6].移动互联网舆情育人价值的实现逻辑与提升路径[J]. 湖南社会科学 2016(02)
    • [7].基于系统动力学的互联网舆情传递及引导策略研究[J]. 情报科学 2016(10)
    • [8].大数据时代的汽车产品缺陷互联网舆情[J]. 环球市场信息导报 2017(14)
    • [9].2016互联网群体博弈与重构[J]. 人民周刊 2017(02)
    • [10].互联网舆情引导策略研究[J]. 辽宁工业大学学报(社会科学版) 2013(06)
    • [11].互联网舆情热点分析统计方法研究[J]. 科技促进发展 2010(S1)
    • [12].高校互联网舆情监测系统研究[J]. 信息技术与信息化 2020(02)
    • [13].大型企业互联网舆情监测与应对分析[J]. 中国管理信息化 2019(05)
    • [14].高校互联网舆情人才素养体系的构建与思考[J]. 采写编 2018(06)
    • [15].关于建设新疆互联网舆情监测体系的几点思考[J]. 学理论 2014(29)
    • [16].移动互联网舆情视域下的大学生思想政治教育研究[J]. 考试周刊 2013(59)
    • [17].移动互联网舆情新特征、新挑战与对策[J]. 情报杂志 2014(03)
    • [18].移动互联网舆情生成机制研究[J]. 南京邮电大学学报(社会科学版) 2013(02)
    • [19].互联网舆情信息监测、预测、预警评价指标体系的研究——以天津市信息中心为例[J]. 信息系统工程 2012(04)
    • [20].中外互联网舆情管控法律体系比较分析[J]. 上海公安高等专科学校学报 2012(03)
    • [21].基于政务需求的互联网舆情监测分析研究[J]. 电子政务 2012(09)
    • [22].一种互联网舆情监控软件实现[J]. 电脑知识与技术 2012(34)
    • [23].新形势下互联网舆情的监测导控[J]. 安徽警官职业学院学报 2011(06)
    • [24].互联网舆情挖掘研究述略[J]. 情报资料工作 2010(02)
    • [25].新时代互联网舆情信息工作探析[J]. 新媒体研究 2018(22)
    • [26].移动互联网舆情监控体系相关技术研究[J]. 信息网络安全 2017(09)
    • [27].互联网舆情监测系统在高校校园网中的应用[J]. 电脑知识与技术 2016(03)
    • [28].《一月互联网舆情事件数据统计报告》[J]. 商业文化 2015(07)
    • [29].《十一月互联网舆情事件数据统计报告》[J]. 商业文化 2015(01)
    • [30].《十二月互联网舆情事件数据统计报告》[J]. 商业文化 2015(04)

    标签:;  ;  ;  

    互联网舆情分析关键技术的研究与实现
    下载Doc文档

    猜你喜欢