网络舆情分析关键技术研究

网络舆情分析关键技术研究

论文摘要

随着互联网的迅猛发展和网民数量的迅速增长,越来越多的人通过网络来表达自己的情绪和观点,由此网络便逐渐发展成为民意的集散地。在这种现实背景下,对一些突发事件和敏感案件的不实言论和恶意煽动,会欺骗和误导广大人民群众,因此有必要对网络上的话题和言论进行有效地监管,旨在从海量的网络文本数据中及时捕捉舆情的动态,它对维护社会稳定、构建和谐社会具有重要的现实意义。因此,对网络舆情分析技术的研究已成为一项十分紧迫的重要课题。本文对网络舆情分析的信息获取技术、信息预处理技术以及舆情信息分析技术进行了全面的介绍和分析,并重点研究了舆情分析系统中的两种关键技术文本特征选择和特征权重计算:(1)论文对特征选择问题进行研究。文本特征选择的信息增益算法通常会导致在指定类别中出现稀少而在其他类别中出现频繁的特征被选择出来,这显然并非特征选择所期望的结果。针对这一局限性,本文提出了基于特征分布补偿因子和惩罚因子的信息增益的改进方法。实验结果表明,改进的方法可以有效平衡特征出现与不出现时所带的信息量,能够取得较好的分类效果。(2)论文对特征权重计算问题进行研究。特征权重算法对文本分类系统的精确度有很大影响,传统的TFIDF算法未能考虑特征项在类间和类内的分布情况,本文在对传统算法和相关改进算法深入分析的基础上,引入了类间偏斜度、类内离散度和权重调整因子的改进思路,提出了WA-DI-SI的特征权重改进算法。实验结果表明,本文提出的改进算法较之其他改进算法,具有更好的分类效果。利用上述研究成果,本文设计了网络舆情分析系统的整体框架和各部分的工作流程,并实现了相关的功能。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 前言
  • 1.1 引言
  • 1.2 课题的研究背景和意义
  • 1.2.1 网络舆情基本概念
  • 1.2.2 网络舆情的特点
  • 1.2.3 网络舆情分析的意义
  • 1.3 国内外研究现状
  • 1.3.1 国外研究现状
  • 1.3.2 国内研究现状
  • 1.4 论文研究内容与章节组织
  • 1.4.1 论文研究内容
  • 1.4.2 论文章节组织
  • 第二章 网络舆情分析关键技术
  • 2.1 网络信息获取技术
  • 2.1.1 网络爬虫技术的工作原理
  • 2.1.2 网络爬虫技术的工作流程
  • 2.1.3 网络爬虫技术的比较与分析
  • 2.2 信息预处理技术
  • 2.2.1 网页清洗技术
  • 2.2.2 文本分词技术
  • 2.2.3 文本表示模型与特征选取技术
  • 2.2.4 文本分类算法
  • 2.3 网络舆情分析技术
  • 2.4 本章小结
  • 第三章 特征选择算法和权重计算算法的改进研究
  • 3.1 特征选择技术研究
  • 3.1.1 特征选择的定义
  • 3.1.2 特征选择的分类
  • 3.1.3 特征选择算法及相关改进研究
  • 3.2 基于补偿因子和惩罚因子的信息增益改进研究
  • 3.2.1 信息增益算法的分析
  • 3.2.2 信息增益算法的局限性与相关改进工作
  • 3.2.3 基于补偿因子和惩罚因子的信息增益改进研究
  • 3.2.4 实验方案
  • 3.2.5 实验结果及分析
  • 3.3 基于 WA-DI-SI 算法的特征权重改进研究
  • 3.3.1 TFIDF 特征权重算法
  • 3.3.2 TFIDF 算法的缺陷及相关改进工作
  • 3.3.3 基于 WA-DI-SI 算法的特征权重改进研究
  • 3.3.4 实验方案
  • 3.3.5 实验结果及分析
  • 3.4 本章小结
  • 第四章 网络舆情分析系统设计与实现
  • 4.1 系统整体架构
  • 4.2 系统功能模块设计
  • 4.2.1 信息采集子系统
  • 4.2.2 信息预处理子系统
  • 4.2.3 舆情分析子系统
  • 4.3 系统功能模块的实现
  • 4.4 本章小结
  • 第五章 结束语
  • 5.1 本文的工作总结
  • 5.2 今后的研究方向
  • 参考文献
  • 致谢
  • 个人简历
  • 相关论文文献

    • [1].基于数据挖掘技术的舆情分析系统的设计[J]. 电脑知识与技术 2020(03)
    • [2].基于多维度的公安舆情分析模型构建[J]. 情报探索 2020(03)
    • [3].公共卫生突发事件网络舆情与处置研究——基于新冠肺炎疫情的舆情分析[J]. 视听 2020(05)
    • [4].新加坡高层访华的网络舆情分析——以“2019·10王瑞杰访华”为例[J]. 文化与传播 2020(01)
    • [5].“可信”的云舆情分析平台[J]. 网络安全和信息化 2020(04)
    • [6].基于深度学习的“教育公平”网络舆情分析[J]. 情报探索 2020(06)
    • [7].期货行业智能舆情分析技术应用[J]. 信息技术与标准化 2020(05)
    • [8].2019年农药舆情分析及2020年展望[J]. 农药科学与管理 2020(07)
    • [9].区块链技术在舆情分析中的价值体现[J]. 青年记者 2020(18)
    • [10].大数据透视两会热点 把脉“后疫情时代”教育走向——2020全国两会教育舆情分析报告[J]. 中国民族教育 2020(06)
    • [11].高速公路工程建设期间舆情分析及其应对——以喀麦隆克里比深水港疏港高速公路(一期)工程建设为例[J]. 企业改革与管理 2020(11)
    • [12].灾害舆情分析系统的设计与实现[J]. 科学技术创新 2020(26)
    • [13].女子离汉抵京事件舆情分析[J]. 新闻研究导刊 2020(15)
    • [14].大数据环境下舆情分析与决策支持体系研究[J]. 牡丹江教育学院学报 2018(12)
    • [15].网络舆情分析系统中关键技术研究[J]. 山西警察学院学报 2019(01)
    • [16].把脉舆情分析[J]. 青年记者 2019(19)
    • [17].舆情分析师的自我修养[J]. 青年记者 2019(19)
    • [18].网络舆情分析的趋势:从大数据到长数据[J]. 青年记者 2018(20)
    • [19].基于互联网的数字媒体内容舆情分析系统[J]. 中国民族博览 2017(06)
    • [20].网上舆情分析研判体系的构建[J]. 电子技术与软件工程 2016(23)
    • [21].基于数据挖掘的高校网络舆情分析系统设计与实现[J]. 电子技术与软件工程 2016(23)
    • [22].《今日科技》杂志社(科技舆情分析研究所)载体产品展示[J]. 今日科技 2017(02)
    • [23].政法网络舆情分析与对策研究[J]. 法制博览 2017(14)
    • [24].近年来海外涉华图书舆情分析[J]. 国际传播 2017(03)
    • [25].舆情分析师培养机制探析[J]. 青年记者 2015(36)
    • [26].夹缝中的舆情分析师[J]. 财会月刊 2014(27)
    • [27].舆情分析报告的新闻属性探讨[J]. 青年记者 2016(19)
    • [28].论基于证据的教育舆情分析[J]. 教育研究 2016(07)
    • [29].大数据时代下的网络舆情分析系统[J]. 电子技术与软件工程 2016(17)
    • [30].“后舆情时代”的舆情分析[J]. 网络传播 2019(12)

    标签:;  ;  ;  ;  ;  

    网络舆情分析关键技术研究
    下载Doc文档

    猜你喜欢