论文摘要
随着互联网的发展,网络成为人们表达自己意见和情感的重要平台,网络舆情的收集及分析已成为相关部门获取民众思想和建议的一个有效手段。作为网络上比较活跃、参与人数比较多的网络交流方式,BBS所反映的舆情信息对相关的企业或部门掌握当前人们的思想动态、行为趋势显得尤为重要。BBS舆情信息的智能分析包括BBS舆情信息的获取、自动中文分词、自动提取关键词、分析热点话题和观点发展趋势等,实现以最小的人力物力开销达到最优化的舆情分析效果。BBS舆情分析系统实现BBS舆情信息分析的智能化管理,将论坛监控的工作交由系统来完成,实现最终可以不必人工地对各个BBS进行跟踪、监控,就能及时、准确地掌握所需的BBS信息。本文介绍了网络舆情分析系统的总体框架,该框架包括BBS信息自动获取、自动存储、自动分析、自动预测等功能。论述了一种改进的网络爬虫方法实现对BBS舆情信息的自动获取过程,通过对帖子内容进行中文分词和提取关键词,介绍了规则库的设计及信息的匹配过程,避免人工更新词库的滞后性和主观性,提出了一种改进的基于关联规则挖掘的算法,并做了相关的实验比较。本文还论述了热点话题的分析方法,并对得到的热点话题进行了科学评价和预测。本文在论述过程中对上述所描述的方法和功能都分别采用实例来说明方法的可靠性和有效性,这些实验也表明本课题所使用的研究方法具有较高的效率和准确性。
论文目录
摘要Abstract第1章 绪论1.1 研究背景和目的1.2 研究内容和意义1.3 国内外的研究现状1.4 论文组织1.5 本章小结第2章 网络舆情研究相关技术分析2.1 DOM树功能分析2.2 正则表达式2.3 中文分词及自动提取关键词技术2.4 热点话题分析及预测技术2.5 本章小结第3章 BBS舆情智能系统分析3.1 系统功能分析3.1.1 系统体系结构分析3.1.2 信息获取功能分析3.1.3 信息匹配过程分析3.1.4 热点分析模块分析3.2 系统流程分析3.3 知识规则库分析3.4 系统性能分析3.5 本章小结第4章 BBS舆情信息获取处理4.1 网络爬虫4.1.1 BBS爬虫的爬行策略4.1.2 BBS页面信息简化过程4.2 BBS信息获取方法4.2.1 基于表格结构的BBS信息获取方法4.2.2 基于非表格结构的BBS信息获取方法4.3 BBS网页信息预处理4.4 本章小结第5章 BBS舆情信息匹配方法的实现5.1 知识规则库的功能分析5.2 知识规则库动态更新方法的实现5.2.1 关联规则概述5.2.2 经典关联规则算法及改进5.2.3 关联分析的知识规则库的设计与实现5.3 信息匹配实验及结果分析5.4 本章小结第6章 热点话题分析与预测6.1 热点话题分析6.1.1 热点话题的自动获取6.1.2 热点话题自动获取实验分析6.1.3 热点话题评价6.1.4 热度评价实验及结果分析6.2 热点话题预测6.2.1 热点话题预测方法分析与实现6.2.2 热点话题预测实验及结果分析6.3 本章小结结论参考文献攻读硕士学位期间发表的论文和获得的科研成果致谢
相关论文文献
标签:舆情论文; 智能分析论文; 信息获取论文; 知识规则库论文; 热点话题论文;