基于评论分析的Blog观点提取技术研究

基于评论分析的Blog观点提取技术研究

论文摘要

Blog是一种基于RSS技术的信息交互平台,它是一种作者与读者以日志风格进行交互的中介,是一种崭新的信息传播和交互方式。与传统的网络信息相比,Blog具有动态性、交互性以及共享性等特点。为用户在互联网上发布信息和进行交互提供了方便。随着Blog的迅速发展,信息量的膨胀和信息源的无限增加使得互联网用户很难找到高质量的Blog。另一方面在Blog信息源中存在着大量的垃圾Blog,即使在一个高评价的Blog中也存在着大量的垃圾评论信息。给互联网用户的阅读与交流带来了不便。如何对Blog信息进行分析评定Blog的质量成为一个亟待解决并且及具有意义的问题。本文对基于评论分析的Blog观点提取技术进行了研究,目标是对Blog信息源进行评价得到读者对Blog的支持度。由于是从评论的角度分析Blog观点,发现在Blog中存在着大量的垃圾评论,因此本文的研究内容包括垃圾评论的识别过滤以及Blog观点提取。在对评论信息进行深入研究之后,发现垃圾评论具有评论内容高度重复性、垃圾评论者集合性、垃圾链接集合性以及垃圾评论发布时间的局部密集性等特征。本文针对垃圾评论的特征分别从内容角度、链接角度和发布时间角度对评论信息分析打分,通过得分与指定阈值的比较识别垃圾评论。对Blog结构进行深入研究之后,发现可以从评论数目、评论内容和评论中包含的情感词汇来分析。本文在垃圾评论识别过滤的基础上对评论信息进行分析,分别从上述三个角度分析对Blog打分,通过平衡因子得到Blog支持度。基于以上的研究成果,本文设计并实现了一个Blog观点提取的实验原型系统,包括了数据解析、垃圾评论过滤、情感词提取、观点提取等模块,为进行相关的算法实验和研究提供了一个基础平台。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景和意义
  • 1.1.1 研究的背景
  • 1.1.2 研究的意义
  • 1.2 国内外相关研究综述
  • 1.2.1 垃圾评论过滤技术现状
  • 1.2.2 观点分析研究现状
  • 1.3 研究问题的定义
  • 1.3.1 基本定义
  • 1.3.2 问题描述
  • 1.4 本文的结构安排
  • 第2章 Blog 基本理论
  • 2.1 引言
  • 2.2 BLOG 概述
  • 2.2.1 Blog 概念
  • 2.2.2 Blog 特点
  • 2.3 BLOG 数据模型
  • 2.4 本章小结
  • 第3章 垃圾评论过滤技术
  • 3.1 引言
  • 3.2 垃圾评论定义
  • 3.2.1 狭义的垃圾评论定义
  • 3.2.2 广义的垃圾评论定义
  • 3.3 垃圾评论特征
  • 3.3.1 评论内容高度重复性
  • 3.3.2 垃圾评论者集合性
  • 3.3.3 垃圾链接集合性
  • 3.3.4 垃圾评论发布时间的局部密集性
  • 3.4 垃圾评论识别技术
  • 3.5 垃圾评论过滤算法
  • 3.5.1 评论内容分析
  • 3.5.2 评论连接分析
  • 3.5.3 发布时间分析
  • 3.5.4 算法描述
  • 3.6 实验与分析
  • 3.6.1 实验数据描述
  • 3.6.2 算法评价标准
  • 3.6.3 算法性能分析
  • 3.6.4 垃圾评论过滤算法分析
  • 3.7 本章小结
  • 第4章 基于评论分析的Blog 观点标注算法
  • 4.1 引言
  • 4.2 BLOG 观点标注技术
  • 4.3 BLOG 的文本表示与特征选择
  • 4.3.1 构造特征空间
  • 4.3.2 文本表示
  • 4.3.3 特征项选择
  • 4.3.4 特征项权重计算
  • 4.4 BLOG 观点标注算法
  • 4.4.1 评论数目分析
  • 4.4.2 相似度分析
  • 4.4.3 特殊感情词汇分析
  • 4.4.4 算法描述
  • 4.5 实验与分析
  • 4.5.1 实验数据描述
  • 4.5.2 算法性能分析
  • 4.5.3 观点提取算法分析
  • 4.5.4 对比算法分析
  • 4.6 本章小结
  • 第5章 Blog 观点提取系统
  • 5.1 引言
  • 5.2 系统功能目标及开发环境
  • 5.2.1 系统功能目标
  • 5.2.2 开发平台及工具
  • 5.3 系统总体设计
  • 5.4 系统详细设计
  • 5.4.1 XML 解析模块
  • 5.4.2 垃圾评论过滤模块
  • 5.4.3 情感词提取模块
  • 5.4.4 Blog 观点提取模块
  • 5.5 系统可视化界面
  • 5.6 本章小结
  • 结论
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].高中物理Blog教研中存在的问题及解决策略[J]. 中国教育技术装备 2017(05)
    • [2].以Blog为平台的教育叙事研究与教师专业化发展[J]. 文教资料 2011(20)
    • [3].Blog在图书馆参考咨询工作中的应用[J]. 河南科技学院学报 2013(11)
    • [4].Blog在教师个人知识管理中的应用研究[J]. 中国科教创新导刊 2009(08)
    • [5].Blog档案袋评价的设计与实施[J]. 考试周刊 2011(45)
    • [6].草根的盛宴——基于Blog的教育叙事研究[J]. 时代教育(教育教学版) 2008(08)
    • [7].基于BLOG的艺术类学生网络交流应用研究[J]. 网友世界 2014(10)
    • [8].基于概率潜在语义分析的Blog个性化查询扩展研究[J]. 安阳师范学院学报 2013(02)
    • [9].基于Blog和Blog群组的网络协作学习研究[J]. 周口师范学院学报 2012(04)
    • [10].试论基于Blog的教育叙事与教师专业发展[J]. 科技视界 2012(33)
    • [11].Blog在医学信息检索教学中的辅助作用[J]. 医学信息学杂志 2011(07)
    • [12].基于Blog的教育叙事与教师专业发展研究[J]. 东方企业文化 2011(08)
    • [13].中学图书馆Blog应用现状及启示[J]. 图书情报工作 2011(S1)
    • [14].Blog在高等职业教育中的应用[J]. 电脑知识与技术 2010(11)
    • [15].基于博客(BLOG)的背越式跳高技术教学探索与实践[J]. 运城学院学报 2010(02)
    • [16].基于BLOG平台的教育叙事研究[J]. 河南科技学院学报(自然科学版) 2010(01)
    • [17].Blog——《文献检索与利用》课教学的辅助工具[J]. 情报探索 2010(05)
    • [18].博客(Blog)在“过程写作法”中的作用探究[J]. 长春理工大学学报(高教版) 2009(08)
    • [19].Blog在网络信息服务中的应用研究[J]. 潍坊学院学报 2009(04)
    • [20].基于博客(Blog)的过程写作法新探[J]. 陕西教育(高教版) 2009(05)
    • [21].博客(Blog)对大学生思想政治教育的影响及其对策[J]. 湖南医科大学学报(社会科学版) 2008(01)
    • [22].博客(Blog)技术在大学英语写作教学中的应用[J]. 西北医学教育 2008(05)
    • [23].博客(Blog)在成人教育中的应用研究[J]. 科技信息(学术研究) 2008(02)
    • [24].存在理论与blog虚拟学习社区的构建[J]. 湖北广播电视大学学报 2008(02)
    • [25].基于Blog的高校图书馆个性化服务[J]. 科技情报开发与经济 2008(17)
    • [26].博客(Blog)在图书馆中的应用探讨[J]. 电脑知识与技术 2008(19)
    • [27].基于Blog平台的高校学习型图书馆建设之思考[J]. 长春师范学院学报(自然科学版) 2008(08)
    • [28].基于BLOG的企业默会知识共享探讨[J]. 现代商贸工业 2008(09)
    • [29].Blog在初中物理教学中的应用[J]. 新课程(上) 2011(11)
    • [30].论Blog在个人知识管理中的应用[J]. 科技创新导报 2011(08)

    标签:;  ;  ;  

    基于评论分析的Blog观点提取技术研究
    下载Doc文档

    猜你喜欢