社交网络中情感分析技术研究

社交网络中情感分析技术研究

论文摘要

情感分析是舆情分析、热点挖掘、产品推荐等应用的重要基础。互联网,特别是社交网络,提供了丰富的情感信息。Twitter、Facebook及新浪微博正在快速发展,用户在这些社交网络的发言与行为深刻反映了他们的情感信息。然而,微博的文字短小,用户自身的行为也存在随意性等特点,使得传统的基于文本分析的情感分析方法难以适用。本文基于社会学的同质分析等理论,充分利用社交网络的网络特性,深入研究了基于用户关系特性的社交网络情感分析模型与方法。首先,针对用户博文结构化特征差、信息不足的缺陷,提出基于观点一致性的情感分析方法,实现用户级的情感分析。传统方法根据用户的博文内容判断用户的态度与情感。然而,微博用户之间的关系,如关注、转发等,本身又蕴含了丰富的信息。因此,新方法基于用户标签和共同好友,衡量用户之间的情感相似性,并根据影响力决定用户间行为数据的影响权重,最终,通过综合大量好友的信息,判断用户的真正情感。其次,针对许多用户社会关系信息缺失的现状,研究用户间隐含关系的挖掘机制,然后结合用户的显式关系,提出融合全面用户关系信息的情感分析方法,以支持博文级与用户级的情感分析。许多微博用户的显式关系仅仅反映了他们生活中的人际关系,不能反映他们对许多事件的真实情感。为此,运用社会学同质性理论,提出用户博文数据的相似性度量指标,结合博文之间的相似性、博文之间的回复关系、用户博文一致性等信息,推断用户间的隐含关系。在此基础上,进一步研究了融合全面用户关系信息的情感分析方法。基于来自新浪微博的数据集,实现并验证了以上工作的有效性。该数据集包含了新浪微博用户的社交关系数据、用户属性、用户行为数据等信息。实验结果表明,与现有方法相比,观点一致性方法的各项评测指标均更优,用户级的预测精度提高了16%。同时,在少量标注集的半监督环境下,融合用户关系信息的方法在博文级与用户级的预测精度上,至少提升了2%。总之,新方法通过分析用户的社会关系并挖掘隐含的用户关联,再与用户的显式关系相结合,获得了更准确的情感分析结果。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景和意义
  • 1.1.1 研究背景
  • 1.1.2 研究意义
  • 1.2 相关研究
  • 1.2.1 微博
  • 1.2.2 文本情感分析
  • 1.2.3 面临的挑战
  • 1.3 研究内容
  • 1.4 论文的组织结构
  • 第二章 情感分析综述
  • 2.1 情感信息的提取
  • 2.1.1 评价词的提取
  • 2.1.2 评价对象的提取
  • 2.1.3 观点持有者的提取
  • 2.2 情感信息的分类
  • 2.2.1 主客观信息的分类
  • 2.2.2 主观信息情感的分类
  • 2.3 情感信息的检索与归纳
  • 2.3.1 情感信息的检索
  • 2.3.2 情感信息的归纳
  • 2.4 情感分析评测
  • 2.4.1 NTCIR(NII test collection for IR systems)
  • 2.4.2 COAE(Chinese opinion analysis evaluation)
  • 2.5 本章小结
  • 第三章 基于观点一致性的情感分析方法
  • 3.1 相关背景
  • 3.1.1 动机
  • 3.1.2 相关理论和基础知识
  • 3.2 基于用户之间的相似性
  • 3.2.1 基于标签的相似性
  • 3.2.2 基于共同好友的相似性
  • 3.2.3 基于用户的相似性
  • 3.3 基于用户的影响力
  • 3.4 基于历史评论信息
  • 3.5 基于观点一致性(OAB)的情感分析方法
  • 3.6 实验准备与对比模型
  • 3.7 本章小结
  • 第四章 融合用户关系信息的情感分析方法
  • 4.1 基本思想
  • 4.2 用户之间的隐含关系
  • 4.2.1 用户之间的明确关系与隐含关系
  • 4.2.2 用户之间相似性关系
  • 4.2.3 隐含关系的运用
  • 4.3 博文之间的关系
  • 4.3.1 博文相似关系
  • 4.3.2 回复关系
  • 4.3.3 用户一致性
  • 4.4 融合用户关系(FUR)的情感分析方法
  • 4.5 实验准备与对比模型介绍
  • 4.5.1 实验准备
  • 4.5.2 对比模型介绍
  • 4.6 本章小结
  • 第五章 基于微博数据的实验验证
  • 5.1 实验数据集
  • 5.1.1 数据集获取
  • 5.1.2 数据预处理
  • 5.2 评测标准
  • 5.2.0 精确率(Precision)
  • 5.2.1 准确率(Accuracy)
  • 5.2.2 召回率(Recall)
  • 5.2.3 F1值
  • 5.3 基于观点一致性的情感分析方法
  • 5.3.1 对比实验和参数设置
  • 5.3.2 结果分析
  • 5.4 融合用户关系的情感分析方法
  • 5.4.1 对比实验和参数设置
  • 5.4.2 结果分析
  • 5.5 本章小结
  • 第六章 总结与展望
  • 6.1 工作总结
  • 6.2 工作展望
  • 致谢
  • 参考文献
  • 作者在学习期间取得的学术成果
  • 作者在学习期间参加的科研项目
  • 相关论文文献

    标签:;  ;  ;  ;  

    社交网络中情感分析技术研究
    下载Doc文档

    猜你喜欢