论文摘要
情感分析是舆情分析、热点挖掘、产品推荐等应用的重要基础。互联网,特别是社交网络,提供了丰富的情感信息。Twitter、Facebook及新浪微博正在快速发展,用户在这些社交网络的发言与行为深刻反映了他们的情感信息。然而,微博的文字短小,用户自身的行为也存在随意性等特点,使得传统的基于文本分析的情感分析方法难以适用。本文基于社会学的同质分析等理论,充分利用社交网络的网络特性,深入研究了基于用户关系特性的社交网络情感分析模型与方法。首先,针对用户博文结构化特征差、信息不足的缺陷,提出基于观点一致性的情感分析方法,实现用户级的情感分析。传统方法根据用户的博文内容判断用户的态度与情感。然而,微博用户之间的关系,如关注、转发等,本身又蕴含了丰富的信息。因此,新方法基于用户标签和共同好友,衡量用户之间的情感相似性,并根据影响力决定用户间行为数据的影响权重,最终,通过综合大量好友的信息,判断用户的真正情感。其次,针对许多用户社会关系信息缺失的现状,研究用户间隐含关系的挖掘机制,然后结合用户的显式关系,提出融合全面用户关系信息的情感分析方法,以支持博文级与用户级的情感分析。许多微博用户的显式关系仅仅反映了他们生活中的人际关系,不能反映他们对许多事件的真实情感。为此,运用社会学同质性理论,提出用户博文数据的相似性度量指标,结合博文之间的相似性、博文之间的回复关系、用户博文一致性等信息,推断用户间的隐含关系。在此基础上,进一步研究了融合全面用户关系信息的情感分析方法。基于来自新浪微博的数据集,实现并验证了以上工作的有效性。该数据集包含了新浪微博用户的社交关系数据、用户属性、用户行为数据等信息。实验结果表明,与现有方法相比,观点一致性方法的各项评测指标均更优,用户级的预测精度提高了16%。同时,在少量标注集的半监督环境下,融合用户关系信息的方法在博文级与用户级的预测精度上,至少提升了2%。总之,新方法通过分析用户的社会关系并挖掘隐含的用户关联,再与用户的显式关系相结合,获得了更准确的情感分析结果。
论文目录
摘要ABSTRACT第一章 绪论1.1 研究背景和意义1.1.1 研究背景1.1.2 研究意义1.2 相关研究1.2.1 微博1.2.2 文本情感分析1.2.3 面临的挑战1.3 研究内容1.4 论文的组织结构第二章 情感分析综述2.1 情感信息的提取2.1.1 评价词的提取2.1.2 评价对象的提取2.1.3 观点持有者的提取2.2 情感信息的分类2.2.1 主客观信息的分类2.2.2 主观信息情感的分类2.3 情感信息的检索与归纳2.3.1 情感信息的检索2.3.2 情感信息的归纳2.4 情感分析评测2.4.1 NTCIR(NII test collection for IR systems)2.4.2 COAE(Chinese opinion analysis evaluation)2.5 本章小结第三章 基于观点一致性的情感分析方法3.1 相关背景3.1.1 动机3.1.2 相关理论和基础知识3.2 基于用户之间的相似性3.2.1 基于标签的相似性3.2.2 基于共同好友的相似性3.2.3 基于用户的相似性3.3 基于用户的影响力3.4 基于历史评论信息3.5 基于观点一致性(OAB)的情感分析方法3.6 实验准备与对比模型3.7 本章小结第四章 融合用户关系信息的情感分析方法4.1 基本思想4.2 用户之间的隐含关系4.2.1 用户之间的明确关系与隐含关系4.2.2 用户之间相似性关系4.2.3 隐含关系的运用4.3 博文之间的关系4.3.1 博文相似关系4.3.2 回复关系4.3.3 用户一致性4.4 融合用户关系(FUR)的情感分析方法4.5 实验准备与对比模型介绍4.5.1 实验准备4.5.2 对比模型介绍4.6 本章小结第五章 基于微博数据的实验验证5.1 实验数据集5.1.1 数据集获取5.1.2 数据预处理5.2 评测标准5.2.0 精确率(Precision)5.2.1 准确率(Accuracy)5.2.2 召回率(Recall)5.2.3 F1值5.3 基于观点一致性的情感分析方法5.3.1 对比实验和参数设置5.3.2 结果分析5.4 融合用户关系的情感分析方法5.4.1 对比实验和参数设置5.4.2 结果分析5.5 本章小结第六章 总结与展望6.1 工作总结6.2 工作展望致谢参考文献作者在学习期间取得的学术成果作者在学习期间参加的科研项目
相关论文文献
标签:社交网络论文; 情感分析论文; 观点一致性论文; 关系信息论文;