面向网络舆情的微博用户影响力分析

面向网络舆情的微博用户影响力分析

论文摘要

随着Web2.0时代的到来,微博用户正以惊人的速度在增长。微博是一种允许用户发布短文本消息并通过关注机制分享信息的社交网络平台。近几年,微博凭借其海量的即时信息、开放和低门槛等特性在网民中快速渗透迅速成为热门事件的发酵场所。在社会矛盾日益激烈的现如今,对其用户影响力的研究具有极大的现实意义。微博的关注关系和信息的单向流通使得微博不仅具有社交属性,而且是信息传播的重要媒介。本文通过深入分析微博复杂网路的相关特性并结合微博网络的信息传播特性,研究微博网络的节点影响力,并最终取得了很好的实验结果。本论文的工作主要有以下几个方面:1)对新浪微博自媒体属性和传播模式进行分析,结合复杂网络相关特性,证明了利用社会化网络知识对微博网络节点进行分析的可行性。2)基于社会化网络节点属性和微博传播分析定义了微博网络节点影响力,结合pagerank算法,利用微博用户关注关系网络和微博信息传播网络设计了一种微博用户影响力评价算法。3)利用新浪微博API和第三方应用oauth认证、分布式爬取技术获取海量完整的新浪微博数据,mapreduce实现用户影响力评价算法。4)在hadoop分布式系统上,利用海量微博数据计算微博用户影响力,并将实验结果与实际微博数据进行对比分析。实验表明,该算法在微博服务中能有效的反映微博用户的真实影响力,适用于度量微博用户的影响力。微博网络中蕴含着丰富的数据资源,其研究价值和商业价值都很巨大。本文从网络节点用户影响力的角度对这一社会化网络进行分析,取得了很好的结果。本文的研究对微博舆情分析具有重要的理论和实际意义。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状
  • 1.2.1 中外社交网络影响力工程应用现状
  • 1.2.2 学术界对微博影响力的研究现状
  • 1.3 本文的主要工作
  • 1.4 论文组织结构
  • 第二章 微博信息传播特征及影响力分析相关技术
  • 2.1 新浪微博自媒体特征
  • 2.1.1 互联网自媒体概要
  • 2.1.2 新浪微博自媒体特征
  • 2.1.3 新浪微博传播模型
  • 2.2 用户影响力评价算法中的关键技术
  • 2.2.1 Hadoop分布式系统架构
  • 2.2.2 PageRank算法
  • 2.2.3 数据挖掘技术
  • 2.2.4 复杂网络
  • 2.3 本章小结
  • 第三章 面向网络舆情的微博用户影响力评价算法
  • 3.1 社会化网络
  • 3.1.1 复杂网络的图表示
  • 3.1.2 图中节点的度与度分布
  • 3.1.3 社会化网络
  • 3.2 基于网络节点属性和信息传播的用户影响力定义
  • 3.2.1 新浪微博用户属性分析
  • 3.2.2 新浪微博信息传播影响因素分析
  • 3.2.3 解决僵尸粉影响措施
  • 3.2.4 基于微博网络信息传播的用户影响力定义
  • 3.3 基于链接分析的微博用户影响力评价算法
  • 3.3.1 用户潜在影响力Userank
  • 3.3.2 用户传播影响力Retrank
  • 3.3.3 用户影响力评价方法
  • 3.4 本章小结
  • 第四章 基于分布式系统的微博海量数据分析
  • 4.1 微博数据大规模获取
  • 4.1.1 新浪微博开放平台
  • 4.1.2 海量数据采集设计
  • 4.2 微博用户影响力算法的mapreduce实现
  • 4.3 本章小结
  • 第五章 实验与结果分析
  • 5.1 数据集描述
  • 5.2 实验过程
  • 5.2.1 集群搭建
  • 5.2.2 算法实现
  • 5.3 实验结果分析
  • 5.4 本章小结
  • 第六章 结束语
  • 致谢
  • 参考文献
  • 作者在学期间取得的学术成果
  • 相关论文文献

    标签:;  ;  ;  ;  

    面向网络舆情的微博用户影响力分析
    下载Doc文档

    猜你喜欢