论文摘要
随着Web2.0时代的到来,微博用户正以惊人的速度在增长。微博是一种允许用户发布短文本消息并通过关注机制分享信息的社交网络平台。近几年,微博凭借其海量的即时信息、开放和低门槛等特性在网民中快速渗透迅速成为热门事件的发酵场所。在社会矛盾日益激烈的现如今,对其用户影响力的研究具有极大的现实意义。微博的关注关系和信息的单向流通使得微博不仅具有社交属性,而且是信息传播的重要媒介。本文通过深入分析微博复杂网路的相关特性并结合微博网络的信息传播特性,研究微博网络的节点影响力,并最终取得了很好的实验结果。本论文的工作主要有以下几个方面:1)对新浪微博自媒体属性和传播模式进行分析,结合复杂网络相关特性,证明了利用社会化网络知识对微博网络节点进行分析的可行性。2)基于社会化网络节点属性和微博传播分析定义了微博网络节点影响力,结合pagerank算法,利用微博用户关注关系网络和微博信息传播网络设计了一种微博用户影响力评价算法。3)利用新浪微博API和第三方应用oauth认证、分布式爬取技术获取海量完整的新浪微博数据,mapreduce实现用户影响力评价算法。4)在hadoop分布式系统上,利用海量微博数据计算微博用户影响力,并将实验结果与实际微博数据进行对比分析。实验表明,该算法在微博服务中能有效的反映微博用户的真实影响力,适用于度量微博用户的影响力。微博网络中蕴含着丰富的数据资源,其研究价值和商业价值都很巨大。本文从网络节点用户影响力的角度对这一社会化网络进行分析,取得了很好的结果。本文的研究对微博舆情分析具有重要的理论和实际意义。
论文目录
摘要ABSTRACT第一章 绪论1.1 研究背景及意义1.2 国内外研究现状1.2.1 中外社交网络影响力工程应用现状1.2.2 学术界对微博影响力的研究现状1.3 本文的主要工作1.4 论文组织结构第二章 微博信息传播特征及影响力分析相关技术2.1 新浪微博自媒体特征2.1.1 互联网自媒体概要2.1.2 新浪微博自媒体特征2.1.3 新浪微博传播模型2.2 用户影响力评价算法中的关键技术2.2.1 Hadoop分布式系统架构2.2.2 PageRank算法2.2.3 数据挖掘技术2.2.4 复杂网络2.3 本章小结第三章 面向网络舆情的微博用户影响力评价算法3.1 社会化网络3.1.1 复杂网络的图表示3.1.2 图中节点的度与度分布3.1.3 社会化网络3.2 基于网络节点属性和信息传播的用户影响力定义3.2.1 新浪微博用户属性分析3.2.2 新浪微博信息传播影响因素分析3.2.3 解决僵尸粉影响措施3.2.4 基于微博网络信息传播的用户影响力定义3.3 基于链接分析的微博用户影响力评价算法3.3.1 用户潜在影响力Userank3.3.2 用户传播影响力Retrank3.3.3 用户影响力评价方法3.4 本章小结第四章 基于分布式系统的微博海量数据分析4.1 微博数据大规模获取4.1.1 新浪微博开放平台4.1.2 海量数据采集设计4.2 微博用户影响力算法的mapreduce实现4.3 本章小结第五章 实验与结果分析5.1 数据集描述5.2 实验过程5.2.1 集群搭建5.2.2 算法实现5.3 实验结果分析5.4 本章小结第六章 结束语致谢参考文献作者在学期间取得的学术成果
相关论文文献
标签:微博论文; 影响力论文; 信息传播论文; 海量数据论文;