基于云计算环境的web数据挖掘算法研究

基于云计算环境的web数据挖掘算法研究

论文摘要

目前,单一CPU节点的计算能力已经发展到一个瓶颈,而利用云计算技术,人们可以方便的通过网络获取强大的计算能力、存储能力以及基础设施。因此将消耗大量计算资源的复杂计算通过网络分布到多节点上进行计算的方式成为了新的有效的解决方案。Web数据挖掘是从Web超链接、网页内容和使用日志中探寻有用的信息的数据挖掘方法。Web Graph是Web数据挖掘中非常重要的用来描述web信息的数据结构。这种数据结构在Web页面爬取、搜索引擎结果排序以及社交网络等应用中更是有着非常广泛的应用。论文针对Web数据挖掘中Graph的算法在云计算环境中进行研究。论文介绍了Web Graph数据结构,搭建了云计算环境,提出社交网站用户Graph数据的获取方案,并使用力导向算法形象描述Graph数据;论文同时设计并优化了Web Graph直径的计算算法,并利用云计算环境进行了算法功能和性能测试,测试结果表明:在集群中部署分布式算法,可以显著提高Graph数据挖掘的效率。论文研究成果在搜索引擎以及社交网络分析领域具有较高的应用价值。

论文目录

  • 致谢
  • 摘要
  • ABSTRACT
  • 1 引言
  • 2 云计算和Web数据挖掘技术
  • 2.1 云计算
  • 2.1.1 云计算的分类和特点
  • 2.1.2 云计算的应用场景
  • 2.1.3 云计算技术的研究现状
  • 2.2 云计算的关键技术
  • 2.2.1 数据存储领域的核心技术
  • 2.2.2 数据管理领域的关键技术
  • 2.2.3 编程模型领域的关键技术
  • 2.3 Web数据挖掘概述
  • 2.3.1 Web Graph及其应用
  • 2.3.2 社交网络服务(Social Network Service)
  • 3 Web Graph数据的获取与展示
  • 3.1 Web Graph挖掘的数据结构和存储方案
  • 3.1.1 Web Graph算法使用的数据结构
  • 3.1.2 Web Graph数据的存储方式
  • 3.2 Graph数据的抓取
  • 3.2.1 申请Facebook应用程序
  • 3.2.2 开发Facebook应用程序获取用户关系
  • 3.3 Graph数据的形象化展示
  • 3.4 本章总结
  • 4 Graph挖掘算法
  • 4.1 Graph直径求解算法设计
  • 4.1.1 Graph的直径
  • 4.1.2 算法思想分析
  • 4.1.3 OptimDM算法的优化实现
  • 4.2 OptimDM算法的性能分析
  • 4.3 本章总结
  • 5 算法仿真实验与应用分析
  • 5.1 Hadoop平台的搭建
  • 5.1.1 Hadoop平台与OptimDM算法
  • 5.1.2 单节点Hadoop环境的搭建
  • 5.1.3 多节点分布式运行Hadoop
  • 5.1.4 基于Elicpse的MapReduce开发环境
  • 5.2 算法的仿真和性能测试
  • 5.2.1 传统单节点环境的图直径求解实验
  • 5.2.2 集群环境中OptimDM算法的实验
  • 5.3 OptimDM算法的应用
  • 5.4 本章总结
  • 6 总结和展望
  • 参考文献
  • 作者简历
  • 学位论文数据集
  • 相关论文文献

    • [1].中小银行数据挖掘思路浅析[J]. 金融电子化 2020(05)
    • [2].浅析大数据挖掘中抽样估计法的应用[J]. 现代信息科技 2019(21)
    • [3].基于大数据挖掘的广播电视客户价值分析[J]. 科技视界 2019(34)
    • [4].基于深度学习的工业领域数据挖掘方法及应用[J]. 数字技术与应用 2019(11)
    • [5].基于大数据思维的财务数据挖掘及应用研究[J]. 国际商务财会 2019(11)
    • [6].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(04)
    • [7].基于云计算的大数据挖掘体系构建分析[J]. 中外企业家 2020(11)
    • [8].测绘地理信息专业背景下的《时空数据挖掘》课程设计[J]. 南宁师范大学学报(自然科学版) 2020(01)
    • [9].智慧医疗下云数据挖掘在精细化医疗管理中的应用[J]. 中医药管理杂志 2020(03)
    • [10].高校管理人员教育数据挖掘能力培养的实践价值与实施路径[J]. 中国教育信息化 2020(07)
    • [11].大数据环境下的数据挖掘课程教学探索[J]. 中国新通信 2020(06)
    • [12].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(05)
    • [13].基于云计算的大数据挖掘内涵及解决方案研究[J]. 数字通信世界 2020(03)
    • [14].基于可拓数据挖掘的建筑立面设计方法研究[J]. 科技传播 2020(08)
    • [15].数据挖掘实践教学环节探索[J]. 科技经济导刊 2020(11)
    • [16].大数据挖掘与云服务模式的构建[J]. 江西电力职业技术学院学报 2020(01)
    • [17].医疗云存储下医院信息数据挖掘及实现技术的探索[J]. 信息与电脑(理论版) 2020(05)
    • [18].高校治理视阈下教育数据挖掘的应用与挑战[J]. 高教论坛 2020(04)
    • [19].大数据挖掘与分析的关键技术研究[J]. 中国新通信 2020(08)
    • [20].浅析数据挖掘[J]. 内江科技 2020(06)
    • [21].教育数据挖掘关键技术应用研究[J]. 轻纺工业与技术 2020(06)
    • [22].物联网海上舰船航行数据挖掘方法[J]. 舰船科学技术 2020(12)
    • [23].云环境中大数据挖掘的有效花费研究[J]. 上海理工大学学报 2020(03)
    • [24].对《零售数据挖掘与应用》课程教学的思考[J]. 知识经济 2020(18)
    • [25].教育数据挖掘和学习分析研究进展[J]. 牡丹江师范学院学报(自然科学版) 2020(03)
    • [26].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(08)
    • [27].电商市场中大数据挖掘的分析以及决策探究[J]. 中国新通信 2020(12)
    • [28].关于大数据挖掘中的数据分类算法技术的研究[J]. 电脑知识与技术 2020(20)
    • [29].长输油气管道大数据挖掘与应用[J]. 物联网学报 2020(03)
    • [30].数据挖掘实践课程教学模式的探索[J]. 教育教学论坛 2020(36)

    标签:;  ;  ;  ;  

    基于云计算环境的web数据挖掘算法研究
    下载Doc文档

    猜你喜欢