关联规则挖掘算法在web日志挖掘中的应用研究

关联规则挖掘算法在web日志挖掘中的应用研究

论文摘要

随着网络在人们日常生活中的普及,越来越多的机构、团体和个人在Internet上发布和搜寻信息,使得Web上储存了海量的数据,这些数据为数据挖掘提供了丰富的资源。另一方面,Web数据的一些特性也对数据挖掘提出了巨大的挑战,这些挑战推动了数据挖掘技术在Web数据上的应用研究,即Web数据挖掘。Web数据挖掘是指利用数据挖掘或机器学习的方法从Web上大量的数据资源中发现有用知识。Web日志挖掘主要从web使用数据中发现使用模式,以便更好的理解用户并为基于网络的应用系统提供更好的服务。本文主要研究关联规则挖掘在Web日志挖掘中的应用。首先介绍了Web数据挖掘的含义、流程和分类。其次,本文对Web日志挖掘进行了深入的探讨,这一部分主要讨论了Web日志数据的采集和预处理的各个步骤以及各步骤常用的技术方法,另外本文还给出了Web日志模式发现过程中常用的技术以及Web日志挖掘的应用领域。之后,本文仔细研究了数据挖掘中的关联规则挖掘,文中先是给出了关联规则挖掘的基本概念,然后对两个经典算法Apriori和Eclat进行研究,重点给出了两个算法的思想和执行过程并分析了它们的优越性和局限性。在两个算法的分析结果上,本文给出了一个Eclat改进算法,并通过在各种数据集上的实验验证改进算法的性能,实验结果表明,本文给出的Eclat改进算法对稀疏数据集有较为理想的改进。最后,本文基于Web日志挖掘理论和关联规则挖掘算法给出了一个基于关联规则挖掘算法的Web日志挖掘原型系统的实现,并利用该系统对NASA HTTP数据集进行了挖掘。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状
  • 1.3 本文研究内容和结构安排
  • 第2章 Web数据挖掘和Web日志挖掘
  • 2.1 Web数据挖掘的含义
  • 2.2 Web数据挖掘的分类
  • 2.3 Web日志挖掘
  • 2.3.1 数据收集和预处理
  • 2.3.1.1 数据源及数据收集
  • 2.3.1.2 数据预处理
  • 2.3.2 模式发现及所用技术
  • 2.3.3 模式分析
  • 2.3.4 Web日志挖掘的应用
  • 第3章 关联规则挖掘算法研究
  • 3.1 关联规则挖掘
  • 3.1.1 相关概念
  • 3.1.2 挖掘步骤
  • 3.2 Apriori算法研究
  • 3.2.1 Apriori算法思想
  • 3.2.2 Apriori算法实现
  • 3.2.3 Apriori算法的局限
  • 3.3 Eclat算法研究
  • 3.4 Eclat改进算法
  • 3.4.1 Eclat算法的局限
  • 3.4.2 Eclat改进算法
  • 3.4.3 Eclat改进算法和Eclat算法的性能对比
  • 3.4.4 结论
  • 第4章 一个Web日志挖掘原型系统的实现
  • 4.1 开发环境与数据源
  • 4.2 系统设计
  • 4.2.1 系统总体架构
  • 4.2.2 主要功能
  • 4.2.2.1 数据预处理模块
  • 4.2.2.2 频繁模式挖掘模块
  • 4.2.2.3 关联规则挖掘模块
  • 4.3 系统实现
  • 4.3.1 数据预处理模块的实现
  • 4.3.2 频繁模式挖掘模块的实现
  • 4.3.3 关联规则挖掘模块的实现
  • 4.4 系统评价
  • 第5章 总结
  • 5.1 本文所做工作
  • 5.2 展望
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文目录
  • 学位论文评阅及答辩情况表
  • 相关论文文献

    • [1].基于云计算的Web日志挖掘模块设计[J]. 电脑与信息技术 2019(02)
    • [2].基于Web日志挖掘的个性化学习资源推荐模型研究[J]. 电脑知识与技术 2018(23)
    • [3].基于日志挖掘的移动搜索用户行为研究综述[J]. 情报理论与实践 2014(03)
    • [4].网络日志挖掘技术探究[J]. 硅谷 2010(14)
    • [5].日志挖掘技术及其应用[J]. 中国新技术新产品 2009(20)
    • [6].基于日志挖掘的电商查询建议方法[J]. 计算机工程与科学 2018(02)
    • [7].基于流程日志挖掘的专家平台设计[J]. 计算机工程 2008(20)
    • [8].基于访问日志挖掘的高校综合信息门户页面推荐研究[J]. 计算技术与自动化 2016(04)
    • [9].Web日志挖掘中的数据预处理研究[J]. 河南科技 2018(19)
    • [10].Web日志挖掘系统研究及设计[J]. 信息与电脑(理论版) 2014(16)
    • [11].基于Web日志的数据挖掘初探[J]. 电脑知识与技术 2010(27)
    • [12].基于聚类算法的电子商务日志挖掘商业智能研究[J]. 中国商贸 2014(01)
    • [13].基于Apriori算法的高校Web日志挖掘系统构建[J]. 中国林业教育 2019(02)
    • [14].基于日志挖掘的移动应用用户访问模型建模技术研究[J]. 计算机科学 2014(11)
    • [15].Web日志挖掘的研究[J]. 数字通信世界 2019(03)
    • [16].基于云计算的大规模网页日志挖掘研究[J]. 电脑知识与技术 2014(28)
    • [17].基于聚类的Web日志挖掘方法探析[J]. 商场现代化 2008(35)
    • [18].浅谈Web日志挖掘技术[J]. 科技致富向导 2010(27)
    • [19].基于Web日志挖掘的策略研究[J]. 电脑知识与技术 2011(31)
    • [20].基于Web日志挖掘的个性化教育系统的研究与实现[J]. 福建电脑 2009(06)
    • [21].Web日志挖掘中事务识别的研究[J]. 广东广播电视大学学报 2009(03)
    • [22].Web日志挖掘在图书馆中的应用探讨[J]. 江西图书馆学刊 2008(03)
    • [23].PUGA:Web日志挖掘模型[J]. 计算机工程与设计 2016(09)
    • [24].Web日志挖掘中的数据预处理研究[J]. 黑龙江科技信息 2014(31)
    • [25].聚类算法在Web日志挖掘中的研究[J]. 物联网技术 2015(07)
    • [26].基于日志挖掘的影像设备云监控系统的设计与应用研究[J]. 中国数字医学 2020(10)
    • [27].Web日志挖掘中的数据预处理技术研究[J]. 科技视界 2014(12)
    • [28].基于Web日志挖掘的个性化服务技术的研究[J]. 网络安全技术与应用 2010(06)
    • [29].Web日志挖掘技术在网络教学平台中的应用研究[J]. 制造业自动化 2009(11)
    • [30].基于SQL Server 2005的Web日志挖掘应用研究[J]. 现代计算机(专业版) 2008(12)

    标签:;  ;  ;  

    关联规则挖掘算法在web日志挖掘中的应用研究
    下载Doc文档

    猜你喜欢