基于概念格的Web日志挖掘的研究

基于概念格的Web日志挖掘的研究

论文摘要

随着Web资源的不断丰富和增加,Web站点结构变得越来越复杂,传统的Web站点缺乏智能性和主动性,因此,面对复杂而庞大的万维网,人们不容易找到自己感兴趣的信息,同时Web站点和Web服务器的设计难度也相应提高,这就需要对Web站点进行优化以提供智能的Web服务,如个性化服务、自适应站点等。而优化站点的一个重要依据就是用户的访问行为,由于Web日志详细地记录了用户的访问信息,具有丰富的内涵。因此,Web日志挖掘能够有效地发现用户的访问模式,为站点改进提供依据,从而解决以上问题。本文讨论了Web日志挖掘的过程为数据预处理、模式发现和模式分析;详细地分析了Web日志挖掘数据预处理阶段的各项任务以及Web日志挖掘中的各种模式发现方法和技术;分析了采用Godin算法在构造概念格时需要遍历原始概念格中的所有节点才能确定新概念的产生子,提出了使用树结构的搜索方法来缩小新概念的产生子及其父节点的搜索范围以完成概念格的更新,提高和改善了概念格的构造效率。本文将概念格理论应用于Web日志挖掘的模式发现,解决了Web日志的增量挖掘问题;研究了基于概念格的关联规则的挖掘,提出了一种从最大频繁项集产生所有强关联规则的优化方法,减少了模式发现中频繁项集的发现时间和不必要的规则的产生,从而提高了模式发现的效率。概念格的渐进式构造算法的优点在于可以实现概念格的维护和更新,从而使得Web日志挖掘模式发现方法能够有效地实现智能Web服务所需要的模式库的更新。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状
  • 1.2.1 Web 日志挖掘
  • 1.2.2 概念格
  • 1.3 论文组织
  • 第二章 Web 日志挖掘过程的研究
  • 2.1 数据来源
  • 2.2 Web 日志挖掘模型
  • 2.3 数据预处理
  • 2.3.1 数据清洗
  • 2.3.2 用户识别
  • 2.3.3 会话识别
  • 2.3.4 路径补充
  • 2.3.5 预处理结果
  • 2.4 模式发现
  • 2.4.1 页面关联知识发现
  • 2.4.2 访问序列模式发现
  • 2.4.3 类知识发现
  • 2.4.4 路径挖掘
  • 2.4.5 统计分析
  • 2.5 模式分析
  • 2.6 小结
  • 第三章 概念格及其构造算法的改进
  • 3.1 概念格的基本知识
  • 3.1.1 格的基本理论
  • 3.1.2 概念格理论的基本概念
  • 3.2 概念格的构造
  • 3.2.1 批处理算法
  • 3.2.2 渐进式算法
  • 3.3 渐进式构造算法的改进
  • 3.3.1 Godin 算法分析
  • 3.3.2 算法改进
  • 3.3.3 实验比较
  • 3.4 小结
  • 第四章 基于概念格的用户访问模式发现的研究
  • 4.1 增量更新问题
  • 4.2 关联规则挖掘及其优化
  • 4.2.1 关联规则挖掘问题
  • 4.2.2 关联规则生成方法的优化
  • 4.3 基于概念格的页面关联规则挖掘
  • 4.3.1 页面关联规则挖掘的目的
  • 4.3.2 相关定义描述
  • 4.3.3 概念格的形成
  • 4.3.4 基于概念格的关联规则发现
  • 4.3.5 实验分析及评价
  • 4.4 小结
  • 第五章 总结与展望
  • 5.1 本文的研究工作
  • 5.2 进一步的工作
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表的论文
  • 相关论文文献

    • [1].基于云计算的Web日志挖掘模块设计[J]. 电脑与信息技术 2019(02)
    • [2].基于Web日志挖掘的个性化学习资源推荐模型研究[J]. 电脑知识与技术 2018(23)
    • [3].基于日志挖掘的移动搜索用户行为研究综述[J]. 情报理论与实践 2014(03)
    • [4].网络日志挖掘技术探究[J]. 硅谷 2010(14)
    • [5].日志挖掘技术及其应用[J]. 中国新技术新产品 2009(20)
    • [6].基于日志挖掘的电商查询建议方法[J]. 计算机工程与科学 2018(02)
    • [7].基于流程日志挖掘的专家平台设计[J]. 计算机工程 2008(20)
    • [8].基于访问日志挖掘的高校综合信息门户页面推荐研究[J]. 计算技术与自动化 2016(04)
    • [9].Web日志挖掘中的数据预处理研究[J]. 河南科技 2018(19)
    • [10].Web日志挖掘系统研究及设计[J]. 信息与电脑(理论版) 2014(16)
    • [11].基于Web日志的数据挖掘初探[J]. 电脑知识与技术 2010(27)
    • [12].基于聚类算法的电子商务日志挖掘商业智能研究[J]. 中国商贸 2014(01)
    • [13].基于Apriori算法的高校Web日志挖掘系统构建[J]. 中国林业教育 2019(02)
    • [14].基于日志挖掘的移动应用用户访问模型建模技术研究[J]. 计算机科学 2014(11)
    • [15].Web日志挖掘的研究[J]. 数字通信世界 2019(03)
    • [16].基于云计算的大规模网页日志挖掘研究[J]. 电脑知识与技术 2014(28)
    • [17].基于聚类的Web日志挖掘方法探析[J]. 商场现代化 2008(35)
    • [18].浅谈Web日志挖掘技术[J]. 科技致富向导 2010(27)
    • [19].基于Web日志挖掘的策略研究[J]. 电脑知识与技术 2011(31)
    • [20].基于Web日志挖掘的个性化教育系统的研究与实现[J]. 福建电脑 2009(06)
    • [21].Web日志挖掘中事务识别的研究[J]. 广东广播电视大学学报 2009(03)
    • [22].Web日志挖掘在图书馆中的应用探讨[J]. 江西图书馆学刊 2008(03)
    • [23].PUGA:Web日志挖掘模型[J]. 计算机工程与设计 2016(09)
    • [24].Web日志挖掘中的数据预处理研究[J]. 黑龙江科技信息 2014(31)
    • [25].聚类算法在Web日志挖掘中的研究[J]. 物联网技术 2015(07)
    • [26].基于日志挖掘的影像设备云监控系统的设计与应用研究[J]. 中国数字医学 2020(10)
    • [27].Web日志挖掘中的数据预处理技术研究[J]. 科技视界 2014(12)
    • [28].基于Web日志挖掘的个性化服务技术的研究[J]. 网络安全技术与应用 2010(06)
    • [29].Web日志挖掘技术在网络教学平台中的应用研究[J]. 制造业自动化 2009(11)
    • [30].基于SQL Server 2005的Web日志挖掘应用研究[J]. 现代计算机(专业版) 2008(12)

    标签:;  ;  ;  

    基于概念格的Web日志挖掘的研究
    下载Doc文档

    猜你喜欢