关联规则挖掘在图书借阅数据处理中的应用

关联规则挖掘在图书借阅数据处理中的应用

论文摘要

高校图书馆作为高校师生的一个重要知识库,馆内藏书所涉及的领域非常广泛;图书馆每年购入新书,因此图书馆藏书量也在不断增多。师生们要在众多的书籍中找到自己需要的相关图书是一件非常困难的事情。因此,快速有效地优化藏书布局对师生的学习与研究显得尤为重要。本课题的目标就是运用数据挖掘中的关联规则方法,从读者的历史借阅数据中快速有效地挖掘出借阅书籍之间的关联信息,来帮助管理员优化藏书布局。本文首先阐述了数据挖掘的理论基础,对关联规则数据挖掘中的一些经典算法进行了系统的分析和总结;然后根据要求将图书馆历史借阅数据进行数据预处理,包括数据的导入和提取、事务数据库的建立;在此基础上将新的关联规则挖掘算法MFP-Miner算法运用到事务数据库,挖掘出借阅书籍之间的关联规则。实验结果显示,该算法在效率上优于其它算法。由于图书馆借阅数据每日有更新,数据库不断增大,并且根据需要的关联程度不同,最小支持度也有变化。为了使图书摆放能够尽快适应师生借阅需求,需要不断地更新挖掘结果。若利用前面的挖掘算法(如MFP-Miner等)重新挖掘整个数据库,将会很费时间,而且以前挖掘出来的信息也被浪费。为此,本文提出运用MFIA-IU算法来解决数据库和最小支持度同时变化时的综合更新挖掘最大频繁项目集的问题,从而可避免每年对旧数据的重复挖掘。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 课题的背景和意义
  • 1.2 数据挖掘的发展历史及国内外研究现状
  • 1.2.1 数据挖掘发展历史
  • 1.2.2 国内外研究现状
  • 1.3 课题研究目的、数据来源、处理工具
  • 1.4 本文的主要结构安排
  • 1.5 本章小结
  • 2 数据挖掘概述
  • 2.1 数据挖掘的定义
  • 2.2 数据挖掘的过程
  • 2.3 与数据挖掘相关的技术
  • 2.3.1 数据库技术与数据挖掘
  • 2.3.2 数据挖掘与传统分析方法
  • 2.3.3 数据挖掘和联机分析处理(OLAP)
  • 2.4 数据挖掘的任务
  • 2.5 数据挖掘的应用领域与发展趋势
  • 2.5.1 数据挖掘的应用领域
  • 2.5.2 数据挖掘的发展趋势
  • 2.6 本章小结
  • 3 关联规则
  • 3.1 关联规则基本理论
  • 3.1.1 关联规则挖掘技术的提出
  • 3.1.2 关联规则中的基本概念
  • 3.2 关联规则挖掘的常用算法
  • 3.3 MFP-Miner 算法
  • 3.3.1 算法中的基本定义
  • 3.3.2 MFP-Miner 算法思想
  • 3.3.3 MFP-Miner 算法描述
  • 3.3.4 与Mafia 算法的比较
  • 3.4 本章小结
  • 4 关联规则挖掘在高校图书馆中的应用
  • 4.1 图书馆借阅数据的预处理
  • 4.1.1 图书馆借阅数据的导入及提取
  • 4.1.2 事务数据库的建立
  • 4.2 图书借阅关联规则挖掘算法实现
  • 4.3 实验结果与分析
  • 4.4 本章小结
  • 5 最大频繁项目集的综合更新挖掘 MFIA-IU
  • 5.1 MFIA-IU 算法的理论基础
  • 5.2 算法思想和描述
  • 5.3 MFIA-IU 算法的性能测试
  • 5.4 本章小结
  • 6 总结与展望
  • 6.1 本文总结
  • 6.2 未来工作展望
  • 参考文献
  • 附录:MFP-Miner 算法程序代码
  • 致谢
  • 个人简历
  • 研究生阶段发表的学术论文
  • 相关论文文献

    标签:;  ;  ;  

    关联规则挖掘在图书借阅数据处理中的应用
    下载Doc文档

    猜你喜欢