论文摘要
高校图书馆作为高校师生的一个重要知识库,馆内藏书所涉及的领域非常广泛;图书馆每年购入新书,因此图书馆藏书量也在不断增多。师生们要在众多的书籍中找到自己需要的相关图书是一件非常困难的事情。因此,快速有效地优化藏书布局对师生的学习与研究显得尤为重要。本课题的目标就是运用数据挖掘中的关联规则方法,从读者的历史借阅数据中快速有效地挖掘出借阅书籍之间的关联信息,来帮助管理员优化藏书布局。本文首先阐述了数据挖掘的理论基础,对关联规则数据挖掘中的一些经典算法进行了系统的分析和总结;然后根据要求将图书馆历史借阅数据进行数据预处理,包括数据的导入和提取、事务数据库的建立;在此基础上将新的关联规则挖掘算法MFP-Miner算法运用到事务数据库,挖掘出借阅书籍之间的关联规则。实验结果显示,该算法在效率上优于其它算法。由于图书馆借阅数据每日有更新,数据库不断增大,并且根据需要的关联程度不同,最小支持度也有变化。为了使图书摆放能够尽快适应师生借阅需求,需要不断地更新挖掘结果。若利用前面的挖掘算法(如MFP-Miner等)重新挖掘整个数据库,将会很费时间,而且以前挖掘出来的信息也被浪费。为此,本文提出运用MFIA-IU算法来解决数据库和最小支持度同时变化时的综合更新挖掘最大频繁项目集的问题,从而可避免每年对旧数据的重复挖掘。
论文目录
摘要Abstract1 绪论1.1 课题的背景和意义1.2 数据挖掘的发展历史及国内外研究现状1.2.1 数据挖掘发展历史1.2.2 国内外研究现状1.3 课题研究目的、数据来源、处理工具1.4 本文的主要结构安排1.5 本章小结2 数据挖掘概述2.1 数据挖掘的定义2.2 数据挖掘的过程2.3 与数据挖掘相关的技术2.3.1 数据库技术与数据挖掘2.3.2 数据挖掘与传统分析方法2.3.3 数据挖掘和联机分析处理(OLAP)2.4 数据挖掘的任务2.5 数据挖掘的应用领域与发展趋势2.5.1 数据挖掘的应用领域2.5.2 数据挖掘的发展趋势2.6 本章小结3 关联规则3.1 关联规则基本理论3.1.1 关联规则挖掘技术的提出3.1.2 关联规则中的基本概念3.2 关联规则挖掘的常用算法3.3 MFP-Miner 算法3.3.1 算法中的基本定义3.3.2 MFP-Miner 算法思想3.3.3 MFP-Miner 算法描述3.3.4 与Mafia 算法的比较3.4 本章小结4 关联规则挖掘在高校图书馆中的应用4.1 图书馆借阅数据的预处理4.1.1 图书馆借阅数据的导入及提取4.1.2 事务数据库的建立4.2 图书借阅关联规则挖掘算法实现4.3 实验结果与分析4.4 本章小结5 最大频繁项目集的综合更新挖掘 MFIA-IU5.1 MFIA-IU 算法的理论基础5.2 算法思想和描述5.3 MFIA-IU 算法的性能测试5.4 本章小结6 总结与展望6.1 本文总结6.2 未来工作展望参考文献附录:MFP-Miner 算法程序代码致谢个人简历研究生阶段发表的学术论文
相关论文文献
标签:数据挖掘论文; 关联规则论文; 最大频繁项目集论文;