论文摘要
随着信息时代到来,数据库存储信息量急剧增大。面对庞大的数据资源,人们需要功能强大的工具来“挖掘”其中有用的知识。数据挖掘(Data Mining,DM)正是在这个背景下而提出的新技术。数据挖掘又称为数据库知识发现,是从大量的数据中抽取未知的、新颖的、有效的及潜在有用的知识或模式的高级处理过程。关联规则挖掘是数据挖掘领域研究与应用的热点之一。Apriori算法是挖掘关联规则的经典算法。但Apriori算法仅仅考虑数据库中项出现的频率,没有考虑到数据库项属性及记录具有不同的重要性,所以挖掘的规则具有一定的局限性。针对这一问题,本文重点研究了加权关联规则,提出一种挖掘水平加权与垂直加权相结合的加权关联规则模型及实现算法。本文研究主要内容包括:①介绍了数据挖掘的发展和相关概念,研究了数据挖掘的过程、技术及应用,对其今后的发展进行了探讨。②研究了关联规则,讨论了Apriori算法,分析不产生频繁项集的FP-growth算法。③全面研究了加权关联规则,深入研究加权关联规则算法—MINWAL(O)算法,分析了水平权值归一化处理方法。④提出水平加权与垂直加权相结合的改进加权关联规则算法—MWAL算法,详细阐述了该算法的实现。这是本文的重点。
论文目录
摘要ABSTRACT1 绪论1.1 研究背景1.2 国内外研究状况1.2.1 国外研究状况1.2.2 国内研究状况1.3 本文课题研究的目的和意义1.3.1 本文课题研究目的1.3.2 本文课题研究的意义1.4 本文课题主要工作1.5 本文课题创新点1.6 论文组织结构2 数据挖掘2.1 数据挖掘概述及定义2.1.1 数据挖掘概述2.1.2 数据挖掘定义2.2 数据挖掘过程2.2.1 数据准备2.2.2 数据挖掘2.2.3 结果的解释和评价2.3 数据挖掘的功能2.4 数据挖掘的技术2.5 数据挖掘的应用2.5.1 数据挖掘科研应用2.5.2 数据挖掘商业应用2.6 数据挖掘对社会影响及展望2.6.1 数据挖掘的社会影响2.6.2 数据挖掘展望2.7 本章内容小结3 关联规则挖掘理论和算法3.1 关联规则的基本概念3.1.1 基本概念及定义3.1.2 关联规则挖掘的过程3.2 关联规则挖掘分类3.2.1 布尔型关联规则和数值型关联规则3.2.2 单层关联规则和多层关联规则3.2.3 单维关联规则和多维关联规则3.2.4 约束性关联规则和不带约束性关联规则3.3 关联规则经典算法3.3.1 Apriori 算法3.3.2 由频繁项集产生关联规则3.3.3 Aproiri 算法的缺陷3.4 优化Aproiri 算法的方法3.4.1 基于Aproiri 算法的优化3.4.2 不产生候选挖掘频繁项集—FP-gorwth 算法3.5 基于约束的关联挖掘3.5.1 约束的关联挖掘分类3.5.2 规则约束性的关联规则的实现3.6 关联规则发展趋势3.7 本章小结4 加权关联规则挖掘的研究4.1 加权关联规则定义4.2 加权关联规则的算法4.2.1 K-支持期望4.2.2 加权关联规则算法4.3 加权关联规则的优化4.3.1 水平权值归一化的加权关联规则的优化4.3.2 其他的加权关联规则的优化4.4 一种改进的加权关联规则及算法研究4.4.1 问题的提出4.4.2 水平加权关联及垂直加权关联规则4.4.3 改进的加权关联规则相关定义4.4.4 改进的加权关联规则算法及实现4.4.5 MWAL 算法与其它算法比较分析与讨论4.5 本章小结5 总结和展望5.1 主要总结5.2 后续研究工作致谢参考文献附录作者在攻读硕士学位期间发表的论文目录
相关论文文献
标签:数据挖掘论文; 关联规则论文; 加权关联规则论文; 复合加权论文; 算法论文;