关系数据库上强相关项目对的挖掘算法研究

关系数据库上强相关项目对的挖掘算法研究

论文摘要

关联规则在商业中的广泛应用使得它成为数据挖掘中最活越的研究方向之一。然而,在传统的基于支持度的关联规则挖掘框架中,数据之间真正的关联可能会未被发现,与此同时可能还会产生太多不具有真正相关性的规则,已是一个众所周知的事实。基于此,统计关联已被越来越多的研究人员所采用,从而弥补关联规则的不足。近来,在交易数据库上的具有统计意义的强相关项目对的挖掘受到的一定的重视。在给定最小相关阈值θ和待挖掘的交易数据库的情况下,强相关项目对的挖掘问题是要找出所有的满足皮尔森关联系数不小于θ的项目对。 同时,由于大量的商业数据是存储在关系数据库中的,大部分的数据挖掘应用也是针对关系数据库的。因此进行关系数据库上的强相关项目对挖掘的研究,有着十分重大的理论价值和实际意义。 本文主要的研究内容包含两部分: 1) 为了在关系数据库上进一步减少候选项目对测试的代价,我们通过1NF的性质,对Taper算法进行改进,设计改进的TaperR算法,在挖掘过程中减少候选项目对的数目,从而提高算法的效率。实验结果表明,设计的新算法在进行关系数据库上的强相关项目对挖掘时,具有良好的效果。因此,更适合在实际的关系数据库系统中应用。 2) 为了有效解决关系数据库上的Top-K强相关项目对的挖掘问题,我们提出了基于阈值估计的Top-K强相关项目对挖掘算法,实验结果表明,新方法是行之有效的。

论文目录

  • 第1章 绪论
  • 1.1 课题的研究背景
  • 1.2 相关国内外研究现状
  • 1.3 论文的研究内容
  • 第2章 关联挖掘及其相关算法
  • 2.1 传统关联分析的概念
  • 2.2 多维关联分析
  • 2.3 多层次关联分析
  • 2.4 基于约束的关联分析
  • 2.5 统计关联分析
  • 2.6 非结构化复杂类型数据的关联分析
  • 2.7 本章小结
  • 第3章 基于 1NF的强相关项目对挖掘算法研究
  • 3.1 引言
  • 3.2 皮尔森关联系数以及 Taper算法
  • 3.3 关系数据库规范化理论
  • 3.4 基于 1NF的强相关项目对的挖掘算法-TaperR算法
  • 3.5 实验结果
  • 3.5.1 实验数据集
  • 3.5.2 实验结果
  • 3.6 本章小结
  • 第4章 Top-k强相关项目对挖掘算法研究
  • 4.1 引言
  • 4.2 利用 TaperR算法挖掘 Top-K强相关项目对
  • 4.3 基于阈值估计的 Top-K强相关项目对挖掘算法
  • 4.4 实验结果
  • 4.5 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    • [1].基于非关系数据库的全球时空大数据组织管理研究[J]. 地理信息世界 2019(06)
    • [2].基于关系数据库的OLAP研究[J]. 信息与电脑(理论版) 2016(01)
    • [3].关系数据库向文档数据库的模式转换算法[J]. 现代计算机(专业版) 2016(18)
    • [4].粗糙关系数据库的数学基础[J]. 计算机工程与应用 2015(14)
    • [5].关系数据库的实体间关系提取方法的研究[J]. 计算机应用与软件 2019(10)
    • [6].“教、学、做一体化”在“关系数据库”课程中的应用[J]. 学习月刊 2010(15)
    • [7].基于元数据的关系数据库语义集成方法[J]. 计算机工程 2008(06)
    • [8].模糊关系数据库及应用探讨[J]. 科技传播 2011(15)
    • [9].粗糙关系数据库及其发展[J]. 重庆邮电大学学报(自然科学版) 2009(04)
    • [10].基于关系数据库的持久化技术研究[J]. 科技创新导报 2008(27)
    • [11].关系数据库设计原则分析[J]. 数字通信世界 2018(04)
    • [12].关于关系数据库技术运用于计算机网络设计的研究[J]. 数字通信世界 2017(04)
    • [13].基于相似度的粗关系数据库的近似查询[J]. 计算机工程与应用 2008(21)
    • [14].浅析关系数据库的查询优化[J]. 数字技术与应用 2017(07)
    • [15].异构关系数据库移植平台的设计[J]. 现代计算机(专业版) 2014(34)
    • [16].逐级扩展的非关系数据库分布策略[J]. 信息工程大学学报 2013(04)
    • [17].基于关系数据库语义解析的信息推理研究[J]. 科学技术与工程 2010(33)
    • [18].基于关系数据库语义解析的信息推理研究[J]. 黑龙江科学 2010(06)
    • [19].统一多维数据模型的后关系数据库体系结构[J]. 计算机工程与应用 2009(08)
    • [20].一种粗关系数据库索引方法[J]. 计算机工程 2008(22)
    • [21].面向对象在关系数据库中的设计与应用[J]. 电脑知识与技术 2016(20)
    • [22].基于关系数据库的应急预案领域本体构建研究[J]. 微计算机应用 2010(01)
    • [23].关系数据库原理及其在计算机网络设计中的应用优势[J]. 科技创新导报 2018(35)
    • [24].后关系数据库在新型电子商务中的应用研究[J]. 中国高新技术企业 2010(16)
    • [25].基于规则的关系数据库到本体的转换方法[J]. 计算机应用研究 2008(03)
    • [26].基于多维云模型的关系数据库数字水印算法[J]. 佳木斯大学学报(自然科学版) 2008(03)
    • [27].基于关系数据库的蒙文局部本体构建及整合[J]. 北京工业大学学报 2014(11)
    • [28].粗糙关系数据库的度量[J]. 计算机科学 2012(12)
    • [29].综合监控系统多关系数据库同步组件设计[J]. 城市轨道交通研究 2012(11)
    • [30].关系数据库的模式抽取[J]. 现代计算机(专业版) 2009(04)

    标签:;  ;  ;  ;  

    关系数据库上强相关项目对的挖掘算法研究
    下载Doc文档

    猜你喜欢