时态关联规则挖掘算法研究及其在学术合作关系挖掘中的应用

时态关联规则挖掘算法研究及其在学术合作关系挖掘中的应用

论文摘要

学术关系是社会关系的重要组成部分,学术关系挖掘对于科技评价有着重要的意义。本文阐述了社会关系信息化分析技术的研究现状,研究并分析了数据挖掘中关联规则挖掘和时态关联规则挖掘的相关知识。提出利用渐进时间分区挖掘算法挖掘专家间的学术合作关系。针对学术合作关系具有随时间有效的特点,而传统Apriori算法不适用具有时间属性数据项的关联规则挖掘问题,采用了渐进时间分区挖掘算法挖掘专家学术合作关系。论文阐述了渐进时间分区挖掘算法的基本思想和相关定义,详细介绍了该算法的分区方法和自连接方法。该算法根据不同分区的累计数来求解不同时间分区的关联规则,有效的解决时态约束关联规则挖掘问题,同时,以论文合作作者的学术关系挖掘作为例子验证了该算法的有效性。针对学术合作关系有效合作时间不确定的特点,论文的发表时间不能够完全代表学术的合作时间,在此基础上研究并分析了时间分区的扩展与归并技术,对经过渐进时间分区算法挖掘得出的频繁项集所出现的时间分区进行必要的扩展和归并,并在此基础上结合Apriori算法进行再次挖掘。通过进一步的挖掘提高了时态关联规则挖掘结果的有效性,最后用部分项目申报数据对该方法进行了实验验证。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 社会关系信息化技术研究现状
  • 1.2 学术关系挖掘技术与研究意义
  • 1.2.1 学术活动的特点与挖掘技术
  • 1.2.2 学术关系挖掘的研究意义
  • 1.3 数据挖掘研究现状与应用
  • 1.3.1 数据挖掘研究现状
  • 1.3.2 数据挖掘的应用
  • 1.4 时态关联规则挖掘综述
  • 1.5 本文的主要工作内容及组织安排
  • 1.5.1 主要工作内容
  • 1.5.2 组织安排
  • 第二章 关联规则挖掘概述
  • 2.1 关联规则挖掘
  • 2.1.1 关联规则挖掘基础理论
  • 2.1.2 关联规则的主要分类
  • 2.1.3 关联规则挖掘常用算法
  • 2.2 时态关联规则挖掘
  • 2.2.1 时态数据库的基础理论
  • 2.2.2 时态数据库的主要类别
  • 2.2.3 时态数据挖掘
  • 2.3 小结
  • 第三章 用渐进时间分区关联规则算法挖掘学术合作关系
  • 3.1 用Apriori算法挖掘学术关系关联规则
  • 3.1.1 Apriori算法基本思想
  • 3.1.2 用Apriori算法挖掘合作作者间的关联规则分析
  • 3.2 渐进时间分区挖掘算法的基本思想
  • 3.3 渐进时间分区挖掘算法的基础理论
  • 3.4 用渐进时间分区算法挖掘学术合作关系
  • 3.4.1 数据库分区索引策略
  • 3.4.2 渐进分区剪枝策略
  • 3.4.3 时态频繁项集的真子集生成策略
  • 3.4.4 学术关系关联规则结果分析
  • 3.5 渐进时间分区挖掘算法的应用
  • 3.5.1 数据预处理
  • 3.5.2 基于时间属性的数据项提取
  • 3.5.3 实验分析
  • 3.6 小结
  • 第四章 基于可变时区的学术关系挖掘
  • 4.1 可变时区的关联规则挖掘特点
  • 4.2 可变时区的扩展与归并
  • 4.2.1 按比例扩展策略
  • 4.2.2 归并策略
  • 4.3 可变时区的扩展与归并算法
  • 4.3.1 基本思想
  • 4.3.2 基本流程和步骤
  • 4.3.3 算法执行实例
  • 4.4 实验结果分析
  • 4.5 小结
  • 第五章 结束语
  • 5.1 本文研究工作总结
  • 5.2 学术合作关系挖掘期望发展的方向
  • 参考文献
  • 致谢
  • 攻读硕士学位期间完成论文情况
  • 攻读硕士学位期间参加的科研项目情况
  • 相关论文文献

    标签:;  ;  ;  ;  

    时态关联规则挖掘算法研究及其在学术合作关系挖掘中的应用
    下载Doc文档

    猜你喜欢