论文摘要
学术关系是社会关系的重要组成部分,学术关系挖掘对于科技评价有着重要的意义。本文阐述了社会关系信息化分析技术的研究现状,研究并分析了数据挖掘中关联规则挖掘和时态关联规则挖掘的相关知识。提出利用渐进时间分区挖掘算法挖掘专家间的学术合作关系。针对学术合作关系具有随时间有效的特点,而传统Apriori算法不适用具有时间属性数据项的关联规则挖掘问题,采用了渐进时间分区挖掘算法挖掘专家学术合作关系。论文阐述了渐进时间分区挖掘算法的基本思想和相关定义,详细介绍了该算法的分区方法和自连接方法。该算法根据不同分区的累计数来求解不同时间分区的关联规则,有效的解决时态约束关联规则挖掘问题,同时,以论文合作作者的学术关系挖掘作为例子验证了该算法的有效性。针对学术合作关系有效合作时间不确定的特点,论文的发表时间不能够完全代表学术的合作时间,在此基础上研究并分析了时间分区的扩展与归并技术,对经过渐进时间分区算法挖掘得出的频繁项集所出现的时间分区进行必要的扩展和归并,并在此基础上结合Apriori算法进行再次挖掘。通过进一步的挖掘提高了时态关联规则挖掘结果的有效性,最后用部分项目申报数据对该方法进行了实验验证。
论文目录
摘要ABSTRACT第一章 绪论1.1 社会关系信息化技术研究现状1.2 学术关系挖掘技术与研究意义1.2.1 学术活动的特点与挖掘技术1.2.2 学术关系挖掘的研究意义1.3 数据挖掘研究现状与应用1.3.1 数据挖掘研究现状1.3.2 数据挖掘的应用1.4 时态关联规则挖掘综述1.5 本文的主要工作内容及组织安排1.5.1 主要工作内容1.5.2 组织安排第二章 关联规则挖掘概述2.1 关联规则挖掘2.1.1 关联规则挖掘基础理论2.1.2 关联规则的主要分类2.1.3 关联规则挖掘常用算法2.2 时态关联规则挖掘2.2.1 时态数据库的基础理论2.2.2 时态数据库的主要类别2.2.3 时态数据挖掘2.3 小结第三章 用渐进时间分区关联规则算法挖掘学术合作关系3.1 用Apriori算法挖掘学术关系关联规则3.1.1 Apriori算法基本思想3.1.2 用Apriori算法挖掘合作作者间的关联规则分析3.2 渐进时间分区挖掘算法的基本思想3.3 渐进时间分区挖掘算法的基础理论3.4 用渐进时间分区算法挖掘学术合作关系3.4.1 数据库分区索引策略3.4.2 渐进分区剪枝策略3.4.3 时态频繁项集的真子集生成策略3.4.4 学术关系关联规则结果分析3.5 渐进时间分区挖掘算法的应用3.5.1 数据预处理3.5.2 基于时间属性的数据项提取3.5.3 实验分析3.6 小结第四章 基于可变时区的学术关系挖掘4.1 可变时区的关联规则挖掘特点4.2 可变时区的扩展与归并4.2.1 按比例扩展策略4.2.2 归并策略4.3 可变时区的扩展与归并算法4.3.1 基本思想4.3.2 基本流程和步骤4.3.3 算法执行实例4.4 实验结果分析4.5 小结第五章 结束语5.1 本文研究工作总结5.2 学术合作关系挖掘期望发展的方向参考文献致谢攻读硕士学位期间完成论文情况攻读硕士学位期间参加的科研项目情况
相关论文文献
标签:渐进时间分区挖掘论文; 学术关系论文; 时态关联规则论文; 时间分区论文;
时态关联规则挖掘算法研究及其在学术合作关系挖掘中的应用
下载Doc文档