论文摘要
本论文研究课题源于国家973基础研究项目(No.2002CB312006)“Internet环境下基于Agent的软件中间件理论和方法研究”和国家自然基金项目(No.60473077)“水印关系数据库关键技术研究”。 近年来,随着我国信息化建设的快速发展,知识的自动获取已成为一种重要的技术手段。数据挖掘研究如何从大量的数据中智能地自动地抽取出有价值的知识和信息,因而成为当前人工智能研究中非常活跃的研究领域。粗糙集理论是一种有效地处理模糊性和不确定性问题的数学工具,为数据挖掘提供了新的思路和基础。本文的研究工作主要围绕基于粗糙集理论的数据挖掘,重点从基于粗糙集理论的特征选择和连续属性离散化两个方面展开。本文的主要创新性研究工作包括: 1) 提出了基于属性出现频率的属性约简算法,这种算法以条件属性在分辨矩阵中出现的频率作为启发信息,以条件属性所在最小分辨矩阵项的基数作为辅助启发信息,来寻找决策信息系统的最小约简。实验证明,大多数情况下该算法能够找到系统的最优(最小)约简。在没有找到最优约简的情况下,算法能够找到次优约简。 2) 分析属性约简中条件属性之间的关系以及约简集合中条件属性和决策属性之间的关系。在粗糙集理论的基础上给出了属性相关度的定义,并且根据这一定义,提出了基于属性相关度的属性约简算法。实验结果证明,这种算法能够有效地去除属性子集中的无关属性和冗余属性。 3) 提出了基于粗糙集理论的确定候选断点集合的新算法,该方法能够在保证系统分辨关系的前提下,大幅度的降低候选断点的数量,从而大幅度的减少了后继离散化算法的计算量。实验表明,这种确定候选断点集合的办法是切实可行的。 4) 提出了一种基于断点权重的启发式连续属性离散化方法。这种方法将连续属性的候选断点作为一个单个的条件属性,建立新的决策信息系统以考察每个候选断点对信息系统分辨能力的贡献。将断点在分辨矩阵中的出现频率作为断点的权值,寻找系统的最优断点集合。实验结果表明,此算法能在较好地保留原信息系统的分辨能力的同时,有效地解决离散化问题。 5) 提出了一种基于DBSCAN聚类的连续属性离散化算法。这种离散化算法,结合基于密度分布的聚类算法和粗糙集理论中属性依赖度的概念,通过对决策信息系统中的所有实例进行聚类来实现连续属性的离散化。实验表明,这种离散化
论文目录
相关论文文献
- [1].基于数据挖掘算法的成都市流动人口状况研究[J]. 经济研究导刊 2020(03)
- [2].大数据下的数据挖掘算法在多维度评教模型中的应用[J]. 信息与电脑(理论版) 2020(01)
- [3].审计信息系统的异常数据挖掘算法和应用[J]. 全国流通经济 2020(19)
- [4].云计算环境下的数据挖掘算法探究[J]. 网络安全技术与应用 2019(05)
- [5].基于决策树的大学生职位晋升影响因素数据挖掘算法[J]. 北华大学学报(自然科学版) 2019(06)
- [6].如何运用数据挖掘算法进行投诉预测分析[J]. 信息通信 2019(11)
- [7].基于关联规则的数据挖掘算法[J]. 电子技术与软件工程 2018(02)
- [8].一种基于神经网络的数据挖掘算法[J]. 电脑编程技巧与维护 2017(03)
- [9].基于数据挖掘算法的电子图书馆智能推荐技术研究[J]. 西南师范大学学报(自然科学版) 2017(07)
- [10].采用高阶累积量压缩的镀铬加工实时数据挖掘算法[J]. 世界有色金属 2016(09)
- [11].基于云计算的海量数据挖掘算法[J]. 产业与科技论坛 2015(16)
- [12].数据挖掘算法基于关联规则的分析和应用[J]. 课程教育研究 2017(11)
- [13].基于数据挖掘算法的创客校园质量管理模型研究[J]. 现代职业教育 2017(10)
- [14].基于云计算的数据挖掘算法研究[J]. 无线互联科技 2013(12)
- [15].基于数据挖掘算法数据模型实现大数据分析的方法研究[J]. 电子测量技术 2020(03)
- [16].数据挖掘算法在云平台应用中的优化与实施[J]. 电子元器件与信息技术 2019(03)
- [17].关联规则下的数据挖掘算法分析[J]. 信息记录材料 2018(07)
- [18].一种改进的数据挖掘算法[J]. 科技通报 2016(11)
- [19].基于神经网络自适应搜索的大数据挖掘算法[J]. 计算机与网络 2016(23)
- [20].基于R语言的数据挖掘算法研究[J]. 电脑知识与技术 2016(28)
- [21].云计算平台下数据挖掘算法研究[J]. 信阳农林学院学报 2017(01)
- [22].入侵检测中常用数据挖掘算法的分析与研究[J]. 无线互联科技 2014(11)
- [23].基于链距离估计的非显著特征数据挖掘算法[J]. 科技通报 2015(06)
- [24].数据挖掘算法的研究——以不确定图模型为例[J]. 电脑知识与技术 2015(12)
- [25].数据挖掘算法的分析探讨[J]. 硅谷 2014(02)
- [26].动态云模型大规模数据挖掘算法[J]. 长春工业大学学报(自然科学版) 2014(03)
- [27].常用数据挖掘算法的分析对比[J]. 河南科技 2014(19)
- [28].高速接入网云计算平台的大数据挖掘算法研究(英文)[J]. 机床与液压 2017(24)
- [29].数据挖掘算法在中药研究中的应用[J]. 中国药房 2018(19)
- [30].一种有效的多类医疗数据挖掘算法研究[J]. 科技通报 2017(05)