论文摘要
常用的数据挖掘方法有许多,贝叶斯网络(Bayesian Networks ,BN)方法在数据挖掘中的应用是当前研究的热点问题,具有广阔的应用前景。数据挖掘的主要任务就是对数据进行分析处理,从而获得其中隐含的、事先未知的而又有用的知识。它的最终目的就是发现隐藏在数据内部的规律和数据之间的特征,从而服务于管理和决策。贝叶斯网络作为在上个世纪末提出的一种崭新的数据处理工具,在进行不确定性推理和知识表示等方面已经表现出它的独到之处,特别是当它与统计方法结合使用时,显示出许多关于数据处理的优势。本文致力于贝叶斯网络在数据挖掘中的应用研究,首先介绍了贝叶斯网络相关理论,贝叶斯网络的学习是数据挖掘中非常重要的一个环节,本文比较详细的讨论了网络图结构问题,为利用贝叶斯网络解决实际问题,建立样本数据结构和依赖关系奠定了基础。其次介绍了数据挖掘的相关问题以及主流的数据挖掘算法,并分析了各类算法的优缺点。针对目前还没有一种完整的在数据挖掘中构建贝叶斯网络的算法步骤,本文探讨性地提出了一种启发式的在数据挖掘中利用样本数据构建贝叶斯网络的算法思想,该算法较好的解决了在数据挖掘中利用样本数据设计贝叶斯网络问题。最后进行了实验分析,利用本文提出的算法,建立了大学生考研模型和农户信用等级评定模型,进行了较为详细的实验,并分别与决策树方法和传统的信用评分方法进行了比较,实验结果表明本文提出的算法设计简单、方法实用、应用有效,与其它算法相比还有精度较高的特点,同时也表现出了该算法在数据挖掘方面的优势,利于实际中的管理、分析、预测和决策等。