论文摘要
学习是人类特有的一种能力,是系统积累经验以改善其性能的过程。机器学习是继专家之后人工智能应用的又一重要研究领域,也是人工智能和神经计算的核心研究课程之一。机器学习的基本目标是使计算机具有学习的能力,模拟或实现人类的学习活动,它是研究计算机识别现有知识,获取知识,不断改进性能和实现自身完善的方法。机器学习在许多领域都有着成功的运用,其已成为新的边缘学科。机器学习与人工智能各种基础问题的统一性观点正在形成,各种学习方法的应用范围不断扩大,部分应用研究成果已转化为商品,与机器学习有关的学术活动空前活跃。粗糙集理论是一种刻划具有不完整性和不确定性信息的全新数学工具。其主要思想是在保证知识库的分类能力不变的前提下,通过知识约简导出问题的决策或分类规则。该理论已经在数据挖掘、机器学习、过程控制、决策分析和模式识别等领域得到广泛的应用。决策树在机器学习中有极其广泛的应用。决策树是一种重要的归纳推理学习法,本文提出了一种基于粗糙集的决策树优化算法,该算法利用粗糙集中的近似分类精度及规则的确定性因子来进行属性选择,构造决策树。在算法形成的过程中提出抑制因子,运用抑制因子对决策树进行修剪,避免了先生成决策树再修剪的繁琐步骤。而且在每次将对象划分子集时都将条件属性值与决策属性值进行匹配考察,避免了不必要的计算,提高了算法速度。另一方面,对于数据库的动态变化,本文在分析经典算法的基础上,将Rough集理论应用于规则归纳系统,提出了一种基于粗糙集获取规则的增量式学习方法,实现当新对象加入时规则知识库的增量式学习过程,且在增量式学习过程中,该算法充分利用现有规则知识库中的信息,减少算法的搜索空间范围,从而降低其复杂度,并且在利用粗糙集获取规则方法的基础上提出一种决策值更新方法,它强调充分发挥决策者和分析人员的主观能动性的重要性,以满足不断变化的外部情况,而不只是单纯依赖机器决策,从而论证了人的决策和机器学习之间的互动关系。