论文题目: 基于粗糙集的分类知识发现方法及其应用研究
论文类型: 博士论文
论文专业: 管理科学与工程
作者: 满江虹
导师: 达庆利
关键词: 粗糙集,分类,属性约简,规则合并,供应链需求趋势预测
文献来源: 东南大学
发表年度: 2005
论文摘要: 作为知识发现的重要研究分支,数据分类在商务决策中发挥着日益重要的作用,本文从知识发现的角度对基于特定的准则对现有数据、信息进行分类研究的方法作了大致概括与评价,介绍了当前知识发现、分类研究及粗糙集的分类研究的主要成果及研究现状,并在此基础上按照决策表分类知识发现的步骤展开全文基于粗糙集的分类知识发现的研究。本文将数据预处理工作单列一章进行讨论,主要包括信息系统的决策表表示方式,原始决策表中的冗余与不一致数据的清理以及连续数据的离散化等数据预处理技术.将支持度的思想引入粗糙集等价矩阵的定义当中,构造增广等价矩阵,并基于此增广等价矩阵分别针对决策表中的冗余对象和不相容对象设计了两个数据净化算法,在提高数据清理的有效性的同时最大限度地降低数据清理对决策表的破坏,避免原始决策表重要信息丢失;其次,将基于信息熵的属性重要性引入粗糙集的可辨别矩阵构造过程,针对含有多个连续属性值的决策表给出精确离散化算法,充分保留决策表的一致性。同时,为克服精确离散化切点对不同训练子集的选取和不同的离散化技术过于敏感的难题,在精确离散的基础上给出了利用精确切点区间分别构造精确离散区间和模糊离散区间的算法。在决策表的条件属性约简方面,本文区分对待决策表对象较少与较多两种情形提出两种改进的粗糙集的属性约简的方法。针对较少对象的一般决策表,由决策表的核开始,给出了的基于信息熵和相对可辨别矩阵的属性约简的启发式搜索算法,达到缩小搜索空间,减少计算量的目的,利用信息熵和近似分类质量的特点,充分考虑条件属性间的联系;其次,针对大数据集决策表,即决策表中对象过多时,本文将基于扩张矩阵决策表属性约简问题转化为规划问题,并提出免疫算法进行规划模型的求解方法,具体方法是以基于信息熵的属性重要性和粗糙集的近似分类质量求出决策表的核与扩张矩阵,然后以基于离差的免疫算法代替通常的基于信息熵的免疫算法,求出规划问题的解,即决策表的属性约简结果,用于降低分类知识发现中决策表中的冗余与不相关的属性对挖掘质量的破坏,减少要处理的数据量,简化分类器,从而减轻数据噪声的影响,提高泛化性能。在决策表的规则获取方面,改进了粗糙集视野下的一般规则获取,提出了连续型条件属性的规则合并,探讨了分类的概率规则获取以及决策解释等内容。首先,给出基于决策类核属性的值约简的包装算法和基于等价矩阵的两种改进的分类规则获取算法,其中,基于决策类核属性的分类规则获取的值约简算法,保证了生成的规则形式整齐,层次分明,便于检索;其次,对于具有连续的数值型取值的条件属性,在不降低精确度的前提下,提出针对决策类的分类规则合并算法,在具有相同类标号的规则集合中合并连续条件属性区间,这样一方面不会导致矛盾规则的出现,保证了产生分类规则的精度,另一方面避开了后续的反复约简及合并工作,简化了计算,提高分类能力;另外,还探讨了边界区域的分类的概率规则获取问题,以条件概率给出规则的置信度、覆盖度、支持度定义,利用Bayes理论进行决策解释,提出基于粗糙集Bayes理论的决策建议的解释算法,并通过供应链需求集成分析应用案例分析,以计算结果对比证明了本文算法的有效性。将本文给出的分类知识发现方法应用到供应链管理的实践操作当中,主要探讨基于分类方法的供应链需求趋势预测问题,把基于改进的粗糙集的分类方法引入供应链需求预测过程,从供应链企业以往需求预测经验中挖掘出其需求趋势变化与当时的经济、社会、文化等背景之间关系的“预测知识”,并以此知识指导未来的需求预测。针对条件属性层次性较强的情形,本文还提出一种条件属性的合并方法,用来代替通常的决策表属性约简,以突变级数评价法改进粗糙集在属性约简方面的弊端,以基于支持度与可信度的等价矩阵法获取知识,充分利用粗糙集等软计算强大的知识发现能力,将需求预测由经验、技术层面提升到知识层面,使成员充分共享整条供应链上的各个企业的预测知识,改进自身预测精度,提高整条敏捷供应链的运作效率。
论文目录:
中文摘要
英文摘要
第一章 绪论
1.1 分类与知识发现
1.2 分类研究文献综述
1.3 智能计算与分类
1.3.1 神经网络与分类
1.3.2 粗糙集与分类
1.3.3 模糊逻辑、粗糙集与分类
1.4 本文的研究方法及结构
第二章 分类数据预处理
2.1 决策表与粗糙集
2.1.1 信息系统与决策表
2.1.2 粗糙近似与等价类
2.2 基于增广等价矩阵的数据清理
2.2.1 等价矩阵的构造
2.2.2 数据净化算法
2.3 数据离散化
2.3.1 精确离散化
2.3.1.1 基于信息熵的属性重要性
2.3.1.2 决策表的可辨别矩阵
2.3.1.3 精确离散算法
2.3.2 模糊离散化
2.4 算例
2.4.1 数据清理算例
2.4.2 数据离散化算例
2.5 本章小结
第三章 属性约简方法
3.1 基于相对可辨别矩阵的属性约简
3.1.1 决策表的核与属性重要性
3.1.2 相对可辨别矩阵
3.1.3 基于相对可辨别矩阵的属性约简算法
3.1.4 算例分析
3.2 基于免疫算法的属性约简
3.2.1 扩张矩阵
3.2.2 免疫算法
3.2.2.1 免疫系统
3.2.2.2 免疫算法的相关定义
3.2.2.3 免疫算法的计算流程
3.2.3 基于扩张矩阵的属性约简免疫算法
3.2.3.1 编码和初始种群选择
3.2.3.2 目标函数
3.2.3.3 决策表属性约简的免疫算法
3.2.4 算例分析
3.3 本章小结
第四章 分类规则获取方法
4.1 决策表的一般分类规则获取
4.1.1 基于决策类核属性的分类规则获取算法
4.1.2 基于等价矩阵的分类规则获取算法
4.1.3 算例
4.2 数值型条件属性的规则合并
4.2.1 引例
4.2.2 规则表
4.2.3 规则合并算法
4.3 分类的概率规则获取
4.3.1 变精度粗糙集
4.3.2 概率规则
4.3.3 决策解释算法
4.4 供应链需求集成分析应用案例分析
4.5 本章小结
第五章 分类方法在供应链需求趋势预测中的应用
5.1 供应链需求影响因素的确定
5.2 基于突变级数评价法的属性合并算法
5.2.1 需求影响因素确定
5.2.2 条件属性合并
5.2.3 条件属性赋值及决策表生成
5.3 基于分类规则获取的商品住宅需求趋势预测案例分析
5.3.1 商品住宅需求影响因素的确定
5.3.2 影响因素的合并
5.3.3 数据来源及预处理
5.3.4 决策表属性合并及知识发现
5.3.5 结果比较
5.3.5.1 结果的定量比较
5.3.5.2 结果的定性比较
5.4 本章小结
第六章 结论与展望
参考文献
攻读博士学位期间发表的论文
致谢
发布时间: 2007-06-11
参考文献
- [1].基于粗糙集的知识发现及在CRM中的应用研究[D]. 魏娟.哈尔滨工程大学2006
- [2].四种粗糙集扩展模型的研究[D]. 包艳玲.陕西师范大学2018
- [3].粗糙集的模糊刻画与知识颗粒特征研究[D]. 李秀红.山东大学2006
- [4].Research on Fuzzy Characterization of Rough Set and Characters of Knowledge Granule[D]. Li Xiuhong.山东大学2006
- [5].粗糙集与信息系统约简—决策规则优化[D]. 管延勇.山东大学2006
- [6].粗糙集理论及其应用研究[D]. 王珏.西安电子科技大学2005
- [7].正负域覆盖广义粗糙集与知识粗传播研究[D]. 薛佩军.山东大学2007
- [8].基于犹豫模糊环境下的软集与粗糙集理论模型的研究[D]. 张海东.电子科技大学2017
- [9].模糊环境下基于决策粗糙集的决策方法研究[D]. 梁德翠.西南交通大学2014
- [10].量化Domain与格上粗糙集理论研究[D]. 高宁华.湖南大学2017
标签:粗糙集论文; 分类论文; 属性约简论文; 规则合并论文; 供应链需求趋势预测论文;