基于Rough集的知识发现及其在汉语处理中的应用

基于Rough集的知识发现及其在汉语处理中的应用

论文题目: 基于Rough集的知识发现及其在汉语处理中的应用

论文类型: 博士论文

论文专业: 计算机应用技术

作者: 刘启和

导师: 杨国纬

关键词: 集理论,知识发现,知识约简,词类标注,句法分析

文献来源: 电子科技大学

发表年度: 2005

论文摘要: Rough集理论是处理不确定、不精确和不完备信息的新型数学工具,在知识表示与推理、数据分析、数据挖掘和知识发现等领域得到了广泛的应用。基于Rough集的知识发现过程就是采用Rough集技术从数据中发现新颖、有用的、非平凡的模式的过程,其应用遍及医疗、金融、工业、语言处理等领域。因此,基于Rough集的知识发现研究,在理论和实际应用上,都有十分重要的价值和意义。 Rough集理论着重研究信息系统,特别是决策表的知识约简问题,以获得更简洁的信息表示,或用于预测未知对象决策属性的有用的规则。本文从知识约简及其算法,应用等方面进行详细研究,并取得如下创新性成果: 提出新的条件信息熵及其高效知识约简算法。基于现有条件信息熵的知识约简算法不仅其时间复杂度高,而且得到的核和约简可能并不是代数观点下的核和约简。为了从信息论的角度计算代数观点下的核和约简,分析了现有条件信息熵的不足,给出一个新的条件信息熵,它能够等价表示代数观点下的核和约简。使用新的条件信息熵,给出计算核、计算约简的算法。由于新的条件信息熵能够等价表示代数观点下的核和约简,因此采用这些算法计算的结果一定是代数观点下的核和约简。理论分析与实验结果说明,这些算法不仅是高效的,而且在搜索最小或次优约简方面,优于基于正区域和基于现有条件信息熵的知识约简算法。 提出决策表转换算法。一些计算核和约简的高效算法只对一致决策表适用,而对不一致决策表并不适用。针对此问题,给出将不一致决策表转换为一致决策表的算法,并且保持转换前后的核和约简集合不变。证明了该算法的正确性,并分析了该算法时间复杂度及其对知识约简的影响,分析结果表明转换算法不会增加知识约简算法的时间复杂度,而且转换后进行知识约简更有可能获得最小约简。 提出基于数据库系统的Rough模型中知识约简算法的扩展策略。基于数据库系统的Rough模型中的高效、可伸缩的知识约简算法只对一致决策表适用。将决策表转换后再使用此模型中的知识约简算法进行知识约简,这种策略可以

论文目录:

中文摘要

Abstract

目录

符号索引

图表索引

第一章 前言

1.1 研究目的和意义

1.2 研究现状

1.2.1 知识发现

1.2.2 Rough集理论

1.2.3 自然语言处理

1.3 基于Rough集的知识发现中存在的问题

1.4 本文主要内容与创新

1.5 本文章节安排

第二章 知识发现与Rough集理论

2.1 知识发现

2.1.1 知识发现的一般过程

2.1.2 基于Rough集的知识发现

2.2 Rough集理论

2.2.1 近似空间

2.2.2 信息系统

2.2.3 知识约简

2.2.4 属性值约简

2.3 区分矩阵与区分函数

2.3.1 区分矩阵

2.3.2 区分函数

2.4 主要概念与运算的信息论表示

2.4.1 基本概念

2.4.2 信息论表示

2.5 本章小结

第三章 基于信息熵的高效知识约简算法

3.1 问题的提出及意义

3.2 信息表与决策表

3.3 条件信息熵

3.3.1 现有条件信息熵的局限性

3.3.2 新的条件信息熵

3.3.3 信息论等价表示

3.4 新的属性重要性及其性质

3.5 基于新条件信息熵的高效知识约简算法

3.5.1 计算条件信息熵

3.5.2 计算核

3.5.3 计算约简

3.5.4 实验结果

3.6 本章小结

第四章 决策表的转换

4.1 相关工作

4.2 决策表的转换

4.2.1 转换算法

4.2.2 算法正确性证明

4.2.3 算法复杂度分析

4.2.4 转换对知识约简的影响

4.3 基于数据库系统的Rough集模型中知识约简算法的扩展

4.3.1 Han方法的不足

4.3.2 基于数据库系统的Rough集模型

4.3.3 模型的扩展

4.3.4 仿真实验

4.4 三种区分矩阵的关系

4.4.1 三种区分矩阵

4.4.2 区分矩阵的关系

4.5 本章小结

第五章 不一致决策表的知识约简

5.1 相关工作

5.2 知识约简类型

5.3 知识约简的实施

5.3.1 实施知识约简的方法

5.3.2 时间复杂度分析

5.4 分布约简与约简的信息论定义

5.5 λ—Fuzzy约简

5.5.1 概念的引入

5.5.2 实施和复杂度分析

5.5 仿真实验

5.7 本章小结

第六章 在汉语处理中的应用

6.1 自然语言处理

6.2 语言学知识发现

6.3 基于Rough集的知识发现

6.3.1 决策规则

6.3.2 最小规则集

6.3.3 规则的使用

6.4 词类标注

6.4.1 已有方法

6.4.2 Rough集方法

6.4.3 程序设计

6.4.4 仿真实验

6.5 在句法分析中的应用

6.5.1 已有方法

6.5.2 汉语句法分析

6.5.3 谓语中心词的识别

6.5.4 基于Rough集的识别结果评判

6.5.5 仿真实验

6.6 本章小结

第七章 全文总结和今后工作

7.1 全文总结

7.2 今后工作

参考文献

致谢

个人简历、在学期间的研究成果及发表的学术论文

一、个人简历

二、论文

三、教学与科研成果

发布时间: 2006-11-28

参考文献

  • [1].不一致决策表数据处理方法研究[D]. 尹林子.中南大学2013
  • [2].基于不一致决策表的知识约简方法研究[D]. 曾凡智.华中科技大学2009
  • [3].基于粗糙集理论的动态数据挖掘关键技术研究[D]. 王永生.北京科技大学2016
  • [4].基于粗糙集的决策表知识约简研究[D]. 黄国顺.华中科技大学2007
  • [5].基于粗糙集理论的隐私保护数据挖掘研究[D]. 叶明全.合肥工业大学2013
  • [6].Rough集理论及其应用中若干问题的研究[D]. 李凡.电子科技大学2008
  • [7].基于数据挖掘的智能决策研究[D]. 张文宇.西北工业大学2003
  • [8].基于Rough集的不完备信息处理方法研究[D]. 官礼和.西南交通大学2012
  • [9].粗糙数据分析模型与算法研究[D]. 魏巍.山西大学2012
  • [10].基于统计学习理论的分类方法研究[D]. 殷志伟.哈尔滨工程大学2009

相关论文

  • [1].基于粗糙集和数据库技术的知识发现与推理方法研究[D]. 乔梅.天津大学2005
  • [2].基于分类模型的知识发现机理和方法研究[D]. 蒙祖强.中南大学2004
  • [3].基于粗糙集的数据挖掘算法研究[D]. 刘文军.北京师范大学2004
  • [4].基于粗糙集的知识发现及在CRM中的应用研究[D]. 魏娟.哈尔滨工程大学2006
  • [5].知识发现中粗糙集理论的研究[D]. 刘少辉.中国科学院研究生院(计算技术研究所)2003
  • [6].基于生物启发计算的知识发现关键技术研究与实现[D]. 彭京.四川大学2006
  • [7].基于粗糙集理论的数据挖掘算法研究[D]. 张静.西北工业大学2006
  • [8].基于粗糙集的知识发现方法研究[D]. 孙成敏.吉林大学2006
  • [9].基于多层关联规则的概念分层知识库中知识发现的研究[D]. 金胜男.天津大学2006
  • [10].基于粒度计算的知识发现研究及其应用[D]. 刘勇.浙江大学2006

标签:;  ;  ;  ;  ;  

基于Rough集的知识发现及其在汉语处理中的应用
下载Doc文档

猜你喜欢