论文题目: 基于领域知识的知识发现研究
论文类型: 博士论文
论文专业: 计算机应用技术
作者: 杨立
导师: 王裕国
关键词: 面向服务的体系结构,本体,知识发现,领域知识,语义距离,意外规则
文献来源: 中国科学院研究生院(软件研究所)
发表年度: 2005
论文摘要: 目前,知识发现的研究与应用是学术界和应用领域关注的热点,但是面对通常是领域相关的复杂应用环境,现有的知识发现研究在体系结构和算法方面尚未很好地融入领域知识,应用效果难如人意。如何从面向最终用户的角度出发,实现基于领域知识的知识发现,成为了现阶段知识发现研究和应用的焦点问题之一。随着面向服务的架构及语义网技术的发展,如何在面向服务的架构上实现知识发现应用也成为下一代知识发现系统研究领域内一个新的课题。因此本文主要对基于领域知识的知识发现展开讨论,具体在以下两个方面即:面向服务的、可融入领域知识的知识发现体系结构和基于领域知识的知识发现算法等进行了研究,取得了如下创新性研究成果: 1)、提出了一个新的面向服务的知识发现体系结构SOA4KD,建立了一个知识发现服务的质量评价体系,提出了一个基于示例学习的元学习算法来保障知识发现服务的质量。 2)、提出了一种基于领域本体服务,用户通过自然语言输入知识发现需求的方案及算法。首先对领域本体进行了分层细化,然后提出了一个扩展的知识发现任务本体,将可能的问题元素和知识发现任务联系起来,最后给出了一个语义解释算法,将用户以自然语言方式表达的需求转化为计算机可理解的形式化语言,并证明了该算法是可靠的和完整的。通过该方法,用户可以自助地在SOA4KD上实现知识发现应用。 3)、提出一种基于语义距离的最近邻分类方法SDkNN。该方法基于领域本体服务计算语义距离,并将其应用到最近邻算法中,提高了分类性能。经过在UCI数据集以及实际应用数据集中验证,SDkNN的整体性能要优于传统方法,在数据不完整的情况下效果更为明显,实践证明SDkNN有很好的应用价值。 4)、提出了一种基于本体服务的多层次意外分类规则发现算法。通过逐层知识推送和启发式规则判断意外性,可以有效提高算法效率和精度。实验证明该方法的整体性能要优于传统方法,并存实际应用中得到了验证。 5)、提出了一种基于VSOM的两阶段神经网络模型,实验表明该模型可以克服传统RBFNN需要手工定义聚类个数和中心的不足,并可以解决数据分布不平衡对预测结果的影响。基于上述神经网络模型提出了一种融合领域知识的保险洪灾损失预测模型,该模型将基于DEM的地形等因子抽象出来,并融合当地的领域知识-洪灾风险图,实验证明该方法可以明显提高模型的泛化能力。 6)、基于模型-控制-视图(MVC)设计模式实现了一个面向服务的知识发现系统原型。通过在保险公司内部进行应用,展现了该系统的应用潜力。 最后,对全文进行总结,分析目前研究工作中有待完善的地方,同时指明了进一步研究的方向。
论文目录:
摘要
ABSTRACT
目录
图表目录
第一章 绪论
1.1 研究背景
1.2 研究目标和主要内容
1.3 本文的贡献
1.4 本文的结构
第二章 知识发现系统研究综述
2.1 引言
2.1.1 知识发现和数据挖掘
2.1.2 知识发现应用状况和研究内容
2.1.3 知识发现系统
2.2 一个知识发现系统的基本需求
2.3 已有的典型知识发现系统及结构
2.3.1 第一、二代知识发现系统
2.3.2 下一代知识发现系统
2.4 小结与展望
第三章 基于领域知识的知识发现算法研究综述
3.1 引言
3.2 领域知识的概念
3.2.1 定义
3.3 领域知识在知识发现中的角色
3.3.2 数据选择阶段
3.3.2 数据预处理阶段
3.3.3 数据转换阶段
3.3.4 数据挖掘阶段
3.3.5 模式解释/评价阶段
3.3.6 领域知识的反馈
3.4 领域知识的表示
3.4.1 常用的知识表示方法
3.4.2 知识发现中常用的领域知识表示方法
3.5 领域知识在知识发现的研究现状和前景
3.5.1 数据预处理阶段
3.5.2 数据挖掘阶段
3.5.3 模式解释/评价阶段
3.5.4 展望
3.6 小结
第四章 一个面向服务的知识发现体系结构SOA4KD
4.1 引言
4.2 相关定义和概念
4.3 面向服务的知识发现体系结构SOA4KD
4.3.1 基于自然语言的知识发现需求获取
4.3.2 知识发现服务质量本体KDSQO
4.3.3 基于示例学习的元学习器
4.4 实现技术
4.4.1 问题分词过程
4.4.2 KDS描述及发现
4.4.3 多质量因子的元学习器实现
4.5 实验与评价
4.5.1 一个应用实例
4.5.2 相关系统特点比较
4.6 结论
第五章 一种基于语义距离的最近邻分类方法
5.1 引言
5.2 最近邻方法
5.3 基于本体的语义距离计算方法
5.3.1 本体
5.3.2 语义距离
5.4 基于语义距离的最近邻方法-SDKNN
5.4.1 数据预处理-计算wf
5.4.2 算法描述
5.5 实验
5.5.1 实验设计
5.5.2 实验结果分析
5.5.3 讨论
5.6 小结及未来工作方向
第六章 利用本体发现多层次意外分类规则
6.1 引言
6.2 相关研究工作
6.3 整体框架
6.4 相关定义
6.5 剪枝策略
6.6 基于本体的多层次意外规则发现算法
6.7 预测问题
6.8 实验
6.9 小结及未来工作方向
第七章 一种基于VSOM的两阶段神经网络模型及其在保险洪灾损失预测中的应用
7.1 研究背景
7.2 问题描述
7.3 技术路线
7.4 保险洪灾损失预测模型整体架构
7.4.1 地形因子
7.4.2 排水能力因子
7.4.3 模型建立
7.4.4 一个基于VSOM的两阶段神经网络模型
7.4.5 融入领域知识以提高模型的泛化能力
7.5 实例验证
7.6 小结
第八章 一个原形系统EASYMINER
8.1 引言
8.2 基于MVC的知识发现过程分析
8.3 系统功能结构
8.4 实例研究-本文主要内容的综合应用
8.5 小结
第九章 结论与展望
9.1 本文工作总结
9.2 今后的工作
参考文献
致谢
发表文章目录及参加的科研应用项目
发布时间: 2005-07-08
参考文献
- [1].领域知识的获取[D]. 李卫.北京邮电大学2008
- [2].基于本体的应急领域知识表示与复用研究[D]. 李华.天津大学2008