论文题目: 基于Kolmogorov复杂性的知识获取方法研究
论文类型: 博士论文
论文专业: 计算机科学与技术
作者: 郝宇
导师: 张钹,朱小燕
关键词: 复杂性,知识获取,规则优化,条件信息距离
文献来源: 清华大学
发表年度: 2005
论文摘要: 1.将Kolmogorov复杂性引入到知识获取规则集的优化问题中。根据最小描述长度准则,推导出一般知识获取系统中,知识获取规则集优化的目标函数。并以此为基础,提出了基于规则扩展和局部搜索的规则库优化算法。2.参与设计并建立了生物文献知识提取系统,系统通过预处理,自动规则提取,规则优化及规则动态匹配,实现了从生物医学文献中提取蛋白质关系的功能,并初步达到实用。基于Kolmogorov复杂性的规则优化算法在大大减少规则数量的前提下,性能提高了8.9%。3.在信息距离的基础上,定义了条件信息距离,并推导出条件信息距离的一般计算公式,并证明了条件信息距离满足距离的一般性质。通过多义词的实验,说明了条件信息距离比一般信息距离能够更全面、准确、灵活地把握概念之间的关系,因而具有很好的理论潜力和应用前景。4.依据编码定理,给出了对象x的Kolmogorov复杂性K(x)和条件复杂性K(x|c)的近似计算方法。根据信息距离和条件信息距离的计算公式,提出基于大规模数据统计的信息距离NSD和c条件下的条件信息距离CNSD及其计算方法。并通过词形相似词的实验证明了NSD比当前流行的基于压缩的相似性度量CDM,在获取概念信息关系等底层知识时的优越性。5.为克服条件信息距离中条件定义的不确定性,提出了基于条件模式的扩展条件信息距离。首先确定需要处理的语义关系,并根据特定的语义关系生成一组语法规则,然后将语法规则转化为条件模式。提出了条件模式下的扩展条件信息距离的计算方法。利用语义规则为y-ISA-x的扩展条件信息距离,设计并实现了一个概念分类知识获取系统。并通过把用户的需求转换为条件模式,实现了一个智能问答系统。
论文目录:
第1章 引言
1.1 研究的目的、意义及研究背景
1.2 知识获取的方法
1.3 知识获取的内容
1.4 文本知识获取研究现状
1.5 利用信息距离进行知识获取
1.6 论文内容安排
第2章 KOLMOGOROV 复杂性
2.1 KOLMOGOROV 复杂性的定义
2.2 通用概率分布
第3章 知识获取规则的优化
3.1 最小描述长度原则
3.2 基于KOLMOGOROV 复杂性的规则优化算法
3.3 生物关系提取系统概述
3.4 描述长度的计算
3.5 规则扩展
3.6 局部搜索
3.7 实验设计
3.8 实验结果及讨论
3.9 本章小结
第4章 条件信息距离及其统计实现
4.1 正规化信息距离
4.2 条件信息距离
4.3 KOLMOGOROV 复杂性的近似计算方法
4.4 基于压缩的信息距离
4.5 通用统计分布
4.6 基于大规模数据统计的信息距离与条件信息距离
4.7 词的多义
4.8 本章小结
第5章 条件信息距离的扩展
5.1 概念关系与条件模式
5.2 分类知识的获取
5.3 聪明的问答系统
5.4 本章小结
第6章 结论
参考文献
致谢
声明
个人简历、在学期间发表的学术论文与研究成果
发布时间: 2006-06-29
参考文献
- [1].领域文本知识获取方法研究及其在考古领域中的应用[D]. 张春霞.中国科学院研究生院(计算技术研究所)2005
- [2].基于粗糙集理论的不确定信息处理与知识获取方法研究[D]. 冯林.西南交通大学2008
- [3].不完备数据的动态知识获取方法研究[D]. 罗川.西南交通大学2015
- [4].面向中医辨证计算的粗糙集知识获取方法及其应用研究[D]. 施明辉.厦门大学2008
相关论文
- [1].基于遗传模糊系统的知识获取方法研究[D]. 张弘.吉林大学2004
- [2].基于粗糙集的不完备信息系统知识获取理论与方法[D]. 黄兵.南京理工大学2004
- [3].中文文本自动分类中的关键问题研究[D]. 薛德军.清华大学2004
- [4].知识获取中的Rough Sets理论及其应用研究[D]. 马玉良.浙江大学2005
- [5].复杂性科学的方法论研究[D]. 黄欣荣.清华大学2005
- [6].Web挖掘中的降维和分类方法研究[D]. 孙建涛.清华大学2005
- [7].量子信息论与计算经济学中若干算法与复杂性问题研究[D]. 孙晓明.清华大学2005
- [8].领域文本知识获取方法研究及其在考古领域中的应用[D]. 张春霞.中国科学院研究生院(计算技术研究所)2005
- [9].数学概念的知识获取与分析方法研究[D]. 曾庆田.中国科学院研究生院(计算技术研究所)2005
- [10].模式分类与视觉导航中的分层数据处理研究[D]. 何英华.清华大学2005