论文题目: 基于本体的语义信息系统研究——理论分析与系统实现
论文类型: 博士论文
论文专业: 情报学
作者: 余传明
导师: 董慧
关键词: 语义互连网,语义信息系统,信息抽取,语义检索,信息可视化
文献来源: 武汉大学
发表年度: 2005
论文摘要: 语义信息系统是情报学研究的一个全新的领域,对这个新兴的领域进行探索具有非常重要的意义。首先,能够从一定程度上满足人们知识需求的需要,知识经济的发展使得人们对于信息的需求也发生了根本的变化,人们对于信息的需求转化为知识需求,这就使得信息的加工朝着系统化组织资源,提炼知识的方向发展;符合了信息系统向语义互连网融合的趋势,目前Internet在信息表达和检索方面存在缺陷,主要在于其设计目的是面向用户的直接阅读和处理,而没有提供计算机可读的语义信息,因此限制了计算机在信息检索中的自动分析处理以及进一步的智能化处理的能力,而语义互联网,将力求使计算机之间能够从语义层次上互相理解和沟通,这对于传统的互联网将产生巨大推动和革命作用;能够弥补传统信息检索的不足,传统的关键词的检索方式曾经在一定程度上满足过用户的需求,由于字义本身与其概念的延伸不在同一级上,这使得寻找的结果可能仅仅是与字面意义或某层意义相匹配,但人们想要的往往是这个信息的概念及其相关成分,而不仅仅是字面所表达的意思,基于语义进行信息检索,正好能够满足此项需求;符合信息系统自身从传统的面向句法和结构转为面向语义的趋势,在传统的信息系统中,异构信息的处理和分布式信息的处理已经成为热点,解决这些问题的核心是提高信息系统的互操作能力,而“信息系统互操作的核心将由系统、句法、结构转为语义”,从这个意义上说,开发语义信息系统本身具有十分关键的作用。 本文正是从这一实际出发,探讨了一种新的信息系统——语义信息系统的概念和原理,以本体作为语义信息系统的基础,从语义信息描述、语义信息获取、语义信息检索、语义信息输出四个方面对语义信息系统的技术细节进行了深入分析,并结合实际,讨论了一个以历史事件为研究领域的语义信息系统(国共两党合作语义信息系统——GGHZ-SIS)的设计、构建和实现。全文共计十万余字,分八章,主要内容如下: 1.语义信息系统概述 语义信息系统还是一个全新的概念,这一章十分详细的分析了语义信息系
论文目录:
中文摘要
英文摘要
0 前言
0.1 语义信息系统的研究背景
0.1.1 本体技术开始应用于信息系统
0.1.2 知识管理研究逐步工程化
0.1.3 语义互联网开始萌芽
0.1.4 自然语言处理技术取得进步
0.2 语义信息系统的研究意义
0.3 本文的研究内容以及思路
0.4 本文的研究方法
0.5 本文的创新之处
1 语义信息系统概述
1.1 什么是语义信息系统
1.1.1 信息与语义信息
1.1.2 信息系统和语义信息系统
1.2 语义信息系统的构成
1.2.1 语义描述子系统
1.2.2 语义提取子系统
1.2.3 语义存储子系统
1.2.4 语义查询子系统
1.2.5 语义输出子系统
1.3 语义信息系统的特性
1.3.1 语义信息系统与管理信息系统
1.3.2 语义信息系统与决策支持系统
1.3.3 语义信息系统与竞争情报系统
1.3.4 语义信息系统与专家系统
1.4 语义信息系统构建
1.5 小结
2 语义信息系统的基础——本体
2.1 本体概述
2.1.1 本体的定义
2.1.2 本体的分类
2.1.3 本体与叙词表的关系
2.2 常用的本体
2.2.1 WordNet
2.2.2 知网
2.2.3 SUMO
2.3 本体的构建方法
2.3.1 骨架法(Skeletal Methodology):
2.3.2 Methontology方法
2.3.3 循环获取过程(Cyclic Acquisition Process):
2.4 本体的自动获取
2.4.1 本体获取步骤
2.4.2 评估
2.5 小结
3 语义信息描述
3.1 RDF和RDFS
3.1.1 RDF
3.1.2 RDFS
3.2 DAML
3.3 OWL
3.3.1 OWL Lite中的RDFS特征
3.3.2 OWL Lite中的等价与不等价
3.3.3 OWL Lite的属性特征
3.3.4 OWL Lite的性质限制
3.3.5 OWL Lite基数限制
3.3.6 OWL DL和OWL FULL的增值特征
3.4 小结
4 语义信息提取
4.1 什么是语义信息提取
4.2 西文语义信息提取的原型分析
4.2.1 SMORE
4.2.2 OntoMat Annotiser
4.2.3 AeroDAML
4.2.4 Annotea
4.2.5 比较
4.3 中文语义信息提取的特殊性
4.3.1 词语切分
4.3.2 词性标注
4.3.3 句法分析
4.4 基于浅层句法分析的语义信息提取
4.4.1 语义实体提取
4.4.2 语义关系提取
4.5 小结
5 语义信息检索
5.1 什么是语义检索
5.2 语义检索的原理
5.2.1 对检索入口赋予语义
5.2.2 对信息组织赋予语义
5.2.3 对检索结果赋予语义
5.2.4 利用语义描述本体进行推理
5.3 语义检索的实现
5.3.1 基于SOAP的检索实现
5.3.2 基于OWL-QL的检索实现
5.3.3 基于RDQL的检索实现
5.3.4 比较
5.4 小结
6 语义信息输出可视化
6.1 语义信息可视化的目的与任务
6.2 语义信息可视化组件分析
6.2.1 TGVizTab
6.2.2 OntoViz
6.2.3 Jambalaya
6.2.4 OntoRama
6.2.5 比较
6.3 小结
7 国共两党合作语义信息系统的设计与实现
7.1 GGHZ-SIS开发原则与系统构架
7.1.1 实现原则
7.1.2 系统构架
7.2 GGHZ-SIS的开发平台与工具
7.2.1 开发平台
7.2.2 所用的工具
7.3 GGHZ-SIS语义描述模块实现
7.3.1 实现思路
7.3.2 结果
7.4 GGHZ-SIS语义提取模块实现
7.4.1 实现思路
7.4.2 关键步骤
7.4.3 结果
7.5 GGHZ-SIS语义检索模块实现
7.5.1 实现思路
7.5.2 Browser端的实现
7.5.3 语义索引的实现
7.5.4 语义搜索的实现
7.5.5 结果
7.6 GGHZ-SIS语义输出模块实现
7.6.1 实现思路
7.6.2 数据结构
7.6.3 语义数据的读取
7.6.4 节点和边的生成
7.6.5 界面交互的实现
7.6.6 结果
7.7 小结
8 结语
图表索引
参考文献
发布时间: 2006-03-27