问答式OWL知识检索技术

问答式OWL知识检索技术

论文摘要

问答式检索以其符合普通用户行为习惯的输入输出模式、满意的准确度成为信息检索技术中的研究热点,先后出现了:面向数据库的问答式检索技术、面向Web的问答式检索技术、面向本体的问答式检索技术。但是,现有的问答式检索系统依然存在以下问题:(1)常用的手动建立和自动学习知识获取方式在建立效率和质量方面存在限制;(2)处理问题映射的方法通常是半自动的,需要用户手动解决语义模糊问题;(3)处理包含模糊概念和关系的问题存在困难。2004年被W3C推荐为工业标准的网络本体语言(Web Ontology Language,OWL)已经成为Web上知识表示和共享的基础。大量个人和学术团体专注于自动学习和手动建立不同领域的用OWL规范表示的本体知识库(本文称为OWL知识),Web上将保存大量OWL版本的本体知识。检索这些知识,实现用户和Web智能体间的动态交互已经成为Web智能(Web Intelligence)领域的重要研究内容。针对问答式检索存在的问题,结合OWL语言规范的特点,本文集中研究了问答式OWL知识检索技术中三个重要问题:获取OWL知识库、映射自然语言问题成为OWL查询、扩展OWL语言的知识表示能力。这三个问题的研究内容和主要结果如下:1.鉴于目前两种直接知识获取方式:手动建立和自动学习在本体建立效率和本体质量方面的限制,本文集中研究包括搜索、聚类、后处理三个关键步骤的OWL知识间接获取。基于OWL知识的主要语义特征(概念可以组织成具有等级的层次结构;复杂概念的语义通过简单概念说明;类的语义可以通过一些属性限制等。),提出了粗粒度和细粒度的OWL知识语义相似性计算方法,并用它们完成了OWL知识间接获取的两个重要步骤:搜索和聚类OWL文档。实验结果表明,粗粒度语义相似性计算方法具有较好的过滤和排序性能;尽管细粒度语义相似性计算方法对手工建立和自动学习到的OWL文档在参数设定方面有区别,但是只要输入正确的类型个数就能获得正确的聚类结果。2.给定自然语言问题和OWL知识源,将自然语言问题映射为语义等价的OWL查询(RDF元组集)是获取正确答案的关键。为了完成上述任务,本文提出了一种三阶段语义映射框架,并在该框架的基础上研究了基于模糊约束满足和基于学习的两种自动语义映射方法及基于模版的查询组合方法,实现了一个问答式OWL知识检索原型系统——Agile。我们搜集了不同领域的三个OWL知识库和对应的问题集,以Agile为平台进行了一系列实验。结果表明:(1)自然语言处理技术、基于模糊约束的语义映射方法中软约束的优化顺序及两种组合精化方法对映射精度都有影响;(2)选定了软约束的优化顺序,知识库的具体结构差异会对基于模糊约束的语义映射方法有较少的影响;(3)消除了前两个阶段的错误影响,组合RDF元组时,两种精化方法可以极大的提高组合精度;(4)和基于模糊约束满足的语义映射算法中精度最高和最低的优化顺序比较,基于学习的映射算法精度通常介于二者之间;(5)树型、函数和懒惰型三类分类器上的比较实验说明:J48分类器在三个数据集上都取得了较好的效果。3.现有知识表示语言的局限,使得一些包含模糊概念和关系的问题无法处理。本文的另一研究侧面是利用现有技术,扩展OWL语言规范,实现模糊问题检索。首先,以模糊描述逻辑为语义基础,为OWL语言扩展了模糊概念和关系等算子,并提出了OWL现有概念到新增算子的转换规则用于统一扩展语言的语义。其次,以扩展语言为媒介,特化了Zadeh提出的PNL(Precisiated Natural Language)过程,提出一种用自然语言检索FOWL知识的PNL式系统,重写了PFL格式的DDB推理规则。最后,用一个应用实例说明了该系统的检索流程。本文的主要贡献如下:1.为了解决OWL知识的间接获取,基于OWL知识的语义特点,提出一种用于计算OWL文档语义相似性的算法,结合层次聚类技术对该方法进行了分析和验证。该方法较好的反映了OWL文档的语义特点,聚类效果比较明显。2.为了建立自然语言问题到RDF元组集的语义映射,提出一种基于模糊约束满足的语义映射方法。理论分析和实验验证表明该方法有较多优势:(1)该方法是完全自动的;(2)知识库的领域和结构差异对映射精度影响不大;(3)调整约束的优化顺序可提高映射的精度。3.为了增强映射过程的学习能力,提出了基于学习的语义映射用于完成词集到元素集的自动映射。实验结果表明在训练数据充足的情况下,选择J48分类器,算法精度可以达到80%。4.为了检索带模糊概念的问题,基于模糊描述逻辑扩展了现有OWL语言规范,并以扩展语言为知识表示方式,探讨了PNL式模糊知识问答系统。应用实例说明以扩展语言为知识源,利用模糊描述逻辑的推理机制和PNL式问答框架可以处理一些带模糊概念的自然语言问题。总之,本文可以作为问答式检索技术的一个研究范例,被推广到其他信息格式和其他知识表示形式,并最终为问答式检索向实用化发展提供可行途径。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景
  • 1.2 主要研究内容
  • 1.3 研究意义
  • 1.4 创新性工作
  • 1.4.1 OWL知识的间接获取
  • 1.4.2 问题到OWL查询的语义映射
  • 1.4.3 OWL语言的模糊扩展及应用
  • 1.5 本文结构
  • 1.6 本章小结
  • 第2章 OWL规范及相关研究
  • 2.1 本体语言简介
  • 2.1.1 本体
  • 2.1.2 本体语言
  • 2.2 OWL语言规范及扩展
  • 2.3 OWL知识获取
  • 2.3.1 手动建立知识库
  • 2.3.2 自动学习知识库
  • 2.3.3 知识的间接获取
  • 2.4 OWL知识查询
  • 2.4.1 基于工具的浏览
  • 2.4.2 基于特定查询语言的检索
  • 2.4.3 问答式检索
  • 2.5 本章小结
  • 第3章 问答式OWL知识检索系统
  • 3.1 系统剖析
  • 3.1.1 系统架构
  • 3.1.2 知识获取
  • 3.1.3 问题映射
  • 3.1.4 数据结构
  • 3.2 系统特点
  • 3.3 本章小结
  • 第4章 OWL知识的间接获取
  • 4.1 WI OntoSearch
  • 4.1.1 总体架构
  • 4.1.2 概念—权向量组匹配算法
  • 4.1.3 实验
  • 4.2 基于语义相似性的OWL知识聚类
  • 4.2.1 OWL知识的语义相似性算法(OWL-SSim)
  • 4.2.2 简单命名类之间的相似性
  • 4.2.3 复杂类之间的相似性
  • 4.2.4 实验
  • 4.3 OWL知识后处理
  • 4.3.1 扩充实例知识
  • 4.3.2 消除不一致性
  • 4.4 本章小结
  • 第5章 基于模糊约束满足的问题语义映射
  • 5.1 问题到OWL知识的语义映射
  • 5.1.1 自然语言问题
  • 5.1.2 OWL知识库
  • 5.1.3 语义映射
  • 5.2 形式化知识
  • 5.2.1 预处理
  • 5.2.2 分解自然语言问题
  • 5.2.3 解析OWL知识库
  • 5.3 基于模糊约束满足的语义映射方法
  • 5.3.1 模糊约束满足问题
  • 5.3.2 基于模糊约束满足的语义映射概述
  • 5.3.3 模糊约束
  • 5.3.4 实例
  • 5.4 组合OWL查询语言
  • 5.4.1 基于模板的组合方法
  • 5.4.2 识别隐含属性
  • 5.4.3 过滤噪声
  • 5.5 实验
  • 5.5.1 实验数据
  • 5.5.2 实验评估
  • 5.5.3 实验结果及分析
  • 5.6 本章小结
  • 第6章 基于学习的问题语义映射
  • 6.1 基于学习的语义映射工作流
  • 6.2 基于学习的语义映射算法
  • 6.2.1 样本空间建立
  • 6.2.2 特征提取
  • 6.3 实验
  • 6.4 本章小结
  • 第7章 OWL语言的模糊扩展及模糊查询
  • 7.1 扩展OWL语言处理模糊知识
  • 7.1.1 模糊描述逻辑FALC
  • 7.1.2 编码RDF/XML格式的模糊算子
  • 7.1.3 OWL到FOWL的转换
  • 7.2 PNL式模糊知识问答系统
  • 7.2.1 总体框架
  • 7.2.2 重写推理规则
  • 7.2.3 应用实例
  • 7.3 本章小结
  • 结论
  • 1 主要工作和贡献
  • 2 未来的工作
  • 参考文献
  • 攻读博士学位期间发表的学术论文
  • 致谢
  • 相关论文文献

    • [1].语义网中OWL本体概述及其构建方法研究[J]. 电脑知识与技术 2020(12)
    • [2].看似离谱的OWL与实则靠谱的自迭代玩法[J]. 电子竞技 2017(07)
    • [3].暴雪的野望:千呼万唤始出来的OWL[J]. 电子竞技 2017(15)
    • [4].OWL近日公布了选手签约、薪酬等信息[J]. 电子竞技 2017(17)
    • [5].OWL新增伦敦战队和第二支洛杉矶战队[J]. 电子竞技 2017(17)
    • [6].OWL本体在纺织企业的应用[J]. 大连工业大学学报 2010(02)
    • [7].基于OWL的成语典故本体构建研究[J]. 计算机技术与发展 2010(05)
    • [8].面向协同设计的产品模型的本体表达及OWL描述[J]. 烟台大学学报(自然科学与工程版) 2009(04)
    • [9].基于关系数据库的OWL本体存储与提取技术[J]. 计算机系统应用 2015(06)
    • [10].基于OWL本体的关系数据库语义映射方法的研究[J]. 沈阳理工大学学报 2009(01)
    • [11].软件分类的OWL知识表示[J]. 新乡学院学报 2014(06)
    • [12].一种基于关系数据库提取OWL本体的方法[J]. 计算机与信息技术 2011(10)
    • [13].基于OWL本体的知识表示研究[J]. 情报理论与实践 2010(09)
    • [14].基于关系数据库的OWL本体构建方法的研究[J]. 计算机科学 2009(07)
    • [15].OWL文件向关系数据库的映射及存储研究[J]. 计算机与现代化 2017(05)
    • [16].基于OWL属性特征的语义检索研究[J]. 电子设计工程 2010(02)
    • [17].基于OWL本体的法律知识库原型系统的设计和实现[J]. 现代情报 2010(07)
    • [18].基于OWL的教学反思本体构建研究[J]. 计算机技术与发展 2013(10)
    • [19].基于OWL的产品设计知识本体建模[J]. 制造业自动化 2012(13)
    • [20].基于关系数据库的OWL本体存储及查询方法[J]. 河南师范大学学报(自然科学版) 2012(02)
    • [21].穿越中西方象征诗林的“鸟”与“OWL”——《鵩鸟赋》与《猫头鹰与夜莺》中的“猫头鹰”意象之比较[J]. 兰州学刊 2011(01)
    • [22].一种支持自定义模糊数据类型表示的模糊OWL扩展[J]. 计算机科学 2011(06)
    • [23].基于OWL的网络管理领域本体构建方法[J]. 内江师范学院学报 2009(10)
    • [24].一种基于OWL的语义网数据划分与并行加载方法[J]. 计算机技术与发展 2014(02)
    • [25].基于OWL本体论语言的“工匠精神”知识本体与课程体系构建[J]. 当代职业教育 2019(06)
    • [26].一种由叙词表向本体OWL(Ontology Web Language)快速转换的转换算法[J]. 南华大学学报(自然科学版) 2016(04)
    • [27].基于关系数据库的OWL本体存储工具的设计[J]. 数字技术与应用 2014(12)
    • [28].带负授权RBAC模型的OWL表示及冲突检测[J]. 计算机工程与应用 2010(30)
    • [29].基于OWL的模具企业经验知识库构建方法的研究[J]. 计算机技术与发展 2011(03)
    • [30].语义网中OWL本体研究[J]. 硅谷 2011(23)

    标签:;  ;  ;  ;  ;  

    问答式OWL知识检索技术
    下载Doc文档

    猜你喜欢