基于本体的农业自动应答系统关键技术研究

论文摘要

随着网络技术的发展，信息获取成为人们工作生活中的重要组成部分，因此也极大地推动了自然语言处理技术的发展，同时也对自然语言处理技术提出了更高的要求，如何在网络世界中快速、准确地获得服务是研究的一大难点。自动应答系统正是在这种情况下产生发展的。自动应答系统是搜索的一种形式，并且对于传统的搜索形式应答系统能更好的改善搜索质量。目前国内的应答系统尚处于探索阶段，较低的自然语言处理水平和人工智能的发展水平制约了自动应答系统的智能水平。现有的自动应答技术比较集中在对用户的输入问句进行关键词的检索匹配，对其中的关键部分—语义理解涉及的不是很多。针对上面问题，本文提出引入领域本体作为语义理解的基础。本体(ontology)是一种用来描述概念及概念与概念之间关系的模型，包含领域的较完整的知识和丰富的语义关系，把这些资源通过方法应用到应答查询中，使得一定程度上帮助解决语义理解不足的问题。文章通过构造一个小型的本体来协助完成问题的理解、检索以及问句间的语义相似度计算。确定本体的范畴，提取领域中的概念，定义概念属性及相互关系，用本体描述语言描述本体，确定本体的存储方式。对应答系统进行模块设计，建立问题—答案库，并在本体提供的知识背景下对用户和问题—答案库中的问句进行分析处理，提取问句的句型和中心概念及扩展概念集，设计检索方案，在问题—答案库中查找候选问句集。将得到的问句集与用户问句进行语句相似度计算，将结果值高于阈值的问句—答案对作为结果返回。目前普遍使用的语句相似度算法倾向于基于统计的方法和基于语义词典的计算方法，前者不考虑词语本身携带的语义信息，后者则受词典本身的限制。因此在借鉴现有算法的基础上，文章提出使用基于本体的语义相似度计算方法，主要讨论并构造了概念之间和问句之间的语义相似度计算模型。概念间相似度算法主要通过对本体中不同概念之间的各个属性进行对比，判别它们在各个属性上的相同与否来得到概念间的语义相似度，同时对其近邻概念集进行相似度比较，最终加权得到线性方程来确定概念在领域本体背景下的相似度。为了保证在概念数目较多时的计算精度，文章引入禁忌算法来寻找最优解。在得到概念间相似度的基础上设计问句向量模型，借鉴向量空间计算方法来得到问句间的相似度。最后介绍系统原型并通过实验分析，证明算法的正确性和有效性。

论文目录

摘要

Abstract

1 序论

1.1 研究意义与背景

1.2 国内外研究发展现状

1.2.1 自动应答系统

1.2.2 本体

1.3 论文内容和结构

1.3.1 研究内容

1.3.2 论文结构

2 本体的相关技术

2.1 本体的定义及特性

2.2 本体的分类

2.3 本体的设计原则

2.4 本体的描述语言

2.5 本体的开发方法

3 自动应答系统通用技术研究分析

3.1 主要模块

3.1.1 问题处理模块

3.1.2 候选问题检索模块

3.1.3 问句语义相似度计算

3.2 词语相似度及相关计算方法

3.2.1 词语相似度的概念

3.2.2 基于语料统计的方法

3.2.3 基于语义词典的方法

3.3 句子相似度及其传统计算方法

3.3.1 句子相似度的概念

3.3.2 基于向量空间模型的IF-IDF方法

3.3.3 基于语义依存的相似度计算方法

4 基于本体的农业自动应答系统关键技术研究

4.1 本体构建

4.1.1 应答系统的本体特点

4.1.2 领域本体构建

4.1.3 本体的存储

4.1.4 本体对知识的管理

4.2 基于本体的问题处理

4.2.1 问句预处理

4.2.2 问句标准型转换

4.2.4 问句类型分析转换过程

4.2.5 问句语义信息提取

4.3 问题检索

4.4 基于本体的语义相似度计算

4.4.1 基于本体的问句向量表示

4.4.2 基于本体的概念语义相似度计算

4.4.3 基于本体的句子语义相似度计算

5 基于本体的农业自动应答系统总体设计与算法性能分析

5.1 系统的总体分析设计

5.2 算法性能分析

6 总结与展望

6.1 本文主要工作

6.2 需进一步研究的问题

参考文献

在读期间发表的学术论文

作者简介

致谢

基于本体的农业自动应答系统关键技术研究

论文摘要

论文目录

相关论文文献

猜你喜欢