论文摘要
本论文结合全文信息检索新技术,提出了使用答案集相似度计算方法和答案重组的基于Web智能答疑技术,该技术主要包括三个组成部分:问句理解、信息检索和答案匹配与抽取。在问句理解模块中,本文利用自然语言处理技术中的词法分析和句法分析,对用户用自然语言提出的问题首先是进行最基本的预处理,包括问句分词和词性标注,然后去停用词后进行问题分类,提取问句特征项,并进行问句特征项扩展和疑问意向匹配。本文的词性标注模块使用了基于转换的错误驱动的学习方法,使用了信息增益法对问题类型进行提取,同时在问句特征项提取过程中使用知识点、疑问意向和问句类型细化的方式对关键词进行提取。在答案信息检索模块中,使用跨网页查询技术建立本地文档库,同时使用全文信息检索技术,该方式可以解决目前答疑系统因采用答案库,导致查询速度慢及跨平台性不高的缺陷。在信息检索过程中,对信息检索结果按照一定的规则进行排序和过滤,并进行了分页处理。在答案匹配与抽取中,由于答案信息检索后产生的答案片段集有很多,可选取最前面的若干个做进一步的答案片段过滤。对答案片段过滤后可以对这些答案集合两两进行相似度计算,选取相似最多的答案片段集合中的一个作为最终的答案,如果答案集中产生的答案都不相似,则可通过疑问意向词、问题分类词等信息做进一步的过滤,选取其中最前面的一个作为最终答案,然后通过对最终答案进行重组将答案返回给用户。最后本文利用JSP技术构建了并实现了一个基于Web的智能答疑系统,实验结果取得了不错的结果,但还有提高的空间。
论文目录
摘要ABSTRACT第1章 概述1.1 研究背景1.2 国内外研究现状1.2.1 国外研究现状1.2.2 国内研究现状1.3 研究内容和研究意义1.3.1 研究内容1.3.2 本文的创新及其意义1.4 论文结构安排第2章 基于WEB 的智能答疑系统的需求分析与总体设计2.1 系统需求2.1.1 系统功能需求2.1.2 系统性能需求2.2 技术思想2.3 系统总体结构研究2.4 系统开发相关技术2.4.1 JSP 动态网页技术2.4.2 Tomcat 应用服务器2.4.3 数据库访问技术第3章 智能答疑主要技术的研究3.1 问句理解3.1.1 问句理解框架3.1.2 问句分词与词性标注3.1.3 问句分类与分析3.1.4 问句特征项提取3.1.5 问句特征项扩展3.2 答案信息检索模块3.2.1 本地文档库的采集和索引建立3.2.2 答案信息检索框架3.2.3 问句的信息检索3.2.4 答案预处理3.3 答案匹配与抽取模块3.3.1 答案匹配与抽取框架3.3.2 答案片段过滤3.3.3 答案重组第4章 基于WEB 的智能答疑系统实现与测试4.1 系统实现4.1.1 词库和本地文档库实现4.1.2 问句理解模块实现4.1.3 答案信息检索模块实现4.1.4 答案匹配与抽取模块实现4.2 实验结果及评测4.2.1 实验结果4.2.2 实验结果评测第5章 总结与展望5.1 论文总结5.2 论文展望参考文献硕士期间发表的文章致谢
相关论文文献
标签:智能答疑论文; 全文信息检索论文; 问句理解论文; 答案匹配论文;