列表类自动问题问答系统的设计与实现

论文摘要

我们已经进入了一个信息飞速发展的时代。面对排山倒海的文字信息,如何从中找到问题的确切答案成了一个重要的研究课题。自动问题回答系统是能够根据用户输入的自然语言问题返回确切答案的系统。由于问题的答案往往不止一个,因此如何在非结构化的文本语料中寻找到尽可能多的正确答案是一个非常重要的研究课题。本文首先阐述了列表类问题回答与一般问题回答的区别,列表类问题要求返回尽可能多的正确答案,且答案的个数不确定,然后针对列表类自动问题回答的任务要求及这些特点,设计了一个列表类问题回答的框架并实现了一个列表类问题回答系统。该系统在问题分析答案分类过程中,抽取问题中的关键词并根据该关键词来对答案类型的所属进行分类;在文档检索中系统采用一种基于短语的检索模型,灵活有效地调节查询词的长度与权重,来提高文档检索的性能;在答案排序中,提出了一种基于答案与上下文中词的距离的排序模型来对最终答案进行排序。本文提出的框架在一定程度上解决了如何在返回尽可能多的答案的同时保证答案质量的问题。实验结果表明利用这些模型与算法的列表类问题回答系统与baseline系统相比,性能有显著的提高。

论文目录

摘要

Abstract

第1章引言

1.1 自动问题回答系统

1.2 列表类自动问题回答

1.3 本文概貌

第2章研究背景

2.1 TREC的问题回答任务

2.2 问题回答的分类及其研究进展

2.3 列表类问题回答的研究现状

第3章自动问答系统概览

3.1 系统工作流程

3.2 用户界面

第4章列表类问题回答的特点及其系统框架

4.1 列表类问题回答的特点

4.2 列表类问题回答系统的框架

第5章列表类问题回答的实现

5.1 问题分析

5.1.1 依存关系语法分析器

5.1.2 关键词抽取

5.2 答案类型分类

5.3 文档检索

5.3.1 查询词生成

5.3.2 索引生成

5.3.3 基于短语的检索模型

5.4 答案抽取

5.5 答案排序

5.5.1 基于距离的答案排序模型

第6章实验及评测

6.1 测试数据和评测方法

6.1.1 测试数据的选取

6.1.2 评测方法和指标

6.2 问题分析与答案分类

6.2.1 问题分析

6.2.2 答案类型分类

6.3 文档检索

6.3.1 文档排序模型

6.3.2 句子排序模型

6.3.3 检索模型各要素对性能的影响

6.4 候选答案抽取

6.5 答案排序

6.5.1 答案距离排序模型的效果评价

6.5.2 答案排序模型各因素的作用评价

6.5.3 答案排序模型在TREC中的成绩

第7章结论和展望

参考文献

攻读硕士学位期间参加的科研项目和发表的论文

致谢

列表类自动问题问答系统的设计与实现

论文摘要

论文目录

相关论文文献

猜你喜欢