论文摘要
我们已经进入了一个信息飞速发展的时代。面对排山倒海的文字信息,如何从中找到问题的确切答案成了一个重要的研究课题。自动问题回答系统是能够根据用户输入的自然语言问题返回确切答案的系统。由于问题的答案往往不止一个,因此如何在非结构化的文本语料中寻找到尽可能多的正确答案是一个非常重要的研究课题。本文首先阐述了列表类问题回答与一般问题回答的区别,列表类问题要求返回尽可能多的正确答案,且答案的个数不确定,然后针对列表类自动问题回答的任务要求及这些特点,设计了一个列表类问题回答的框架并实现了一个列表类问题回答系统。该系统在问题分析答案分类过程中,抽取问题中的关键词并根据该关键词来对答案类型的所属进行分类;在文档检索中系统采用一种基于短语的检索模型,灵活有效地调节查询词的长度与权重,来提高文档检索的性能;在答案排序中,提出了一种基于答案与上下文中词的距离的排序模型来对最终答案进行排序。本文提出的框架在一定程度上解决了如何在返回尽可能多的答案的同时保证答案质量的问题。实验结果表明利用这些模型与算法的列表类问题回答系统与baseline系统相比,性能有显著的提高。
论文目录
相关论文文献
- [1].基于依赖关系的定义类问题回答系统[J]. 自动化学报 2009(11)
- [2].基于错误驱动算法组合分类器及其在问题分类中的应用[J]. 计算机研究与发展 2008(03)
- [3].开放领域的QA系统结构及性能分析[J]. 模式识别与人工智能 2009(04)