基于搜索引擎的自动问答系统

基于搜索引擎的自动问答系统

论文摘要

自动问答系统能用准确简洁的答案回答用户使用自然语言提出的问题,作为一种新的信息获取方式,正受到越来越多的关注。传统的自动问答系统趋向使用结构化或半结构化的封闭式知识库系统,从而存在领域受限、更新滞后等缺点。互联网及搜索引擎的出现为自动问答系统重新构建知识库提供了新的机会。本文在对传统搜索引擎及自动问答系统的发展现状分析的基础上,设计并实现了一个高性能的基于搜索引擎的中文自动问答系统。该系统依托中文分词和名实体识别等自然语言技术,对自动问答系统中的两项关键技术---问句类型分析和答案挖掘算法进行了详细讨论。在此基础上,针对不同的问句类型,结合其特点和实际应用,分别提出了符合各自问句类型的答案挖掘算法。同时,本文实现了一个通用的支持人物,时间,地点这三类问题的应用系统,具有实际应用价值和可扩展性。本文提出的答案挖掘算法对中文信息处理及通用自动问答系统的相关研究具有一定的借鉴意义。实验结果证明,本文提出的问句类型分析和答案挖掘的算法有效的提高了MRR评价值,其中人物类型的问题的MRR值达到了0.75,三种问句类型的平均MRR也达到了0.6,基本上能够满足实际应用需求。自动问答系统是一个非常具有挑战性的课题,本文着重解决了三种基本问句类型的问题。以后将努力研究通用类型问题的解决,问句复述,相关性分析,系统实时性能的提高,以及答案精确度的进一步提高。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 选题背景和研究意义
  • 1.2 国内外研究现状
  • 1.2.1 问答系统概述
  • 1.2.2 面向开放领域的自动问答系统概述
  • 1.3 本文工作及论文安排
  • 1.3.1 本文工作
  • 1.3.2 论文结构
  • 第二章 相关技术与理论
  • 2.1 问题分类中的数学模型
  • LTP词法分析系统'>2.2 HITLTP词法分析系统
  • 2.3 搜索引擎的选择
  • 2.4 网页抓取
  • 2.4.1 域名解析(DNS Resolver)
  • 2.4.2 HTTP协议
  • 2.4.3 Socket介绍
  • 2.5 小结
  • 第三章 系统分析与设计
  • 3.1 系统分析
  • 3.1.1 传统搜索引擎体系结构
  • 3.1.2 AutoQA的功能需求
  • 3.1.3 AutoQA面临的挑战
  • 3.1.4 系统性能需求
  • 3.2 Auto QA的总体架构
  • 3.2.1 系统结构设计
  • 3.3 问句处理
  • 3.3.1 概述
  • 3.3.2 问句分类
  • 3.3.3 问句关键词提取与权值计算
  • 3.3.4 问句扩展
  • 3.4 搜索引擎返回结果处理
  • 3.4.1 语料提取策略
  • 3.4.2 提取相关句
  • 3.5 答案挖掘与排序
  • 3.6 本章小结
  • 第四章 系统实现
  • 4.1 系统实现的总体框架
  • LTP链接库'>4.2 HITLTP链接库
  • 4.3 问句处理模块
  • 4.3.1 问句关键词提取(QueryKeyword)
  • 4.3.2 问句类型(QueryType)
  • 4.3.3 问句扩展(QueryExtend)
  • 4.4 全局数据模块
  • 4.5 搜索引擎处理模块
  • 4.5.1 摘要抓取(CrawlAbstract)
  • 4.5.2 摘要净化(AbstractExtracter)
  • 4.6 答案挖掘模块
  • 4.6.1 答案挖掘(AnswerExtracter)
  • 4.6.2 答案合并(AnswerCombine)
  • 4.6.3 答案排序(AnswerSort)
  • 4.7 本章小结
  • 第五章 系统的测试
  • 5.1 评价标准与测试语料
  • 5.1.1 评价标准
  • 5.1.2 测试语料
  • 5.2 测试结果与分析
  • 5.3 自动问答系统性能演示
  • 5.4 本章小结
  • 第六章 结束语
  • 致谢
  • 参考文献
  • 相关论文文献

    • [1].基于道路法规知识图谱的多轮自动问答研究[J]. 现代情报 2020(08)
    • [2].面向知识自动化的自动问答研究进展[J]. 自动化学报 2017(09)
    • [3].基于深度学习算法的自动问答概述[J]. 信息与电脑(理论版) 2017(23)
    • [4].国外医学领域自动问答系统研究现状及启示[J]. 医学信息学杂志 2017(03)
    • [5].国外跨语言自动问答系统研究综述[J]. 现代情报 2008(10)
    • [6].基于知识图谱的抑郁症自动问答系统研究[J]. 湖北大学学报(自然科学版) 2020(05)
    • [7].自动问答系统设计与实现[J]. 软件导刊 2014(09)
    • [8].基于自动问答技术的智能文本机器人[J]. 科技创业家 2013(08)
    • [9].面向自动问答系统的问句相似度计算研究[J]. 重庆大学学报 2019(09)
    • [10].一个集装箱知识自动问答系统的设计[J]. 现代计算机(专业版) 2015(16)
    • [11].图书馆自动问答系统的设计与实现[J]. 情报工程 2019(02)
    • [12].自然语言处理领域中的自动问答研究进展[J]. 武汉大学学报(理学版) 2019(05)
    • [13].高校图书馆参考咨询自动问答体系研究[J]. 科技情报开发与经济 2012(11)
    • [14].中文知识图谱在商品咨询自动问答系统中的应用[J]. 自动化技术与应用 2020(06)
    • [15].智能穿戴设备中的自动问答系统研究[J]. 广东石油化工学院学报 2019(01)
    • [16].面向校园咨询场景的自动问答系统设计[J]. 自动化技术与应用 2018(06)
    • [17].基于招生领域自动问答系统的问题理解的研究[J]. 电脑知识与技术 2009(10)
    • [18].教务门户网自动问答系统的设计与实现[J]. 电脑知识与技术 2009(36)
    • [19].一种基于卷积神经网络的自动问答系统[J]. 乐山师范学院学报 2020(04)
    • [20].远程教育中自动问答系统相关技术探究[J]. 中国教育信息化 2018(20)
    • [21].限定领域的自动问答系统研究[J]. 北方工业大学学报 2010(01)
    • [22].卷积深度神经网络在基于文档的自动问答任务中的应用与改进[J]. 计算机应用与软件 2019(08)
    • [23].自动问答系统中课程知识本体的构建与实现[J]. 电子技术与软件工程 2014(05)
    • [24].面向自动问答的机器阅读理解综述[J]. 华东师范大学学报(自然科学版) 2019(05)
    • [25].基于卷积神经网络的自动问答[J]. 华东师范大学学报(自然科学版) 2017(05)
    • [26].VSM在旅游自动问答系统中的应用研究[J]. 山西能源学院学报 2019(02)
    • [27].基于英文文档的WHY问句自动问答技术研究[J]. 科技传播 2010(12)
    • [28].Web农业实用技术自动问答系统设计实现[J]. 现代图书情报技术 2009(Z1)
    • [29].基于本体的领域自动问答系统研究[J]. 计算机应用与软件 2019(08)
    • [30].基于Seq2Seq的生成式自动问答系统应用与研究[J]. 现代计算机(专业版) 2017(36)

    标签:;  ;  ;  ;  

    基于搜索引擎的自动问答系统
    下载Doc文档

    猜你喜欢