问答对自动获取的研究

问答对自动获取的研究

论文摘要

问答对的规模和质量是影响基于常问问题集问答系统性能的重要因素,目前所使用的问答对库一般是人工构建的,往往需要耗费大量的时间和人力物力。本文围绕问答对库构建过程中的网页问答对自动获取,领域问答对过滤及相关问答对过滤等技术进行了一系列的研究和探讨,主要取得了以下几个方面的成果:(1)提出了一种基于DOM的网页问答对自动获取方法。该方法将HTML页面解析成DOM树形式,抽取树的文本节点作为问答对的候选,根据DOM树的节点和结构信息提取分类特征,采用改进贝叶斯分类算法,构造分类模型,实现了从网页中自动获取问答对的方法。问答对自动获取实验结果表明,该方法具有较好的效果。(2)提出了一种结合句法结构关系和领域特征的领域问答对过滤方法。研究领域知识库构建方法,结合云南旅游领域特点,构建了云南旅游领域知识库。在句法结构分析的基础上,选取句子主干与领域词汇作为分类特征,采用改进贝叶斯分类器进行领域问答对过滤。实验结果表明,结合句法结构关系和领域特征进行领域问答对过滤具有很好的效果。(3)针对问答对特点,提出了一种面向词组合与句子的相关问答对过滤方法。该方法通过计算词组合或句子和问答对的相似度来判断两者是否相关。以“知网”为基础,计算词语语义相似度。在句法结构分析的基础上,提取问答对中的有效搭配对,并计算有效搭配对之间的相似度,从而实现了融合词法、句法和语义的问答对相似度计算。而向词组合与句子的相关问答对过滤实验结果表明,该方法具有较好的效果。(4)利用上述研究成果,搭建了网页问答对自动获取原型系统,云南旅游领域问答对过滤原型系统,面向词组合与句子的相关问答对过滤原型系统。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状
  • 1.3 论文的研究内容和组织结构
  • 1.3.1 研究内容
  • 1.3.2 论文组织
  • 第二章 基于DOM树的网页问答对自动获取
  • 2.1 引言
  • 2.2 相关研究
  • 2.3 基于DOM树的网页信息抽取
  • 2.3.1 DOM(文档对象模型)介绍
  • 2.3.2 HTML页面解析
  • 2.4 网页问答对获取
  • 2.4.1 分类特征的提取
  • 2.4.2 朴素贝叶斯分类算法
  • 2.4.3 改进贝叶斯分类算法
  • 2.4.4 问答对的取舍
  • 2.4.5 实验结果及分析
  • 2.5 本章小结
  • 第三章 结合句法结构关系和领域特征的领域问答对过滤
  • 3.1 引言
  • 3.2 相关研究
  • 3.3 领域知识库构建
  • 3.4 领域问答对过滤模型建立
  • 3.4.1 停用词表构建
  • 3.4.2 结合句法结构关系和领域特征的问答对分类
  • 3.4.3 领域问答对过滤
  • 3.4.4 实验结果及分析
  • 3.5 本章小结
  • 第四章 面向词组合与句子的问答对相关性及过滤方法
  • 4.1 引言
  • 4.2 相关研究
  • 4.3 面向词组合的问答对相关性和过滤方法
  • 4.3.1 词语相似度计算
  • 4.3.2 面向词组合的相关问答对过滤
  • 4.4 面向句子的问答对相关性和过滤方法
  • 4.4.1 句子相似度计算
  • 4.4.2 面向句子的相关问答对过滤
  • 4.5 实验结果及分析
  • 4.6 本章小节
  • 第五章 原型系统的实现与评价
  • 5.1 引言
  • 5.2 网页问答对自动获取原型系统的设计和实现
  • 5.2.1 系统整体框架
  • 5.2.2 HTML页面解析
  • 5.2.3 DOM节点句子的分类
  • 5.2.4 问答对的取舍
  • 5.2.5 系统评价
  • 5.3 云南旅游领域问答对过滤原型系统的设计和实现
  • 5.3.1 系统整体框架
  • 5.3.2 云南旅游领域知识库构建
  • 5.3.3 分类特征提取
  • 5.3.4 云南旅游领域问答对过滤
  • 5.3.5 系统评价
  • 5.4 面向词组合与句子的相关问答对过滤原型系统的设计和实现
  • 5.4.1 系统整体框架
  • 5.4.2 有效搭配对的提取
  • 5.4.3 相似度计算
  • 5.4.4 面向词组合与句子的相关问答对过滤
  • 5.4.5 系统评价
  • 5.5 本章小结
  • 第六章 结论及下一步的工作
  • 6.1 结论
  • 6.2 下一步的工作
  • 致谢
  • 参考文献
  • 附录A 攻读硕士学位期间发表的论文
  • 附录B 攻读硕士学位期间参与的项目
  • 附录C 攻读硕士学位期间申请的专利及软件著作权
  • 相关论文文献

    • [1].智能问答系统研究[J]. 电子技术与软件工程 2019(05)
    • [2].影响高质量网络问答系统建设的因素[J]. 物流科技 2016(12)
    • [3].植物病虫害智能问答系统设计与实现[J]. 农业网络信息 2017(01)
    • [4].智能问答系统中命名实体识别问题研究[J]. 数字技术与应用 2017(07)
    • [5].智能问答系统的研究与设计[J]. 南方农机 2017(20)
    • [6].基于知识图谱的军事武器问答系统[J]. 指挥信息系统与技术 2020(05)
    • [7].基于深度学习的问答系统研究[J]. 湖北师范大学学报(自然科学版) 2019(01)
    • [8].问答系统研究综述[J]. 科技传播 2019(05)
    • [9].基于深度学习的智能问答系统研究与设计[J]. 信息与电脑(理论版) 2019(11)
    • [10].基于深度学习的领域问答系统的设计与实现[J]. 成都信息工程大学学报 2019(03)
    • [11].基于微信公众号的物理实验智能问答系统教学应用[J]. 物理与工程 2019(S1)
    • [12].高校移动智能问答系统设计与实现[J]. 中国教育网络 2016(Z1)
    • [13].问答系统研究综述[J]. 计算机科学与探索 2012(03)
    • [14].社区问答系统研究综述[J]. 计算机科学 2010(11)
    • [15].领域问答系统生成器的研究[J]. 北京信息科技大学学报(自然科学版) 2009(03)
    • [16].面向大规模网络数据的社会化问答系统[J]. 哈尔滨工业大学学报 2008(12)
    • [17].基于微信公众号的智能语音问答系统应用与研究[J]. 无线互联科技 2019(24)
    • [18].面向水利信息资源的智能问答系统构建与应用[J]. 计算机与现代化 2020(03)
    • [19].智能问答系统在医学领域的应用研究[J]. 医学信息 2018(14)
    • [20].中文问答系统的现代汉语疑问句类型分析研究概述[J]. 佳木斯职业学院学报 2016(12)
    • [21].基于本体的农业问答系统研究[J]. 农机化研究 2009(01)
    • [22].受限领域问答系统的中文问句分析研究[J]. 计算机工程 2008(10)
    • [23].基于特定领域知识的医疗问答系统信息质量预测[J]. 智能计算机与应用 2019(06)
    • [24].说服系统在社会化问答系统中的应用分析——以知乎为例[J]. 现代情报 2020(01)
    • [25].基于智能问答系统的智慧校园助理的设计与实现[J]. 电子技术与软件工程 2019(24)
    • [26].渔业领域智能问答系统的研究[J]. 电脑编程技巧与维护 2019(05)
    • [27].大数据知识图谱的电商领域问答系统设计[J]. 商场现代化 2019(16)
    • [28].基于微信的付费语音问答系统设计与实现[J]. 计算机技术与发展 2018(05)
    • [29].社区问答系统中问题推荐机制[J]. 计算机与现代化 2015(08)
    • [30].即时交互式问答系统的设计与实现[J]. 小型微型计算机系统 2009(09)

    标签:;  ;  ;  ;  ;  

    问答对自动获取的研究
    下载Doc文档

    猜你喜欢