论文摘要
在互联网的时代,网上信息爆炸性地增长,人们希望在网络世界中快速、准确地找到自己需要的信息。现在以关键词或关键词的简单逻辑组合为基础的信息检索方式在一定程度上已经不能满足人们对信息获取的要求,智能问答系统为了满足人们的这种要求而逐渐地发展起来的。近些年来,中文信息处理技术的进步也极大地推动了中文问答系统的发展。越来越多的国内外相关方向的研究人员开始将更多的精力转向中文自然语言问答系统的研究中。智能问答系统是当前自然语言处理领域的难点和热点,它综合运用自然语言理解、信息检索等技术,对用自然语言描述的问题,能自动生成简洁、准确的答案。目前,由于中文自然语言的复杂性和处理技术的局限性,让计算机完全理解人类语言是非常困难的,因此还没有出现成熟的智能问答系统。现阶段中文问答系统的研究与应用还是以特定领域为主。本文围绕限定领域内智能问答系统的设计与实现,针对领域知识库构建,问句理解分析,FAQ问句匹配等关键技术进行了一系列的研究探讨。FAQ库问句匹配采用句子相似度计算方法来实现,主要用于实现用户常问问题的快速、准确回答。此外,系统利用网络爬虫抓取的网页建立了主题文档库,对于FAQ无法解答的问题,系统将从主题文档库中检索答案,这部分是对问答系统的补充和完善。
论文目录
摘要ABSTRACT目录图表目录第一章 绪论1.1 论文研究背景1.2 问答系统的研究现状1.2.1 国外的研究情况1.2.2 国内的研究情况1.3 问答系统的评测方法1.4 研究内容与意义1.4.1 本文研究内容1.4.2 研究意义1.4.3 本文结构安排第二章 相关理论与技术2.1 传统的检索模型2.1.1 布尔模型(Boolean Model)2.1.2 向量空间模型(Vector Space Model)2.2 语言模型方法2.2.1 统计语言模型2.2.2 语言模型中的平滑技术2.3 系统的评价第三章 限定领域内智能问答系统的设计及知识库构建3.1 智能问答系统的设计3.2 问答系统知识库的构建3.3 本体对知识的管理第四章 HTML页面分析处理4.1 HTML和XML的比较4.2 HTML页面分析4.2.1 网页结构分析4.2.2 网页内容分析4.2.3 主题文档库4.3 索引生成第五章 限定领域内智能问答系统的实现5.1 开发工具5.2 FAQ库问句匹配子系统的实现5.2.1 FAQ问句匹配子系统的设计5.2.2 问句相似度计算过程5.2.3 实验结果5.3 主题文档库检索第六章 结论与未来研究方向6.1 全文总结6.2 进一步的研究工作致谢参考文献
相关论文文献
标签:信息检索论文; 问答系统论文; 语言模型论文; 问句相似度论文;