汉语句子相似度计算方法及其应用的研究

汉语句子相似度计算方法及其应用的研究

论文题目: 汉语句子相似度计算方法及其应用的研究

论文类型: 硕士论文

论文专业: 应用数学

作者: 周舫

导师: 郑逢斌

关键词: 自然语言处理,问答系统,句子相似度,意图提取,知网

文献来源: 河南大学

发表年度: 2005

论文摘要: 在中文信息处理中,汉语句子的相似度计算是一项基础而又重要的工作,它直接决定着某些领域的研究发展状况。例如,自动问答系统、基于实例的机器翻译、信息检索、自动文摘等领域,句子相似度计算都是一个非常关键的问题,长期以来一直是人们研究的一个热点和难点。本文在研究汉语句子相似度的过程中,针对汉语由语素构成词语,由词语构成语句的特点,分别对汉语中的义原、词语、句子三个层次的相似度计算进行了研究。这三者层次不同,但是联系密切,由部分构成一个有机的整体,整个计算过程每一步都利用上一步的计算结果。本文主要有如下几个方面的研究成果:1.研究了汉语语句的问句意图,并提出问句意图的提取方法。问句意图的提取是以疑问句为研究对象的,问句类型不同,提取意图的方法也会有所差异。本文的研究是处于问答系统背景下,分析语料根据不同疑问句出现的频率,把问句类型分为三类:特指问句,正反问句,句末语助词问句,从而根据问句的类型针对性的提出相对应的问句意图提取方法。2.研究了汉语词语语义相似度及其计算方法,利用知网提供的丰富语义信息,计算义原相似度,进一步计算基于知网的词语语义相似度。词语相似度是本文句子相似度计算的基础。3.提出多层次多种特征融合的汉语句子相似度计算方法。该算法从多个角度考察语句的相似性,充分利用句子含有的目标层、结构层、语义层等丰富信息,从句子中提取问句意图、关键词集、句子长度、名词个数、动词个数、专有名词个数等多种特征。运用一种简单有效的融合手段,进而获取综合特征,利用综合特征确定句子相似度的值。4.以金融领域自然语言问答系统的模型为实例,体现句子相似度计算在具体应用领域的重要性。这一课题的研究及其成果对于中文信息处理中的多种领域,都将具有一定的参考价值和良好的应用前景。

论文目录:

摘要

ABSTRACT

第1章 绪论

1.1 论文研究的背景

1.2 句子相似度的研究现状和分析

1.2.1 国内外的研究现状

1.2.2 存在的主要问题

1.3 本文的主要工作及内容安排

第2章 词语相似度及其计算方法的研究

2.1 词语相似度概念及相关计算方法的研究

2.1.1 词语相似度的概念

2.1.2 基于语义词典的方法

2.1.3 基于语料统计的方法

2.2 知网语义知识资源

2.2.1 知网系统的概述

2.2.2 知网的知识词典

2.3 基于知网的义原相似度的计算

2.3.1 义原的相关知识

2.3.2 义原相似度的计算

2.4 基于知网的汉语词语语义相似度的计算

第3章 汉语句子相似度及其计算方法的研究

3.1 句子相似度的概念及传统计算方法

3.1.1 句子相似度的概念

3.1.2 基于向量空间模型的TF-IDF 方法

3.1.3 基于语义依存的相似度计算方法

3.1.4 编辑距离方法

3.2 相似度计算模型

3.2.1 相似度

3.2.2 相似算法

3.3 用户问句意图的分类和提取

3.3.1 问句意图的含义

3.3.2 问句意图的符号表示方法

3.3.3 问句类型

3.3.4 问句意图的提取

3.4 多层次多种特征融合的句子相似度计算方法

3.4.1 设计思想

3.4.2 查询意图的相似度计算

3.4.3 关键词集的相似度计算

3.4.4 其它相似度特征因素的计算

3.4.5 多层次多种特征融合的句子相似度计算

3.4.6 计算方法评价

第4章 应用实例——金融领域自然语言问答系统的模型

4.1 金融领域自然语言问答系统的总体设计方案

4.2 金融领域自然语言问答系统的体系结构图

4.3 汉语自动分词系统的总体模块结构

4.3.1 汉语自动分词系统的总体模块结构图

4.3.2 常用分词方法

4.3.3 有关处理方法

4.4 金融领域的常用问题集问答系统

4.4.1 FAQ 的收集与组织

4.4.2 候选问题集的查找

4.4.3 句子相似度计算

4.4.4 常用问题库的更新

4.5 应用系统的模型

4.5.1 问题理解模块

4.5.2 FAQ 模块

4.5.3 信息检索模块

4.5.4 答案抽取模块

4.5.5 遗留问题处理

总结与展望

致谢

参考文献

攻读硕士学位期间发表的论文及科研成果

发布时间: 2005-07-28

参考文献

  • [1].自动问答系统中问句相似度计算方法研究[D]. 徐海洲.华东交通大学2014
  • [2].领域问答系统中问句相似度计算方法研究[D]. 刘拼拼.哈尔滨工业大学2018
  • [3].基于卷积神经网络的多元颅面相似度计算方法研究[D]. 王志辉.西北大学2018
  • [4].自适应学习系统中几何试题相似度计算方法研究[D]. 周政.渤海大学2018
  • [5].汉维辅助翻译系统中结合词向量的句子相似度计算方法研究[D]. 解倩倩.新疆大学2017
  • [6].基于本体的概念相似度计算方法的研究[D]. 唐中林.武汉理工大学2013
  • [7].多特征融合的电影相似度计算方法研究[D]. 俞云飞.华东师范大学2012
  • [8].推荐系统用户相似度计算方法研究[D]. 朱文奇.重庆大学2014
  • [9].基于领域本体的客服问答系统的设计与实现[D]. 刘晓强.青岛大学2016
  • [10].一种综合多层次信息的句子相似度计算方法研究[D]. 王璐.重庆大学2016

相关论文

  • [1].中文短语相似度计算方法研究及应用[D]. 王莹莹.长沙理工大学2008
  • [2].基于《知网》的句子相似度计算的研究[D]. 张玉娟.中国地质大学(北京)2006
  • [3].基于语义理解的中文常问问答系统的研究[D]. 刘小宇.大连理工大学2006
  • [4].语句相似度计算在智能答疑系统中的应用[D]. 王常亮.东南大学2006
  • [5].计算机领域中文自动问答系统的研究[D]. 张辉丽.天津大学2006
  • [6].基于知网的词汇语义计算研究及应用[D]. 余超.沈阳航空工业学院2007
  • [7].属性约简算法和文本相似度计算在智能分析系统的研究[D]. 杨霞.电子科技大学2007
  • [8].基于语句相似度计算的主观题自动评分技术研究[D]. 南铉国.延边大学2007
  • [9].基于分词的中文文本相似度计算研究[D]. 沈斌.天津财经大学2006
  • [10].基于自然语言处理的问答系统研究[D]. 王慧慧.电子科技大学2006

标签:;  ;  ;  ;  ;  

汉语句子相似度计算方法及其应用的研究
下载Doc文档

猜你喜欢