基于WordNet的短文本语义相似性计算研究

基于WordNet的短文本语义相似性计算研究

论文摘要

句子或者是短文本的相似度在文本相关性判断,网页检索,信息检索以及文本挖掘方面起着越来越重要的角色。在相似性计算方面已有一些算法来自于对于长文本以及大文档的相似性计算。但是这些算法在计算效率上明显不足,对短文本的表达形式不完善,并且需要比较多的人工输入信息,较多的背景知识。本文提出了一种新的计算短文本语义距离的算法,该算法不涉及通用的相似性算法,它是基于知识库WordNet,以及词法库The Brown Corpus的相似性算法。文中构建了一种新的基于WordNet和Corpus Statistics的IC(Information Content)计算模型IC-CW,考虑概念在WordNet中语义信息以及语料库中概念的频率信息。并针对目前已有的语义相似性计算方法均与领域相关的特点,设计了一种通用的概念之间的语义相似性计算方法:SS-CW。在SS-CW的基础上又提出了一种新的文本之间的语义相似性计算方法ST-CW,在R&B以及Miller数据集上进行了实验,实验结果验证了新的模型和算法的有效性。

论文目录

  • 提要
  • 第1章 绪论
  • 1.1 研究背景和意义
  • 1.2 本文研究的主要内容及其先进性
  • 1.3 论文的组织结构
  • 第2章 本体库WordNet的介绍
  • 2.1 本体的定义和简介
  • 2.1.1 本体的分类
  • 2.1.2 本体的应用
  • 2.2 WordNet发展与应用
  • 2.2.1 WordNet发展
  • 2.2.2 WordNet中节点之间的语关系
  • 2.2.3 WordNet中词汇组织结构
  • 2.3 WordNet中概念的结构
  • 2.3.1 WordNet中的拓扑结构
  • 2.3.2 WordNet中概念的表示形式
  • 2.4 WordNet中的存储结构
  • 2.4.1 WordNet中的存储结构
  • 2.4.2 WordNet中文件作用介绍
  • 2.5 本章小结
  • 第3章 语义相似度计算方法
  • 3.1 WordNet概念语义相似度IC参数
  • 3.1.1 基于统计的IC计算方法
  • 3.1.2 基于知识库层次结构的IC计算模型及缺点
  • 3.2 常用的概念之间的语义相似性计算算法
  • 3.2.1 基于概念间的路径距离计算方法
  • 3.2.2 基于信息内容IC的语义相似性计算方法
  • 3.3 常见的文本相似性计算算法
  • 3.3.1 向量模型方法
  • 3.3.2 Corpus-based方法
  • 3.3.3 Feather-based方法和综合方法
  • 3.4 本章小结
  • 第4章 概念之间语义相似性计算SS-CW
  • 4.1 基于WordNet与The Brown Corpus的IC计算模型IC-CW
  • 4.1.1 IC-CW模型
  • 4.1.2 IC-CW模型值域分析
  • 4.1.3 IC-CW模型实现
  • 4.2 IC模型IC-CW评估
  • 4.2.1 实验数据
  • 4.2.2 IC-CW与Nuno在语法树上比较
  • 4.2.3 IC-CW在算法中的应用
  • 4.3 基于IC-CW的语义相似度计算模型SS-CW
  • 4.3.1 语义相似度计算方法SS-CW
  • 4.3.2 SS-CW实现
  • 4.4 基于IC-CW的语义相似度计算方法SS-CW分析
  • 4.5 本章小结
  • 第5章 短文本语义相似性计算ST-CW
  • 5.1 相关计算
  • 5.1.1 相关概念词序相似度计算CW-SS
  • 5.1.2 字符串相似度的计算NSS
  • 5.2 文本语义距离计算ST-SW设计与实现
  • 5.2.1 ST-SW文本预处理
  • 5.2.2 ST-SW算法过程
  • 5.3 文本语义距离计算ST-SW分析分析
  • 5.4 本章小结
  • 第6章 总结与展望
  • 6.1 本文总结
  • 6.2 工作展望
  • 参考文献
  • 致谢
  • 攻读硕士期间研究成果
  • 摘要
  • Abstract
  • 相关论文文献

    • [1].WordNet在大学英语词汇教学中的应用初探[J]. 品位经典 2019(10)
    • [2].基于WordNet的语义相似度算法研究[J]. 内蒙古师范大学学报(哲学社会科学版) 2016(04)
    • [3].一种基于WordNet的混合式语义相似度计算方法[J]. 计算机工程与科学 2017(05)
    • [4].一种基于WordNet语义相似度的改进算法[J]. 数字技术与应用 2013(08)
    • [5].WordNet在图像语义分析中的应用[J]. 科技创新导报 2012(14)
    • [6].基于WordNet词义消歧的系统融合[J]. 自动化学报 2010(11)
    • [7].基于WordNet的无导词义消歧方法[J]. 浙江大学学报(工学版) 2010(04)
    • [8].WordNet在文本聚类中的应用研究[J]. 现代图书情报技术 2009(10)
    • [9].基于WordNet词义消歧的语义检索研究[J]. 湘潭大学自然科学学报 2017(02)
    • [10].WordNet应用问题研究[J]. 科技致富向导 2013(35)
    • [11].浅议WordNet的发展趋势与应用[J]. 科技致富向导 2010(26)
    • [12].由Wordnet话词汇空缺[J]. 中国科技信息 2011(21)
    • [13].一种集成WordNet到受控自然语言系统的算法[J]. 华中科技大学学报(自然科学版) 2010(04)
    • [14].概念图及WordNet辅助大学英语词汇教学的可能性探究[J]. 教育与教学研究 2009(03)
    • [15].基于WordNet的本体查询方法研究[J]. 郑州大学学报(工学版) 2016(03)
    • [16].一种基于WordNet的跨语言地理本体匹配方法[J]. 地理信息世界 2016(02)
    • [17].WordNet在查询扩展中的应用研究[J]. 科技信息 2009(14)
    • [18].基于WordNet的隐喻自动处理研究[J]. 外语电化教学 2010(06)
    • [19].概念图及WordNet辅助大学英语词汇教学实证研究[J]. 电化教育研究 2009(08)
    • [20].基于WordNet的概念语义相似度研究[J]. 湖南科技学院学报 2008(12)
    • [21].基于WordNet语义知识库的英语学习者作文局部连贯自动评价[J]. 河南师范大学学报(自然科学版) 2016(06)
    • [22].基于WordNet的语义相似度算法改进研究[J]. 软件导刊 2016(05)
    • [23].基于边权重的WordNet词语相似度计算[J]. 计算机工程与应用 2018(01)
    • [24].基于wordNet的类别可拓展网页分类系统(英文)[J]. 深圳大学学报(理工版) 2009(02)
    • [25].WordNet应用问题研究[J]. 科技致富向导 2013(23)
    • [26].一种基于WordNet和Corpus Statistics的语义相似性计算方法[J]. 吉林大学学报(理学版) 2010(05)
    • [27].基于中文WordNet的中英文词语相似度计算[J]. 郑州大学学报(理学版) 2010(02)
    • [28].基于WordNet的通用服务分类方法[J]. 计算机工程与科学 2013(09)
    • [29].基于WordNet和聚焦爬虫的半自动领域本体构建[J]. 计算机应用 2008(S2)
    • [30].基于WordNet的关联数据本体映射研究[J]. 情报杂志 2013(02)

    标签:;  ;  ;  

    基于WordNet的短文本语义相似性计算研究
    下载Doc文档

    猜你喜欢