论文摘要
句子或者是短文本的相似度在文本相关性判断,网页检索,信息检索以及文本挖掘方面起着越来越重要的角色。在相似性计算方面已有一些算法来自于对于长文本以及大文档的相似性计算。但是这些算法在计算效率上明显不足,对短文本的表达形式不完善,并且需要比较多的人工输入信息,较多的背景知识。本文提出了一种新的计算短文本语义距离的算法,该算法不涉及通用的相似性算法,它是基于知识库WordNet,以及词法库The Brown Corpus的相似性算法。文中构建了一种新的基于WordNet和Corpus Statistics的IC(Information Content)计算模型IC-CW,考虑概念在WordNet中语义信息以及语料库中概念的频率信息。并针对目前已有的语义相似性计算方法均与领域相关的特点,设计了一种通用的概念之间的语义相似性计算方法:SS-CW。在SS-CW的基础上又提出了一种新的文本之间的语义相似性计算方法ST-CW,在R&B以及Miller数据集上进行了实验,实验结果验证了新的模型和算法的有效性。
论文目录
相关论文文献
- [1].WordNet在大学英语词汇教学中的应用初探[J]. 品位经典 2019(10)
- [2].基于WordNet的语义相似度算法研究[J]. 内蒙古师范大学学报(哲学社会科学版) 2016(04)
- [3].一种基于WordNet的混合式语义相似度计算方法[J]. 计算机工程与科学 2017(05)
- [4].一种基于WordNet语义相似度的改进算法[J]. 数字技术与应用 2013(08)
- [5].WordNet在图像语义分析中的应用[J]. 科技创新导报 2012(14)
- [6].基于WordNet词义消歧的系统融合[J]. 自动化学报 2010(11)
- [7].基于WordNet的无导词义消歧方法[J]. 浙江大学学报(工学版) 2010(04)
- [8].WordNet在文本聚类中的应用研究[J]. 现代图书情报技术 2009(10)
- [9].基于WordNet词义消歧的语义检索研究[J]. 湘潭大学自然科学学报 2017(02)
- [10].WordNet应用问题研究[J]. 科技致富向导 2013(35)
- [11].浅议WordNet的发展趋势与应用[J]. 科技致富向导 2010(26)
- [12].由Wordnet话词汇空缺[J]. 中国科技信息 2011(21)
- [13].一种集成WordNet到受控自然语言系统的算法[J]. 华中科技大学学报(自然科学版) 2010(04)
- [14].概念图及WordNet辅助大学英语词汇教学的可能性探究[J]. 教育与教学研究 2009(03)
- [15].基于WordNet的本体查询方法研究[J]. 郑州大学学报(工学版) 2016(03)
- [16].一种基于WordNet的跨语言地理本体匹配方法[J]. 地理信息世界 2016(02)
- [17].WordNet在查询扩展中的应用研究[J]. 科技信息 2009(14)
- [18].基于WordNet的隐喻自动处理研究[J]. 外语电化教学 2010(06)
- [19].概念图及WordNet辅助大学英语词汇教学实证研究[J]. 电化教育研究 2009(08)
- [20].基于WordNet的概念语义相似度研究[J]. 湖南科技学院学报 2008(12)
- [21].基于WordNet语义知识库的英语学习者作文局部连贯自动评价[J]. 河南师范大学学报(自然科学版) 2016(06)
- [22].基于WordNet的语义相似度算法改进研究[J]. 软件导刊 2016(05)
- [23].基于边权重的WordNet词语相似度计算[J]. 计算机工程与应用 2018(01)
- [24].基于wordNet的类别可拓展网页分类系统(英文)[J]. 深圳大学学报(理工版) 2009(02)
- [25].WordNet应用问题研究[J]. 科技致富向导 2013(23)
- [26].一种基于WordNet和Corpus Statistics的语义相似性计算方法[J]. 吉林大学学报(理学版) 2010(05)
- [27].基于中文WordNet的中英文词语相似度计算[J]. 郑州大学学报(理学版) 2010(02)
- [28].基于WordNet的通用服务分类方法[J]. 计算机工程与科学 2013(09)
- [29].基于WordNet和聚焦爬虫的半自动领域本体构建[J]. 计算机应用 2008(S2)
- [30].基于WordNet的关联数据本体映射研究[J]. 情报杂志 2013(02)