张弛:基于加权语义网的改进文本相似度计算方法论文

张弛:基于加权语义网的改进文本相似度计算方法论文

本文主要研究内容

作者张弛,张贯虹,周艳玲(2019)在《基于加权语义网的改进文本相似度计算方法》一文中研究指出:为了提高特征词权重和文本语义相似度计算的精确性,文章提出了一种基于加权语义网的改进文本相似度计算方法。该方法首先以特征词为节点,以特征词窗口共现原理创建边,以频率-逆文本频率(term frequency-inverse document frequency,TF-IDF)值作为特征词节点的初始权值,融合共现频率和概念语义距离自定义边权重计算方法,构建加权文本语义复杂网络。然后使用语义网络中特征词综合特征指数排名靠前的m个词组成特征向量,利用搬土距离(earth mover’s distance,EMD)衡量两个文本间的语义相似度。最后基于公开数据集对文本进行聚类实验,实验结果表明,在基于F1度量值标准上文章提出的方法要优于传统的文本相似度计算方法。

Abstract

wei le di gao te zheng ci quan chong he wen ben yu yi xiang shi du ji suan de jing que xing ,wen zhang di chu le yi chong ji yu jia quan yu yi wang de gai jin wen ben xiang shi du ji suan fang fa 。gai fang fa shou xian yi te zheng ci wei jie dian ,yi te zheng ci chuang kou gong xian yuan li chuang jian bian ,yi pin lv -ni wen ben pin lv (term frequency-inverse document frequency,TF-IDF)zhi zuo wei te zheng ci jie dian de chu shi quan zhi ,rong ge gong xian pin lv he gai nian yu yi ju li zi ding yi bian quan chong ji suan fang fa ,gou jian jia quan wen ben yu yi fu za wang lao 。ran hou shi yong yu yi wang lao zhong te zheng ci zeng ge te zheng zhi shu pai ming kao qian de mge ci zu cheng te zheng xiang liang ,li yong ban tu ju li (earth mover’s distance,EMD)heng liang liang ge wen ben jian de yu yi xiang shi du 。zui hou ji yu gong kai shu ju ji dui wen ben jin hang ju lei shi yan ,shi yan jie guo biao ming ,zai ji yu F1du liang zhi biao zhun shang wen zhang di chu de fang fa yao you yu chuan tong de wen ben xiang shi du ji suan fang fa 。

论文参考文献

  • [1].基于加权语义网的文本相似度计算方法研究[J]. 张弛,周艳玲,张贯虹.  赤峰学院学报(自然科学版).2019(05)
  • [2].一种基于SA_LDA模型的文本相似度计算方法[J]. 邱先标,陈笑蓉.  计算机科学.2018(S1)
  • [3].融合耦合距离区分度和强类别特征的短文本相似度计算方法[J]. 马慧芳,刘文,李志欣,蔺想红.  电子学报.2019(06)
  • [4].面向情感聚类的文本相似度计算方法研究[J]. 李欣,李旸,王素格.  中文信息学报.2018(05)
  • [5].语义与统计相结合的中文微博相似度计算方法[J]. 李楚贞.  数字技术与应用.2017(03)
  • [6].一种新的广义模糊数相似度计算方法[J]. 陈树伟,王延昭,周威.  郑州大学学报(工学版).2013(04)
  • [7].本体映射中一种综合的概念相似度计算方法[J]. 徐茜,彭进业,李展.  计算机工程与应用.2010(24)
  • [8].利用加权词句向量的文本相似度计算方法[J]. 徐鑫鑫,刘彦隆,宋明.  小型微型计算机系统.2019(10)
  • [9].融合词向量的多特征问句相似度计算方法研究[J]. 曹莉丽,王未央.  现代计算机(专业版).2017(17)
  • [10].复杂网络全局拓扑相似度计算方法实证研究[J]. 胡燕祝,权桁,艾新波.  软件.2015(09)
  • 论文详细介绍

    论文作者分别是来自邵阳学院学报(自然科学版)的张弛,张贯虹,周艳玲,发表于刊物邵阳学院学报(自然科学版)2019年03期论文,是一篇关于复杂网络论文,特征词论文,距离论文,文本相似度论文,邵阳学院学报(自然科学版)2019年03期论文的文章。本文可供学术参考使用,各位学者可以免费参考阅读下载,文章观点不代表本站观点,资料来自邵阳学院学报(自然科学版)2019年03期论文网站,若本站收录的文献无意侵犯了您的著作版权,请联系我们删除。

    标签:;  ;  ;  ;  ;  

    张弛:基于加权语义网的改进文本相似度计算方法论文
    下载Doc文档

    猜你喜欢