本文主要研究内容
作者张弛,张贯虹,周艳玲(2019)在《基于加权语义网的改进文本相似度计算方法》一文中研究指出:为了提高特征词权重和文本语义相似度计算的精确性,文章提出了一种基于加权语义网的改进文本相似度计算方法。该方法首先以特征词为节点,以特征词窗口共现原理创建边,以频率-逆文本频率(term frequency-inverse document frequency,TF-IDF)值作为特征词节点的初始权值,融合共现频率和概念语义距离自定义边权重计算方法,构建加权文本语义复杂网络。然后使用语义网络中特征词综合特征指数排名靠前的m个词组成特征向量,利用搬土距离(earth mover’s distance,EMD)衡量两个文本间的语义相似度。最后基于公开数据集对文本进行聚类实验,实验结果表明,在基于F1度量值标准上文章提出的方法要优于传统的文本相似度计算方法。
Abstract
wei le di gao te zheng ci quan chong he wen ben yu yi xiang shi du ji suan de jing que xing ,wen zhang di chu le yi chong ji yu jia quan yu yi wang de gai jin wen ben xiang shi du ji suan fang fa 。gai fang fa shou xian yi te zheng ci wei jie dian ,yi te zheng ci chuang kou gong xian yuan li chuang jian bian ,yi pin lv -ni wen ben pin lv (term frequency-inverse document frequency,TF-IDF)zhi zuo wei te zheng ci jie dian de chu shi quan zhi ,rong ge gong xian pin lv he gai nian yu yi ju li zi ding yi bian quan chong ji suan fang fa ,gou jian jia quan wen ben yu yi fu za wang lao 。ran hou shi yong yu yi wang lao zhong te zheng ci zeng ge te zheng zhi shu pai ming kao qian de mge ci zu cheng te zheng xiang liang ,li yong ban tu ju li (earth mover’s distance,EMD)heng liang liang ge wen ben jian de yu yi xiang shi du 。zui hou ji yu gong kai shu ju ji dui wen ben jin hang ju lei shi yan ,shi yan jie guo biao ming ,zai ji yu F1du liang zhi biao zhun shang wen zhang di chu de fang fa yao you yu chuan tong de wen ben xiang shi du ji suan fang fa 。
论文参考文献
论文详细介绍
论文作者分别是来自邵阳学院学报(自然科学版)的张弛,张贯虹,周艳玲,发表于刊物邵阳学院学报(自然科学版)2019年03期论文,是一篇关于复杂网络论文,特征词论文,距离论文,文本相似度论文,邵阳学院学报(自然科学版)2019年03期论文的文章。本文可供学术参考使用,各位学者可以免费参考阅读下载,文章观点不代表本站观点,资料来自邵阳学院学报(自然科学版)2019年03期论文网站,若本站收录的文献无意侵犯了您的著作版权,请联系我们删除。
标签:复杂网络论文; 特征词论文; 距离论文; 文本相似度论文; 邵阳学院学报(自然科学版)2019年03期论文;