一种综合加权的词语语义相似度计算研究

一种综合加权的词语语义相似度计算研究

论文摘要

在中文信息处理中,文本相似度计算一直是人们研究的热点,它广泛应用于信息智能检索、自动问答系统以及机器翻译等领域。目前文本相似度计算主要有基于统计和基于语义词典两种方法。基于语义词典的方法是从语义角度来计算词语的相似度,结果与人的主观判断较为接近,且计算比基于统计的方法简便。本文研究的词语相似度计算就是在《知网》语义词典基础之上的。本文基于传统的词语相似度计算的方法,提出了一种同时考虑语义距离、义原树深度以及密度等多因素的义原相似度计算方法,并采用遗传算法对各因素的影响权重进行了优化。论文首先介绍了国内句子、词语相似度计算的现状,研究了基于《知网》的词语相似度的计算方法。然后提出了综合考虑多种因素的义原相似度计算方法,该方法从多个方面考察义原的相似度,充分利用了义原树深度、密度等信息,并采用遗传算法对影响相似度的各个因素的权重进行优化,避免了通过经验确定权值的不可靠性和主观性。最后通过对考生试卷的主观题进行自动评分实验,证明了本文所提方法的有效性。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 研究的背景及意义
  • 1.2 研究现状
  • 1.2.1 句子相似度计算研究
  • 1.2.2 词语相似度计算的研究
  • 1.3 本文的组织结构
  • 第2章 基于《知网》的词语相似度计算研究
  • 2.1 《知网(HowNet)》简介
  • 2.2 词语相似度计算方法
  • 2.2.1 词语相似度计算
  • 2.2.2 义原相似度计算
  • 2.2.3 概念相似度计算
  • 第3章 融合多元信息的词语相似度计算方法的设计
  • 3.1 融合多元信息的设计思想
  • 3.2 融合多元信息的义原相似度计算方法
  • 3.3 多元信息权重的选择
  • 第4章 遗传算法的研究
  • 4.1 遗传算法简介
  • 4.2 遗传算法的基本操作
  • 4.2.1 初始种群个体编码
  • 4.2.2 群体设定
  • 4.2.3 遗传操作
  • 4.2.4 基本遗传算法的流程
  • 4.3 遗传算法的优缺点
  • 第5章 基于遗传算法的义原相似度计算实现与分析
  • 5.1 词语相似度算法实现
  • 5.1.1 融合多元信息的义原相似度算法设计实现
  • 5.1.2 概念、词语相似度的计算
  • 5.2 遗传算法优化权重的过程
  • 5.2.1 权重系数编码
  • 5.2.2 适应性函数
  • 5.2.3 遗传操作
  • 5.2.4 终止条件
  • 5.3 实验与分析
  • 5.3.1 环境与参数
  • 5.3.2 实验结果与分析
  • 第6章 句子相似度在主观题批阅中的应用
  • 6.1 主观题批阅综述
  • 6.2 主观题自动评判
  • 6.2.1 句子预处理
  • 6.2.2 句子语义相似度计算
  • 6.2.3 分数分配
  • 6.3 实现与结果分析
  • 6.3.1 实验结果
  • 6.3.2 结果分析
  • 总结
  • 参考文献
  • 攻读硕士学位期间发表的学术论文及科研工作
  • 致谢
  • 相关论文文献

    • [1].基于局部语义相关性的定义文本义原预测[J]. 中文信息学报 2020(05)
    • [2].基于知网义原信息量的词语相似度计算方法[J]. 软件导刊 2015(06)
    • [3].一种基于义原信息量的词语相似度计算方法[J]. 电脑与信息技术 2015(03)
    • [4].收手[J]. 东西南北 2010(08)
    • [5].一种实例库与义原关系相结合的概念消歧算法[J]. 首都师范大学学报(自然科学版) 2016(03)
    • [6].基于《知网》义原空间的文本相似度计算[J]. 科学技术与工程 2013(29)
    • [7].基于知网义原词向量表示的无监督词义消歧方法[J]. 中文信息学报 2015(06)
    • [8].一种改进的基于本体概念相似度计算方法研究[J]. 南京邮电大学学报(自然科学版) 2011(06)
    • [9].基于角度—相似度转换模型的义原相似度计算[J]. 浙江工业大学学报 2017(06)
    • [10].基于逆概念频率的词语相似度计算[J]. 厦门大学学报(自然科学版) 2015(02)
    • [11].词语转喻变义及其族群现象中的义原桥接[J]. 广西民族大学学报(哲学社会科学版) 2015(06)
    • [12].基于义原关系的多策略汉语词义消歧方法[J]. 大连理工大学学报 2010(04)
    • [13].基于《知网》的词语语义相似度改进算法研究[J]. 计算机工程 2015(02)
    • [14].一种改进的基于《知网》的词语相似度计算方法[J]. 计算机应用 2009(01)
    • [15].面向语义检索的中医理论知识库构建方法的研究[J]. 中文信息学报 2012(05)
    • [16].基于知网的词汇语义相似度计算方法研究[J]. 计算机应用研究 2010(09)
    • [17].基于HowNet的词语相关度计算模型[J]. 微型机与应用 2012(08)
    • [18].基于知网的中文词语相似度计算[J]. 智能计算机与应用 2015(03)
    • [19].中文问句分类特征的研究[J]. 计算机应用与软件 2012(03)
    • [20].基于语义相似度的共词分析方法研究[J]. 图书馆学刊 2017(01)
    • [21].借重于人工知识库的词和义项的向量表示:以HowNet为例[J]. 中文信息学报 2016(06)
    • [22].忠于文本的《离骚》题义原探[J]. 山花 2011(12)
    • [23].基于匈牙利算法的语义相似度分析在信息安全泄密检查中的应用[J]. 新乡学院学报(自然科学版) 2010(06)
    • [24].一种频率增强的语句语义相似度计算[J]. 湖南大学学报(自然科学版) 2013(02)
    • [25].“厨”义原流与“厨柜”文化漫议[J]. 楚雄师范学院学报 2015(08)
    • [26].她们为什么迷“耽美”[J]. 大众心理学 2010(06)
    • [27].基于HowNet的论文复制检测关键技术研究[J]. 福建师范大学学报(自然科学版) 2011(06)
    • [28].面向网络舆情分析的语义相似度算法研究[J]. 山东科学 2014(06)
    • [29].网络文章中句子倾向性判别的方法研究[J]. 信息网络安全 2012(03)
    • [30].一种基于Hownet的词向量表示方法[J]. 北京大学学报(自然科学版) 2019(01)

    标签:;  ;  ;  ;  ;  

    一种综合加权的词语语义相似度计算研究
    下载Doc文档

    猜你喜欢