基于多目标优化的中文分词模型的研究

基于多目标优化的中文分词模型的研究

论文摘要

自然语言自身的模糊性和复杂性,使得中文分词问题在理论上很难找到一个好的解决方案。在实际应用中,中文分词也难以满足诸如中文搜索、文本分类和机器翻译的需求。通过分析各种不同的分词模型发现,多个分词要素对切分方案的共同作用常常体现和统一于一个概率公式,称为单目标评价函数。既然多个分词特征共同作用于切分结果,那么理论上可以利用多个评估函数从不同侧面评价结果。不同的侧面对应不同的评价函数,切分结果的求解也就变为优化多个目标函数的过程,分词问题因此化归为多目标优化问题。本文选择句子的二元词频概率、二元词性概率和句子子串长度方差作为目标函数。如果把切分方案看做一个个体,那么把不同的分词方案组合成群体,利用交叉、变异和选择操作对种群进化,利用环境约束操作对种群个体约束,从而形成多目标优化的整体流程。其中,利用多目标向量对所有个体进行Pareto排序,同时为了保持群体多样性,引入聚集距离的概念,通过Pareto排序和聚集距离构建偏序关系,继而选择优秀解。受个体进化在自然界中会受到环境影响的启发,针对分词问题加入了环境约束操作,约束个体变异和进化的方向,同时克服进化算法在局部搜索方面的缺点。在实现的过程中,对句子切分子串信息值标注,信息值可以反映子串的词类属性(人名或者地名等)、歧义的位置属性(和前串还是后串发生歧义)以及确定属性(可以确定的符号、在库词等)。最后进行了歧义测试、整体测试以及基于多特征的人名识别测试,从测试结果来看,利用多目标优化模型解决中文分词问题也许是一种崭新的方法。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第一章 引言
  • 1.1 论文背景
  • 1.2 主要工作
  • 1.3 研究意义
  • 1.4 论文结构
  • 第二章 中文分词概述
  • 2.1 中文分词问题的描述
  • 2.2 中文分词要素的概述
  • 2.2.1 匹配属性
  • 2.2.2 词频
  • 2.2.3 局部词频、全局词频
  • 2.2.4 互信息
  • 2.2.5 t-测试(差)
  • 2.2.6 上下文特征向量
  • 2.2.7 词性
  • 2.2.8 Tags
  • 2.2.9 字标引系列
  • 2.2.10 语义要素
  • 2.2.11 分词要素小结
  • 2.3 中文分词方法的概述
  • 2.3.1 基于匹配
  • 2.3.2 N-最短路
  • 2.3.3 n-gram统计
  • 2.3.4 隐马尔科夫(HMM),MIIM
  • 2.3.5 Source-Channel和SVM
  • 2.3.6 基于规则学习的分词方案
  • 2.3.7 基于搜索的分词方案
  • 2.3.8 自适应的迭代模型
  • 2.3.9 最大熵、条件随机场
  • 2.4 关于分词结果的比较
  • 2.5 本章小结
  • 第三章 多目标优化相关知识
  • 3.1 多目标优化问题概述
  • 3.1.1 多目标优化问题的一般描述
  • 3.2 多目标问题的一般解决方案
  • 3.2.1 加权法
  • 3.2.2 约束法
  • 3.2.3 进化算法
  • 3.3 本章小结
  • 第四章 多目标优化模型的建立
  • 4.1 知识库学习
  • 4.2 建立分词的多目标优化模型
  • 4.2.1 多个目标的选择
  • 4.2.2 切分方案编码
  • 4.2.3 模型框架
  • 4.2.4 变异
  • 4.2.5 交叉
  • 4.2.6 初始化种群
  • 4.2.7 选择
  • 4.2.8 环境约束
  • 4.2.9 数字相关词语的识别
  • 4.2.10 总体算法
  • 4.2.11 算法时间复杂度分析
  • 4.3 本章小结
  • 第五章 测试和分析
  • 5.1 歧义测试
  • 5.2 人名识别测试
  • 5.3 总体测试结果
  • 5.4 本章小结
  • 第六章 总结与展望
  • 6.1 本文总结
  • 6.2 未来展望
  • 参考文献
  • 发表文章目录
  • 致谢
  • 代码说明
  • 1 代码说明和部分代码
  • 2 分词部分结果
  • 详细摘要
  • 相关论文文献

    • [1].基于参考线的预测策略求解动态多目标优化问题[J]. 控制与决策 2020(07)
    • [2].典型多目标优化算法在控制优化中的适用性研究[J]. 科技视界 2020(19)
    • [3].基于高维多目标优化的多车场车辆路径问题[J]. 计算机与数字工程 2017(07)
    • [4].一种基于多目标优化的混凝剂综合评价方法[J]. 净水技术 2017(09)
    • [5].多目标优化问题的模糊交叉算法与收敛性初探[J]. 电脑迷 2017(03)
    • [6].基于遗传算法的货箱多目标优化[J]. 车辆与动力技术 2019(04)
    • [7].多目标优化算法标准测试函数寻优研究[J]. 电脑知识与技术 2020(23)
    • [8].基于分布估计算法的多目标优化[J]. 软件 2017(12)
    • [9].融合张角拥挤控制策略的高维多目标优化[J]. 自动化学报 2015(06)
    • [10].多目标优化算法的应用模型[J]. 成功(教育) 2011(05)
    • [11].线性互补问题与多目标优化[J]. 数学杂志 2014(03)
    • [12].多目标优化问题的研究[J]. 东莞理工学院学报 2014(03)
    • [13].浅析多目标优化问题[J]. 科技视界 2013(14)
    • [14].正交设计的E占优策略求解高维多目标优化问题研究[J]. 计算机科学 2012(02)
    • [15].一种改进的基于分解多目标优化算法[J]. 电脑知识与技术 2012(34)
    • [16].改进选择策略的有约束多目标优化算法[J]. 高技术通讯 2019(12)
    • [17].云计算资源多目标优化调度方法在移动端子系统中的应用[J]. 河南科技 2019(35)
    • [18].考虑综合需求侧响应的区域综合能源系统多目标优化调度[J]. 电力建设 2020(07)
    • [19].动态多目标优化:测试函数和算法比较[J]. 控制与决策 2020(10)
    • [20].多目标优化软件开发及其应用[J]. 工程设计学报 2015(03)
    • [21].基于全局排序的高维多目标优化研究[J]. 软件学报 2015(07)
    • [22].基于多目标优化问题的教学质量评价模型研究[J]. 时代教育(教育教学版) 2009(Z1)
    • [23].面向客户定制产品开发的多目标优化算法设计[J]. 中国机械工程 2012(06)
    • [24].一类多目标优化问题的有效解[J]. 贵州师范大学学报(自然科学版) 2012(02)
    • [25].图像处理优化的系统流程与多目标优化理论分析[J]. 硅谷 2012(19)
    • [26].一种求解动态多目标优化问题的粒子群算法[J]. 系统仿真学报 2011(02)
    • [27].一类带约束多目标优化问题的区间算法[J]. 黑龙江科技学院学报 2009(01)
    • [28].多目标优化问题的求解框架[J]. 微计算机信息 2009(36)
    • [29].激活规则多目标优化算法在任务分解中的应用[J]. 计算机工程 2020(03)
    • [30].一类多目标优化控制问题的混合型对偶[J]. 内蒙古农业大学学报(自然科学版) 2019(06)

    标签:;  ;  ;  ;  

    基于多目标优化的中文分词模型的研究
    下载Doc文档

    猜你喜欢