基于分类器融合的生物医学命名实体与关系识别研究

基于分类器融合的生物医学命名实体与关系识别研究

论文摘要

生物医学命名实体识别与关系识别是生物医学文本挖掘的基本任务。目前,国内外用于该方面研究的大部分识别模型是建立在单个机器学习算法的基础上,没有一种算法能够取得非常好的效果,这就说明单一算法不能够达到高效率识别的目的。通过对各种统计学习方法的分析可以发现,不同的学习模型之间存在着互补性和相关性,所以分类器融合是一种改进的新思路。本文主要从两个方面进行了深入研究:1、基于单分类器和多分类器融合的生物医学命名实体识别研究。首先研究了基于单分类器的生物医学命名实体识别,采用最大熵算法和条件随机域算法,对Yapex语料中的蛋白质名称进行了识别。系统中结合了丰富的特征集,我们引入缩写词识别模块、边界扩展模块和过滤器模块进行后处理。接着,针对存在的问题,我们研究了基于多分类器融合的生物医学命名实体识别,提出了一种融合方法,即把条件随机域算法与最大熵算法进行有机融合,利用不同学习模型之间存在的互补性和相关性,进一步提高了生物医学命名实体识别的性能。2、基于单分类器和多分类器融合的生物医学命名实体关系识别研究。我们主要研究了蛋白质相互作用关系识别,着重分析蛋白质相互作用关系的特点,抽取出各种浅层语言学特征,包括交互蛋白质实体对特征、关键词特征、语块特征、上下文环境特征等。基于有效的浅层语言学特征,先采用单分类器方法进行识别,针对单分类器方法存在的片面性,考虑到不同分类模型的分类结果之间具有的互补性和相关性,采用同样的融合方法,对蛋白质相互作用关系进行识别,取得了较好的识别性能。

论文目录

  • 摘要
  • ABSTRACT
  • 创新点摘要
  • 前言
  • 第一章 概述
  • 1.1 生物医学文本信息抽取
  • 1.2 生物医学命名实体识别
  • 1.3 生物医学命名实体关系识别
  • 1.4 评测标准
  • 1.5 重要国际评测会议
  • 第二章 基于单分类器的生物医学命名实体识别
  • 2.1 引言
  • 2.2 分类器模型
  • 2.2.1 最大熵模型
  • 2.2.2 条件随机域模型
  • 2.3 特征选择
  • 2.4 基于最大熵模型的蛋白质名称识别
  • 2.4.1 模糊匹配算法
  • 2.4.2 规则过滤
  • 2.4.3 缩写词识别
  • 2.4.4 左右边界扩展
  • 2.4.5 实验结果与分析
  • 2.5 基于条件随机域模型的生物医学命名实体识别
  • 2.5.1 特征选择
  • 2.5.2 缩写词识别
  • 2.5.3 修改边界错误
  • 2.5.4 其他识别策略
  • 2.5.5 实验结果与分析
  • 2.6 本章小结
  • 第三章 基于分类器融合的生物医学命名实体识别
  • 3.1 引言
  • 3.2 多分类器融合基本理论
  • 3.2.1 基本分类器的联系
  • 3.2.2 获得不同基本分类器方法
  • 3.2.3 融合基本分类器方法
  • 3.3 基于分类器融合的生物医学命名实体识别方法
  • 3.3.1 融合方法
  • 3.3.2 特征提取
  • 3.3.3 缩写词识别
  • 3.3.4 嵌套识别
  • 3.3.5 实验结果与分析
  • 3.4 本章小结
  • 第四章 蛋白质相互作用关系识别
  • 4.1 引言
  • 4.2 识别命名实体关系有关方法
  • 4.2.1 数据知识库识别方法
  • 4.2.2 机器学习识别方法
  • 4.2.3 模式识别方法
  • 4.3 生物医学命名实体关系评测语料及评价方法
  • 4.4 基于浅层语言学特征识别蛋白质相互作用关系
  • 4.5 实验结果与分析
  • 4.6 基于分类器融合的蛋白质相互作用关系识别
  • 4.6.1 选用的特征集合
  • 4.6.2 融合分类器的构建
  • 4.6.3 实验结果与分析
  • 4.7 本章小结
  • 结论
  • 参考文献
  • 发表文章目录
  • 致谢
  • 详细摘要
  • 相关论文文献

    • [1].基于动态分类器集成系统的卷烟感官质量预测方法[J]. 计算机应用与软件 2020(01)
    • [2].基于标准数据集的分类器融合学习模型[J]. 微型电脑应用 2020(04)
    • [3].一种自适应子融合集成多分类器方法[J]. 计算机测量与控制 2019(04)
    • [4].基于多分类器融合的近红外光谱技术鉴别蜂蜜品种[J]. 化学分析计量 2019(03)
    • [5].基于分类器的身份证号码识别研究[J]. 贵州科学 2018(01)
    • [6].一种基于多分类器融合的人体运动行为识别模型[J]. 计算机科学 2016(12)
    • [7].一种基于混淆矩阵的分类器选择方法[J]. 河南理工大学学报(自然科学版) 2017(02)
    • [8].一种代价敏感的三类分类器评估方法的研究与应用[J]. 通化师范学院学报 2017(08)
    • [9].基于多分类器组合的遥感土地利用分类研究[J]. 安徽农业科学 2015(32)
    • [10].多分类器融合与单分类器影像分类比较研究[J]. 矿山测量 2016(04)
    • [11].《未来垃圾分类器》[J]. 幼儿教育 2020(14)
    • [12].基于多分类器组合的城市不透水面提取研究[J]. 城市地理 2017(04)
    • [13].《垃圾分类器》[J]. 辅导员 2016(11)
    • [14].多分类器融合的遥感影像分类方法实验研究[J]. 全球定位系统 2020(05)
    • [15].一种基于核聚类的多分类器选择算法[J]. 电子技术与软件工程 2020(13)
    • [16].基于一种新的级联分类器的目标检测系统[J]. 现代电子技术 2020(01)
    • [17].最佳的分类器链局部检测与挖掘算法[J]. 计算机工程与设计 2017(11)
    • [18].基于多分类器融合与模糊综合评判的滚动轴承故障诊断[J]. 中国科技论文 2016(04)
    • [19].近红外光谱和多分类器融合的葡萄酒品种判别研究[J]. 光谱学与光谱分析 2016(11)
    • [20].基于多分类器集成的语音情感识别[J]. 微电子学与计算机 2015(07)
    • [21].基于集成分类器的流量识别技术研究[J]. 科技视界 2015(33)
    • [22].二叉树型多分类器融合的轴承故障诊断方法[J]. 计算机工程与应用 2015(21)
    • [23].智能垃圾分类器[J]. 科学启蒙 2013(12)
    • [24].一种新的多分类器融合方法[J]. 西南师范大学学报(自然科学版) 2014(01)
    • [25].动态加权投票的多分类器聚合[J]. 现代计算机(专业版) 2014(05)
    • [26].面向用户观点分析的多分类器集成和优化技术[J]. 计算机学报 2013(08)
    • [27].基于证据理论的优化集成分类器融合算法及应用[J]. 化工学报 2012(09)
    • [28].多类不平衡数据上的分类器性能比较研究[J]. 计算机工程 2011(10)
    • [29].基于多分类器融合的语音识别方法研究[J]. 重庆邮电大学学报(自然科学版) 2011(04)
    • [30].基于粗糙集约简的多分类器系统构造方法[J]. 计算机工程与应用 2010(03)

    标签:;  ;  ;  ;  ;  

    基于分类器融合的生物医学命名实体与关系识别研究
    下载Doc文档

    猜你喜欢