面向概念查询的生物医学多文档摘要技术研究

面向概念查询的生物医学多文档摘要技术研究

论文摘要

近年来,随着生命科学的不断发展,生物医学文献数量呈指数级增长,海量的数据为研究人员提供了丰富的资源的同时,也为知识的检索和理解带来了巨大挑战。在生物医学文献数据库中,一个生物医学概念可以检索到大量的文献,有些疾病概念可以检索到几万篇相关研究论文,一个基因也能找到上千篇参考文献,逐一阅读相关文献将是十分费时耗力的工作。因此,自动整合生物医学概念的相关资源,使用户能快速掌握查询概念的相关信息对生物医学研究人员有重要意义。文本自动摘要技术是对文本内容进行自动概括和精炼的过程,能利用较少的语句概括文本的主要信息,使用户对文本内容有快速的认识。将自动摘要技术应用于生物医学文本挖掘中有助于提高研究人员查阅和分析相关资料的效率,快速理解和掌握生物医学概念的相关知识。本文利用自动摘要技术对两类生物医学概念,即疾病和基因,针对各自语料和资源的特点,分别进行多文档自动摘要的抽取和生成。面向疾病概念的摘要,本文提出了一种利用生物医学语义关系进行多文档摘要抽取的方法,旨在从语义层面比较全面的覆盖查询疾病概念的多方面内容。本文对查询疾病的相关语义关系进行分析,根据语义关系获取相关句子并对句子按语义相关性排序。实验中分析了24种常见病,生成的概念涉及了致病原因、类型、防治策略等语义类型。实验结果表明,利用语义关系特征抽取摘要的方法能提高摘要的性能,且由于增加了生物医学语义层面内容,使生成的摘要更符合研究人员的查询需要。面向基因概念的摘要,本文提出了一种利用排序学习生成基因摘要的方法。本文提出了三种特征作为候选摘要句选取的依据,即基因本体相关性、主题相关性以及TextRank,并利用排序学习方法自动从训练集获取三类特征在句子重要性排序中的权重。实验结果表明,利用三种特征衡量候选摘要句的重要程度序能提高摘要的性能,而利用排序学习方法从训练集中自动学习特征权重的方法也有利于特征的进一步扩展,为引入更多有效的句子重要性评价特征提供的便利。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 研究背景
  • 1.2 自动摘要研究现状
  • 1.2.1 文本挖掘领域的自动摘要研究现状
  • 1.2.2 生物医学领域自动摘要研究现状
  • 1.3 论文的组织
  • 2 相关知识及评价方法
  • 2.1 生物医学相关知识
  • 2.1.1 一体化医学语言系统
  • 2.1.2 SemRep
  • 2.1.3 MeSH
  • 2.1.4 MEDLINE
  • 2.2 评价方法
  • 2.2.1 自动文摘评价方法分类
  • 2.2.2 常用自动摘要评价方法
  • 3 基于语义关系抽取的疾病摘要生成
  • 3.1 生物医学语义关系抽取和筛选
  • 3.1.1 语义关系抽取工具SemRep
  • 3.1.2 语义关系筛选
  • 3.2 基于语义关系的摘要抽取和生成
  • 3.2.1 句子排序
  • 3.2.2 摘要生成
  • 3.3 实验与结果分析
  • 3.3.1 实验设计
  • 3.3.2 不同摘要方法的比较
  • 3.4 本章小结
  • 4 基于排序学习的基因摘要生成
  • 4.1 特征选择
  • 4.1.1 基因本体相关性
  • 4.1.2 主题相关性
  • 4.1.3 TextRank
  • 4.2 排序学习
  • 4.3 实验与结果分析
  • 4.3.1 语料
  • 4.3.2 实验过程
  • 4.4 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 相关论文文献

    • [1].生物医学的“数据冰山”[J]. 科学新闻 2019(06)
    • [2].生物医学大数据是重要战略资源[J]. 科学新闻 2019(06)
    • [3].目的论视域下生物医学论文翻译探析[J]. 大众标准化 2020(08)
    • [4].选择最合适的纤维织造、更安全的生物医学结构[J]. 中国纤检 2020(07)
    • [5].实验猕猴在生物医学研究中的福利管理[J]. 生命科学 2020(07)
    • [6].生物医学道德增强的伦理探析[J]. 大庆社会科学 2020(04)
    • [7].生物医学标准物质的发展与挑战[J]. 计量技术 2019(10)
    • [8].生物医学领域需要持续的科技创新[J]. 中国高等教育 2016(23)
    • [9].生物医学文本挖掘研究热点分析[J]. 中华医学图书情报杂志 2016(02)
    • [10].3D打印生物医学产业大有可为[J]. 新湘评论 2016(17)
    • [11].3D生物打印材料在生物医学领域中的应用及研究进展[J]. 中华临床医师杂志(电子版) 2019(02)
    • [12].生物医学研究中的实验记录及其存档与管理[J]. 生物技术通讯 2017(02)
    • [13].激光扫描共聚焦显微镜在生物医学中发展与应用[J]. 科教文汇(中旬刊) 2017(07)
    • [14].生物医学文献中的蛋白质相互作用抽取研究[J]. 山东工业技术 2016(20)
    • [15].生物医学大数据的现状与展望[J]. 健康之路 2018(12)
    • [16].“聚合”:生物医学酝酿第三次革命[J]. 科学新闻 2011(02)
    • [17].日本期刊《药物和生物医学分析》审稿过程实例分析[J]. 编辑学报 2011(04)
    • [18].《生物医学研究杂志》正式出版发行[J]. 南京医科大学学报(自然科学版) 2010(05)
    • [19].《生物医学研究杂志》正式出版发行[J]. 南京医科大学学报(自然科学版) 2010(04)
    • [20].《生物医学研究杂志》正式出版发行[J]. 南京医科大学学报(自然科学版) 2010(09)
    • [21].《生物医学研究杂志》正式批准[J]. 南京医科大学学报(社会科学版) 2009(04)
    • [22].《生物医学论文写作20讲》出版[J]. 中国学校卫生 2008(01)
    • [23].生物医学论文写作20讲出版[J]. 生殖医学杂志 2008(01)
    • [24].《生物医学论文写作20讲》出版[J]. 中国心理卫生杂志 2008(03)
    • [25].美研制出可广泛用于生物医学的新材料[J]. 功能材料信息 2008(02)
    • [26].上海市儿童生物医学研究知情同意执行情况调查[J]. 医学与社会 2020(01)
    • [27].关于我国涉及人的生物医学研究管理规范的思考[J]. 科技管理研究 2020(11)
    • [28].浅谈3D打印技术在生物医学领域的应用与发展[J]. 信息记录材料 2019(07)
    • [29].生物医学大数据的现状与发展趋势研究[J]. 科技与创新 2018(02)
    • [30].生物医学大数据发展的新挑战与趋势[J]. 中国科学院院刊 2018(08)

    标签:;  ;  ;  ;  ;  

    面向概念查询的生物医学多文档摘要技术研究
    下载Doc文档

    猜你喜欢