几何学习在病毒分类与肿瘤分型中的应用

几何学习在病毒分类与肿瘤分型中的应用

论文摘要

随着分子生物学的迅速进展,对物种分类与进化的研究已经由宏观领域开始转入微观领域。传统的生物分类方法是建立在形态学基础上的,但生物的生长环境对生物个体的表型影响很大,这给传统生物分类带来误导。由于生物大分子的进化是一个缓慢的过程,这给从分子水平上研究生物分类与进化提供了可靠的依据。此外,对肿瘤亚型的分型一直是医学上的难题,由最初基于形态学的分型转向细胞化学检测方法的分型。但是肿瘤亚型在这些方面却十分相似,很难分辨。现代基因表达技术为肿瘤亚型分类与预测提供了新的方法,并得到成功的应用。本文将几何学习算法成功地应用于生物全基因组序列的分类与肿瘤亚型分类与识别。1.应用几何学习算法对病毒全基因组序列的分类,从而实现对生物的分类与进化的研究。首先对全基因组DNA序列进行特征分析,选择部分特征量来描述全基因组序列的特征,再对全基因组序列进行特征提取并将其映射到特征空间的点。选择部分样本点应用几何学习算法将这些点(顶点)构建几何图,再按最近距离原则对待分类序列进行分类。并对NCBI提供的8类病毒全基因组序列分类测试,正确率为94%。将实验结果与常用比对算法BLAST比较,两者的分类结果非常接近;此外,再将实验结果与支撑向量机(SVM)得到的结果比较,结果优于SVM。2.本文又将几何学习方法对Golub等人公布的急性白血病的基因表达数据集进行分类识别,它包括两个亚型(ALL,AML)。首先应用“分类信息指数”指标对急性白血病的基因表达谱数据进行特征基因的选取,再用几何学习算法构造两类亚型的几何凸胞联合体。最后应用分型算法对两个急性白血病的亚型分型实验,实验结果对其两类亚型能完全正确地识别。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 引言
  • 1.2 分子系统发生学与基因组分析
  • 1.2.1 分子系统发生学与物种分类
  • 1.2.2 分子进化树
  • 1.2.3 生物基因组分析与生物进化
  • 1.3 基因表达技术与肿瘤
  • 1.3.1 基因表达技术
  • 1.3.2 基因表达数据分析与肿瘤研究
  • 1.3.3 基于基因表达谱的肿瘤分型
  • 1.4 本文的内容安排
  • 1.5 本文创新点
  • 第二章 基于图的几何理论
  • 2.1 图的基本概念
  • 2.2 图的基本运算与操作
  • 2.2.1 图的基本运算
  • 2.2.2 图的基本操作
  • 2.2.3 常见的几类特殊图
  • 2.3 树与平面图
  • 2.3.1 树及相关概念
  • 2.3.2 平面图
  • 2.4 图的权、向量空间和矩阵表示
  • 2.4.1 图的权
  • 2.4.2 图的向量空间
  • 2.4.3 图的矩阵表示
  • 2.5 图与特征空间
  • 2.5.1 图的覆盖
  • 2.5.2 图在空间的几何关系
  • 2.5.3 几何图在空间的覆盖
  • 2.6 基于图几何的复杂几何形体的数学描述
  • 2.6.1 复杂形体的几何元素
  • 2.6.2 复杂形体的几何运算
  • 2.7 小结
  • 第三章 DNA 序列特征量与相似度分析
  • 3.1 DNA 特征与分析方法
  • 3.1.1 DNA 序列的傅里叶变换与小波分析
  • 3.1.2 基于 Hurst 指数与信息熵的 DNA 特征分析
  • 3.1.3 DNA 序列的马尔可夫链分析
  • 3.1.4 相同碱基的相对坐标与含量的统计参量
  • 3.1.5 碱基比和 DNA 序列的数字向量的欧氏距离及向量夹角
  • 3.1.6 基于词频统计的三联体频率分析
  • 3.2 DNA 序列特征量的比较与分析
  • 3.3 DNA 序列相似度分析
  • 3.3.1 基于比对的 DNA 序列相似度分析
  • 3.3.2 不比对 DNA 序列的相似度分析
  • 3.4 小结
  • 第四章 基于全基因组序列非比对的生物病毒分类
  • 4.1 数据来源及分析方法
  • 4.1.1 病毒全基因组序列数据来源
  • 4.1.2 数据的分析方法
  • 4.1.2.1 病毒全基因组 DNA 序列的特征提取
  • 4.1.2.2 构造空间几何图的学习算法
  • 4.1.2.3 基于三角图的病毒全基因组序列的分类算法
  • 4.2 实验结果分析与比较
  • 4.2.1 实验结果与分析
  • 4.2.2 基于 BLAST 比对的实验结果与比较
  • 4.2.3 基于 SVM 的分类结果与比较
  • 4.3 小结
  • 第五章 基于几何学习的肿瘤分型的研究
  • 5.1 问题描述与数据描述
  • 5.2 数据处理方法
  • 5.2.1 肿瘤基因表达谱数据预处理
  • 5.2.2 训练算法
  • 5.2.3 肿瘤亚型分型算法
  • 5.3 实验结果与分析
  • 5.3.1 基于几何学的肿瘤分型结果与分析
  • 5.3.2 两种方法的分型结果比较与分析
  • 5.4 小结
  • 第六章 总结与展望
  • 6.1 本文工作总结
  • 6.2 存在的问题和未来工作
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文目录
  • 相关论文文献

    • [1].“生物的多样性”专题复习策略[J]. 生物学教学 2017(07)
    • [2].“生物的分类”一节的教学设计[J]. 生物学教学 2017(07)
    • [3].探索前沿,低调耕耘[J]. 大学生 2017(01)
    • [4].基于科学史观建构和“3M认知模型”的“生物的分类”教学设计[J]. 中学生物学 2020(04)
    • [5].“生物的分类”一节的教学设计[J]. 中学生物学 2015(11)
    • [6].生物分类字典在自然类博物馆藏品信息管理系统中的应用[J]. 科学教育与博物馆 2018(05)
    • [7].微型生物分类[J]. 风景园林 2011(04)
    • [8].“神奇的微生物”教学设计[J]. 中学生物学 2016(01)
    • [9].“尝试对生物进行分类“一节的教学设计[J]. 生物学教学 2015(04)
    • [10].基于生物动态过程观察的野外动植物分类学习策略[J]. 高教论坛 2018(12)
    • [11].“生物的分类”一节教学设计[J]. 生物学通报 2015(10)
    • [12].中国海及西太平洋生物分类研究进展及展望[J]. 海洋与湖沼 2020(04)
    • [13].挖掘分类学中的哲学思想,落实生物学学科核心素养[J]. 中学生物学 2020(Z1)
    • [14].“尝试对生物进行分类”一节的创意设计[J]. 中学生物学 2011(09)
    • [15].“生物分类的阶元”一节的教学探索[J]. 生物学教学 2009(04)
    • [16].浅析以生物分类为统领的高考复习方法[J]. 教学考试 2020(33)
    • [17].编者的话[J]. 符号与传媒 2018(02)
    • [18].科学有趣的鱼类分类[J]. 齐鲁渔业 2009(09)
    • [19].牡蛎常见病害初诊速查检索表[J]. 水产科技情报 2016(05)
    • [20].科学出版社生命科学分社新书推介2011-1,2[J]. 中国生物化学与分子生物学报 2011(03)
    • [21].跳出三界外的古怪生物[J]. 大科技(百科新说) 2011(07)
    • [22].生物分类知识在城市绿化建设中的应用——为荣昌城市绿树办个“身份证”[J]. 科学咨询(科技·管理) 2012(06)
    • [23].扇贝常见病害诊断速查检索表[J]. 水产科技情报 2011(06)
    • [24].正确理解生物学教学中“种”的概念[J]. 高师理科学刊 2008(05)
    • [25].寻找生物世界的秩序[J]. 生命世界 2008(02)
    • [26].遗态材料的发展及其应用[J]. 新材料产业 2015(03)
    • [27].生物检索表助你快速解题[J]. 考试(高考理科版) 2011(11)
    • [28].大猩猩基因组测序完成 与人类基因相似度达98%[J]. 科技传播 2012(06)
    • [29].初中生物知识难点整理[J]. 中学生物教学 2015(08)
    • [30].精彩预约于智慧设计——苏州市优质课案例及评析[J]. 江苏教育学院学报(自然科学) 2013(01)

    标签:;  ;  ;  ;  ;  ;  

    几何学习在病毒分类与肿瘤分型中的应用
    下载Doc文档

    猜你喜欢