基于邻接谱分解的基因表达谱数据分类研究

基于邻接谱分解的基因表达谱数据分类研究

论文摘要

进入21世纪以来,科学技术高度发达,人们的生活水平不断提高,人类越来越渴望理解自身的起源过程,探索生命的奥秘。随着现代生物技术的不断发展,生物信息学近年来获得了突破性进展,对基因芯片技术的研究也日趋成熟,基因表达数据的获取变得越来越容易,得到的数据也越来越准确。随着人们不断对公布的大量DNA序列进行分析和数据挖掘,基因的神秘面纱也随之揭开。对肿瘤基因表达谱进行深入研究,可以了解肿瘤的发生发展机制,有助于人们发现新的疾病亚型,找出肿瘤早期的诊断指标和治疗靶点,提高复杂疾病诊断的准确率,增强临床治疗肿瘤的有效性。但是由于基因表达谱数据具有高维度,小样本的特点,远远超出传统分析方法所能处理的范畴,现有的相关数据分析和数据挖掘方法已经不能满足实际的需要,如何对其进行有效的处理、挖掘、分析和理解成了生物信息学研究的瓶颈。为此,研究人员将对肿瘤基因表达谱数据的分析从传统的统计学方法逐渐过渡到运用机器学习的方法上,成为生物信息学近年来研究的热点。本文基于生物信息学理论和谱图理论,运用模式识别方法和计算机技术,将反映图结构的特征表示引入到基因表达谱数据的分类中,研究了基于谱图理论的肿瘤基因表达谱数据的特征提取及分类,并对数据的分析结果,算法的性能进行了论证。主要研究内容有:1.详细介绍了基因表达谱的基础知识,对近年来基因芯片表达数据的分类分析方法进行了综述,在分析基因表达谱数据特点的基础上,对分类的研究背景,研究现状,研究意义,现阶段存在的问题以及未来的研究方向进行了探讨。2.提出了一种基于邻接矩阵分解的肿瘤亚型特征提取及分类方法,首先对肿瘤基因表达谱数据以高斯权构造邻接矩阵,然后进行奇异值分解,最后将分解得到的特征向量作为分类特征输入支持向量机进行分类识别。对白血病的两个亚型采用留一法进行试验,取得了良好的效果。3.结合主分量分析方法,对基因表达谱数据样本点构造高斯权邻接矩阵,使样本点具有空间结构信息,SVD分解后,采用特征记分准则进行筛选,找出最大限度区分肿瘤样本与正常样本的主分量作为样本特征,输入KNN分类器进行分类。通过对白血病和结肠癌表达谱数据进行实验,证明了该方法的可行性与有效性。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第一章 绪论
  • 1.1 生物信息学
  • 1.1.1 生物信息学简介
  • 1.1.2 研究意义
  • 1.2 谱图理论
  • 1.2.1 谱图理论的发展
  • 1.2.2 相关概念
  • 1.2.3 谱图理论在基因表达谱数据中的应用
  • 1.3 本文的研究内容及组织结构
  • 第二章 基因表达谱数据相关研究
  • 2.1 基因芯片技术
  • 2.2 基因表达谱数据
  • 2.2.1 基因表达谱数据的制备采集及预处理
  • 2.2.2 基因表达谱数据的特点
  • 2.3 基因表达谱数据的研究现状及研究方向
  • 2.3.1 基因表达谱数据的研究现状
  • 2.3.2 基因表达谱数据的研究方向
  • 第三章 基于邻接矩阵分解的肿瘤亚型特征提取方法
  • 3.1 基因表达谱数据的特征提取
  • 3.1.1 特征提取与选择模型
  • 3.1.2 基于邻接矩阵分解的肿瘤亚型特征提取方法
  • 3.1.3 支持向量机
  • 3.2 实验
  • 3.2.1 实验方法
  • 3.2.2 实验结果及分析
  • 3.3 本章小结
  • 第四章 基于邻接谱主分量分析的肿瘤分类方法
  • 4.1 提取主分量方法在基因数据表达谱中的应用
  • 4.1.1 主分量分析方法
  • 4.1.2 基于邻接矩阵提取主分量的基因表达谱数据分类方法
  • 4.1.3 KNN分类器
  • 4.2 实验
  • 4.2.1 实验方法
  • 4.2.2 实验结果及分析
  • 4.3 本章小结
  • 第五章 总结与展望
  • 5.1 论文总结
  • 5.2 研究展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表的论文及参加的科研项目
  • 相关论文文献

    • [1].基因表达谱技术分析棒曲霉毒素肾细胞毒性的机制[J]. 现代食品科技 2017(06)
    • [2].基于高通量测序的数字基因表达谱技术研究进展[J]. 北方园艺 2015(10)
    • [3].基因表达谱技术:贵亦需有道[J]. 医学争鸣 2010(04)
    • [4].我国发现Ⅰ型糖尿病的多基因表达谱,有助于该病的预测[J]. 生物学教学 2014(09)
    • [5].基于加权极限学习机的肿瘤基因表达谱数据分类[J]. 东北大学学报(自然科学版) 2017(06)
    • [6].奥美拉唑对人脐静脉内皮细胞全基因表达谱的影响及机制分析[J]. 南方医科大学学报 2012(04)
    • [7].脂多糖活化巨噬细胞的数字基因表达谱分析[J]. 中国药理学与毒理学杂志 2013(06)
    • [8].肾阴虚证和肾阳虚证基因表达谱的比较研究[J]. 山西医科大学学报 2012(09)
    • [9].口腔鳞癌细胞外泌体分离鉴定及基因表达谱研究[J]. 中华肿瘤防治杂志 2018(19)
    • [10].原发性骨质疏松症肾阳虚证骨组织全基因表达谱研究[J]. 中国骨质疏松杂志 2017(07)
    • [11].结肠癌基因表达谱降噪算法研究[J]. 医学理论与实践 2015(14)
    • [12].黄芩素对白念珠菌基因表达谱的影响[J]. 第二军医大学学报 2010(07)
    • [13].气滞血瘀证大鼠舌部基因表达谱变化初探[J]. 中国比较医学杂志 2017(09)
    • [14].中医药对类风湿关节炎细胞凋亡及基因表达谱的影响[J]. 中华中医药杂志 2010(04)
    • [15].重金属胁迫下白骨壤数字基因表达谱分析[J]. 林业科学研究 2017(02)
    • [16].高温胁迫下坛紫菜的数字基因表达谱研究[J]. 海洋学报(中文版) 2014(06)
    • [17].基于流形学习的基因表达谱数据可视化[J]. 生物信息学 2009(01)
    • [18].鼻息肉基因芯片检测及基因表达谱的研究[J]. 临床耳鼻咽喉头颈外科杂志 2008(11)
    • [19].转化生长因子β对人肾小管上皮细胞全基因表达谱的影响及其生物信息学分析[J]. 临床肾脏病杂志 2019(06)
    • [20].溃疡性结肠炎患者结肠黏膜基因表达谱生物信息学分析[J]. 解放军医药杂志 2019(11)
    • [21].基因表达谱微阵列网络数据库在肿瘤研究中的应用[J]. 中国生物化学与分子生物学报 2016(03)
    • [22].识别乳腺癌固有成像表型:与基因表达谱相关的初步研究[J]. 国际医学放射学杂志 2014(05)
    • [23].2型糖尿病的基因表达谱分析[J]. 中国实用内科杂志 2012(07)
    • [24].正常-脑瘫双生子基因表达谱差异研究[J]. 辽宁中医杂志 2009(11)
    • [25].脂多糖诱导实验性急性水肿性胰腺炎演变为急性坏死性胰腺炎的基因表达谱变化[J]. 胃肠病学 2008(06)
    • [26].基因表达谱技术从消化道肿瘤基础研究到临床转化[J]. 世界华人消化杂志 2018(34)
    • [27].变应性鼻炎发病相关基因表达谱的生物信息学分析及作为药物筛选新方法的探索[J]. 临床耳鼻咽喉头颈外科杂志 2018(19)
    • [28].干旱胁迫下丹参数字基因表达谱分析[J]. 基因组学与应用生物学 2018(10)
    • [29].盐胁迫下旱地棉叶片数字化基因表达谱分析[J]. 江苏农业学报 2016(03)
    • [30].依硫磷酸调控人类基因表达谱的预测及生物信息学分析[J]. 中国实验血液学杂志 2011(03)

    标签:;  ;  ;  ;  ;  

    基于邻接谱分解的基因表达谱数据分类研究
    下载Doc文档

    猜你喜欢