基于基因表达数据的癌症分型方法

基于基因表达数据的癌症分型方法

论文摘要

癌症作为一种重病轻症的疾病,治愈的关键在于如何有效而又准确地及早发现和充分治疗。其中最大的挑战是肿瘤的诊断和精确分型,以区分形态上相似的肿瘤分子亚型,寻找针对病理发生学上一致的肿瘤特异性靶向疗法。基因芯片技术能够快速并行处理大量基因表达,实现多通道、高通量、自动化的数据处理,已被广泛应用于疾病诊断、临床检验等方面。应用基因芯片技术对肿瘤进行诊断和分类,可以在基因表达水平上精确区分肿瘤的分子类型,以更好地预测肿瘤疗效,亦对肿瘤的发生发展机理探讨、肿瘤的早期诊断和分子分型等方面均有重要意义。常规的基因表达数据分类方法将全部样本或者基因作为特征空间。但考虑到在部分样本中发生的某个生物学过程仅涉及到芯片上部分基因,本文采用双向聚类思想,利用与该生物学过程相关的基因簇对样本进行分割,具体内容包括:介绍癌症亚型区分的意义和研究现状,着重介绍急性白血病和弥漫性大B细胞淋巴癌两类癌症的亚型。分析基因芯片的相关知识及其在癌症分型方向上的应用。研究基因表达数据的图像处理和数据分析方法,重点研究聚类分析的常规方法。深入探讨双向聚类方法并对其种类,算法和存在的问题进行分析,在此基础上改进并设计一种基于系统树图的耦合双向聚类算法。在MATLAB6.5的平台上,实现此基因表达数据的双向聚类算法。利用急性白血病和弥漫性大B细胞淋巴癌的基因表达谱数据实验和检验这种聚类算法。实验结果表明,基于系统树图的双向聚类算法能有效地找到特征基因簇。利用这些基因簇分割样本,可以得到与同类算法相比较高的癌症亚型识别率,并有助于发现关键基因和表达模式。

论文目录

  • 致谢
  • 摘要
  • ABSTRACT
  • 目录
  • 第一章 绪论
  • 1.1 选题意义
  • 1.2 研究现状
  • 1.2.1 癌症分型的常规方法
  • 1.2.2 基因芯片在癌症分型上应用的可行性,必要性和发展前景
  • 1.2.3 应用基因芯片的癌症分型方法研究现状
  • 1.3 目标和内容
  • 第二章 基因芯片与癌症分型
  • 2.1 基因芯片概述
  • 2.1.1 基因芯片的原理
  • 2.1.2 基因芯片的制备
  • 2.1.3 样本制备
  • 2.1.4 基因芯片的检测
  • 2.1.5 基因芯片数据库
  • 2.2 癌症分型
  • 2.2.1 急性白血病
  • 2.2.2 弥漫性大 B细胞淋巴癌
  • 第三章 基因芯片分析方法
  • 3.1 基因芯片的图像处理方法
  • 3.1.1 平滑滤波
  • 3.1.2 阵列分割
  • 3.1.3 靶点分割
  • 3.2 基因芯片的数据分析方法
  • 3.2.1 数据提取
  • 3.2.2 数据表达分析
  • 3.3 常用的聚类方法
  • 3.3.1 模式近似度定义
  • 3.3.2 非监督聚类算法
  • 3.3.3 监督聚类算法
  • 3.3.4 一维聚类的局限性
  • 第四章 基因表达数据的双向聚类方法
  • 4.1 双向聚类的概念和意义
  • 4.1.1 双向聚类的概念
  • 4.1.2 双向聚类的意义
  • 4.2 双向聚类的种类和算法
  • 4.2.1 “贪婪递归”搜索法
  • 4.2.2 耦合双向聚类
  • 4.2.3 光谱双向聚类
  • 4.3 基于系统树图的耦合双向聚类方法
  • 4.3.1 不一致性系数
  • 4.3.2 稳定性子类
  • 4.3.3 基于系统树图的耦合双向聚类方法(HCTWC)搜索过程
  • 第五章 HCTWC算法的实现与验证
  • 5.1 数据预处理
  • 5.1.1 原始数据格式
  • 5.1.2 对数处理
  • 5.1.3 归一化及缺失数据处理
  • 5.2 HCTWC算法实现
  • 5.2.1 系统聚类的参数选择
  • 5.2.2 稳定性规则
  • 5.2.3 递归次数
  • 5.3 HCTWC算法评价
  • 5.3.1 DLBCL分型
  • 5.3.2 ALL/ AML分型
  • 第六章 总结与展望
  • 6.1 总结
  • 6.1.1 结果分析
  • 6.1.2 总结讨论
  • 6.2 展望
  • 参考文献
  • 附录 作者在攻读硕士学位期间完成的论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  ;  

    基于基因表达数据的癌症分型方法
    下载Doc文档

    猜你喜欢