论文摘要
癌症作为一种重病轻症的疾病,治愈的关键在于如何有效而又准确地及早发现和充分治疗。其中最大的挑战是肿瘤的诊断和精确分型,以区分形态上相似的肿瘤分子亚型,寻找针对病理发生学上一致的肿瘤特异性靶向疗法。基因芯片技术能够快速并行处理大量基因表达,实现多通道、高通量、自动化的数据处理,已被广泛应用于疾病诊断、临床检验等方面。应用基因芯片技术对肿瘤进行诊断和分类,可以在基因表达水平上精确区分肿瘤的分子类型,以更好地预测肿瘤疗效,亦对肿瘤的发生发展机理探讨、肿瘤的早期诊断和分子分型等方面均有重要意义。常规的基因表达数据分类方法将全部样本或者基因作为特征空间。但考虑到在部分样本中发生的某个生物学过程仅涉及到芯片上部分基因,本文采用双向聚类思想,利用与该生物学过程相关的基因簇对样本进行分割,具体内容包括:介绍癌症亚型区分的意义和研究现状,着重介绍急性白血病和弥漫性大B细胞淋巴癌两类癌症的亚型。分析基因芯片的相关知识及其在癌症分型方向上的应用。研究基因表达数据的图像处理和数据分析方法,重点研究聚类分析的常规方法。深入探讨双向聚类方法并对其种类,算法和存在的问题进行分析,在此基础上改进并设计一种基于系统树图的耦合双向聚类算法。在MATLAB6.5的平台上,实现此基因表达数据的双向聚类算法。利用急性白血病和弥漫性大B细胞淋巴癌的基因表达谱数据实验和检验这种聚类算法。实验结果表明,基于系统树图的双向聚类算法能有效地找到特征基因簇。利用这些基因簇分割样本,可以得到与同类算法相比较高的癌症亚型识别率,并有助于发现关键基因和表达模式。
论文目录
致谢摘要ABSTRACT目录第一章 绪论1.1 选题意义1.2 研究现状1.2.1 癌症分型的常规方法1.2.2 基因芯片在癌症分型上应用的可行性,必要性和发展前景1.2.3 应用基因芯片的癌症分型方法研究现状1.3 目标和内容第二章 基因芯片与癌症分型2.1 基因芯片概述2.1.1 基因芯片的原理2.1.2 基因芯片的制备2.1.3 样本制备2.1.4 基因芯片的检测2.1.5 基因芯片数据库2.2 癌症分型2.2.1 急性白血病2.2.2 弥漫性大 B细胞淋巴癌第三章 基因芯片分析方法3.1 基因芯片的图像处理方法3.1.1 平滑滤波3.1.2 阵列分割3.1.3 靶点分割3.2 基因芯片的数据分析方法3.2.1 数据提取3.2.2 数据表达分析3.3 常用的聚类方法3.3.1 模式近似度定义3.3.2 非监督聚类算法3.3.3 监督聚类算法3.3.4 一维聚类的局限性第四章 基因表达数据的双向聚类方法4.1 双向聚类的概念和意义4.1.1 双向聚类的概念4.1.2 双向聚类的意义4.2 双向聚类的种类和算法4.2.1 “贪婪递归”搜索法4.2.2 耦合双向聚类4.2.3 光谱双向聚类4.3 基于系统树图的耦合双向聚类方法4.3.1 不一致性系数4.3.2 稳定性子类4.3.3 基于系统树图的耦合双向聚类方法(HCTWC)搜索过程第五章 HCTWC算法的实现与验证5.1 数据预处理5.1.1 原始数据格式5.1.2 对数处理5.1.3 归一化及缺失数据处理5.2 HCTWC算法实现5.2.1 系统聚类的参数选择5.2.2 稳定性规则5.2.3 递归次数5.3 HCTWC算法评价5.3.1 DLBCL分型5.3.2 ALL/ AML分型第六章 总结与展望6.1 总结6.1.1 结果分析6.1.2 总结讨论6.2 展望参考文献附录 作者在攻读硕士学位期间完成的论文
相关论文文献
标签:癌症分型论文; 基因表达数据论文; 基因芯片论文; 双向聚类论文; 系统聚类论文; 稳定性子类论文; 急性白血病论文; 弥漫性大细胞淋巴癌论文;