肿瘤基因表达谱分类的特征基因选择研究

肿瘤基因表达谱分类的特征基因选择研究

论文摘要

目前,恶性肿瘤的治疗依然是当今世界的难题,发病类型多样而且难于治愈。早期诊断和精确分类有助于对患者进行有效的临床治疗,在最大程度上挽救宝贵的生命。当今,对肿瘤诊断和分类的主要手段是通过组织病理学特征进行判断的。但是,这个方法有一个固有的缺点。因为,某些肿瘤类型的组织病理学特征很相似,但是在临床治疗反应和预后上具有显著差异,这容易导致病患接受不利治疗。基因芯片技术是一种可以高通量研究基因表达变化的分子技术,通过基因芯片技术可以大规模检测肿瘤的基因表达情况,从而获得肿瘤基因表达谱。因为肿瘤在基因表达变化方面呈现高度的异质性,通过肿瘤基因表达谱可以区分那些组织特征相似的肿瘤类型,从而实现对恶性肿瘤的早期诊断和精确分类。因此基因芯片技术具有很大潜力发展为对肿瘤实现简便、快捷诊断与分类的工具,这无疑可以对患者和社会带来巨大的益处。基于基因表达谱的分类包含两个重要的部分:特征基因选择(feature gene selection)和分类器构建(classifier construction)。在基因表达谱获取过程中,由于非特异性杂交等原因,产生于基因芯片技术的基因表达谱数据具有较大的实验误差。同时,由于实验成本较高导致实验样本很少,而检测的基因数目很多可达上万,这导致基因表达谱数据包含大量的无关基因,是典型的高维、高噪问题。另外,由于存在大量相关性很强的基因,导致分类上存在的冗余信息很多。对于这种充满冗余信息且高维高噪的数据,通过特征选择获得与疾病相关的特征基因对于分类问题显得尤为重要。GA/KNN方法是一种成功的wrapper式特征基因选择方法。自提出以来,其实用价值已在国际上获得广泛认可。我们在MATLAB下实现了GA/KNN方法,并通过实验验证了我们的实现过程,最后我们对GA/KNN的成功之处进行了总结。在总结已有工作成果的基础上,我们尝试提出了一种新的特征选择方法GA/WV。通过公开的基因表达谱的数据分析实验验证,证明我们的GA/WV可以应用到二类或多类的特征基因选择问题,并对我们的GA/WV方法的某些性能进行了摸索。因为噬菌体展示蛋白芯片数据分析原理和基因芯片数据分析原理本质上相同,我们将GA/WV的方法应用到我们实验室的噬菌体展示芯片数据中,通过实验比较,我们发现GA/WV的效果要好于T检验。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  • 第2章 基因表达谱数据的获取和特征基因选择方法归类
  • 2.1 DNA基因表达谱数据的获取
  • 2.1.1 基因芯片实验
  • 2.1.2 基因芯片数据的标准化
  • 2.1.3 基因表达谱数据的描述
  • 2.1.4 常用到的肿瘤基因表达谱数据集
  • 2.2 基于基因表达谱的肿瘤分类与特征基因选择
  • 2.2.1 基于基因表达谱的肿瘤分类意义和原理
  • 2.2.2 肿瘤分类与特征基因选择
  • 2.2.3 特征基因选择方法归类
  • 第3章 基于GA/KNN的特征基因选择研究
  • 3.1 基于GA/KNN特征基因选择方法介绍和应用
  • 3.2 GA/KNN方法说明
  • 3.2.1 基因选择器(gene selector):遗传算法GA
  • 3.2.2 最邻近分类器(KNN)
  • 3.2.3 KNN分类原理
  • 3.2.4 GA/KNN方法总述
  • 3.2.5 GA/KNN方法流程
  • 3.3 GA/KNN的MATLAB实现和实验验证
  • 3.3.1 GA/KNN的MATLAB实现
  • 3.4 GA/KNN的验证
  • 3.4.1 数据过滤和转换
  • 3.4.2 实验验证和结果
  • 3.5 本章小结与讨论
  • 3.5.1 本章小结
  • 3.5.2 本章讨论
  • 第4章 GA/WV方法及实验验证
  • 4.1 WV分类器介绍
  • 4.1.1 WV分类计算原理
  • 4.1.2 WV对多分类的实现
  • 4.2 GA/WV方法流程
  • 4.3 实验验证
  • 4.3.1 数据转换和标准化
  • 4.3.2 基因选择器选择基因子集大小d的设定
  • 4.3.3 遗传寻优搜索停止条件p的确定
  • 4.3.4 Golub数据集上对独立搜索次数的验证
  • 4.3.5 Golub数据集上对d大小变化敏感性的验证
  • 4.3.6 特征基因集合大小确定方法的摸索
  • 4.3.7 特征基因选择和分类性能分析验证
  • 4.3.8 分类通用性分析验证
  • 4.3.9 基因表达谱样本自然结构的检验-聚类验证
  • 4.4 GA/WV讨论
  • 4.5 GA/WV在蛋白谱数据分类中的应用
  • 4.5.1 GA/WV确定候选特征蛋白集
  • 4.5.2 生物测序实验验证
  • 4.6 本章小结
  • 第5章 结论
  • 参考文献
  • 致谢
  • 附录
  • WV分类程序代码
  • 在读期间学术论文发表和科研参与情况
  • 一、在学期间论文发表情况
  • 二、在读期间科研项目参与情况
  • 相关论文文献

    • [1].基因表达谱技术分析棒曲霉毒素肾细胞毒性的机制[J]. 现代食品科技 2017(06)
    • [2].基于高通量测序的数字基因表达谱技术研究进展[J]. 北方园艺 2015(10)
    • [3].基因表达谱技术:贵亦需有道[J]. 医学争鸣 2010(04)
    • [4].我国发现Ⅰ型糖尿病的多基因表达谱,有助于该病的预测[J]. 生物学教学 2014(09)
    • [5].基于加权极限学习机的肿瘤基因表达谱数据分类[J]. 东北大学学报(自然科学版) 2017(06)
    • [6].奥美拉唑对人脐静脉内皮细胞全基因表达谱的影响及机制分析[J]. 南方医科大学学报 2012(04)
    • [7].脂多糖活化巨噬细胞的数字基因表达谱分析[J]. 中国药理学与毒理学杂志 2013(06)
    • [8].肾阴虚证和肾阳虚证基因表达谱的比较研究[J]. 山西医科大学学报 2012(09)
    • [9].口腔鳞癌细胞外泌体分离鉴定及基因表达谱研究[J]. 中华肿瘤防治杂志 2018(19)
    • [10].原发性骨质疏松症肾阳虚证骨组织全基因表达谱研究[J]. 中国骨质疏松杂志 2017(07)
    • [11].结肠癌基因表达谱降噪算法研究[J]. 医学理论与实践 2015(14)
    • [12].黄芩素对白念珠菌基因表达谱的影响[J]. 第二军医大学学报 2010(07)
    • [13].气滞血瘀证大鼠舌部基因表达谱变化初探[J]. 中国比较医学杂志 2017(09)
    • [14].中医药对类风湿关节炎细胞凋亡及基因表达谱的影响[J]. 中华中医药杂志 2010(04)
    • [15].重金属胁迫下白骨壤数字基因表达谱分析[J]. 林业科学研究 2017(02)
    • [16].高温胁迫下坛紫菜的数字基因表达谱研究[J]. 海洋学报(中文版) 2014(06)
    • [17].基于流形学习的基因表达谱数据可视化[J]. 生物信息学 2009(01)
    • [18].鼻息肉基因芯片检测及基因表达谱的研究[J]. 临床耳鼻咽喉头颈外科杂志 2008(11)
    • [19].转化生长因子β对人肾小管上皮细胞全基因表达谱的影响及其生物信息学分析[J]. 临床肾脏病杂志 2019(06)
    • [20].溃疡性结肠炎患者结肠黏膜基因表达谱生物信息学分析[J]. 解放军医药杂志 2019(11)
    • [21].基因表达谱微阵列网络数据库在肿瘤研究中的应用[J]. 中国生物化学与分子生物学报 2016(03)
    • [22].识别乳腺癌固有成像表型:与基因表达谱相关的初步研究[J]. 国际医学放射学杂志 2014(05)
    • [23].2型糖尿病的基因表达谱分析[J]. 中国实用内科杂志 2012(07)
    • [24].正常-脑瘫双生子基因表达谱差异研究[J]. 辽宁中医杂志 2009(11)
    • [25].脂多糖诱导实验性急性水肿性胰腺炎演变为急性坏死性胰腺炎的基因表达谱变化[J]. 胃肠病学 2008(06)
    • [26].基因表达谱技术从消化道肿瘤基础研究到临床转化[J]. 世界华人消化杂志 2018(34)
    • [27].变应性鼻炎发病相关基因表达谱的生物信息学分析及作为药物筛选新方法的探索[J]. 临床耳鼻咽喉头颈外科杂志 2018(19)
    • [28].干旱胁迫下丹参数字基因表达谱分析[J]. 基因组学与应用生物学 2018(10)
    • [29].盐胁迫下旱地棉叶片数字化基因表达谱分析[J]. 江苏农业学报 2016(03)
    • [30].依硫磷酸调控人类基因表达谱的预测及生物信息学分析[J]. 中国实验血液学杂志 2011(03)

    标签:;  ;  ;  ;  

    肿瘤基因表达谱分类的特征基因选择研究
    下载Doc文档

    猜你喜欢