基因芯片数据处理方法及在乳腺癌数据中的应用

基因芯片数据处理方法及在乳腺癌数据中的应用

论文摘要

基因芯片是二十世纪九十年代新兴的一项实验技术,它不同于传统的生物实验手段,可以同时检测成千上万个基因的表达情况。由于其研究的问题规模较大,传统的生物学数据分析方法并不能很好的处理这类数据。伴随着基因芯片技术的不断发展,其数据分析方法也在不断的发展。本文首先从芯片数据分析流程中探针匹配、野值检测、特征选择和构建调控网络环节中存在的问题出发,通过提出新方法或系统的研究来解决这些问题,最后通过对一个乳腺癌数据进行分析来阐释基因芯片在生物学研究中的作用与不足。针对探针匹配问题,我们通过比较一系列数据分析方法在基于新旧探针组定义生成的数据集上得到的结果来研究探针匹配问题对数据分析的影响。经过比较后我们发现改变后的定义对基于基因和基因集合的分析影响很大,对样本分析的影响很小;在野值检测这一环节,我们提出了一套基于迭代思想的野值检测策略,该策略不仅原理简单,不受分类方法局限,而且还在仿真和实际数据集上都取得了令人满意的结果;针对wrapper类方法无法计算每个特征统计显著性的问题,我们提出一套基于排序值衡量特征统计显著性的方法,在仿真数据集上得到的实验结果证明了该方法的有效性;在构建调控网络的研究中,我们通过改变贝叶斯网络学习过程中的参数来研究参数选择对基因调控网络重建结果的影响,比较结果表明先验知识和初始结构都会对网络重建的结果有着不可忽略的影响,在具体使用时应根据实际情况加以选择。在乳腺癌数据的分析中,我们分别研究了基因表达与乳腺癌病人临床特征之间的关系,这些临床特征包括激素受体、淋巴结扩散、肿瘤分级、LVI和肿瘤大小。实验结果表明:激素受体、肿瘤分级这类生物学特征与基因表达之间有很强的相关性,可以从基因表达进行预测;而淋巴结扩散、LVI和肿瘤大小这类解剖学特征则很难从基因表达进行预测。针对与病人预后十分相关的淋巴结扩散问题,我们还研究了其与临床特征间的关系,并分析了各种与其相关的特征对淋巴结扩散的影响。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 课题背景
  • 1.2 基因芯片的原理
  • 1.3 基因芯片的应用
  • 1.4 基因芯片数据处理流程
  • 1.5 论文结构安排
  • 第2章 昂飞公司基因芯片探针匹配对数据分析的影响
  • 2.1 问题背景
  • 2.2 研究现状
  • 2.3 研究方法
  • 2.4 实验结果
  • 2.5 本章小结
  • 第3章 野值检测
  • 3.1 问题背景
  • 3.2 数据集选取
  • 3.3 野值检测策略
  • 3.4 实验结果
  • 3.5 本章小结
  • 第4章 利用排序值衡量基因分类信息显著性的方法
  • 4.1 问题背景
  • 4.2 研究方法
  • 4.3 实验结果
  • 4.4 本章小结
  • 第5章 贝叶斯网络构建调控网络中初值选取的研究
  • 5.1 问题背景
  • 5.2 研究方法
  • 5.3 实验结果
  • 5.4 本章小结
  • 第6章 乳腺癌芯片数据分析
  • 6.1 问题背景
  • 6.2 乳腺癌相关研究进展
  • 6.3 数据集与研究方法
  • 6.4 数据分析结果
  • 6.5 本章小结
  • 第7章 结论与展望
  • 致谢
  • 个人简历、在学期间发表的学术论文与研究成果
  • 相关论文文献

    • [1].六个全球历史土地覆盖数据集数据来源的对比分析[J]. 北京师范大学学报(自然科学版) 2019(06)
    • [2].基于多数据集动态潜变量的在线性能分级评估方法[J]. 控制理论与应用 2020(03)
    • [3].代表性人口空间分布数据集的精度评价——以2010年广东省为例[J]. 热带地理 2020(02)
    • [4].高速公路场景下基于深度学习的数据集建立[J]. 数字技术与应用 2020(02)
    • [5].构建图形图像数据集的方法概述[J]. 计算机产品与流通 2020(08)
    • [6].多国议会数据集及平台建设研究[J]. 情报工程 2020(02)
    • [7].国际主要科学数据集检索平台对比研究[J]. 情报工程 2020(01)
    • [8].实验室化学品纯化方法数据集[J]. 中国科学数据(中英文网络版) 2020(02)
    • [9].化学药物数据集[J]. 中国科学数据(中英文网络版) 2019(01)
    • [10].中亚地区陆表物候逐年数据集(1982–2015)[J]. 全球变化数据学报(中英文) 2020(01)
    • [11].南京百年人物数据集[J]. 中国科学数据(中英文网络版) 2020(03)
    • [12].替代计量学视角下科学数据集价值的定量测度研究[J]. 情报理论与实践 2020(09)
    • [13].数据集采器在临床护理工作中的应用价值探讨[J]. 基层医学论坛 2017(12)
    • [14].医院感染监测基本数据集的建立及作用[J]. 中华医院感染学杂志 2016(11)
    • [15].TextGen:用于新型存储系统基准测试的真实文本数据集生成方法(英文)[J]. Frontiers of Information Technology & Electronic Engineering 2016(10)
    • [16].卫星气候数据集的应用研究与发展分析[J]. 地球信息科学学报 2015(11)
    • [17].用于生命之树重建的数据集[J]. 中国科学数据(中英文网络版) 2017(03)
    • [18].中国有毒动物数据集[J]. 中国科学数据(中英文网络版) 2017(04)
    • [19].基于次序依赖的电力数据集修复[J]. 电测与仪表 2019(24)
    • [20].粤港澳湾区1:50000斗门镇幅工程地质调查及岩土样品试验数据集[J]. 中国地质 2019(S2)
    • [21].全集水网数据集更新方法研究[J]. 经纬天地 2020(01)
    • [22].智能城市产业资讯汇总[J]. 智能城市 2020(11)
    • [23].基于神经网络的机器阅读理解综述[J]. 软件学报 2020(07)
    • [24].2002–2010年中国典型生态系统辐射及光能利用效率数据集[J]. 中国科学数据(中英文网络版) 2019(01)
    • [25].基于镶嵌数据集的海量数据存储管理——以青海湖流域为例[J]. 地球环境学报 2013(04)
    • [26].基于数据集相似性的分类算法推荐[J]. 计算机应用与软件 2016(08)
    • [27].数字数据集揭示文化遗产促进城市可持续发展[J]. 世界遗产 2016(05)
    • [28].洞庭湖区堤垸1949—2013空间分布数据集[J]. 全球变化数据学报(中英文) 2017(01)
    • [29].云南省标准化降水蒸散指数数据集(1998-2012)[J]. 全球变化数据学报(中英文) 2017(04)
    • [30].1979~1998年工业腐蚀失效分析数据集[J]. 中国科学数据(中英文网络版) 2017(01)

    标签:;  ;  ;  ;  

    基因芯片数据处理方法及在乳腺癌数据中的应用
    下载Doc文档

    猜你喜欢