基于基因芯片表达谱的癌症预后元分析方法研究

基于基因芯片表达谱的癌症预后元分析方法研究

论文摘要

大多数癌症芯片数据研究关注的是识别特异组织癌细胞的分子特性。最近,科研工作者开始利用基因芯片数据,研究特异组织癌细胞的预后特性,但关于普遍的肿瘤预后的分子生物学机制仍待研究。本文在现有研究成果之上,使用元分析(meta-analysis)手段研究多种肿瘤数据源的信号共发生的几率。本文首先通过研究特异组织肿瘤亚型间的共同表达调控信号,研究多源数据元分析方法。论文修正现有的元分析方法:基于不同数据源的有序基因列表秩打分(RS)算法。利用实际表达芯片数据,发现RS与“一对多”(OVA)或“一对一”(OVO)比对结合,是分析多源数据的有效方法。论文还通过有效聚类说明,6个独立实验的白血病亚型间的信号差异强于芯片系统间信号德差异。论文探讨了跨临床表征的癌症共同分子机制的存在性,并研究发现这一共性的方法。论文工作创造性地设立了模式匹配(Meta-Analysis Pattern Matches)元分析概念。在分析了白血病、恶性间皮瘤和两个独立乳腺癌共四个基因芯片数据后,发现42个基因在不同癌症病人的治疗结果分组比对中都显示了一致的差异表达。这些基因不但证实了跨临床表征的癌症共同分子机制的存在性,而且是已公布的候选通用预后标志(universal prognostic markers)基因的补充。为了定量地测定与治疗结果相关的不同表型癌症间的共同分子机制,论文进一步研究并提出了新的更成熟的统计算法----排序的基因列表的相似性打分算法(Similarities of Ordered Gene List - SOGL)。SOGL算法的核心思想是不依赖于某个单一数据集中显著的差异表达的效应量,而是关注多实验中一致的差异表达的效应量。该算法基于有序基因列表的排序,赋予越位于排序列表两端的基因越高的权重,累加权重的打分揭示了有序基因列表间的相似性。与其它元分析算法比较,它尤其敏感于差异表达排序相似但有序基因列表本身的差异表达不明显的情况。在分析了五个独立的临床数据源后(恶性间皮瘤、神经胶质瘤、前列腺癌和两个独立乳腺癌),我们从10对可能的成双比对中检测到5对显著相似的有序基因列表。为了说明算法的敏感性,以上5个被分析的数据集中包括无显著差异表达基因的数据集。研究目标是从大规模芯片数据中统计保守的癌症预后标志基因。不包含显著差异表达基因的数据集产生的有序基因列表间的相似结果往往令人质疑:这样找到的标志基因是否能提高预后效果?因此,在SOGL的基础上,论文将现有的两两比对算法扩展为多列表比对。结果发现前列腺癌存活、恶性间皮瘤复发和神经胶质瘤存活所对应的3条有序基因列表之间显著相似。随后,作者选用排序列表相似性打分为支持向量机(SVM)算法的变量提取算法,发现导致3条有序基因列表相似的13个标志基因能够提高原始数据集的预后判别准确率。有临床意义的是,这组标志基因中的12个基因与血管增生调控(regulation of angiogenesis)有关,并且能够准确地预测成人T细胞白血病人的治疗后效果。13个标志基因中的12个涉及血管增生及其调控的基因是MDK、CPE、POSTN、COL4A1、COL11A1、COL1A2、COL5A2、IGFBP3、FN1、ANXA2、BGN和PTGDS。该结果提示细胞外的基质蛋白的破坏是血管新生相关的癌症入侵和转移的重

论文目录

  • 中文摘要
  • 英文摘要
  • 第1章 绪论
  • 1.1节 基因芯片及其应用
  • 1.1.1 基因芯片
  • 1.1.2 基因芯片的应用
  • 1.1.3 基因芯片在癌症精细化诊疗方面的应用
  • 1.2节 癌症相关基因芯片数据研究的主要内容和面临问题
  • 1.2.1 生物信息学
  • 1.2.2 生物检测芯片数据分析问题
  • 1.2.3 数据元分析(Meta-analysis)
  • 1.2.4 基因芯片数据元分析
  • 1.2.5 癌症预后的多因素性
  • 1.3节 本研究工作的理论意义与实用价值
  • 第2章 基因芯片相关的元分析方法
  • 2.1节 元分析的概念
  • 2.2节 元分析的基本内容
  • 2.2.1 确定研究目的,收集有关研究资料
  • 2.2.2 合并统计量的选择
  • 2.2.3 差异检验
  • 2.2.4 合并分析
  • 2.2.5 元分析应注意的问题
  • 2.3节 癌症基因芯片相关的元分析
  • 2.3.1 元分析是显著性差异表达研究的补充和发展
  • 2.3.2 本课题国内研究状况
  • 2.3.3 本课题国外研究动态及尚存的问题
  • 2.4节 本文的研究思路及结构安排
  • 第3章 白血病亚型的元分析研究
  • 3.1节 白血病亚型研究的问题和研究思路
  • 3.2节 材料和方法
  • 3.2.1 数据收集和加工
  • 3.2.2 数据初步分析-元分析准备
  • 3.2.3 秩打分
  • 3.2.4 识别并可视化白血病亚型的聚类
  • 3.2.5 识别儿童白血病亚型的特征基因
  • 3.3节 结果
  • 3.3.1 基因表达检测的数据源和有序基因列表
  • 3.3.2 白血病临床亚型间分子学差异强于实验芯片间差异
  • 3.3.3 验证儿童白血病亚型的标识基因
  • 3.4节 讨论
  • 第4章 多种癌症的共同基因表达模式的元分析研究
  • 4.1节 理论分析
  • 4.1.1 统一化阈值
  • 4.1.2 模式(MAP)匹配计数元分析
  • 4.1.3 检测匹配计数的显著性
  • 4.2节 癌症预后数据元分析结果
  • 4.2.1 癌症预后数据资料的整合
  • 4.2.2 模式匹配元分析结果
  • 4.2.3 相关标志基因的讨论
  • 4.3节 算法讨论及结果意义分析
  • 第5章 有序基因列表的相似性算法研究
  • 5.1节 研究思路
  • 5.2节 算法
  • 5.2.1 概念及符号
  • 5.2.2 相似性打分函数
  • 5.3 节函数的参数实现
  • 5.3.1 数据建模
  • 5.3.2 参数适应性智能选取
  • 5.3.3 显著性评价
  • 5.3.4 标志基因
  • 5.4节 扩展的多重比对函数
  • 5.5节 真实数据分析结果
  • 5.5.1 数据集
  • 5.5.2 基因排序列表两两比对
  • 5.5.3 关于共同秩领先的基因的讨论
  • 5.6节 关于本算法的优势和局限的思考
  • 5.6.1 打分函数定义
  • 5.6.2 数据自适应性
  • 5.6.3 敏感性
  • 5.6.4 相似性的非传递性
  • 5.6.5 适合生物信息的挖掘
  • 5.6.6 计算复杂度
  • 5.6.7 元分析标志基因对单个实验结果的预测能力讨论
  • 5.6.8 小结与展望
  • 第6章 影响癌症治疗效果的共差异表达基因及其分子学机制研究
  • 6.1节 数据
  • 6.1.1 基因表达谱初始化
  • 6.1.2 数据预后分组
  • 6.2节 算法
  • 6.2.1 有序基因列表相似性搜索
  • 6.2.2 分类误差估计
  • 6.3节 分析结果
  • 6.3.1 相似性比对
  • 6.3.2 标识基因
  • 6.3.3 数据预后分析比较
  • 6.3.4 用独立白血病数据评估13 个标志基因的癌症预后判别能力
  • 6.3.5 13 个标志基因的分子生物学讨论
  • 6.4节 小结与展望
  • 第7章 工具软件开发
  • 7.1节 OrderedList 介绍
  • 7.1.1 开发背景和目的
  • 7.1.2 算法核心
  • 7.1.3 函数特色
  • 7.1.4 函数使用
  • 7.1.5 软件应用
  • 7.2节 OrderedList软件包的使用向导
  • 7.2.1 预备
  • 7.2.2 检测基因排序列表间的相似性
  • 7.2.3 检测有序基因列表中重复秩领先的相似性标志基因
  • 第8章 本研究创新点及展望
  • 8.1节 创新点
  • 8.2节 工作展望
  • 致谢
  • 参考文献
  • 缩略术语注释表
  • 附录
  • i. R介绍
  • ii. Bioconductor介绍
  • 1. Bioconductor项目的主要目的
  • 2. Bioconductor的主要特性
  • 3. Bioconductor的使用
  • iii. 17 个在mesothelioma,prostate and glioma实验中共差异表达的探针集信息表
  • 发表论文清单
  • 相关论文文献

    • [1].走向临床的基因芯片[J]. 科学新闻 2013(07)
    • [2].基因芯片撬动的产业[J]. 新知客 2008(04)
    • [3].高污染基因芯片图像的网格划分[J]. 应用光学 2019(01)
    • [4].基因芯片[J]. 中华关节外科杂志(电子版) 2010(04)
    • [5].基因芯片在孕期提供最全面的诊断信息[J]. 中国产前诊断杂志(电子版) 2017(03)
    • [6].基因芯片:春天在哪里[J]. IT经理世界 2012(03)
    • [7].基于表面等离子体共振的基因芯片制备与检测[J]. 生物医学工程学杂志 2009(03)
    • [8].基因芯片核心技术及其最新进展[J]. 国际检验医学杂志 2009(05)
    • [9].基因芯片:小身材,大胃口[J]. 大科技(科学之谜) 2008(07)
    • [10].基因芯片结核分枝杆菌耐多药检测在地市级实验室的应用性评估[J]. 中国防痨杂志 2013(09)
    • [11].应用基因芯片方法检测结核分枝杆菌利福平和异烟肼的耐药性[J]. 中国防痨杂志 2011(10)
    • [12].基因芯片在肉品检测中的应用[J]. 肉类研究 2008(01)
    • [13].“基因芯片”快速检测禽流感[J]. 北方园艺 2013(01)
    • [14].基因芯片在耳鼻咽喉-头颈外科学中的应用[J]. 实用医学杂志 2008(06)
    • [15].甲型H1N1病毒基因芯片研制成功[J]. 中国医疗器械杂志 2009(03)
    • [16].基因芯片技术的发展和应用[J]. 中国医学科学院学报 2008(03)
    • [17].基因芯片联合检测妊娠高血压综合征相关基因的多态性[J]. 安徽医学 2013(08)
    • [18].基因芯片、计算机与作物研究新进展[J]. 国际学术动态 2011(05)
    • [19].一种基于单亲遗传算法的基因芯片的筛选方法[J]. 福建电脑 2012(10)
    • [20].基因芯片在细菌及其耐药检测中的应用[J]. 国际检验医学杂志 2011(02)
    • [21].基因芯片在胃癌基因表达谱中的应用[J]. 癌变.畸变.突变 2008(06)
    • [22].CYP2C19显色型基因芯片的研究[J]. 中国医药生物技术 2015(01)
    • [23].基因芯片作为一线诊断技术在产后患者诊断中的应用[J]. 中国产前诊断杂志(电子版) 2013(02)
    • [24].应用于dPCR基因芯片的荧光精缩无限远物镜设计[J]. 光学技术 2019(05)
    • [25].条斑紫菜优良品系的基因芯片表达谱分析[J]. 天津农业科学 2015(04)
    • [26].我国首个甲型流感病毒耐药分析基因芯片问世[J]. 中国当代医药 2009(10)
    • [27].基因芯片在消化道肿瘤研究中的应用现状[J]. 中国实用内科杂志 2008(09)
    • [28].基因芯片快速检测脑脊液常见病原菌的应用研究[J]. 标记免疫分析与临床 2018(03)
    • [29].基于回归分析的基因芯片图像倾斜校正方法[J]. 大连民族学院学报 2010(01)
    • [30].透明导电薄膜载体材料在无标记电化学基因芯片中的应用[J]. 中国组织工程研究与临床康复 2010(29)

    标签:;  ;  ;  ;  

    基于基因芯片表达谱的癌症预后元分析方法研究
    下载Doc文档

    猜你喜欢