基于基因芯片的基因表达模式分析

基于基因芯片的基因表达模式分析

论文摘要

基因芯片含有寡核苷酸探针或者cDNA探针,用来在一次实验中同时测量成千上万个基因的表达水平。基因表达模式分析系统(GEPS:the Gene ExpressionPattern Scanner)是一个在线的交互式基因芯片数据分析平台,可对基因表达谱进行相关性分析,相似性分析和特异表达分析。这些分析模式是利用空间几何,相关性分析的方法,系统地、全局地鉴定的,并且有图形化和量化显示。用户可以设置分析时的阀值。另外,为了更好地理解基因表达模式,我们从两个基因芯片数据库GEO和GNF下载了329205个非冗余的基因表达纪录,并提供给用户作为参考。GEPS的网址是:http://bioinf.xmu.edu.cn/software/geps/geps.php.在GEPS的基础之上,我们构建了组织特异表达数据库(TSED:Tissue-SpecificExpression Database)。TSED收集了4个公共基因芯片数据集,包含113个人类和小鼠的组织和3455个组织特异表达基因。TSED允许用户根据基因或者组织查询。TSED的网址是:http://bioinf.xmu.edu.cn/databases/TSED/search.php.基因芯片另外一个重要应用是鉴定差异表达基因或者生物标识。差异表达基因常常是通过统计学方法来鉴定的,主要包括:倍数方法,t检验,F检验,SAM,规则t检验等。这些方法都有一定的局限,或者是假阳性率太高或者代表差异表达程度的变量不合适。我们提出了改进F检验和改进t检验,其原理是标准的F值和t值乘上它们各自的变异系数。用两组真实的芯片数据集进行测试,通过散点图分析和随机置换的方法评估假阳性率和假发现率,改进F检验和改进t检验具有一定的优良性能。将得到的差异表达基因按照生理功能分类,显示了一定的相关性和合理性。

论文目录

  • 摘要
  • Abstract
  • 前言
  • 1 基因芯片技术简介
  • 2 基因芯片的应用
  • 3 国内外生物芯片产业的发展概况
  • 4 基因芯片的数据分析
  • 第一章 基因表达模式分析系统(GEPS)的构建
  • 1 引言
  • 2 方法
  • 2.1 GEPS的数据
  • 2.2 基因表达模式的分析
  • 3 GEPS的页面设计与结果显示
  • 3.1 软件部分
  • 3.2 数据库部分
  • 3.3 组织特异表达基因分析
  • 第二章 基因芯片显著性分析统计学方法的比较和改进
  • 1 引言
  • 2 方法
  • 2.1 研究目的和意义
  • 2.2 数据
  • 2.3 改进F检验
  • 2.4 改进F检验的性能
  • 2.5 改进t检验
  • 2.6 改进t检验与标准t检验、倍数方法的性能比较
  • 2.7 改进t检验与贝叶斯正规t检验的性能比较
  • 2.8 改进t检验与SAM的性能比较
  • 2.9 改进F检验和改进t检验的整体特征
  • 3 应用与结果
  • 3.1 运用改进F检验分析成神经管细胞瘤相关基因
  • 3.2 运用改进t检验分析受吸烟影响的基因
  • 总结与讨论
  • 参考文献
  • 硕士在读期间发表论文
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  

    基于基因芯片的基因表达模式分析
    下载Doc文档

    猜你喜欢