论文题目: cDNA微阵列数据的非转化分析方法
论文类型: 博士论文
论文专业: 动物遗传育种与繁殖
作者: 张纪刚
导师: 张勤
关键词: 芯片,对数转换,方差比,非转换方法,标准化
文献来源: 中国农业大学
发表年度: 2005
论文摘要: cDNA微阵列技术已经广泛应用于生物学与医学研究,成为生物学试验中的一种重要试验手段,与其相应的数据处理方法和检测差异表达基因的统计方法也在快速地完善。但cDNA微阵列数据中包含有许多的变异,在用于差异表达基因检测和其他统计分析前,必须将这些“噪音”剔除。背景校正、转换和数据标准化已经广泛地应用于cDNA微阵列数据分析中。目前,通用的数据处理方法是对数比转换法。在数据转换之后,通过标准化过程将不同信道的荧光信号校正到同一水平。但正如Huber等所指出的那样,它本身还存在着一些有待解决的缺陷,如在所检测的样品当中,其一些基因会出现弱表达,或是不表达。在这种情况下,经过背景校正后,这些基因的观测值可能会是负值。然而对于比值或是对数转换,负值是没有意义的;以及假设样品中,只有一小部分的基因发生了差异表达,同时发生差异表达的基因的上下调的比例要对称。这些缺陷会造成“噪音”效应估计有偏,从而影响了检测结果的可靠性。 本研究首先根据Rocke和Durbin提出的微阵列数据分析方法,提出一种基于方差比判别式的非转换方法,并结合试验中的各种影响因子对试验“噪音”的剔除效率进行了模拟研究,结果表明:(1)背景参数估计值(?)略微偏高,但相对偏差较低,可以很好地校正背景影响。(2)比例因子随机误的期望估计值E(eη)基本上是无偏的,同时其相对偏差(RD)值均低于0.5%。(3)比例因子β1在差异表达基因比例较小的情况下,受差异表达基因上下调比例的影响不大。这种方法克服了对数比转换的部分缺陷,但由于其对于试验的设计要求和基因结构的要求而造成适用性的降低。同时研究发现,对于差异表达基因比例较高(如30%),且上下调比例不平衡的微阵列数据,难以有效剔除试验中的“噪音”,因而其适用范围就受到了限制。 根据研究中所发现的问题,改进了标准化公式和判别式(为简便起见,这里称之为“非转换方法”)。利用一个t统计量作为判别式,使标准化参数参数估计中得到准确地剔除潜在差异表达基因,从而提高了标准化参数估计的准确性和精确性。通过模拟研究比较了非转换方法与对数比法在多种条件下剔除cDNA微阵列试验“噪音”功效和对检测差异表达基因的效率的影响,结果证明:这种非转换方法克服了对数比法的缺陷,可以更有效地剔除试验“噪音”,同时在检测差异表达基因的效率方面,非转换方法比常规的对数比法具有更好的稳健性和更高的检测功效,基因检出率和准确性大大提高,同时将错检率控制在预定水平之下(5%)。特别是当差异表达基因比例较高(30%),且上下调比例不平衡时,依然保持了其稳健性和有效性。本研究还利用ApoAl试验的芯片数据进行了效率验证,结果表明:相对于传统的对数转换方法,非转换方法能检测出更多的差异表达基因。 总的来看,非转换方法处理cDNA微阵列数据是行之有效的,并且克服了对数比法中存在的缺陷。因而可作为cDNA微阵列数据的主要方法之一。
论文目录:
目录
表目录
图目录
摘要
ABSTRACT
第一章 文献综述
1.1 生物芯片
1.2 微阵列芯片的作用
1.3 cDNA微阵列分析流程及方法
1.3.1 图像处理
1.3.2 数据转换
1.3.3 标准化过程
1.3.4 差异表达基因的检测
1.3.5 多重检验
1.3.6 其他分析
1.4 基因表达数据的网络资源
1.5 研究的目的和主要内容
第二章 基于方差比的标准化方法
2.1 微阵列数据的数学模型
2.2 方法与数据
2.2.1 参数估计方法
2.2.2 参数估计值的评价
2.2.3 数据模拟
2.3 结果与分析
2.3.1 数据有效性的评定
2.3.2 芯片内基因重复数的作用
2.3.3 样品池容量的影响
2.3.4 差异表达基因中上下调比例的影响
2.3.4 其它结果
2.4.讨论
2.4.1 芯片内基因重复数
2.4.2 基因数目和组成结构
2.4.3 参数的估计
第三章 非对数转换的标准化方法
3.1 前言
3.2.方法与数据
3.2.1 非对数转换方法
3.2.2 对数比方法
3.2.3 检测差异表达的基因
3.2.4 数据模拟
3.3 结果与分析
3.3.1 标准化参数估计比较
3.3.2 检测差异表达基因比较
3.4.讨论
3.4.1 标准化参数估计的比较
3.4.2 检测结果的比较
3.4.3 其它
第四章 应用分析
4.1.材料与方法
4.1.1 cDNA芯片数据
4.1.2 检测差异表达的基因
4.2 结果与分析
第五章 研究总结
5.1 标准化方法分析
5.2 试验因子的影响
参考文献
致谢
发布时间: 2005-07-18
参考文献
- [1].基于表型以及微阵列数据的基因(型)分类技术研究[D]. 肖静.扬州大学2007
- [2].微阵列数据分析中的统计学方法[D]. 黄伟.东北师范大学2012
- [3].微阵列基因表达数据的特征分析方法研究[D]. 王爱国.合肥工业大学2015
相关论文
- [1].基于混合线性模型和条件变量分析的DNA微阵列数据分析方法研究[D]. 陆燕.浙江大学2003
- [2].猪MHC和转铁蛋白多态性与仔猪大肠杆菌K88腹泻关系的研究[D]. 徐如海.中国农业大学2004
- [3].利用系谱传递不平衡检验精细定位QTL[D]. 丁向东.中国农业大学2004
- [4].微阵列数据挖掘技术的研究[D]. 王明怡.浙江大学2004
- [5].利用广义线性方法进行多基因离散性状遗传分析[D]. 殷宗俊.中国农业大学2005
- [6].影响标记辅助导入效率的因素研究[D]. 白俊艳.中国农业大学2005
- [7].利用中国荷斯坦牛定位BTA6上影响产奶性状的QTLs[D]. 陈慧勇.中国农业大学2005
- [8].基因芯片数据管理及数据挖掘[D]. 王川.中国科学院研究生院(上海生命科学研究院)2004
- [9].微阵列技术中生物信息的利用和挖掘[D]. 邓晔.浙江大学2007
- [10].微阵列生物芯片分析方法研究[D]. 邓宁.浙江大学2007