微阵列数据分析中的基因选择及样本分类方法研究

微阵列数据分析中的基因选择及样本分类方法研究

论文摘要

微阵列技术给生物学研究领域提供了极为丰富、详尽的基因表达信息。对微阵列数据的分析研究可以帮助人们理解生命现象的机理,并促进医学向更精确的诊疗方向发展。鉴于基因微阵列数据的高维小样本、高噪声等特点,迫切需要借助于先进的计算方法来分析和利用这些原始信息。微阵列数据分析是生物信息学的重要研究课题,检测差异表达基因、最大化样本分类准确率是其中两大关键技术。本文从基因选择、基因约简、样本分类三方面展开研究,并取得如下研究成果:首先研究了差异表达基因选择问题,提出了基因差异表达显著性阈值的计算方法。该方法通过构造一个优化的统计量,根据给定的错误率指标估算出统计量的阈值,使得统计量大于该阈值的基因可被认为是差异表达基因。仿真及真实微阵列数据上的实验结果验证了该方法的有效性。在本论文中,差异表达基因被用作样本分类的特征基因。在确定基因是否差异表达的基础上,为了减少特征基因冗余对样本分类的影响,研究了多种基因约简方法。约简是基于粗糙集理论的知识发现过程。经典的粗糙集理论建立在等价关系基础上之上,其结果对数据噪声较为敏感。本论文提出了Spearman秩相关分析、近似分布约简、区间值分析等基因约简方法。实验结果表明,通过这些方法优化的特征基因集有效地提高了样本分类的准确率。微阵列数据的小样本特性给现有的分类算法带来了新的挑战。本文提出了一个基于主曲线的微阵列数据分类方法。该方法首先在训练数据集上计算出每类样本的主曲线,然后根据测试样本与各类样本的主曲线间距离的期望方差来确定测试样本所属的类别。实验结果表明,该方法在处理样本数量偏少的数据集时,较之其他几种主流分类方法有一定的优势。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 生物信息学简介
  • 1.2 微阵列数据统计分析
  • 1.2.1 基因芯片原理
  • 1.2.2 微阵列数据统计分析
  • 1.2.3 微阵列数据分析研究的意义和挑战
  • 1.3 论文的主要工作
  • 1.4 论文组织结构
  • 2 微阵列基因选择及样本分类
  • 2.1 基因选择
  • 2.1.1 过滤法
  • 2.1.2 缠绕法
  • 2.1.3 集成法
  • 2.2 样本分类
  • 2.2.1 k-近邻分类法
  • 2.2.2 支撑向量机分类法
  • 2.2.3 贝叶斯分类器
  • 2.2.4 决策树
  • 2.2.5 人工神经网络
  • 2.2.6 Fisher判别分析
  • 2.3 实验分析
  • 2.3.1 实验数据集
  • 2.3.2 实验方法
  • 2.3.3 结果分析
  • 2.4 小结
  • 3 基于排序分析的差异表达基因选择
  • 3.1 基于边缘分布模型的基因排序
  • 3.1.1 边缘分布模型
  • 3.1.2 高维小样本数据抽样统计
  • 3.1.3 参数估算EM算法
  • 3.2 差异表达显著性阈值估算
  • 3.2.1 多重假设检验问题
  • 3.2.2 多重假设检验的控制指标
  • 3.2.3 FDR控制过程
  • 3.3 比较实验方法
  • 3.4 微阵列数据分析实验
  • 3.5 仿真分析
  • 3.6 小结
  • 4 基于Spearman秩相关约简的基因选择
  • 4.1 Spearman秩相关序值决策系统分析
  • 4.1.1 单个指标关联系数计算
  • 4.1.2 相关度计算
  • 4.2 基于Spearman秩相关系数的序值系统约简
  • 4.3 算例
  • 4.4 微阵列数据实验
  • 4.5 小结
  • 5 基因选择近似分布约简
  • 5.1 序值系统近似分布约简理论
  • 5.2 基于近似分布约简的基因选择方法
  • 5.3 实验及结果分析
  • 5.4 小结
  • 6 基因表达区间值分析
  • 6.1 基于优势关系的模糊粗糙集模型
  • 6.1.1 粗糙集
  • 6.1.2 包含度
  • 6.1.3 模糊粗糙集上的优势关系
  • 6.2 区间值决策表
  • 6.2.1 区间值集对比较问题
  • 6.2.2 区间值决策表上集对比较优势关系
  • 6.2.3 集对比较相似度粗糙集
  • 6.2.4 集对比较相似度粗糙集的性质
  • 6.3 属性约简
  • 6.3.1 集对比较优势关系属性约简
  • 6.3.2 模糊集属性约简
  • 6.3.3 基于区分矩阵的属性约简算法
  • 6.4 基因微阵列数据实验
  • 6.5 小结
  • 7 基于主曲线的微阵列数据分类
  • 7.1 主曲线
  • 7.2 基于主曲线的微阵列数据分类方法
  • 7.3 实验及结果分析
  • 7.4 小结
  • 8 总结与展望
  • 致谢
  • 参考文献
  • 附录
  • 相关论文文献

    • [1].微阵列数据研究[J]. 教育现代化 2017(43)
    • [2].多种归一化方法对miRNA微阵列数据的作用分析及比较[J]. 西南师范大学学报(自然科学版) 2020(05)
    • [3].用于微阵列数据分类的子空间融合演化超网络[J]. 电子学报 2016(10)
    • [4].基于迭代延长纠错输出编码的微阵列数据多分类方法[J]. 厦门大学学报(自然科学版) 2018(03)
    • [5].基于主曲线的微阵列数据分类[J]. 计算机科学 2010(12)
    • [6].基于微阵列数据构建的基因通路分析软件的研究进展[J]. 现代生物医学进展 2009(07)
    • [7].最小一乘估计在多重检验中的应用——基于乳腺癌微阵列数据[J]. 数学的实践与认识 2017(21)
    • [8].微阵列数据中的先验信息对基于LASSO变量选择方法影响的模拟研究[J]. 中国卫生统计 2015(03)
    • [9].DNA微阵列数据判别的旋转森林方法[J]. 中国卫生统计 2012(04)
    • [10].DNA微阵列数据特征提取的分类方法研究[J]. 计算机工程与应用 2010(28)
    • [11].微阵列数据的多目标免疫优化双聚类[J]. 生物信息学 2009(03)
    • [12].MATLAB在微阵列数据分析的FDR控制中的实现[J]. 福建电脑 2011(08)
    • [13].三维微阵列数据的多目标进化聚类[J]. 计算机工程与科学 2008(12)
    • [14].基于演化学习超网络的微阵列数据分类[J]. 江苏大学学报(自然科学版) 2014(01)
    • [15].多阶段的微阵列数据特征基因集选取[J]. 吉林大学学报(信息科学版) 2014(05)
    • [16].基于随机森林的胃癌微阵列数据基因通路分析[J]. 生物学杂志 2010(02)
    • [17].基于微阵列数据分析的癌症诊断[J]. 中国科技论文在线 2010(02)
    • [18].主成分分析和支持向量机在微阵列数据分析的应用[J]. 现代计算机(专业版) 2013(26)
    • [19].几种差异基因分析方法及筛选效果的比较[J]. 中国卫生统计 2008(04)
    • [20].基于PCA与核PCA的微阵列数据分析[J]. 长春师范大学学报 2019(06)
    • [21].基于DNA微阵列数据分析的分级Bayes模型[J]. 应用数学学报 2009(05)
    • [22].吗啡急性处理小鼠的微阵列数据分析和生物标记识别[J]. 天津医药 2015(02)
    • [23].基于Hadoop的微阵列数据两阶段并行K近邻基因提取[J]. 计算机工程 2016(05)
    • [24].基于极限学习机(ELM)岭回归的DNA微阵列数据填补[J]. 小型微型计算机系统 2014(10)
    • [25].一种从稳态微阵列数据构建转录调控网络的条件三元互信息新方法[J]. 医用生物力学 2009(S1)
    • [26].基于聚类和微粒群优化的基因选择新方法[J]. 计算机应用 2013(05)
    • [27].基于过采样技术和随机森林的不平衡微阵列数据分类方法研究[J]. 计算机科学 2012(05)
    • [28].一种基于微阵列数据的集成分类方法[J]. 计算机应用研究 2010(01)
    • [29].基于置换重抽样的多重检验和错误发现率估计[J]. 中国卫生统计 2012(05)
    • [30].一种基于ZBDD结构的Top-k挖掘算法[J]. 现代计算机(专业版) 2011(25)

    标签:;  ;  ;  ;  ;  

    微阵列数据分析中的基因选择及样本分类方法研究
    下载Doc文档

    猜你喜欢