时序基因表达数据的建模分析及应用

时序基因表达数据的建模分析及应用

论文摘要

随着DNA芯片技术的广泛应用,基因表达数据分析已成为生命科学的研究热点。DNA微阵列技术是一种研究细胞中基因表达模式的非常有效的技术。这种技术面临的主要挑战是如何分析由此产生的大量基因表达数据。最近,一种新的基因表达数据——时序基因表达数据受到了越来越多的重视。时序基因表达数据根据细胞循环过程,在不同时间点对各基因采集相关数据。目前,虽然已有多种算法可以对时序基因表达数据进行聚类分析(如k均值聚类方法、层次聚类方法,基于统计模型的聚类方法等),但这些方法通常把时序基因表达数据看作是普通的多维空间向量,数据中时间上的自关联信息完全被忽视,不能有效影响到聚类的最终结果。本文研究目的是为了探索新的时序基因表达数据聚类算法,并提出了一组基于自回归模型的动态聚类算法。文中回顾了当前主要的聚类分析技术以及评价聚类效果的评价算法,简要介绍了时序基因表达数据。本论文重点是:(一)建立了一种改进的基于自回归模型和贝叶斯后验概率的动态聚类分析算法,阐述了应用该算法进行时序基因表达数据聚类分析的原理和方法;(二)建立了一种基于自回归模型的模糊动态聚类分析算法,阐述了应用该算法进行时序基因表达数据聚类分析的原理和方法。针对原始动态聚类分析中仅利用类条件概率密度(也称似然度)的问题,根据贝叶斯理论,提出了改进的基于贝叶斯后验概率的聚类算法。同时结合模糊理论,提出了模糊动态聚类分析算法,利用模糊隶属度来调节自回归模型的动态预测过程,克服了原始聚类算法中自回归模型中自回归阶数p =1的局限性。本文最后还利用回归技术对时序基因表达模型做了一些探讨。论文采用MATLAB来编程实现了文中提出的算法,选取了一些数据集来进行实验。实验结果表明,本文提出的方法是有效的、可行的,并且与现有的一些聚类分析方法相比,更为有效。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景
  • 1.1.1 基因芯片概述
  • 1.1.2 微阵列基因表达数据
  • 1.1.3 基因表达数据的分析
  • 1.2 研究现状
  • 1.3 研究目标与意义
  • 1.4 论文结构
  • 第二章 聚类分析及评价算法
  • 2.1 聚类算法
  • 2.1.1 基于划分的聚类算法
  • 2.1.2 基于层次的聚类算法
  • 2.1.3 基于密度的聚类算法
  • 2.1.4 基于网格的聚类算法
  • 2.1.5 模糊聚类算法
  • 2.2 评价算法
  • 2.2.1 误差平方准则
  • 2.2.2 准确率(AC)
  • 2.2.3 互信息(MI)
  • 2.2.4 调整的Rand 指数(ARI)
  • 2.2.5 价值图(FOM)
  • 2.3 一种用于聚类评价的自助法(bootstrap)
  • 第三章 时间序列基因表达数据
  • 3.1 时间序列
  • 3.1.1 时间序列的统计分析
  • 3.1.2 基因表达时间序列
  • 3.2 基因表达时间序列的相似性
  • 3.2.1 缩放和移位问题
  • 3.2.2 分布不均的采样点
  • 3.2.3 形状:内在结构
  • 3.3 基因表达时间序列的聚类
  • 3.3.1 聚类数目
  • 3.3.2 可变的成员隶属度
  • 3.3.3 离群点
  • 3.3.4 噪声
  • 第四章 改进的基于自回归(AR)模型的动态聚类算法
  • 4.1 自回归(AR)模型及单个时间序列的似然性
  • 4.2 基于贝叶斯理论的改进算法
  • 4.3 实验
  • 4.3.1 实验数据
  • 4.3.2 实验结果
  • 4.4 小结
  • 第五章 基于自回归(AR)模型的模糊动态聚类算法
  • 5.1 模糊聚类算法
  • 5.2 自回归(AR)模型
  • 5.3 动态模糊聚类算法
  • 5.4 实验
  • 5.4.1 实验数据
  • 5.4.2 实验结果
  • 5.5 小结
  • 第六章 时序基因表达模型选择的其它探索
  • 6.1 基于回归模型的基因表达曲线拟合
  • 6.2 实验
  • 6.2.1 实验数据
  • 6.2.2 实验结果
  • 6.3 小结
  • 第七章 总结和展望
  • 致谢
  • 参考文献
  • 附录:作者在攻读硕士学位期间发表的论文
  • 相关论文文献

    • [1].接口时序一致性连续定量监测技术研究[J]. 计算机测量与控制 2020(05)
    • [2].山川永恒时序日新[J]. 荣宝斋 2016(08)
    • [3].时序[J]. 杂文月刊(原创版) 2009(09)
    • [4].时序之恋[J]. 宝藏 2008(07)
    • [5].基于排名聚合的时序网络节点重要性研究[J]. 电子科技大学学报 2020(04)
    • [6].点火时序无输出的故障诊断与判定[J]. 电子测试 2020(16)
    • [7].计及风-光-荷时序特性的主动配电网源-储规划策略[J]. 电力系统保护与控制 2020(20)
    • [8].《喧嚣与骚动》中时序颠倒叙事的运用新探[J]. 湖南科技学院学报 2019(06)
    • [9].时序网络中关键节点的识别方法研究进展[J]. 电子科技大学学报 2020(02)
    • [10].时序犹豫模糊软集及其在决策中的应用[J]. 计算机工程与应用 2017(24)
    • [11].幼儿园领域教学时序表的研制[J]. 呼伦贝尔学院学报 2018(04)
    • [12].神入历史与时序思维能力培养的教学探讨[J]. 历史教学(中学版) 2013(05)
    • [13].神入历史与时序思维能力培养的教学探讨[J]. 历史教学(上半月刊) 2013(06)
    • [14].幼儿心理理论与时序记忆的关系——来自时序记忆分离的证据[J]. 心理发展与教育 2012(03)
    • [15].《微机原理及应用》课程中有关时序的教学探讨[J]. 电脑学习 2011(01)
    • [16].从时序律看汉语的空间性[J]. 现代语文(语言研究版) 2011(10)
    • [17].规划的实施要讲究时序[J]. 北京观察 2011(02)
    • [18].火电机组中部分信号的时序预测研究[J]. 中国电力 2020(05)
    • [19].影响城市综合体开发时序的六个因素[J]. 城市问题 2013(02)
    • [20].基于相关反馈的微博相似主题时序查询[J]. 计算机科学 2013(04)
    • [21].试论社会主义市场经济条件下的生产力时序[J]. 泰山乡镇企业职工大学学报 2008(03)
    • [22].一种基于时序路径的FPGA接口时序测试方法[J]. 航天控制 2017(04)
    • [23].今天有点热[J]. 作文世界 2010(06)
    • [24].论教育时序[J]. 高等教育研究 2012(09)
    • [25].径流式水电站的安装时序容量[J]. 水电能源科学 2008(05)
    • [26].基于图嵌入法的时序网络链路预测研究[J]. 杭州师范大学学报(自然科学版) 2020(05)
    • [27].考虑峰谷分时电价和时序特性的分布式电源选址定容[J]. 电测与仪表 2016(13)
    • [28].诱导轮时序位置对离心泵水力性能的影响[J]. 农业工程学报 2015(19)
    • [29].一些光照进天山的时序里[J]. 西部 2019(05)
    • [30].基于时序模糊软集的群决策新方法[J]. 重庆理工大学学报(自然科学) 2014(10)

    标签:;  ;  ;  ;  ;  ;  

    时序基因表达数据的建模分析及应用
    下载Doc文档

    猜你喜欢