基因表达数据模糊聚类算法研究

基因表达数据模糊聚类算法研究

论文摘要

随着DNA芯片技术的发展应用和人类基因组测序的完成,基因表达数据聚类分析已成为后基因组时代的研究热点之一。通过基因表达数据聚类分析可以获取基因功能和基因表达调控信息,这既对调控元件的识别和基因调控网络模型的构建有着重要的意义,也对生物医学领域的研究和应用产生了深刻的影响。模糊聚类算法是分析基因表达数据的重要方法之一。由于一个基因可能与多组不同的基因具有相似的功能,且模糊聚类算法可以发现重叠的基因簇,因此本文选用模糊聚类算法对基因表达数据进行分析。本文针对基因表达数据和基因转录调控机制的特点研究如何有效挖掘基因表达数据中隐含的生物信息。基因间复杂的关系和基因转录调控机制的复杂性对信息提取和传统聚类算法提出了新的挑战。本文依据基因间多种调控关系和基因表达数据的特点,提出一种新的相似性度量。该相似性度量在一定程度上可以克服噪音数据和异常数据对聚类结果的影响,并可以发现基因间多种调控关系。针对传统模糊聚类算法的缺陷,本文提出一种用免疫遗传算法优化的动态模糊聚类算法,该算法能够有效避免模糊聚类算法陷入局部最优解。由于传统模糊聚类分析是一种无监督学习方法,它仅考虑到基因表达数据数学上的特性,并没有考虑到基因的生物学意义。因此有必要研究如何利用已知的各种生物先验知识,提高聚类的质量。半监督聚类算法可以解决这一问题,已成为生物信息学研究的热点和难点。本文利用两种常见的基因功能描述信息(基因本体数据和KEGG Pathway数据)作为监督信息,提出一种多源信息融合的基因表达数据半监督模糊聚类算法,简称MF-SFC算法。本文对基因表达数据进行分析时,首先利用一种基于基因本体数据的模糊聚类算法(GOFuzzy算法)对已知功能注释的基因聚类,得到类标签数据,然后采用主动学习策略从KEGG Pathway数据中产生成对约束,最后再利用MF-SFC算法对所有基因进行第二次聚类。这种二次聚类方法在一定程度上解决了已知功能的基因不能归入未知功能类的问题。实验结果验证了该方法得出的聚类结果更具有生物学意义。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第一章 引言
  • 1.1 课题研究背景与意义
  • 1.2 课题研究目的
  • 1.3 课题研究的主要工作及成果
  • 1.4 论文组织结构
  • 第二章 相关背景知识及相关研究分析
  • 2.1 模糊聚类分析
  • 2.2 基因表达数据聚类分析
  • 2.2.1 基因表达数据缺值处理
  • 2.2.2 基因表达数据相似性度量方式
  • 2.2.3 基因表达数据聚类算法相关研究
  • 2.2.3.1 基因表达数据传统聚类分析
  • 2.2.3.2 基因表达数据模糊聚类分析
  • 2.2.4 基因表达数据聚类结果评价
  • 2.3 基因表达数据模糊聚类算法存在的主要问题
  • 2.4 本章小结
  • 第三章 一种采用新的相似性度量方法的共调控基因动态模糊聚类算法
  • 3.1 研究动机
  • 3.2 信息熵与二次互信息
  • 3.3 广义相似性度量 QMISM
  • 3.4 QMI-IGAFC 聚类算法设计
  • 3.4.1 疫苗的提取
  • 3.4.2 染色体的编码方式和适应度函数
  • 3.4.3 免疫算子设计
  • 3.4.4 算法描述
  • 3.5 实验及分析
  • 3.5.1 人工合成数据
  • 3.5.2 酵母菌基因表达数据
  • 3.6 本章小结
  • 第四章 多源信息融合的基因表达数据半监督模糊聚类算法
  • 4.1 研究动机
  • 4.2 半监督模糊聚类算法
  • 4.3 MF-SFC 多源信息融合的基因表达数据半监督模糊聚类算法
  • 4.4 实验结果及分析
  • 4.4.1 Iris 数据集
  • 4.4.2 生物数据集
  • 4.5 本章小结
  • 总结与展望
  • 总结
  • 展望
  • 致谢
  • 参考文献
  • 在学期间的研究成果及发表的论文
  • 相关论文文献

    • [1].改进模糊聚类算法在客户关系管理软件中的应用[J]. 无线互联科技 2014(11)
    • [2].加权模糊聚类算法在城市综合经济实力评估中的应用[J]. 重庆电子工程职业学院学报 2015(03)
    • [3].改进的模糊聚类算法探究[J]. 信息系统工程 2015(06)
    • [4].基于F统计量层次聚类的组合式模糊聚类算法研究[J]. 电脑与信息技术 2015(04)
    • [5].一种基于广义熵的模糊聚类算法[J]. 计算机工程 2012(13)
    • [6].一种函数型模糊聚类算法及其应用[J]. 荆楚理工学院学报 2019(05)
    • [7].模糊聚类算法分析及程序实现[J]. 信息系统工程 2009(10)
    • [8].一种基于遗传算法的分布式的模糊聚类算法[J]. 电脑开发与应用 2010(10)
    • [9].基于快速高斯核函数模糊聚类算法的图像分割[J]. 化工自动化及仪表 2010(11)
    • [10].基于粗糙模糊聚类算法的重叠社区划分[J]. 信息系统工程 2020(03)
    • [11].模糊聚类算法的优化设计[J]. 河南大学学报(自然科学版) 2013(04)
    • [12].改进的半监督模糊聚类算法[J]. 控制与决策 2010(01)
    • [13].基于核方法的并行模糊聚类算法[J]. 计算机工程与设计 2008(08)
    • [14].基于权重差异度的动态模糊聚类算法[J]. 吉林大学学报(理学版) 2019(03)
    • [15].一种新的半监督熵模糊聚类算法[J]. 泉州师范学院学报 2019(02)
    • [16].改进的粗糙集模糊聚类算法及其应用[J]. 吉林大学学报(理学版) 2015(06)
    • [17].模糊聚类算法综述[J]. 生命科学仪器 2013(06)
    • [18].基于样本加权的可能性模糊聚类算法[J]. 电子学报 2012(02)
    • [19].基于改进蚁群—模糊聚类算法的电影背景音乐情感分类[J]. 北京工业职业技术学院学报 2015(03)
    • [20].模糊聚类算法在入侵检测中的应用[J]. 科技致富向导 2012(12)
    • [21].改进的离群核模糊聚类算法[J]. 计算机工程 2009(11)
    • [22].基于半监督模糊聚类算法的奶牛行为判别系统[J]. 中国畜牧兽医 2018(11)
    • [23].引导函数支配的进化模糊聚类算法[J]. 系统工程理论与实践 2011(02)
    • [24].基于组合隶属度的快速模糊聚类算法[J]. 兰州交通大学学报 2017(01)
    • [25].结合Total-Bregman距离的模糊聚类算法[J]. 计算机科学与探索 2016(02)
    • [26].一种基于神经网络的广义熵模糊聚类算法[J]. 电子学报 2016(08)
    • [27].基于模糊聚类算法的客户细分研究[J]. 数学的实践与认识 2010(11)
    • [28].基于相对密度的数据流模糊聚类算法[J]. 计算机科学 2010(08)
    • [29].改进模糊聚类算法及其在人力资源管理中的应用[J]. 天津师范大学学报(自然科学版) 2008(03)
    • [30].基于fMRI数据的改进模糊聚类算法研究[J]. 常熟理工学院学报 2018(02)

    标签:;  ;  ;  ;  ;  

    基因表达数据模糊聚类算法研究
    下载Doc文档

    猜你喜欢