基因序列图形表达及聚类分析应用研究

基因序列图形表达及聚类分析应用研究

论文摘要

随着生物信息学和医学的迅速发展,以及各种生物的基因和蛋白质的研究,产生了越来越多的庞大的生物基因序列数据通过分析这些序列数据可以获得对人类有益的有关生物结构和功能的信息。数据挖掘技术尤其是聚类分析技术是基因序列分析的一种重要的手段,本文着重研究基因序列图形表达和基于图形表达的基因序列的聚类技术分析与应用。本文提出了一种基于生物学特征的非退化3-D图形表达方法,利用此图形表达来表征基因序列不仅使原始序列的生物学特征得以保留,而且还克服了图形的非退化现象。在建立基因序列矩阵过程中引入了几何中心,采用矩阵的最大特征值不变量来表征原始基因序列。在基因序列图形表达数据聚类分析中,本文提出一种基于多维伪F统计量的动态模糊K-均值聚类分析方法。该聚类分析方法能保证最终类内散步矩阵之迹达到最小,把多维空间的数据有效的分为具有特定数目的不同的类,给出最佳聚类个数。利用文中基因序列图形表达建立H5N1病毒基因序列图形表达数据对本文聚类分析方法进行验证,结果表明该聚类分析方法具有较好的合理性。在BIRCH聚类算法分析研究中,详细分析讨论了BIRCH算法中存在的不足,并针对其不足进行一定的改进,提出了一种基于离差平方和的改进多阀值BIRCH算法,充分利用离差平方和来建立簇与簇的相关性,相对于单纯以簇之间的中心距离来建立相关性有一定的改进,同时在分裂因子的确定上采用了簇中直径的最大值,克服因采用经验值确定分裂因子的缺陷。最后,引入到基因序列图形表达数据聚类分析应用中。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 本文的研究目的
  • 1.2 选题的背景与依据
  • 1.3 国内外现状、水平与发展趋势
  • 1.4 项目来源
  • 1.5 本文主要工作
  • 1.6 本文组织结构
  • 1.7 小结
  • 第2章 生物序列图形表达及聚类分析技术概述
  • 2.1 生物信息学
  • 2.1.1 生物信息学的研究对象与内容
  • 2.2 基因序列图形表达
  • 2.2.1 基于坐标轴的曲线模型
  • 2.2.2 Z 曲线模型
  • 2.2.3 基于映射规则的曲线模型
  • 2.2.4 其他曲线模型
  • 2.3 生物信息处理中的聚类分析技术
  • 2.4 本章小结
  • 第3章 基因序列3-D 图形表达方法
  • 3.1 基因序列的概念
  • 3.2 新的3-D 图形表达DNA 序列
  • 3.2.1 图形的性质
  • 3.3 实验
  • 3.3.1 11 种H5N1 病毒基因HA 片段DNA 序列的NZ 及Z 曲线图形
  • 3.4 实验评价
  • 3.5 小结
  • 第4章 基因序列图形表达数据聚类分析应用研究
  • 4.1 图形表达中的数字特征及提取方法
  • 4.1.1 由图形表达提取特征矩阵
  • 4.1.2 常用矩阵不变量
  • 4.2 NZ 曲线的数字特征及提取
  • 4.3 聚类分析概述
  • 4.4 聚类分析的改进
  • 4.4.1 一些基本概念
  • 4.5 基于图形表达数据的模糊聚类算法
  • 4.6 实验
  • 4.7 实验评价
  • 4.8 本章小结
  • 第5章 基于平衡迭代规约的聚类分析算法研究
  • 5.1 BIRCH 算法
  • 5.1.1 聚类特征
  • 5.1.2 聚类特征树
  • 5.2 BIRCH 聚类算法缺陷及改进
  • 5.3 实验数据与实验结果
  • 5.4 本章小结
  • 结束语
  • 参考文献
  • 附录A 攻读硕士期间发表论文和参加的项目
  • 致谢
  • 相关论文文献

    • [1].基于聚类分析的高速铁路突发事故等级划分[J]. 内江科技 2019(12)
    • [2].基于PubMed数据库患者自我管理研究热点的共词聚类分析[J]. 中国医药导报 2020(01)
    • [3].基于聚类分析的学生成绩评定方法研究[J]. 智库时代 2020(11)
    • [4].基于因子聚类分析的儿童陪伴机器人用户细分[J]. 包装工程 2020(14)
    • [5].基于聚类分析的异常数据检测[J]. 电子技术与软件工程 2020(15)
    • [6].基于聚类算法的大用户用电模式识别研究[J]. 中国管理信息化 2017(19)
    • [7].数学学科核心素养要素析取的实证研究[J]. 数学教育学报 2016(06)
    • [8].聚类分析对学生成绩的研究[J]. 无线互联科技 2014(12)
    • [9].聚类分析和判别分析在投资中的应用[J]. 信息安全与技术 2015(06)
    • [10].基于K-聚类分析法的预防性养护路段划分[J]. 安徽建筑 2015(03)
    • [11].我国“中部崛起”战略的实证分析[J]. 智富时代 2016(S2)
    • [12].基于聚类分析的墨量预置优化方法[J]. 数码世界 2016(12)
    • [13].互联网保险产品开发研究——基于平安互联网保险产品的聚类分析[J]. 保险理论与实践 2017(03)
    • [14].高职大学生心理健康水平的聚类分析[J]. 现代职业教育 2017(07)
    • [15].环境安全评价指标体系的构建及聚类分析——以江苏省13市为例[J]. 赤子(下旬) 2017(01)
    • [16].聚类分析在方言分区上的应用——以江淮官话洪巢片为例[J]. 国际汉语学报 2017(01)
    • [17].经典划分聚类分析方法及算例[J]. 地壳构造与地壳应力文集 2016(02)
    • [18].聚类分析理论的简单应用[J]. 科学中国人 2016(03)
    • [19].2015—2018年国外机构养老研究热点的共词聚类分析[J]. 中国社会医学杂志 2019(06)
    • [20].基于主成分分析和Q型聚类分析的2018年俄罗斯世界杯足球赛各队技战术综合分析[J]. 计算机时代 2020(01)
    • [21].基于聚类分析的不均衡数据标注技术研究[J]. 计算机仿真 2020(02)
    • [22].大学生职业潜能聚类分析与实际就业状况的关联性研究[J]. 教育评论 2018(01)
    • [23].聚类分析在财政实务工作中的应用[J]. 财政科学 2018(02)
    • [24].农业生产资料价格指数的聚类分析[J]. 电脑知识与技术 2017(27)
    • [25].基于PubMed的共词聚类分析方法[J]. 电子科技 2016(02)
    • [26].聚类分析在外国语言学研究中的应用探讨[J]. 中国校外教育 2018(07)
    • [27].基于因子聚类分析的安徽服务业竞争力评价[J]. 中国市场 2013(02)
    • [28].教学测评数据的对应聚类分析法研究[J]. 科技信息 2012(34)
    • [29].近红外光谱和聚类分析法无损快速鉴别小儿抽风散[J]. 光谱学与光谱分析 2008(02)
    • [30].SPSS的聚类分析在经济地理中的应用[J]. 西部皮革 2016(08)

    标签:;  ;  ;  ;  ;  

    基因序列图形表达及聚类分析应用研究
    下载Doc文档

    猜你喜欢