生物序列模式挖掘的研究与应用

生物序列模式挖掘的研究与应用

论文摘要

人类基因组计划启动以来,越来越多物种的基因序列被测出,积累了大量的基因序列信息。与此同时各种蛋白质一级结构,即多肽链的氨基酸残基的排列顺序也在不断被探测出来。这些生物序列数据被存储在世界各地的数据库中,为生物的研究提供了巨量数据。但是有了巨量的数据并不意味着拥有了知识。如何从海量数据中获得有价值的知识、探求生物序列中的规律、挖掘蕴藏的意义,成为当前生物信息学研究的热点和难点。生物序列数据是最重要的生物数据之一,通过对生物序列的分析,我们可以发现物种的遗传规律、物种间的关系等。相关研究对于人类探求生命本质、寻找改造动植物的方法、治疗疾病的药物的研发等具有重要价值与意义。本文分析了生物序列数据的特征,并通过对当前生物序列模式挖掘方法研究中一些问题的探讨,本文取得了如下成果:1)生物序列模式具有复杂的特性,为了更有效地对其进行挖掘,本文设计了一个新的生物序列模式挖掘算法--MS-BioSM。MS-BioSM算法采用新的剪枝方法改进已有的prefixspan算法,同时综合考虑分布式支持度和局部支持度,从而寻找到满足一定阈值且更符合生物意义的序列模式。实验结果表明该算法有效降低了时间和空间的复杂度,并且挖掘出更有生物意义的序列模式。2)转录因子结合位点是一种重要的生物序列模式,同时具有自身的特点,为了更加准确的预测转录因子结合位点,本文设计了GBMM算法—基于遗传算法优化的多重马尔可夫模型。在实验中,通过对生物基因序列中的字符及字符片断间转移概率进行统计分析,建立多个马尔可夫状态转移矩阵,并采用遗传算法优化这些转移矩阵间组合,最终获得综合预测模型。在真实数据集上的实验表明算法具有较高准确率。3)本文结合数据挖掘技术提出了生物序列数据上的主要操作,给出了一个新型的生物序列数据库管理系统体系结构。为生物信息学研究提供一个有效的支持平台。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 生物学背景
  • 1.2 生物数据挖掘技术
  • 1.3 研究意义
  • 1.4 本文工作
  • 1.5 文章结构
  • 第2章 序列模式挖掘与结合位点预测研究现状
  • 2.1 序列模式挖掘研究现状
  • 2.1.1 基本概念
  • 2.1.2 生物序列相似性
  • 2.1.3 生物序列模式挖掘
  • 2.1.4 生物序列模式挖掘状况
  • 2.2 转录因子结合位点研究现状
  • 2.2.1 基本概念
  • 2.2.2 研究意义
  • 2.2.3 转录因子结合位点研究状况
  • 2.3 本章小结
  • 第3章 挖掘基于多支持度的频繁模式
  • 3.1 相关工作
  • 3.2 问题定义
  • 3.3 基于多支持度的生物序列模式挖掘算法
  • 3.4 实验结果和分析
  • 3.5 本章小结
  • 第4章 GBMM:一个结合位点预测算法
  • 4.1 引言
  • 4.2 问题描述
  • 4.3 算法
  • 4.4 实验
  • 4.5 本章小结
  • 第5章 生物序列数据库管理系统体系结构
  • 5.1 引言
  • 5.2 相关研究
  • 5.3 生物序列操作
  • 5.3.1 生物序列数据的表示及其特征
  • 5.3.2 生物序列数据操作
  • 5.4 生物序列数据库管理系统体系结构
  • 5.5 本章小结
  • 总结
  • 参考文献
  • 附录
  • 致谢
  • 相关论文文献

    • [1].序列模式挖掘在心理危机干预技能评估中的应用[J]. 上海交通大学学报(医学版) 2020(03)
    • [2].序列模式中的生成序列模式挖掘综述[J]. 无线通信技术 2018(04)
    • [3].增量序列模式挖掘研究进展[J]. 网络安全技术与应用 2017(01)
    • [4].间隙约束序列模式挖掘的对比研究[J]. 网络安全技术与应用 2017(02)
    • [5].序列模式挖掘两种典型算法的研究[J]. 信息技术 2016(11)
    • [6].满足非重叠条件的带有通配符序列模式挖掘[J]. 小型微型计算机系统 2017(05)
    • [7].基于位置信息的显露序列模式挖掘研究[J]. 计算机科学 2017(07)
    • [8].序列模式挖掘在教学管理上的运用[J]. 电脑知识与技术 2016(13)
    • [9].负序列模式挖掘研究[J]. 廊坊师范学院学报(自然科学版) 2015(03)
    • [10].序列模式挖掘技术在数字图书馆中的应用[J]. 农业图书情报学刊 2015(07)
    • [11].一种最有趣的序列模式挖掘算法[J]. 计算机仿真 2019(04)
    • [12].考虑价格的跨种类模糊序列模式挖掘算法[J]. 计算机应用研究 2018(01)
    • [13].水质时间序列模式挖掘[J]. 计算机技术与发展 2018(05)
    • [14].基于频繁序列模式挖掘的反恐情报关联分析[J]. 情报理论与实践 2018(10)
    • [15].序列模式挖掘在通信网络告警预测中的应用[J]. 计算机科学 2018(S2)
    • [16].闭合负序列模式挖掘[J]. 哈尔滨师范大学自然科学学报 2015(06)
    • [17].多维序列模式挖掘算法分析[J]. 赤峰学院学报(自然科学版) 2014(07)
    • [18].基于序列模式挖掘的读者借阅行为分析[J]. 图书情报知识 2011(04)
    • [19].序列模式挖掘综述[J]. 计算机应用研究 2008(07)
    • [20].多支持度下用户行为序列模式挖掘方法研究[J]. 计算机应用与软件 2018(01)
    • [21].基于隐私保护的序列模式挖掘[J]. 计算机科学 2016(12)
    • [22].基于支持量的并发序列模式挖掘方法[J]. 计算机工程与设计 2016(01)
    • [23].基于序列模式挖掘的基因剪接位点[J]. 数据采集与处理 2016(05)
    • [24].一种基于逻辑的频繁序列模式挖掘算法[J]. 计算机科学 2015(05)
    • [25].高效的稀有序列模式挖掘方法[J]. 计算机科学与探索 2015(04)
    • [26].时态数据中序列模式挖掘研究[J]. 科技创新导报 2014(13)
    • [27].序列模式挖掘在教学管理上的应用[J]. 计算机与现代化 2012(11)
    • [28].一种模糊序列模式挖掘的有效方法[J]. 现代计算机(专业版) 2010(13)
    • [29].并发序列模式挖掘方法研究[J]. 计算机应用 2009(11)
    • [30].序列模式挖掘算法在高血压治疗中的研究[J]. 计算机工程与设计 2018(03)

    标签:;  ;  ;  ;  ;  

    生物序列模式挖掘的研究与应用
    下载Doc文档

    猜你喜欢