论文题目: 基因组序列特征分析
论文类型: 硕士论文
论文专业: 生物医学工程
作者: 焦典
导师: 孙啸
关键词: 基因组,序列,数据库,特征分析,水平基因转移
文献来源: 东南大学
发表年度: 2005
论文摘要: 随着后基因组时代的到来,建立生物数据库并且在其上开发各种分析工具进行数据分析和挖掘,已经成为了生物学研究的一种新方法。我们讨论的序列特征分析主要目的是为了序列的比较,传统的基于比对的序列比较方法由于受到其算法本身的限制,对长序列进行大规模的比对时执行效率很低。本文通过对现今生物数据库中数据最丰富完整的、能够反映遗传进化本质的基因组序列进行统计分析,从而提取出能够反映序列局部结构的特征,通过比较序列特征来进行基因序列分析,既解决了长序列大规模计算的问题,又解决了数据的来源问题。为了实现在基因组范围内按序列特征对相似序列进行快速有效的搜索,本文设计了基于特征的基因组序列数据库搜索系统。提供计算序列特征的算法程序,将各物种基因组序列及其统计特征加入到数据库中。这样的搜索机制能够在较短的时间内找到某些在功能结构上面相似的序列,而不仅仅是碱基排列上相似的序列。借助于基因组序列特征数据库,本文主要使用了碱基对的关联性(BBC)这个特征对基因序列进行了分析。我们发现每个物种基因组内部的序列特征比较相似;人的基因组序列与小鼠和大鼠的部分片段具有一定的相关性;另外人类基因组内存在着一些特征值比较异常的序列,使得它们和其他物种更加近似。水平基因转移(Horizontal gene transfer,HGT)是物种进化的一个重要驱动力。我们利用BBC特征对部分原核生物的基因组序列进行探测,发现一些特征异常的片段,与其他方法发现的水平转移基因较为一致,因此可以把BBC特征作为探测基因组序列上水平转移基因的依据。通过基因组相似序列的搜索,以及运用特征分析基因组序列,对我们研究物种之间的关系、生物进化和系统发生分析等有很大的帮助。
论文目录:
摘要
ABSTRACT
第一章 绪论
1.1 生物信息学和基因组序列分析
1.2 基因组特征提取
1.3 序列特征在基因组分析中的应用
1.3.1 基因组序列的局部特征
1.3.2 基因组序列的全局特征
1.4 本课题的任务及主要研究成果
1.4.1 课题任务
1.4.2 主要成果
第二章 序列统计特征的理论基础
2.1 WF 特征
2.2 DRA 特征
2.3 BBC 特征
2.4 特征的扩展
第三章 基因组序列特征数据库系统(GSFD)的设计
3.1 GSFD 系统的需求分析
3.2 GSFD 系统相关技术
3.3 GSFD 系统的总体框架
3.4 GSFD 系统模块设计
3.4.1 基因组序列下载程序
3.4.2 后台数据库管理程序
3.4.3 用户查询的WEB 界面
3.5 数据规模
3.6 系统执行效率的评估
第四章 基于 BBC 特征的全基因组序列分析
4.1 人类、小鼠、大鼠基因组序列比较分析
4.2 人基因组各条染色体的特征分析
4.2.1 人基因组个染色体BBC 特征分布图谱
4.2.2 人基因组各染色体序列特征的稳定性分析
4.2.3 人基因组上特征异常序列的研究
第五章 BBC 特征在水平基因转移(HGT)研究中的应用
5.1 水平转移基因的理论基础
5.2 寻找水平转移基因的方法学
5.3 基于BBC 特征的水平转移基因的探测方法
第六章 总结与展望
6.1 论文工作总结
6.2 展望
参考文献
致谢
发布时间: 2007-06-11
参考文献
- [1].LncRNA序列中sORF特征分析[D]. 赵佳.山东师范大学2018
- [2].miRNA-靶位点配对的序列特征研究[D]. 夏飞迪.广东工业大学2018
- [3].植物外源性miRNA序列特征研究[D]. 刘海明.吉林大学2015
- [4].基于DNA序列特征分析的固有无序蛋白分类研究[D]. 隋天翔.山东师范大学2016
- [5].基于序列特征的非编码RNA基因预测[D]. 任晓凯.吉林大学2008
- [6].蛋白质热稳定性的相关序列特征挖掘[D]. 丛华剑.烟台大学2016
- [7].原核生物翻译起始区的序列特征及基因间的关联特性[D]. 加顺花.内蒙古大学2004
- [8].基于统计特征的DNA序列特征提取方法研究[D]. 胡奇光.湖南大学2011
- [9].原核微生物热胁迫响应基因特征的研究[D]. 熊恒.华中农业大学2014
- [10].基于多序列特征的跨物种的蛋白质谷胱甘肽化位点的识别[D]. 艾美乐.东北师范大学2016
相关论文
- [1].利用本体论(Ontology)研究脑科学相关基因信息[D]. 陶怡.东南大学2006
- [2].基因表达数据的集成、分析和可视化[D]. 李石法.东南大学2006
- [3].基于序列统计特征的水平转移基因搜索[D]. 顾珉.东南大学2006
- [4].生物医学文本挖掘及其在基因调控信息分析中的应用[D]. 周俊.东南大学2006
- [5].基于结构数据的转录因子结合位点分析[D]. 汤丽华.东南大学2005
- [6].基因表达调控信息的获取、集成和可视化[D]. 吴骏.东南大学2005
- [7].基因组调控元件的分析[D]. 韦芬霞.东南大学2005
- [8].原核生物基因及基因组结构分析[D]. 韩志娴.河北工业大学2005
- [9].基因组中重复序列识别与分析[D]. 王晓敏.国防科学技术大学2005
- [10].基于数据挖掘的生物序列分析研究[D]. 桑永胜.电子科技大学2006