中国马业综合数据库的建立及马基因组序列预测

中国马业综合数据库的建立及马基因组序列预测

论文摘要

现代生物学的发展促进了生物信息学的产生。生物信息学是将信息学的理论技术应用于生物数据的管理和分析,是数学、物理学、计算机科学、化学、生命科学等多学科的交叉学科。生物信息学研究的范围十分广泛,其中数据库的构建就是一个重要方面。如何用理论和计算的方法识别和预测内含子和外显子也是目前生物信息学研究工作的重要任务。本课题通过自编程序建立了以中国马品种资源为主的中国马业综合数据库www.chinahorse.org.cn。并在建立数据库的基础上,初步实现了数据库应用,包括基于Web的文献数据库的网络化查询等。它将为建立马品种资源的科学研究平台打下基础。本研究的主要内容及结果如下:1.建立了专一化、系统化、完整化的马业科学数据库。序列数据库中以基因数据库和蛋白质数据库为主,非序列数据库以文献数据库和图片数据库为主。其中,马的基因数据库中的记录量超过了2万,马的蛋白质数据库的记录超过3万。2.建立了中国马物种资源数据库。涉及品种的外貌、类型、典型特征等多个性状,为从事中国物种品种遗传资源的利用与保护提供了参考。3.建立了马生物信息学研究平台。可以对基因和蛋白质进行相关生物信息学研究,对于进行科研和教学具有一定价值。4.建立了马业科学实验室网站与马业论坛。可以通过互联网进行数据库的检索,提高了数据库的应用效率。网站的建设还可以为数据库的更新带来方便,也为本研究领域内的交流与合作起到桥梁作用。本研究还通过对已发表的马全基因组序列的密码子使用频率做了初步的统计分析工作并对内含子和外显子进行了预测。基于各种序列组分的不同和序列首尾段的保守性,本研究利用离散增量结合支持向量机的方法对马基因组内含子和外显子序列进行识别。基于单碱基、二联体和三联体使用频率,我们能正确预测91%以上的内含子和外显子。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 马业科学简介
  • 1.1.1 马属动物及其分类
  • 1.1.2 马业科学及其研究内容
  • 1.2 生物信息学概述
  • 1.2.1 生物信息学的定义及其主要研究内容
  • 1.2.2 生物信息学的发展
  • 1.2.3 生物信息学的重要性
  • 1.3 生物学数据库
  • 1.3.1 数据库基本知识
  • 1.3.2 数据库管理系统(DBMS)
  • 1.3.3 数据库处理系统与文件处理系统的区别
  • 1.3.4 关于数据库定义的说明
  • 1.3.5 生物数据库的分类及其基本数据库
  • 1.4 本研究的目的与意义
  • 1.4.1 本研究的目的
  • 1.4.2 本研究的意义
  • 2 研究一中国马业综合数据库的建立
  • 2.1 引言
  • 2.1.1 www.chinahorse.org.cn—马业科学数据库的网络化实践
  • 2.1.2 ASP
  • 2.1.3 IIS
  • 2.1.4 超文本传输协议
  • 2.1.5 ASP 访问数据库
  • 2.1.6 Microsoft SQL Server
  • 2.2 材料与方法
  • 2.2.1 中国马业综合数据库的栏目分类
  • 2.2.2 马文献资料数据库的建立
  • 2.2.3 马基因和蛋白质信息库数据库的建立
  • 2.2.4 中国马遗传资源数据库的建立
  • 2.2.5 中国马业综合数据库网站的建立
  • 2.3 结果与分析
  • 2.3.1 马业科学数据库大小
  • 2.3.2 中国马遗传资源资源数据库
  • 2.3.3 马业科学数据库的录入
  • 2.3.4 马业科学数据库的检索系统
  • 2.3.5 马业科学实验室网站
  • 2.3.6 马生物信息学研究平台
  • 2.3.7 马业论坛
  • 2.3.8 数据的网络更新和提交
  • 2.4 讨论
  • 2.4.1 与此数据库的前身www.mayekexue.com.cn 的比较
  • 2.4.2 马业科学数据库的安全
  • 2.4.3 马业科学数据库的可扩展性和可维护性
  • 2.4.4 马业科学数据库的应用前景及其功能作用
  • 2.4.5 需要进一步研究和解决的问题
  • 2.5 小结
  • 3 研究二 马染色体中碱基使用频率的分析及内含子和外显子序列特征分析与预测
  • 3.1 数据集
  • 3.1.1 马全基因序列的数据库的构建
  • 3.1.2 马基因组内含子和外显子序列特征分析与预测数据集
  • 3.2 碱基使用频率研究方法
  • 3.2.1 单碱基使用频率定义
  • 3.2.2 二联体使用频率定义
  • 3.2.3 三联体使用频率定义
  • 3.2.4 密码子偏好性定义
  • 3.3 内含子和外显子预测方法
  • 3.3.1 离散量与离散增量
  • 3.3.2 支持向量机
  • 3.3.3 预测成功率评价指标
  • 3.4 结果
  • 3.4.1 马染色体中碱基使用频率的分析
  • 3.4.2 内含子和外显子预测结果
  • 3.5 讨论
  • 3.5.1 密码子的使用频率
  • 3.5.2 关于马基因组内含子和外显子的预测
  • 3.6 小结
  • 致谢
  • 参考文献
  • 作者简介
  • 相关论文文献

    • [1].浅析钻井安全评价综合数据库建设[J]. 中国管理信息化 2019(10)
    • [2].油脂综合数据库建设研究[J]. 安徽农业科学 2012(11)
    • [3].哈尔滨市社会经济综合数据库的建设研究[J]. 价值工程 2012(30)
    • [4].油田综合数据库的建立与实现[J]. 重庆科技学院学报(自然科学版) 2008(01)
    • [5].统计综合数据库系统的设计与实现[J]. 中国统计 2008(09)
    • [6].交通数据中心数据整合与综合数据库的设计研究[J]. 交通科技 2013(02)
    • [7].分布式数据库在三防综合数据库的应用和实现[J]. 水利信息化 2011(02)
    • [8].浅谈黑龙江综合数据库系统的构架[J]. 中国新技术新产品 2009(10)
    • [9].智慧水务实现路径[J]. 中国建设信息化 2017(03)
    • [10].钻井安全评价综合数据库的建设[J]. 现代制造技术与装备 2009(06)
    • [11].天津出台“十三五”智慧城市建设规划[J]. 中国安防 2016(Z1)
    • [12].天津出台“十三五”智慧城市建设规划[J]. 施工技术 2015(22)
    • [13].地震监测信息综合数据库建设[J]. 地震地磁观测与研究 2017(06)
    • [14].试论军事GIS综合数据库的建设[J]. 中国新通信 2017(21)
    • [15].基于元数据驱动的勘探开发综合数据库通用查询系统[J]. 大庆石油学院学报 2010(06)
    • [16].油气管道安全评价综合数据库的建设[J]. 油气田地面工程 2008(05)
    • [17].基于综合数据库的安徽省地震应急分类响应辅助决策系统[J]. 华南地震 2011(02)
    • [18].本地·经济信息[J]. 投资北京 2012(07)
    • [19].“一带一路”数据资源归集体系建设[J]. 电子政务 2017(01)
    • [20].宁夏气象综合数据库应用技术框架[J]. 计算机技术与发展 2019(08)
    • [21].《中国实验诊断学》杂志社声明[J]. 中国实验诊断学 2018(01)
    • [22].《中国实验诊断学》杂志社声明[J]. 中国实验诊断学 2018(03)
    • [23].《中国实验诊断学》杂志社声明[J]. 中国实验诊断学 2018(05)
    • [24].《中国实验诊断学》杂志社声明[J]. 中国实验诊断学 2018(09)
    • [25].丰台局队创新统计工作机制[J]. 数据 2009(05)
    • [26].基于改进ORM技术的海洋综合数据库管理系统[J]. 信息技术与信息化 2018(07)
    • [27].民族地区发展综合数据库与信息服务平台建设[J]. 中央民族大学学报(自然科学版) 2014(04)
    • [28].黑龙江省综合数据库总体框架设计[J]. 网络与信息 2009(04)
    • [29].县区地名综合数据库建设研究[J]. 智库时代 2019(21)
    • [30].基于J2EE构架的药物与靶点综合数据库及其查询系统(DTDB)的设计与实现[J]. 四川大学学报(自然科学版) 2009(04)

    标签:;  ;  ;  ;  ;  

    中国马业综合数据库的建立及马基因组序列预测
    下载Doc文档

    猜你喜欢