鲽形目分类检索及分子生物学应用模式研究

鲽形目分类检索及分子生物学应用模式研究

论文摘要

进入21世纪以来,由于分类学对生物多样性的重要基础作用,渔业、环境保护、生态学和系统学研究等领域的国际组织等对重振分类学研究高度重视,挖掘与分享分类学信息成为生物多样性公约(CBD)框架下全球生物分类倡议(GTI)的热点议题。为实现自然生物资源的可持续利用,GTI不遗余力地解决CDB贯彻执行中的“分类学障碍”问题。分类学信息的数字化和弥合应用进程不断加快,传统知识数字化、信息存储数字化、数据标准统一化和共享网络化成为分类学信息化发展的必然趋势。但自林奈和拉马克以来,分类阶元系统及描述和分类检索表等分类学研究成果大多是以纸质方式保存,其内容丰富、种类繁多、结构复杂、数量庞大,数字化工作难以一蹴而就,大量沉睡在图书馆、博物馆和档案室里分类学资料等待处理;同时少量数字化信息分散在多个不同结构的数据库中。由于缺少有效的数字化工具,尤其是缺乏能弥和传统分类信息和分子序列信息的软件,在物种分类检索和亲缘关系研究过程中,信息集成与关联分析十分不便。鲽形目鱼类进化历史悠久复杂,形态构造呈特殊的不对称性,许多种类因美味可口而具有重要经济价值,开展分类学研究有典型的生物学代表意义和生产指导意义,但其分类系统至今尚未统一。论文依托前期工作基础,通过设计专项数据库、建立标准化数据索引和开发流程化分类学功能模块,探索将信息要素和分类检索研究方法有机融为一体的技术方法,研究了形态构造特征信息和分子序列信息的弥合模式,设计研制了以分类阶元系统为目录索引,以分类检索表、分子标记、DNA条码分子鉴定、生物学参考信息、参考文献和亲缘关系分析等为主要功能组成和应用方向的《鲽形目分类信息分析系统(Pleuronectiformes Taxonomy Information Analysis System)》(简称《鲽形目分类系统,PTIAS》;著作权登记号2009SR02219),建立了鲽形目分类学信息软件开发模式。1.基于GTI规划的2008-2020年分类学产出,建立了鲽形目分类学数据源综合模糊评价体系。在对数据源进行初步评估、筛选和归类的基础上,分析了不同数据源内容、结构及其相互间关系,设计了适用于PTIAS系统的元数据、索引体系和数据库模式,为分类检索系统的开发奠定了数据基础。2.设计了可兼容不同GTI数据库分类目录的数字化分类阶元系统。基于树型数据窗口(Treeview Datawindow),建立了可扩展上下级阶元、可任意组合不同阶元的数字化分类阶元系统模块,为动态应用阶元组合动态整合数据、开展信息比较分析、构建专项数据库等数据操作等奠定了索引目录结构基础。3、提出了定距式二歧检索表BiosKey算法。建立了以数据过滤模式调取检索表的特征性状并进行组合查询的方法,讨论了传统二歧检索表的树数据结构的同组层无序化特征,及其将之与二叉树结构进行辨分的必要性,为纸质分类检索表的数字化提供了新的工具。同时,基于各种系统的树结构相似性、阶层体系相似性和物种阶元单位的高度一致性,探索了将BiosKey算法应用于建立支序回溯系统,用以集成各类系统信息的可行性。4.从序列信息检索直观化角度出发,基于mtDNA和nDNA基因组结构和数据窗口(Datawindow, DW),建立了直观的分子标记热键检索模式;设计了通过鼠标控制函数检索DNA条码、分子标记等序列信息,并与分类系统目录进行阶元关联的方法。5.研究了大尺寸数据库的快速处理技术,同时建立了不同DOS模式的Blast、Clustal、Phylip软件包的Windows平台运行的优化环境。为加速数据检索、提取和数据库重建,设计了将数据存储(Datastore)嵌入内存数据块进行索引化操作的快速算法,为Windows系统中大文件访问与处理中的I/O与内存限制的瓶颈技术问题。6.研究了以平台模块方式处理不同分类学信息的系统设计与构建方法。按分别设计、系统集成模式,开发了9个数据模块、9个分类学功能模块和3个数据处理辅助模块。各种标准化数据用于有序化伺服系统初始化、数据库和检索索引,或通过程序内建函数转化为分类学专业格式如林奈分类目录、分类检索表、分子序列表和系统发育树等,或为系统的可见与不可见控件如选择列表、数据存储索引等提供初始化参数。7.针对GTI分类学信息门户,基于微软Web浏览控件建立了物种Web信息浏览与编辑工具,方便于使用者自定制Web信息的采集与管理,并基于复合索引实现了Web信息与系统阶元目录的有效关联。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 文献综述
  • 0 引言
  • 1 分类学信息及其标准化研究进展
  • 1.1 生物分类学信息
  • 1.1.1 分类学与系统学
  • 1.1.2 各种生物分类学信息之间的关系
  • 1.1.3 分类学与分类学信息范畴
  • 1.2 CBD 从全球应用角度重新发现分类学价值
  • 1.2.1 面向解决分类学障碍重振学科发展
  • 1.2.2 CBD 现阶段的重要分类学产出
  • 1.3 分类学信息的标准化
  • 1.3.1 国际化标准
  • 1.3.2 CHM 和GTI 分类学信息标准化所遵循的原则
  • 1.3.3 我国的国家标准和其他标准
  • 2 鲽形目分类学信息化工具研究进展
  • 2.1 鲽形目分类学信息的历史发展阶段
  • 2.1.1 纸质化信息记载发展时期
  • 2.1.2 数字化信息记载发展时期
  • 2.2 鲽形目分类学数据库及工具
  • 2.2.1 物种名录
  • 2.2.2 分类阶元系统
  • 2.2.3 分类检索表
  • 2.2.4 分子鉴定系统和DNA 条码
  • 2.2.5 分子标记数据库
  • 2.2.6 分子系统分析软件
  • 2.2.7 分类学参考文献
  • 2.2.8 生物学基本信息数据库
  • 2.3 鲽形目分类学信息研究中存在的问题
  • 3 拟解决的问题、研究方法及主要研究内容
  • 3.1 拟解决的问题
  • 3.2 研究方法
  • 3.3 主要研究内容
  • 第二章 鲽形目分类学信息体系构建
  • 0 引言
  • 1 确定数据标准
  • 1.1 材料
  • 1.2 对鲽形目分类学数据适用的标准化原则的分析
  • 1.2.1 元数据属性及功能的界定
  • 1.2.2 GTI 标准化的分类学产出模式分析
  • 1.3 结果与讨论
  • 2 数据源特征
  • 2.1 材料
  • 2.2 数据源分析与甄选
  • 2.3 结果与讨论
  • 3 源数据的规范化处理
  • 3.1 材料
  • 3.1.1 系统数据集
  • 3.1.2 样本数据采集
  • 3.2 源数据分析与规范化设计
  • 3.3 结果与讨论
  • 4 构建PTIAS 系统数据体系
  • 4.1 材料
  • 4.2 分析与设计
  • 4.2.1 系统数据体系模块设计
  • 4.2.2 系统基本元数据模块之间的关系
  • 4.2.3 模块元数据通用结构
  • 4.2.4 系统元数据模块主要内容
  • 4.2.5 系统数据库的构建
  • 4.3 结果与讨论
  • 5 序列信息与传统分类学信息的弥合
  • 5.1 材料
  • 5.2 分类学数据的弥合需求分析
  • 5.2.1 数据弥合方向与范围
  • 5.2.2 数据弥合方法
  • 5.3 结果与讨论
  • 6 本章小结
  • 第三章 鲽形目分类信息分析系统的构建与实现
  • 0 引言
  • 1 开发与运行环境
  • 1.1 开发环境
  • 1.2 运行环境
  • 1.3 参考源码
  • 2 系统核心组件与功能框架
  • 2.1 材料
  • 2.2 设计与方法
  • 2.3 结果与分析
  • 3 系统模块的设计与功能实现
  • 3.1 命名与名录模块
  • 3.1.1 材料
  • 3.1.2 设计与方法
  • 3.1.3 结果与讨论
  • 3.2 分类阶元系统模块
  • 3.2.1 材料
  • 3.2.2 设计与方法
  • 3.2.3 模块界面结构组成及功能实现
  • 3.2.4 结果与讨论
  • 3.3 分类检索表模块
  • 3.3.1 材料
  • 3.3.2 设计与方法
  • 3.3.3 模块界面结构组成及功能实现
  • 3.3.4 结果与讨论
  • 3.4 DNA 条码模块
  • 3.4.1 材料
  • 3.4.2 设计与方法
  • 3.4.3 模块界面结构组成和功能实现
  • 3.4.4 结果与分析
  • 3.5 分子标记模块
  • 3.5.1 材料
  • 3.5.2 设计与方法
  • 3.5.3 模块界面结构组成和功能实现
  • 3.5.4 结果与分析
  • 3.6 分子系统分析软件模块
  • 3.6.1 材料
  • 3.6.2 设计与方法
  • 3.6.2.1 Blast 组件
  • 3.6.4.2 Clustal W 组件
  • 3.6.4.3 Phylip 程序包组件
  • 3.6.4.4 Treeview X 调用
  • 3.6.5 结果与分析
  • 3.7 生物学基本信息模块
  • 3.7.1 材料
  • 3.7.2 设计与方法
  • 3.7.3 模块界面结构组成及功能实现
  • 3.7.4 结果与分析
  • 3.8 参考文献模块
  • 3.8.1 材料
  • 3.8.2 设计方法、界面结构组成和功能实现
  • 3.8.3 结果与分析
  • 3.9 支序回溯系统模块
  • 3.9.1 材料
  • 3.9.2 设计方法、界面结构组成和功能实现
  • 3.9.3 结果与分析
  • 3.10 数据处理模块
  • 3.10.1 材料
  • 3.10.2 设计与方法
  • 3.10.3 结果与分析
  • 3.11 文件与数据管理模块
  • 3.11.1 材料
  • 3.11.2 设计方法、界面结构组成和功能实现
  • 3.11.3 结果与分析
  • 3.12 通用组合查询模块
  • 3.12.1 材料
  • 3.12.2 设计方法、界面结构组成和功能实现
  • 3.12.3 结果与分析
  • 4 模块组合与系统构建
  • 4.1 材料
  • 4.2 设计与方法
  • 4.2.1 系统组件
  • 4.2.2 数据的系统集成与关联
  • 4.3 系统界面结构组成与功能实现
  • 4.4 结果与讨论
  • 4.4.1 编码要点
  • 4.4.2 系统主要技术特点
  • 第四章 结论与展望
  • 1 总结
  • 1.1 建立了鲽形目分类学信息元数据体系
  • 1.2 建立了GTI 分类学数据源采集模式
  • 1.3 开发了12 个分类学功能模块
  • 1.4 实现了不同阶元组合的信息关联
  • 1.5 探索建立了数字化支序回溯系统
  • 1.6 建立了特定阶元分类学信息分析软件的开发模式
  • 2 讨论与未来工作
  • 2.1 讨论
  • 2.1.1 专业知识
  • 2.1.2 研究范围与探索重点
  • 2.1.3 可持续开发与应用
  • 2.1.4 版权与语言障碍
  • 2.2 后期工作
  • 参考文献
  • 著作权、论文及相关成果
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  

    鲽形目分类检索及分子生物学应用模式研究
    下载Doc文档

    猜你喜欢