论文摘要
进入21世纪以来,由于分类学对生物多样性的重要基础作用,渔业、环境保护、生态学和系统学研究等领域的国际组织等对重振分类学研究高度重视,挖掘与分享分类学信息成为生物多样性公约(CBD)框架下全球生物分类倡议(GTI)的热点议题。为实现自然生物资源的可持续利用,GTI不遗余力地解决CDB贯彻执行中的“分类学障碍”问题。分类学信息的数字化和弥合应用进程不断加快,传统知识数字化、信息存储数字化、数据标准统一化和共享网络化成为分类学信息化发展的必然趋势。但自林奈和拉马克以来,分类阶元系统及描述和分类检索表等分类学研究成果大多是以纸质方式保存,其内容丰富、种类繁多、结构复杂、数量庞大,数字化工作难以一蹴而就,大量沉睡在图书馆、博物馆和档案室里分类学资料等待处理;同时少量数字化信息分散在多个不同结构的数据库中。由于缺少有效的数字化工具,尤其是缺乏能弥和传统分类信息和分子序列信息的软件,在物种分类检索和亲缘关系研究过程中,信息集成与关联分析十分不便。鲽形目鱼类进化历史悠久复杂,形态构造呈特殊的不对称性,许多种类因美味可口而具有重要经济价值,开展分类学研究有典型的生物学代表意义和生产指导意义,但其分类系统至今尚未统一。论文依托前期工作基础,通过设计专项数据库、建立标准化数据索引和开发流程化分类学功能模块,探索将信息要素和分类检索研究方法有机融为一体的技术方法,研究了形态构造特征信息和分子序列信息的弥合模式,设计研制了以分类阶元系统为目录索引,以分类检索表、分子标记、DNA条码分子鉴定、生物学参考信息、参考文献和亲缘关系分析等为主要功能组成和应用方向的《鲽形目分类信息分析系统(Pleuronectiformes Taxonomy Information Analysis System)》(简称《鲽形目分类系统,PTIAS》;著作权登记号2009SR02219),建立了鲽形目分类学信息软件开发模式。1.基于GTI规划的2008-2020年分类学产出,建立了鲽形目分类学数据源综合模糊评价体系。在对数据源进行初步评估、筛选和归类的基础上,分析了不同数据源内容、结构及其相互间关系,设计了适用于PTIAS系统的元数据、索引体系和数据库模式,为分类检索系统的开发奠定了数据基础。2.设计了可兼容不同GTI数据库分类目录的数字化分类阶元系统。基于树型数据窗口(Treeview Datawindow),建立了可扩展上下级阶元、可任意组合不同阶元的数字化分类阶元系统模块,为动态应用阶元组合动态整合数据、开展信息比较分析、构建专项数据库等数据操作等奠定了索引目录结构基础。3、提出了定距式二歧检索表BiosKey算法。建立了以数据过滤模式调取检索表的特征性状并进行组合查询的方法,讨论了传统二歧检索表的树数据结构的同组层无序化特征,及其将之与二叉树结构进行辨分的必要性,为纸质分类检索表的数字化提供了新的工具。同时,基于各种系统的树结构相似性、阶层体系相似性和物种阶元单位的高度一致性,探索了将BiosKey算法应用于建立支序回溯系统,用以集成各类系统信息的可行性。4.从序列信息检索直观化角度出发,基于mtDNA和nDNA基因组结构和数据窗口(Datawindow, DW),建立了直观的分子标记热键检索模式;设计了通过鼠标控制函数检索DNA条码、分子标记等序列信息,并与分类系统目录进行阶元关联的方法。5.研究了大尺寸数据库的快速处理技术,同时建立了不同DOS模式的Blast、Clustal、Phylip软件包的Windows平台运行的优化环境。为加速数据检索、提取和数据库重建,设计了将数据存储(Datastore)嵌入内存数据块进行索引化操作的快速算法,为Windows系统中大文件访问与处理中的I/O与内存限制的瓶颈技术问题。6.研究了以平台模块方式处理不同分类学信息的系统设计与构建方法。按分别设计、系统集成模式,开发了9个数据模块、9个分类学功能模块和3个数据处理辅助模块。各种标准化数据用于有序化伺服系统初始化、数据库和检索索引,或通过程序内建函数转化为分类学专业格式如林奈分类目录、分类检索表、分子序列表和系统发育树等,或为系统的可见与不可见控件如选择列表、数据存储索引等提供初始化参数。7.针对GTI分类学信息门户,基于微软Web浏览控件建立了物种Web信息浏览与编辑工具,方便于使用者自定制Web信息的采集与管理,并基于复合索引实现了Web信息与系统阶元目录的有效关联。
论文目录
摘要ABSTRACT第一章 文献综述0 引言1 分类学信息及其标准化研究进展1.1 生物分类学信息1.1.1 分类学与系统学1.1.2 各种生物分类学信息之间的关系1.1.3 分类学与分类学信息范畴1.2 CBD 从全球应用角度重新发现分类学价值1.2.1 面向解决分类学障碍重振学科发展1.2.2 CBD 现阶段的重要分类学产出1.3 分类学信息的标准化1.3.1 国际化标准1.3.2 CHM 和GTI 分类学信息标准化所遵循的原则1.3.3 我国的国家标准和其他标准2 鲽形目分类学信息化工具研究进展2.1 鲽形目分类学信息的历史发展阶段2.1.1 纸质化信息记载发展时期2.1.2 数字化信息记载发展时期2.2 鲽形目分类学数据库及工具2.2.1 物种名录2.2.2 分类阶元系统2.2.3 分类检索表2.2.4 分子鉴定系统和DNA 条码2.2.5 分子标记数据库2.2.6 分子系统分析软件2.2.7 分类学参考文献2.2.8 生物学基本信息数据库2.3 鲽形目分类学信息研究中存在的问题3 拟解决的问题、研究方法及主要研究内容3.1 拟解决的问题3.2 研究方法3.3 主要研究内容第二章 鲽形目分类学信息体系构建0 引言1 确定数据标准1.1 材料1.2 对鲽形目分类学数据适用的标准化原则的分析1.2.1 元数据属性及功能的界定1.2.2 GTI 标准化的分类学产出模式分析1.3 结果与讨论2 数据源特征2.1 材料2.2 数据源分析与甄选2.3 结果与讨论3 源数据的规范化处理3.1 材料3.1.1 系统数据集3.1.2 样本数据采集3.2 源数据分析与规范化设计3.3 结果与讨论4 构建PTIAS 系统数据体系4.1 材料4.2 分析与设计4.2.1 系统数据体系模块设计4.2.2 系统基本元数据模块之间的关系4.2.3 模块元数据通用结构4.2.4 系统元数据模块主要内容4.2.5 系统数据库的构建4.3 结果与讨论5 序列信息与传统分类学信息的弥合5.1 材料5.2 分类学数据的弥合需求分析5.2.1 数据弥合方向与范围5.2.2 数据弥合方法5.3 结果与讨论6 本章小结第三章 鲽形目分类信息分析系统的构建与实现0 引言1 开发与运行环境1.1 开发环境1.2 运行环境1.3 参考源码2 系统核心组件与功能框架2.1 材料2.2 设计与方法2.3 结果与分析3 系统模块的设计与功能实现3.1 命名与名录模块3.1.1 材料3.1.2 设计与方法3.1.3 结果与讨论3.2 分类阶元系统模块3.2.1 材料3.2.2 设计与方法3.2.3 模块界面结构组成及功能实现3.2.4 结果与讨论3.3 分类检索表模块3.3.1 材料3.3.2 设计与方法3.3.3 模块界面结构组成及功能实现3.3.4 结果与讨论3.4 DNA 条码模块3.4.1 材料3.4.2 设计与方法3.4.3 模块界面结构组成和功能实现3.4.4 结果与分析3.5 分子标记模块3.5.1 材料3.5.2 设计与方法3.5.3 模块界面结构组成和功能实现3.5.4 结果与分析3.6 分子系统分析软件模块3.6.1 材料3.6.2 设计与方法3.6.2.1 Blast 组件3.6.4.2 Clustal W 组件3.6.4.3 Phylip 程序包组件3.6.4.4 Treeview X 调用3.6.5 结果与分析3.7 生物学基本信息模块3.7.1 材料3.7.2 设计与方法3.7.3 模块界面结构组成及功能实现3.7.4 结果与分析3.8 参考文献模块3.8.1 材料3.8.2 设计方法、界面结构组成和功能实现3.8.3 结果与分析3.9 支序回溯系统模块3.9.1 材料3.9.2 设计方法、界面结构组成和功能实现3.9.3 结果与分析3.10 数据处理模块3.10.1 材料3.10.2 设计与方法3.10.3 结果与分析3.11 文件与数据管理模块3.11.1 材料3.11.2 设计方法、界面结构组成和功能实现3.11.3 结果与分析3.12 通用组合查询模块3.12.1 材料3.12.2 设计方法、界面结构组成和功能实现3.12.3 结果与分析4 模块组合与系统构建4.1 材料4.2 设计与方法4.2.1 系统组件4.2.2 数据的系统集成与关联4.3 系统界面结构组成与功能实现4.4 结果与讨论4.4.1 编码要点4.4.2 系统主要技术特点第四章 结论与展望1 总结1.1 建立了鲽形目分类学信息元数据体系1.2 建立了GTI 分类学数据源采集模式1.3 开发了12 个分类学功能模块1.4 实现了不同阶元组合的信息关联1.5 探索建立了数字化支序回溯系统1.6 建立了特定阶元分类学信息分析软件的开发模式2 讨论与未来工作2.1 讨论2.1.1 专业知识2.1.2 研究范围与探索重点2.1.3 可持续开发与应用2.1.4 版权与语言障碍2.2 后期工作参考文献著作权、论文及相关成果致谢
相关论文文献
标签:鲽形目论文; 分类学信息论文; 数据库论文; 分类检索表论文; 条码论文; 系统发育树论文;