论文摘要
在生命科学领域内,新的高效的实验技术产生了海量的生物学数据,针对这些数据的分析也产生了大量的算法和软件工具。异构的数据源阻碍了不同实验室之间的数据交换,不同的算法软件之间也缺乏统一的信息交互标准,如此大量的数据和算法在相关的各个领域都需要有效的整合。基于此,生命科学的相关领域具有集成功能的软件包被不断开发出来。然而,第一,这些相关领域的软件包都没有提供通用一致的数据和算法接口。第二,这些相关领域的软件工具都没有提供协同工作机制。第三,这些软件工具无法在不同的操作系统间无缝的移植。此外,它们普遍缺乏友好的客户端图形操作界面GUI(graphical user interface)。本文提出构建一个基于Java环境的工作流管理平台BioW(Bio-Workflow)。该平台基于工作流技术,采取Java 2平台企业版(Java 2 platform)的体系结构。它不仅(1)给出通用一致的接口来集成算法工具和数据源;(2)其工作流机制使得被集成的软件更容易进行信息交互。BioW平台所提供的独立软件开发包software development kit(SDK)包含通用的数据接口Bio-data,用户可以利用该接口集成各种异构数据源,譬如神经科学领域的各种神经元序列等。该SDK还包括一致的算法接口Bio-node,用户可以利用该接口集成各种形式的算法工具,包含一系列开源的Java代码,开源的其他代码(C,C++等),以及可执行的二进制程序。其次,BioW提供多用户管理模块和协同工作机制。基于此,每个用户都拥有各自的空间存储自己的数据和分析工作流。此外,用户组的公共空间所存储的数据和工作流可以被同组的其他用户共享,这使得研究者可以无冲突的共享实验数据和分析过程,提高了复杂研究工作的效率。再次,该平台提供友好的客户端图形界面GUI,研究者可以在该界面上以拖拉节点的方式来定制,修改和执行工作流程。最后,BioW基于Java构建,因此独立于操作系统,整个工程一次编译后便可部署于不同的操作系统。
论文目录
相关论文文献
- [1].枯草芽孢杆菌bioW基因在大肠杆菌中的表达及其对宿主生长的抑制作用[J]. 西北农林科技大学学报(自然科学版) 2009(01)