论文摘要
传统空间工作流系统面临着异构数据急剧膨胀、地学计算复杂度日益增长和任务集成困难等挑战。同时,海量异构分布数据的管理,大计算量应用的支撑以及资源的有效利用亦是当前空间工作流系统亟待解决的任务。本文设计并实现了一个云环境下高性能的、可扩展的分布式并行工作流系统CSWf,采用高效的虚拟化并行计算模型,实现了能够兼容MapReduce服务的云工作流引擎,可显著提高空间工作流执行效率。本文主要研究内容和成果如下:(1)针对空间工作流的异构数据急剧膨胀、地学计算复杂度日益增长和任务集成困难等现状,综述了云计算、工作流等国内外发展状况,阐述论文的研究的目的和意义,确定论文的研究目标与内容,提出研究技术路线。(2)研究了云计算、空间信息服务与工作流技术相关领域的基础理论,探讨分析了云服务模型、策略和安全问题,以及Web服务、地理服务构建所涉及的标准,通过开展工作流技术规范、建模方法和定义语言的研究,总结阐述了云空间工作流技术的适应性。在此基础上,根据空间信息和地理数据的特殊性,提出云环境下工作流数据存储和处理策略,以及空间工作流的实现方案。(3)根据空间数据和云计算特征,设计了一个的高性能、可扩展的分布式并行工作流系统CSWf,采用自主设计的CSWf云工作流过程定义语言——CPDL,集成高效的虚拟化并行计算模型,实现了高性能的云工作流引擎,能够有效地解决分布式工作流系统的建模、调度、协同和执行等难题。最后以城市空气污染指数计算工作流为例,采用美国国家环境保护局公布的空气污染数据,与传统工作流软件进行工作流执行性能对比测试,试验结果表明,云环境下空间工作流系统CSWf在处理大数据量具有良好性能优势。