高性能计算中工作流调度引擎的设计与实现

高性能计算中工作流调度引擎的设计与实现

论文摘要

伴随着高性能计算设备的广泛使用,在高性能计算资源上求解的问题也越来越复杂。这类问题通常是由多个相互关联的作业共同组成,对这类问题的求解就是一个工作流作业的执行过程。然而,传统的高性能作业管理系统却对这类作业的管理和执行缺乏有效的支持,从而导致高性能计算资源的使用受到了很大限制。本文针对传统的高性能作业管理系统在处理工作流作业方面存在的问题,在深入研究工作流技术的基础上,着眼于高性能计算环境下工作流作业的自动调度与执行,提出了一个应用于高性能计算环境下的工作流调度引擎模型。本模型采用层次化的设计思想,将整个系统分为五层,分别是;表现层、解析层、处理层、接口层和数据管理层。各层功能独立,接口单一。在实现中,本文针对工作流作业所包含的复杂作业关系,设计了采用XML语言描述工作流作业的方法;在对工作流作业的属性进行了深入分析的基础上,设计出了工作流子作业对象的数据结构;提出了与工作流子作业直接优先级和间接优先级相关的算法,在此基础上设计了系统的调度策略,实现了工作流子作业的有效调度;通过对底层高性能作业管理系统所提供的命令进行封装,实现了用户对工作流作业的实时控制,为用户提供了友好的人机交互通道。最后,对系统的可扩展性、易维护性和可靠性进行了分析,并且通过作业的实际运行,说明了该工作流调度引擎具有较高的可用性和准确性。

论文目录

  • 目录
  • 表目录
  • 图目录
  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 高性能计算机概述
  • 1.2 工作流技术概述
  • 1.3 高性能计算中的工作流技术
  • 1.3.1 高性能计算中作业管理方面存在的问题
  • 1.3.2 工作流技术在高性能计算中的应用
  • 1.4 课题研究背景
  • 1.5 课题研究内容
  • 1.6 论文的组织
  • 第二章 高性能计算机中的作业管理系统
  • 2.1 高性能计算机架构及其作业管理系统
  • 2.1.1 MPP架构的计算机及其作业管理系统
  • 2.1.2 Beowulf架构的集群及其作业管理系统
  • 2.1.3 Beowulf集群编程模型
  • 2.2 PBS作业管理系统概述
  • 2.2.1 PBS作业管理系统的组成
  • 2.2.2 PBS的队列与调度系统
  • 2.2.3 PBS常用命令
  • 2.3 作业管理系统对工作流调度引擎的设计与实现的影响
  • 第三章 工作流调度引擎的设计
  • 3.1 总体设计
  • 3.1.1 系统设计原则
  • 3.1.2 系统的总体构架
  • 3.2 工作流调度引擎的表现层设计
  • 3.2.1 表现层的设计思想
  • 3.2.2 表现层的服务形式
  • 3.3 工作流解析器的设计
  • 3.3.1 工作流解析器的功能设计
  • 3.3.2 XML解析方法
  • 3.3.3 工作流说明文档的处理过程设计
  • 3.4 工作流子作业对象设计
  • 3.4.1 工作流子作业对象的设计规划
  • 3.4.2 子作业对象的功能设计
  • 3.5 工作流作业对象池的设计
  • 3.5.1 线程池概念的引入
  • 3.5.2 工作流作业对象池的功能设计
  • 3.6 作业处理器的设计
  • 3.6.1 作业处理器的组成
  • 3.6.2 作业处理器的功能设计
  • 3.7 子作业调度算法
  • 3.7.1 子作业优先级概念的引出
  • 3.7.2 子作业优先级的定义
  • 3.7.3 子作业优先级的量化计算方法
  • 3.7.4 子作业调度算法描述
  • 3.8 数据管理层的设计
  • 3.8.1 数据管理层的组成
  • 3.8.2 数据库管理器
  • 3.8.3 日志管理器
  • 3.8.4 异常处理器
  • 3.9 接口层的设计
  • 3.9.1 接口的概念
  • 3.9.2 接口层的组成
  • 3.9.3 接口层的功能设计
  • 第四章 工作流调度引擎的实现
  • 4.1 工作流调度引擎的开发环境
  • 4.2 表现层的实现
  • 4.2.1 表现层提供的命令
  • 4.2.2 工作流的作业描述模型
  • 4.2.3 工作流作业说明文档
  • 4.2.4 工作流作业说明文档的Schema规范
  • 4.3 解析层的实现
  • 4.3.1 解析器的实现
  • 4.3.2 工作流子作业对象的实现
  • 4.3.3 子作业对象依赖关系的拓扑结构
  • 4.3.4 作业对象池的实现
  • 4.4 处理层的实现
  • 4.4.1 作业执行器的实现
  • 4.4.2 作业处理器的实现
  • 4.4.3 作业对象的持久化
  • 4.5 数据管理层的实现
  • 4.5.1 数据库管理器的实现
  • 4.5.2 数据库中存储的数据列表
  • 4.5.3 日志管理器的实现
  • 4.5.4 异常处理器的实现
  • 4.6 接口层的实现
  • 4.6.1 作业控制接口的实现
  • 4.6.2 本地命令接口的实现
  • 第五章 工作流调度引擎的应用
  • 5.1 实验环境部署
  • 5.2 实验流程实例
  • 5.2.1 应用实例
  • 5.2.2 功能说明
  • 5.3 进一步分析
  • 5.4 小结
  • 结束语
  • 参考文献
  • 作者简历 攻读硕士学位期间完成的主要工作
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    高性能计算中工作流调度引擎的设计与实现
    下载Doc文档

    猜你喜欢