Print

基于模型的高性能计算集群建模与合成

论文摘要

为了解决科学和工程领域中具有重大挑战的问题(Grand-challenge problems),使用由普通商品化(Commodity off-the-shelf,COTS)组件建立的通用并行计算机(General-purpose parallel computers)即高性能计算(High-performance Computing,HPC)集群对大规模处理(Massively processing)的并行应用构建原型(Prototype)、调试、运行逐渐替代使用专用,通常是昂贵的超级计算(Supercomputing)平台。然而,不同的应用需要不同的计算环境组合软、硬组件来支撑。因此,针对特定的应用快速、高效地部署和重配置高性能计算平台就变得很重要。本论文开发了一个基于模型的高性能计算集群建模与合成框架以实现高性能计算集群快速自动化部署。在通用建模环境(Generic Modeling Environment,GME)中把高性能计算集群软、硬件组件建模成独立的模型,以实现集群模型在不同操作平台上的重用,应用对象约束语言(Object Constraint Language,OCL)实现集群软件包间的相互依赖关系;通过模型翻译器(Translator)把集群模型翻译成可执行脚本文件(例如Python脚本),用以实现高性能计算集群的安装和配置,并以Perceus集群为实例实现模型设计与实施过程。

论文目录

  • 摘要
  • Abstract
  • 第一章 引言
  • 1.1 研究背景
  • 1.2 研究对象
  • 1.3 论文主要任务
  • 1.4 论文内容组织
  • 第二章 相关支撑技术
  • 2.1 并行计算
  • 2.1.1 并行计算的原理
  • 2.1.2 并行计算机分类
  • 2.1.3 并行编程模型
  • 2.2 高性能计算集群
  • 2.2.1 集群定义
  • 2.2.2 集群分类
  • 2.2.3 高性能计算集群架构
  • 2.2.4 高性能计算集群组件
  • 2.3 脚本编程语言
  • 2.4 基于模型设计
  • 2.4.1 模型驱动架构
  • 2.4.2 模型集成计算
  • 第三章 集群系统的实现
  • 3.1 基于向导的手动实现
  • 3.1.1 集群环境
  • 3.1.2 系统构建
  • 3.1.3 集群测试
  • 3.2 基于脚本的自动实现
  • 3.2.1 集群环境
  • 3.2.2 集群构建
  • 3.2.3 集群测试
  • 第四章 集群系统建模与合成
  • 4.1 元模型设计
  • 4.2 模型设计
  • 4.3 集群实例
  • 第五章 结论
  • 5.1 工作总结
  • 5.2 课题展望
  • 参考文献
  • 附录
  • 附录1 Helloworld并行C程序代码
  • 附录2 OSCAR安装命令
  • 附录3 部分Python脚本
  • 附录4 SUNDIALS测试例子
  • 致谢
  • 相关论文文献

    本文来源: https://www.lw50.cn/article/0973f74e68c1f14798cb22e8.html