并行计算性能实时监测与分析工具RMAPCP的研究与实现

并行计算性能实时监测与分析工具RMAPCP的研究与实现

论文摘要

机群并行计算技术正在成为高性能计算中的主流技术,在科学与工程计算中得到了广泛的应用,越来越多的工程技术人员需要自己编写并行计算程序并希望编写的程序正确、高效,能迅速查找到并行程序中的逻辑错误、定位性能瓶颈,提高并行计算效率。 本文研究与开发的并行计算性能实时监测与分析工具RMAPCP有助于MPI并行编程人员实现上述目标。RMAPCP实时地收集并行程序的运算过程信息和并行运算节点性能信息,以图形化方式反馈给并行编程人员,通过观察这些信息和最后的分析结果,有助于并行编程人员分析并行程序性能,查找性能瓶颈,完善并行算法,提高并行程序效率。 本文从系统运行环境、设计背景、总体设计思想、实现方法与技术等方面介绍了RMAPCP,着重探讨了性能监测库、节点机守护进程和监测前端实现中的关键技术,主要包括性能数据的采集、传输方法,实时性监测的实现,监测前端和守护进程的协调与控制,性能数据的表现与性能分析等,最后通过一个应用实例验证了RMAPCP的实际效果。

论文目录

  • 1 绪论
  • 1.1 选题目的及意义
  • 1.2 论文的主要研究内容与创新
  • 1.2.1 论文的主要研究内容
  • 1.2.2 论文的特色与创新
  • 2 并行计算机群系统及其负载均衡
  • 2.1 并行计算机的产生与发展
  • 2.2 TOP 500最高性能计算机统计
  • 2.3 机群计算系统
  • 2.4 机群系统的分类与特点
  • 2.4.1 机群系统的分类
  • 2.4.2 机群系统的特点
  • 2.5 机群系统中的负载均衡
  • 2.5.1 并行划分
  • 2.5.2 负载的度量
  • 2.5.3 负载均衡方法分类
  • 2.5.4 动态负载均衡的调度模型与均衡策略
  • 2.5.5 动态负载均衡算法的模型分析
  • 3 RMAPCP的开发背景
  • 3.1 并行性能监测工具分析与比较
  • 3.2 常见并行性能监测工具
  • 3.2.1 MPE
  • 3.2.2 Paradyn
  • 3.2.3 Vampir
  • 3.3 RMAPCP的设计切入点
  • 4 机群计算环境及RMAPCP开发工具
  • 4.1 机群计算环境
  • 4.1.1 可移植消息传递界面(MPI)
  • 4.1.2 并行虚拟机(PVM)
  • 4.1.3 MPI与PVM的比较
  • 4.2 RMAPCP主要开发工具
  • 4.2.1 Java
  • 4.2.2 JSci包
  • 4.2.3 proc文件系统
  • 4.3 Java与Linux的混合编程
  • 4.3.1 Java中的网络数据传输
  • 4.3.2 linux中的网络数据传输
  • 4.3.3 Java与Linux的通信
  • 5 RMAPCP总体设计
  • 5.1 RMAPCP设计目标
  • 5.2 并行程序性能评价指标
  • 5.3 系统环境构成
  • 5.3.1 系统硬件构成
  • 5.3.2 系统软件构成
  • 5.4 RMAPCP功能划分
  • 6 各功能模块实现方法
  • 6.1 性能监测库
  • 6.1.1 功能概述
  • 6.1.2 实现方案
  • 6.2 守护进程
  • 6.2.1 守护进程执行流程
  • 6.2.2 信息收集与传送
  • 6.3 监测前端
  • 6.3.1 监测前端功能概述
  • 6.3.2 初始化模块
  • 6.3.3 统一时钟
  • 6.3.4 数据接收与显示
  • 6.3.5 性能信息统计
  • 7 应用实例
  • 7.1 并行计算测试例程
  • 7.2 实际监测效果图
  • 8 结论及改进意见
  • 8.1 结论
  • 8.2 建议
  • 致谢
  • 参考文献
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  

    并行计算性能实时监测与分析工具RMAPCP的研究与实现
    下载Doc文档

    猜你喜欢