面向多核SMP集群的并行性能模拟技术研究

面向多核SMP集群的并行性能模拟技术研究

论文摘要

随着多核技术的发展,出现了新型的多核SMP集群系统。它具有较好的灵活性和扩展性,结点内性能的提高带来整个多核SMP集群系统性能的提升,人们能够以相对更高的性价比拥有更多的计算核心。MPI消息传递并行应用在多核SMP集群系统上也表现出与传统单核处理器集群系统不同的性能特征,给性能分析与优化带来新的问题。同时,多核SMP集群系统可能扩展到上万个处理器,其性能模拟对宿主机本身性能要求较高。并行模拟器能够利用宿主机较大的内存容量和极大地并行化模拟任务使得模拟速度大大提高,因此采用并行性能模拟方法对多核SMP集群进行性能模拟。本文以如何准确模拟多核SMP集群系统性能为目标,对MPI消息传递并行应用在多核SMP集群上的性能预测展开了相关研究,主要工作如下:(1)MPI并行应用在多核SMP集群中的通信主要包括结点间通信、片间通信、片内通信这三层通信。由于通信的延迟、带宽在不同层中表现出很大差别,因此需要对每层通信进行模拟进而准确预测通信时间。基于延迟带宽的方法,根据消息大小、消息所处的层次、不同层的延迟带宽设定延迟计算公式,从而评估消息通信时间。在模拟运行时,首先判断消息所处的通信层次;其次执行消息所产生的事件以推进模拟时钟,并根据延迟计算公式计算各次通信时间,进而得到消息传递目标并行应用的执行时间。实验结果表明,对于通信量较小、网络资源竞争较低的并行应用,三层通信特点的延迟带宽模型模拟具有较高的模拟精度,且高于没有区分结点内通信层次的模型的模拟精度。(2)多核SMP集群由于资源共享引起通信竞争,主要包括对结点内的核间二级缓存、内存和网络中交换机端口的竞争。针对通信中存在的竞争,对多核SMP超结点和两种主流高性能集群互连网络(交换式以太网和InfiniBand网络)进行详细的性能建模。该详细模型主要对交换机、网卡、结点、内存及二级缓存进行建模,实现了交换机制、网络拓扑、路由策略、通道选择策略及流控制策略,同时也通过在交换机端口维持一个负载模型和竞争模型实现了自适应路由,从而精确刻画通信竞争并准确预测通信时间。实验结果表明,对于通信量较大、网络资源竞争较高的并行应用,详细模型模拟也具有较高的模拟精度,且高于延迟带宽模型的模拟精度。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 研究现状
  • 1.2.1 并行系统性能模拟技术
  • 1.2.2 互连网络性能模拟技术
  • 1.3 研究内容与研究贡献
  • 1.4 论文结构
  • 第二章 相关背景技术
  • 2.1 引言
  • 2.2 并行系统并行性能模拟技术
  • 2.2.1 并行离散事件性能模拟技术概述
  • 2.2.2 并行离散事件性能模拟中的建模技术
  • 2.2.3 基于并行离散事件的互连网络性能模拟技术
  • 2.3 典型并行离散事件性能模拟环境POSE
  • 2.3.1 概述
  • 2.3.2 POSE中的面向对象建模技术
  • 2.3.3 基于POSE的BigSim并行性能模拟器
  • 2.4 本章小结
  • 第三章 基于延迟带宽模型的多核SMP集群性能模拟
  • 3.1 引言
  • 3.2 基于延迟带宽的性能建模
  • 3.2.1 功能模型与仿真
  • 3.2.2 性能模型
  • 3.3 实现
  • 3.4 实验与分析
  • 3.5 本章小结
  • 第四章 基于详细网络模型的多核SMP集群性能模拟
  • 4.1 引言
  • 4.2 多核SMP集群拓扑模型
  • 4.3 多核SMP结点建模
  • 4.3.1 二级缓存模型
  • 4.3.2 内存模型
  • 4.3.3 结点模型
  • 4.4 集群网络建模
  • 4.4.1 交换式以太网建模
  • 4.4.2 InfiniBand网络建模
  • 4.5 实现
  • 4.6 实验与分析
  • 4.6.1 基于交换式以太网的集群的模拟结果
  • 4.6.2 基于InfiniBand的集群的模拟结果
  • 4.6.3 结果分析
  • 4.7 本章小结
  • 第五章 结束语
  • 5.1 研究工作总结
  • 5.2 进一步研究展望
  • 致谢
  • 参考文献
  • 作者在学期间取得的学术成果
  • 作者在学期间参加的主要科研工作
  • 相关论文文献

    标签:;  ;  ;  ;  

    面向多核SMP集群的并行性能模拟技术研究
    下载Doc文档

    猜你喜欢