论文摘要
随着多核技术的发展,出现了新型的多核SMP集群系统。它具有较好的灵活性和扩展性,结点内性能的提高带来整个多核SMP集群系统性能的提升,人们能够以相对更高的性价比拥有更多的计算核心。MPI消息传递并行应用在多核SMP集群系统上也表现出与传统单核处理器集群系统不同的性能特征,给性能分析与优化带来新的问题。同时,多核SMP集群系统可能扩展到上万个处理器,其性能模拟对宿主机本身性能要求较高。并行模拟器能够利用宿主机较大的内存容量和极大地并行化模拟任务使得模拟速度大大提高,因此采用并行性能模拟方法对多核SMP集群进行性能模拟。本文以如何准确模拟多核SMP集群系统性能为目标,对MPI消息传递并行应用在多核SMP集群上的性能预测展开了相关研究,主要工作如下:(1)MPI并行应用在多核SMP集群中的通信主要包括结点间通信、片间通信、片内通信这三层通信。由于通信的延迟、带宽在不同层中表现出很大差别,因此需要对每层通信进行模拟进而准确预测通信时间。基于延迟带宽的方法,根据消息大小、消息所处的层次、不同层的延迟带宽设定延迟计算公式,从而评估消息通信时间。在模拟运行时,首先判断消息所处的通信层次;其次执行消息所产生的事件以推进模拟时钟,并根据延迟计算公式计算各次通信时间,进而得到消息传递目标并行应用的执行时间。实验结果表明,对于通信量较小、网络资源竞争较低的并行应用,三层通信特点的延迟带宽模型模拟具有较高的模拟精度,且高于没有区分结点内通信层次的模型的模拟精度。(2)多核SMP集群由于资源共享引起通信竞争,主要包括对结点内的核间二级缓存、内存和网络中交换机端口的竞争。针对通信中存在的竞争,对多核SMP超结点和两种主流高性能集群互连网络(交换式以太网和InfiniBand网络)进行详细的性能建模。该详细模型主要对交换机、网卡、结点、内存及二级缓存进行建模,实现了交换机制、网络拓扑、路由策略、通道选择策略及流控制策略,同时也通过在交换机端口维持一个负载模型和竞争模型实现了自适应路由,从而精确刻画通信竞争并准确预测通信时间。实验结果表明,对于通信量较大、网络资源竞争较高的并行应用,详细模型模拟也具有较高的模拟精度,且高于延迟带宽模型的模拟精度。