论文摘要
随着高性能计算技术在社会生产生活各方面的应用日益广泛,高性能计算的性能评测尤其是性能预测在高性能计算领域内逐渐受到重视。目前研究最广泛的是使用性能模型进行预测。建立性能模型,只需要收集关于应用程序及目标机器的一些相关信息进行分析,然后通过一些计算得出应用程序在目标机器上运行所需要的时间。相对于其他方法来说,整个预测过程花费的时间大大缩短,而且其预测精度也比较高。现有的一些性能模型与程序所使用的数值算法密切相关,建立过程需要花费大量的专家人力,模型计算时间较长,无法实现自动化;另一些性能模型所使用的工具和建模方法基于某种类型的计算平台,且只对其少数战略同盟直接可用。本文着重于高性能计算机系统的内存系统性能模型,分析了使用机器特征操作能力与应用程序中循环的内存访问模式相结合的性能模型框架,并在充分分析的基础上,对性能模型工具进行了移植,在Intel X86结构上实现了对应的模型计算工具,对应用程序中的循环而不是基本块进行处理,精简所需要考虑的内存访问特征;并针对该性能模型框架中为获取应用程序内存访问模式使用的Multi-MAPS测试工具可能存在的、不能覆盖所有的HPC应用程序中的内存访问模式的问题进行了讨论并提出了解决办法。实验数据表明,使用移植到Intel X86结构上的性能模型进行性能预测能够达到预期的精度;通过插值的算法后可以使用已获取Multi-MAPS循环中的数据来计算其他应用程序中其他可能的内存访问模式所对应的机器内存带宽,从而可以加快整个性能模型计算的时间。