论文摘要
现在的并行程序开发面临着两个十分重要的问题。首先,多核处理器的出现以及逐渐普及,对并行程序设计开发提出了更高的要求。其次,随着工艺水平的进步和处理器体系结果的发展,处理器的速度已经远远超过了存储器的速度,并且这种速度上的差异在逐渐扩大,从而导致了“存储墙”的出现。传统的程序并行化技术固然可以利用多核的特性,但其基本不考虑程序的局部性,导致程序的运行性能较差。本文针对循环嵌套结构中的一类程序,研究出了一套面向程序局部性的并行优化方法。首先,本文提出了一种新的并行划分方法。该划分方法考虑了同线程内不同访存之间(U-U)的重用关系,并尽量利用这种重用关系来提高程序的局部性。而后,本文还提出了一种基于新并行划分方法的程序优化方法。该优化方法考虑了线程间访存(T-T)的重用关系,并且也同样利用这种重用关系进一步增强程序的局部性。此外,我们还在研究中发现了局部性在层次存储结构中的“漂移”现象。最后,我们通过实验证明,使用该套方法对程序并行优化,可以显著降低程序的运行时间,提高程序的运行效率。我们还给出了该套方法的编译实现框架,并进行了总结与展望。
论文目录
相关论文文献
- [1].多核程序交互理论及应用[J]. 计算机工程与科学 2014(01)
- [2].基于迭代序的流程序局部性分析和优化[J]. 计算机研究与发展 2012(06)
- [3].基于程序局部性引导的有界模型检测优化方法[J]. 通信学报 2018(03)