论文摘要
作为解决大规模计算问题的重要手段,高性能计算越来越广泛地应用到科学与工程的各个领域。随着高性能计算的发展,各种并行计算机不断涌现并得到广泛使用。目前国内外流行的并行计算机体系结构主要有SMP、MPP、COW和SMP集群等,其中SMP集群体系结构结合了共享存储和分布式存储两种体系结构的特点,同时兼顾了计算性能和可扩展性两个方面。本文围绕这种多级并行体系结构中的超节点级、节点级和单机指令级三个层次的并行性开发与优化,在科学计算程序的综合优化技术研究方面做了以下的工作与创新:(1)针对SMP集群体系结构提出了多级并行计算时间模型,用于程序性能的微观分析;将单机处理速度与加速比统一起来,提出了基于单机优化加速因子的多级并行优化加速比评价模型,该模型分别从三个并行层次的角度出发对程序性能进行评价,并指导对程序的改进与优化。(2)提出了计算网格到处理器网格的新型映射策略,对处理器进行合理的逻辑组织,以最大限度地减少通信开销。(3)以实际测试时间为基础,提出了等通信需求可扩展模型,用于分析并行系统的可扩展性。(4)对长方网格上的并行矩阵乘算法做了进一步改进,并针对改进算法,分别从进程级、线程级和指令级对其进行多级并行性开发与性能优化。实验结果表明,改进算法采用混合编程模型比单纯采用MPI编程模型具有更高的性能。(5)针对三维低马赫数流动和爆炸冲击波模拟两个科学计算问题,将串行算法的改进与优化、区域与迭代空间分解、数据映射等技术相结合,实现了它们的高效并行程序,使性能得到显著提高。在此基础上,对测试结果进行了详细的分析,得出了一些有用的结论。
论文目录
相关论文文献
- [1].科学计算程序的验证和确认[J]. 北京理工大学学报 2010(03)
- [2].面向科学计算程序的向量化[J]. 信息工程大学学报 2011(06)
- [3].科学计算程序在FT64流处理器上的实现、优化和评测[J]. 计算机工程与科学 2008(09)
- [4].WRF与NPB科学计算程序在云平台上的性能研究[J]. 计算机集成制造系统 2018(07)
- [5].面向GPU存储优化的程序重构方法[J]. 小型微型计算机系统 2011(10)
- [6].基于Babel的公共构件程序设计[J]. 科技风 2009(06)
- [7].并行环境与集群系统有效速度的实用测试算法分析[J]. 中国商界(上半月) 2010(11)
- [8].结构体向量化中的存储优化[J]. 小型微型计算机系统 2016(09)
标签:集群论文; 并行计算时间模型论文; 加速比论文; 可扩展模型论文; 多级并行论文; 单机性能优化论文; 映射策略论文;