科学计算程序的综合优化技术研究

科学计算程序的综合优化技术研究

论文摘要

作为解决大规模计算问题的重要手段,高性能计算越来越广泛地应用到科学与工程的各个领域。随着高性能计算的发展,各种并行计算机不断涌现并得到广泛使用。目前国内外流行的并行计算机体系结构主要有SMP、MPP、COW和SMP集群等,其中SMP集群体系结构结合了共享存储和分布式存储两种体系结构的特点,同时兼顾了计算性能和可扩展性两个方面。本文围绕这种多级并行体系结构中的超节点级、节点级和单机指令级三个层次的并行性开发与优化,在科学计算程序的综合优化技术研究方面做了以下的工作与创新:(1)针对SMP集群体系结构提出了多级并行计算时间模型,用于程序性能的微观分析;将单机处理速度与加速比统一起来,提出了基于单机优化加速因子的多级并行优化加速比评价模型,该模型分别从三个并行层次的角度出发对程序性能进行评价,并指导对程序的改进与优化。(2)提出了计算网格到处理器网格的新型映射策略,对处理器进行合理的逻辑组织,以最大限度地减少通信开销。(3)以实际测试时间为基础,提出了等通信需求可扩展模型,用于分析并行系统的可扩展性。(4)对长方网格上的并行矩阵乘算法做了进一步改进,并针对改进算法,分别从进程级、线程级和指令级对其进行多级并行性开发与性能优化。实验结果表明,改进算法采用混合编程模型比单纯采用MPI编程模型具有更高的性能。(5)针对三维低马赫数流动和爆炸冲击波模拟两个科学计算问题,将串行算法的改进与优化、区域与迭代空间分解、数据映射等技术相结合,实现了它们的高效并行程序,使性能得到显著提高。在此基础上,对测试结果进行了详细的分析,得出了一些有用的结论。

论文目录

  • 图目录
  • 表目录
  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 课题背景
  • 1.2 国内外研究现状
  • 1.2.1 多级并行性开发研究现状
  • 1.2.2 性能评价与分析模型研究现状
  • 1.3 本文主要工作与创新
  • 1.4 本文组织结构
  • 第二章 并行系统可扩展性研究
  • 2.1 引言
  • 2.2 常用可扩展模型与分析
  • 2.3 可扩展模型分类与可扩展性的一般定义
  • 2.3.1 可扩展模型的分类
  • 2.3.2 可扩展性的一般定义
  • 2.4 等通信需求可扩展模型
  • 2.4.1 问题的提出
  • 2.4.2 等通信需求模型的描述
  • 2.4.3 等通信需求模型的意义
  • 2.5 实例分析
  • 2.6 本章小结
  • 第三章 多级并行优化的性能分析评价与映射策略
  • 3.1 多级并行计算时间模型
  • 3.1.1 共享存储时间模型
  • 3.1.2 分布式存储时间模型
  • 3.1.3 多级并行计算时间模型
  • 3.2 多级并行优化的性能评价与分析
  • 3.2.1 SMP 集群性能的衡量标准
  • 3.2.2 加速比性能评价模型
  • 3.3 常用的多级并行优化技术
  • 3.3.1 MPI 并行与优化技术
  • 3.3.2 OpenMP 并行与优化技术
  • 3.3.3 单处理器的性能优化
  • 3.3.4 混合编程的一些问题
  • 3.4 计算网格到处理器网格的新型数据映射策略
  • 3.4.1 问题的提出
  • 3.4.2 二维计算网格到处理器网格的数据映射策略
  • 3.4.3 三维计算网格到处理器网格的数据映射策略
  • 3.5 本章小结
  • 第四章 并行矩阵乘的多级并行性开发与性能优化
  • 4.1 引言
  • 4.2 正方网格上的Fox 算法
  • 4.3 长方网格上的Fox 算法
  • 4.4 长方网格上的改进型Fox 算法
  • 4.5 多级并行性开发与性能优化
  • 4.5.1 实现过程
  • 4.5.2 实验结果
  • 4.5.3 结果分析
  • 4.6 本章小结
  • 第五章 CFD 业务程序LM3D 的多级并行性开发与性能优化
  • 5.1 引言
  • 5.2 控制方程及其求解方法
  • 5.3 LM3D 并行计算方法
  • 5.4 多级并行性开发
  • 5.4.1 离散网格的OpenMP 划分
  • 5.4.2 MPI+OpenMP 混合编程实现
  • 5.5 实验结果与分析
  • 5.6 LM3D 单机性能优化
  • 5.7 本章小结
  • 第六章 爆炸冲击波模拟程序的并行性开发与性能优化
  • 6.1 引言
  • 6.2 控制方程
  • 6.3 单机性能优化
  • 6.4 并行计算方法
  • 6.4.1 数据相关性及其对并行计算的影响
  • 6.4.2 对离散网格进行区域分解的思想
  • 6.5 并行数值模拟性能评价与分析
  • 6.5.1 并行程序性能评价
  • 6.5.2 新型数据映射策略的应用与分析
  • 6.5.3 并行计算与串行计算结果的误差分析
  • 6.6 本章小结
  • 第七章 结束语
  • 致谢
  • 攻读硕士期间发表的论文
  • 参考文献
  • 相关论文文献

    • [1].科学计算程序的验证和确认[J]. 北京理工大学学报 2010(03)
    • [2].面向科学计算程序的向量化[J]. 信息工程大学学报 2011(06)
    • [3].科学计算程序在FT64流处理器上的实现、优化和评测[J]. 计算机工程与科学 2008(09)
    • [4].WRF与NPB科学计算程序在云平台上的性能研究[J]. 计算机集成制造系统 2018(07)
    • [5].面向GPU存储优化的程序重构方法[J]. 小型微型计算机系统 2011(10)
    • [6].基于Babel的公共构件程序设计[J]. 科技风 2009(06)
    • [7].并行环境与集群系统有效速度的实用测试算法分析[J]. 中国商界(上半月) 2010(11)
    • [8].结构体向量化中的存储优化[J]. 小型微型计算机系统 2016(09)

    标签:;  ;  ;  ;  ;  ;  ;  

    科学计算程序的综合优化技术研究
    下载Doc文档

    猜你喜欢