论文摘要
随着近年来图形处理器(GPU)性能的飞速发展,GPU在计算机并行计算等相关领域尤其是在大规模的科学计算中发挥着极其重要的作用,采用CPU与GPU协作来加速大规模科学计算也成为今后高性能计算发展的必然趋势,因此基于CPU-GPU的并行计算模型日趋成为国内外高性能计算领域的热点研究方向,目前已经提出了许多基于CPU-GPU的并行计算模型,但多数是由GPU或者CPU单独进行计算,未能充分发挥CPU与GPU的整体性能。本文依据CPU与GPU的自身特点以及它们在并行计算中各自的优势,提出了一种基于CPU-GPU协作的计算模型,设计了一种任务调度机制,使得CPU与GPU能同时参与对任务的计算,并给出了协调策略,使得数据能在CPU与GPU上动态划分,实现各处理器上的负载均衡,与传统模型相比,更加高效地利用现有资源,该模型还提出了一种针对大规模任务的数据划分方法,有效解决了GPU无法一次容纳所有数据的问题,该模型的任务调度机制和划分方法适用于诸多典型应用,如矩阵运算、图像处理和文本处理等大规模并行计算,并设计了面向用户的接口模型,实现了内部并行对用户的透明,使用户能够方便有效地实现其并行需求。GPU的优化编程是GPU通用计算的核心部分之一,因此本文在提出的计算模型基础上,实现了3种典型应用,分析并结合应用算法的特点,设计了有效的并行算法,采用各种并行优化编程技术,试验结果表明模型给出的策略以及采用的优化编程方法是可行有效的。
论文目录
摘要Abstract1 绪论1.1 研究背景和意义1.2 研究现状1.2.1 CPU-GPU异构计算的研究现状1.2.2 CPU-GPU异构计算模型的研究现状1.3 本文的研究内容和主要工作1.4 研究内容及任务2 OpenCL与GPU编程优化2.1 AMD流处理器体系结构2.2 OpenCL架构2.2.1 平台模型2.2.2 执行模型2.2.3 内存模型2.2.4 编程模型2.3 OpenCL性能优化2.3.1 数据传输优化2.3.2 资源利用优化2.3.3 访存优化2.3.4 指令优化3 基于CPU-GPU异构平台的计算模型3.1 模型架构与特点3.1.1 模型的提出3.1.2 模型架构与特点3.2 系统模型3.2.1 任务数据划分3.2.2 任务评价3.2.3 数据调度处理3.3 接口模型3.4 计算模型总结4 模型实现与性能优化4.1 矩阵乘法的实现与优化4.1.1 矩阵乘法的模型实现4.1.2 矩阵乘法的性能优化4.2 三角矩阵求逆的实现与优化4.2.1 三角矩阵求逆的模型实现4.2.2 三角矩阵求逆的性能优化4.3 求解稠密线程方程组的实现与优化4.3.1 LU分解及其分块算法4.3.2 求解稠密线程方程组的模型实现4.3.3 Right-looking算法的性能优化4.4 本章小结5 性能测试与分析5.1 矩阵乘法的性能测试与分析5.2 三角矩阵求逆的性能测试与分析5.3 稠密线性方程组的性能测试与分析6 结论与展望参考文献致谢
相关论文文献
标签:科学计算论文; 计算模型论文; 优化编程论文;