GPU架构分析与功耗模型研究

GPU架构分析与功耗模型研究

论文摘要

大规模科学计算现在越来越离不开GPU加速。但是,随着GPU架构计算能力的不断增强,其结构越来越复杂,如何充分发挥其计算能力和如何控制其功耗来实现“绿色计算”成为了一个不可回避的巨大挑战。NVIDIA公司最新推出Fermi架构,该架构中包含了多种计算单元,而且具有完整的多级缓存结构,使得GPU架构更加完善。本文的主要工作和创新包括以下两方面:第一,深入研究该架构中的处理单元和各级存储单元的结构,分析GPU架构的执行特点。根据不同指令的特点,实测得出具体指令在GPU计算单元上的执行周期和并发性能;而针对GPU架构根据不同需求而设计的多级、分类详细的存储器结构,深入研究每一种存储器的特点,获得访问不同存储器所需的执行周期。第二,在深入研究GPU架构的基础上提出一种系统级的功耗模型,该模型首先计算出不同native指令及每次访问存储器消耗的功耗;之后,根据应用在硬件上的执行指令和采样工具获得的采样结果,分析预测其功耗。该功耗模型的预测精度达到百分之九十左右。本课题研究内容是国家863重点项目“新概念高效能计算机体系结构及系统研究开发”(2009AA012201)的一部分。

论文目录

  • 摘要
  • ABSTRACT
  • 图录
  • 表录
  • 第一章 绪论
  • 1.1 课题背景
  • 1.1.1 GPGPU 发展历程
  • 1.1.2 主流GPU 架构
  • 1.1.3 现有的编程模型介绍
  • 1.1.4 GPU 功耗研究现状
  • 1.2 课题的研究内容
  • 1.3 本文的主要工作和组织结构
  • 1.3.1 本文的主要工作和创新点
  • 1.3.2 本文的组织结构
  • 第二章 GPU 基本架构介绍
  • 2.1 NVIDIA GPU 编程架构
  • 2.1.1 CUDA 的编程模型
  • 2.1.2 CUDA 存储模型
  • 2.1.3 PTX ISA
  • 2.1.4 Native 代码
  • 2.2 Fermi 总体架构模型
  • 2.2.1 Fermi 多核计算架构
  • 2.2.2 存储模型
  • 2.2.3 超级多线程技术(GigaThread)
  • 2.2.4 C2050 介绍
  • 2.3 CUDA profiler
  • 2.4 本章小结
  • 第三章 FERMI 架构分析和测试
  • 3.1 计算单元分析
  • 3.1.1 计算单元测试代码
  • 3.1.2 计算单元性能测试结果
  • 3.2 存储单元分析
  • 3.2.1 存储器测量代码
  • 3.2.2 存储器性能分析
  • 3.3 GPU 架构编程的优化方法
  • 3.3.1 全局存储器访问优化
  • 3.3.2 共享存储器充分利用
  • 3.3.3 分支指令和原子操作的避免
  • 3.3.4 线程数目的划分
  • 3.3.5 IO 墙问题
  • 3.4 本章小结
  • 第四章 系统级GPU 功耗模型
  • 4.1 功耗理论模型
  • 4.2 实验装置及实验环境
  • 4.2.1 实验装置
  • 4.2.2 实验环境干扰消除
  • 4.3 参数提取
  • 4.3.1 计算单元指令功耗提取
  • 4.3.2 存储器单元功耗参数提取
  • 4.4 本章小结
  • 第五章 系统级功耗模型验证
  • 5.1 基准测试应用
  • 5.1.1 应用选择原则
  • 5.1.2 选定应用介绍
  • 5.2 模型验证结果及分析
  • 5.3 本章小结
  • 第六章 结束语
  • 6.1 总结
  • 6.2 工作展望
  • 参考文献
  • 附录1
  • 致谢
  • 攻读硕士学位期间已发表或录用的论文
  • 相关论文文献

    • [1].GPU架构的航拍舰船图像拼接算法[J]. 舰船科学技术 2020(06)
    • [2].数字信号相似度方法研究及GPU并行加速[J]. 贵州师范大学学报(自然科学版) 2020(03)
    • [3].基于GPU平台和多源遥感的月度草畜平衡快速评价方法研究[J]. 科技促进发展 2020(Z1)
    • [4].GPU优化的大规模线性方程组并行求解的研究与比较[J]. 信息通信 2016(12)
    • [5].GPU支持的低延迟引力波数据处理[J]. 中国科学:物理学 力学 天文学 2017(01)
    • [6].片上网络良率评估的GPU加速[J]. 浙江大学学报(工学版) 2017(01)
    • [7].基于GPU的图像处理并行算法分析[J]. 中小企业管理与科技(上旬刊) 2017(03)
    • [8].GPU协处理视频编码的服务平台设计[J]. 电脑知识与技术 2016(28)
    • [9].基于GPU的图像处理计算方法分析[J]. 科技风 2017(03)
    • [10].基于GPU的脉冲压缩并行化研究[J]. 航空计算技术 2017(02)
    • [11].基于GPU的图像增强实验设计与实现[J]. 实验技术与管理 2017(05)
    • [12].基于GPU的数字信道化设计[J]. 数字技术与应用 2017(06)
    • [13].基于GPU加速的电力系统静态安全分析研究[J]. 机电信息 2017(27)
    • [14].GPU并行计算分析[J]. 数字通信世界 2017(09)
    • [15].基于双线性插值的图像缩放在GPU上的实现[J]. 微电子学与计算机 2016(11)
    • [16].GPU并行加速的多步逆时偏移在东濮前梨园地区的应用[J]. 物探与化探 2015(01)
    • [17].基于GPU的视频编辑特效技术研究与实现[J]. 科技资讯 2015(12)
    • [18].基于GPU的异构计算技术在超级计算领域的现状及发展展望[J]. 电脑迷 2017(08)
    • [19].瑞士研究人员利用GPU加速的超级计算机模拟宇宙[J]. 中国教育网络 2017(08)
    • [20].一种基于GPU的逆时偏移并行算法[J]. 计算机应用与软件 2013(10)
    • [21].基于GPU并行加速的逆时偏移成像方法[J]. 石油地球物理勘探 2013(05)
    • [22].一种基于GPU的主机接口设计与验证[J]. 航空计算技术 2020(06)
    • [23].局部地形改正快速计算的GPU并行的棱柱法[J]. 测绘学报 2020(11)
    • [24].高性能GPU模拟器的实现[J]. 高技术通讯 2020(06)
    • [25].基于GPU的天基预警雷达信号自适应检测仿真[J]. 计算机仿真 2020(06)
    • [26].未来的汽车需要什么样的GPU?[J]. 单片机与嵌入式系统应用 2018(03)
    • [27].未来的汽车需要什么样的GPU?[J]. 中国集成电路 2018(07)
    • [28].基于GPU的视频序列中运动目标轮廓提取[J]. 电子测量技术 2016(11)
    • [29].基于GPU加速的包络波形反演[J]. 物探化探计算技术 2017(02)
    • [30].基于GPU的高质量隐式曲面四边形化[J]. 计算机辅助设计与图形学学报 2016(04)

    标签:;  ;  ;  ;  

    GPU架构分析与功耗模型研究
    下载Doc文档

    猜你喜欢