二维SIMD结构的编译优化与功耗研究

二维SIMD结构的编译优化与功耗研究

论文摘要

近年来随着多媒体应用的日益普及和多样化,这些应用对底层设备的处理能力也提出越来越高的要求,采用传统的一维SIMD结构或者为专门应用设计的ASIC已经无法满足这些应用。二维SIMD结构由于其高性能、可编程和低功耗的特性,已经引起了学术界和工业界的广泛关注,许多大公司例如:Mortorala、Intrinsity、Morphotech和Folsom等,都相继推出了采用二维SIMD结构作为多媒体加速部件的SOC。二维SIMD结构是一个由N×N的处理单元(PE)按照一定的拓扑结构连接组成的阵列结构,其同行或列上的处理单元能够以SIMD方式工作,多行或列之间并行执行,基于二维SIMD结构的并行处理能力,它常被作为多媒体加速部件与通用处理器集成在一个SOC上。虽然二维SIMD结构已经得到了越来越广泛的应用,但目前针对二维SIMD结构的编译优化技术研究却远远滞后于该结构的普及。在这种情况下,程序员只能通过手工编写内嵌汇编代码的方式利用二维SIMD结构的并行性,这就要求程序员不仅熟悉应用程序,而且还要对底层结构有深入的了解,并且具备相当的并行处理编程能力,这都极大增加了程序员的负担。同时由于没有有效编译优化技术的支持,目前针对二维SIMD结构的研究不够深入,关于二维SIMD结构的功耗特性及其与性能之间关系的研究都没有展开,这都给二维SIMD结构的更广泛应用设置了障碍,因此针对二维SIMD结构进行编译优化技术的研究具有十分重要的学术价值和现实意义。本文对目前广泛采用的二维SIMD结构软硬件进行了分析,并在此基础上设计了二维SIMD结构的模拟器、编译工具链和编译优化系统,还在编译优化系统的帮组下对二维SIMD结构的功耗特性展开了研究,本文的主要贡献如下所示:1.对目前广泛采用的二维SIMD结构软硬件特性进行了分析,总结了该类型结构的特点,并在此基础上设计了基于SimpleScalar的二维SIMD结构性能模拟器、功能模拟器和编译工具链。2.针对多媒体应用程序的特点和二维SIMD结构的特性提出了一种二维SIMD结构的编译框架和一系列的编译优化算法,不仅缓解了二维SIMD结构中普遍存在的限制问题,而且妥善处理了二维SIMD结构的三种并行性,特别是SIMD部件间的并行性,这在传统并行理论框架下并不能有效解决。3.从体系结构的角度对二维SIMD结构的功耗特性进行了研究,这为二维SIMD处理器体系结构级低功耗设计和编译器级低功耗优化研究奠定了基础。

论文目录

  • 目录
  • 摘要
  • Abstract
  • 第一章 引言
  • 1.1 应用需求
  • 1.2 二维SIMD结构
  • 1.3 相关研究工作
  • 1.4 本文的安排
  • 第二章 二维SIMD基准结构
  • 2.1 MorlphoSys体系结构
  • 2.2 MorlphoSys指令系统
  • 2.3 MorlphoSys系统操作
  • 第三章 基准结构模拟器
  • 3.1 SimpleScalar模拟器
  • 3.2 二维SIMD结构功能模拟
  • 3.2.1 驱动二维SIMD指令集
  • 3.2.2 二维SIMD结构功能模拟
  • 3.3 二维SIMD结构性能模拟
  • 3.3.1 配置二维SIMD部件
  • 3.3.2 二维SIMD结构融入流水线
  • 第四章 二维SIMD结构编译优化
  • 4.1 可行性分析
  • 4.2 优化预处理
  • 4.2.1 代码标准化
  • 4.2.2 回滚展开的循环
  • 4.2.3 消除简单条件分支
  • 4.2.4 变换SAD操作
  • 4.3 一维SIMD优化
  • 4.3.1 规约操作优化
  • 4.3.2 数据依赖分析
  • 4.3.3 一维SIMD优化
  • 4.4 二维SIMD优化
  • 4.4.1 公共向量优化
  • 4.4.2 流水线优化
  • 4.4.3 部署并行任务
  • 4.4.4 数据重组织
  • 第五章 二维SIMD并行任务部署
  • 5.1 并行任务前驱图
  • 5.1.1 基本块划分
  • 5.1.2 并行任务前驱图
  • 5.2 节点分层
  • 5.2.1 分层驱动
  • 5.2.2 分层算法
  • 5.3 并行任务部署
  • 5.3.1 概念及表示法
  • 5.3.2 部署策略
  • 5.3.3 部署算法
  • 第六章 实验与数据
  • 6.1 实验环境与方法
  • 6.1.1 编译工具链
  • 6.1.2 测试程序
  • 6.2 实验结果
  • 6.3 数据分析
  • 第七章 二维SIMD结构功耗研究
  • 7.1 功耗研究现状
  • 7.2 二维SIMD结构功耗模拟
  • 7.2.1 参数化功耗模型
  • 7.2.2 动态功耗模型
  • 7.2.3 模型的实现
  • 7.3 测试与分析
  • 7.4 体系结构级功耗优化
  • 第八章 总结与展望
  • 8.1 总结
  • 8.2 将来的工作
  • 参考文献
  • 发表文章目录
  • 致谢
  • 相关论文文献

    • [1].面向多面体模型的非规则程序SIMD投机优化技术[J]. 信息工程大学学报 2014(03)
    • [2].SIMD技术在数字图像处理中的应用分析[J]. 计算机光盘软件与应用 2012(03)
    • [3].为4D无线通信设计基于软件无线电及变宽度SIMD处理器体系结构[J]. 电子产品世界 2015(09)
    • [4].SIMD指令集设计空间的形式化描述[J]. 计算机科学 2013(06)
    • [5].龙芯3B的SIMD编译优化及分析[J]. 小型微型计算机系统 2012(12)
    • [6].面向SIMD扩展部件的循环优化研究[J]. 计算机科学 2014(05)
    • [7].SIMD计算机的优化编译器设计[J]. 计算机工程 2009(01)
    • [8].Divergent Branch Threads Compaction for Efficient SIMD Control Flow[J]. Chinese Journal of Electronics 2015(02)
    • [9].共享主存多SIMD结构及编译技术研究[J]. 计算机科学与探索 2009(01)
    • [10].使用SIMD协处理器的高性能声码器[J]. 计算机工程与应用 2009(36)
    • [11].SIMD扩展部件数据依赖关系约束条件研究[J]. 信息工程大学学报 2014(01)
    • [12].Improving SIMD Utilization with Thread-Lane Shuffled Compaction in GPGPU[J]. Chinese Journal of Electronics 2015(04)
    • [13].软件SIMD的研究及应用[J]. 计算机工程 2010(19)
    • [14].基于SIMD的渐进式网络编码的高效实现[J]. 微计算机信息 2009(15)
    • [15].时钟共享多线程处理器SIMD控制器设计与实现[J]. 电子技术应用 2016(11)
    • [16].二维SIMD结构的低功耗调度[J]. 计算机工程 2009(10)
    • [17].基于龙芯SIMD技术的H.264视频解码优化[J]. 计算机工程与设计 2017(12)
    • [18].SIMD非对齐访存结构设计与实现[J]. 计算机工程 2016(09)
    • [19].利用SIMD指令加速VLSI设计规则检查[J]. 微电子学与计算机 2008(07)
    • [20].Efficient SIMD optimization for media processors[J]. Journal of Zhejiang University(Science A:An International Applied Physics & Engineering Journal) 2008(04)
    • [21].基于SIMD-BF模型的并行FFT算法设计与实现[J]. 电声技术 2014(12)
    • [22].Blocking optimized SIMD tree search on modern processors[J]. Journal of Shanghai University(English Edition) 2011(05)
    • [23].SIMD自动向量化编译优化概述[J]. 软件学报 2015(06)
    • [24].高性能算术SIMD模块的电路设计[J]. 微电子学与计算机 2010(09)
    • [25].BWDSP SIMD指令的WHIRL中间表示生成研究[J]. 中国集成电路 2015(03)
    • [26].SIMD向量指令的非满载使用方法研究[J]. 计算机科学 2015(07)
    • [27].基于CUDA的GPU条件分支分歧聚合优化策略[J]. 中国石油大学学报(自然科学版) 2014(03)
    • [28].适用于SIMD体系结构的FPGA分页仿真模型研究[J]. 计算机研究与发展 2011(01)
    • [29].一种共享主存二维SIMD结构资源分配算法的改进与实现[J]. 计算机工程与科学 2008(09)
    • [30].一种支持SIMD体系结构的高效分布式堆栈——HEDSSA[J]. 计算机工程与科学 2017(11)

    标签:;  ;  ;  ;  

    二维SIMD结构的编译优化与功耗研究
    下载Doc文档

    猜你喜欢