面向循环级数组访问的数据预取技术研究

面向循环级数组访问的数据预取技术研究

论文摘要

微处理器和DRAM之间日趋增大的性能差距促使人们探索新的技术以减少或者隐藏访存延迟。Cache层次存储结构能够有效减少大部分运用程序的访存延迟,但是在科学计算程序中,访存延迟在程序执行时间中占很大比重,Cache的利用率低。这类程序中存在大量的线性访问的数组,数组规模越大,强制失效和容量失效的次数也就越多。数据预取技术是解决这类访存失效的有效方法,它预测可能的失效情况,提前发出数据访问操作,将访存与计算重叠起来,有效地隐藏了访存延迟。本文对科学计算程序中循环级数组访问的数据预取技术进行了深入研究和探讨。文章详细分析了各种预取方案的优劣,讨论了研究对象的特点和各种影响因素,提出了一种软硬件结合的数据预取方法。以此方法为指导,本文首先对预取调度问题进行了重点研究,提出了一种新的预取度算法,改进了预取距离计算公式,并在Suif2平台上实现了预取分析算法。其次,本文还设计了一个自适应型的顺序预取硬件单元,并移植了Simplescalar模拟器,模拟验证了该硬件单元的功能行为。实验评测结果表明,本文的数据预取方法可以有效地减少循环级数组访问的访存延迟,降低程序的执行时间,提高系统性能。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 引言
  • 1.1 课题背景及意义
  • 1.2 研究现状
  • 1.3 课题研究内容和主要工作
  • 1.4 论文结构
  • 第二章 相关研究工作
  • 2.1 预取的三个基本问题
  • 2.2 硬件数据预取
  • 2.2.1 顺序型硬件预取
  • 2.2.2 任意步长的预取
  • 2.3 软件数据预取
  • 2.3.1 预取距离
  • 2.3.2 GCC中的预取
  • 2.4 混合型预取方案
  • 2.5 典型体系结构对数据预取的支持
  • 2.5.1 IA-64平台
  • 2.5.2 MIPS平台
  • 2.5.3 Alpha平台
  • 2.6 数据预取技术小结
  • 第三章 循环级数组访问的预取技术研究
  • 3.1 循环级数组访存行为分析
  • 3.2 循环级数组访问的预取特点
  • 3.3 预取分析
  • 3.3.1 局部性分析
  • 3.3.2 循环分解和流水调度
  • 3.4 预取调度
  • 3.4.1 预取度算法
  • 3.4.2 预取距离算法
  • 第四章 预取分析算法实现
  • 4.1 预取分析流程
  • 4.2 主要算法
  • 4.2.1 局部性分析算法
  • 4.2.2 预取调度算法
  • 4.3 基于Suif2平台的算法实现
  • 4.3.1 Suif2简介
  • 4.3.2 算法实现
  • 第五章 硬件预取单元的设计与模拟验证
  • 5.1 预取硬件单元
  • 5.2 硬件预取单元的模拟
  • 5.2.1 Simplescalr模拟平台
  • 5.2.2 模拟器移植
  • 5.3 实验
  • 5.3.1 测试程序
  • 5.3.2 实验流程
  • 5.3.3 实验参数
  • 5.3.4 测试结果
  • 5.4 结论
  • 第六章 结束语
  • 6.1 工作总结
  • 6.2 展望
  • 致谢
  • 参考文献
  • 作者在学期间取得的学术成果
  • 攻读硕士学位期间参加的科研工作
  • 相关论文文献

    • [1].预取技术分析[J]. 电子技术应用 2015(06)
    • [2].浅析缓存预取技术[J]. 现代计算机(专业版) 2011(13)
    • [3].一种软硬结合的预取技术探讨[J]. 中国新技术新产品 2010(10)
    • [4].内容分发网络预取技术综述[J]. 电子技术应用 2019(04)
    • [5].基于双倍步长数据流的硬件预取机制[J]. 计算机工程 2019(06)
    • [6].基于交织预取率的帮助线程预取质量调节算法[J]. 计算机应用研究 2019(02)
    • [7].Web缓存与预取系统的设计与实现[J]. 计算机产品与流通 2018(09)
    • [8].加速不是减速调教Prefetch[J]. 电脑迷 2009(04)
    • [9].个性化推荐与Web预取技术对比[J]. 北华大学学报(自然科学版) 2010(04)
    • [10].帮助线程预取技术研究综述[J]. 计算机科学 2013(07)
    • [11].基于多项式回归预取技术缓存管理的研究[J]. 佳木斯大学学报(自然科学版) 2012(05)
    • [12].Web预取技术的研究[J]. 微计算机应用 2008(07)
    • [13].基于主观贝叶斯方法的数据预取技术[J]. 计算机应用 2008(S1)
    • [14].基于客户-服务器双端去重的Web预取新方法[J]. 计算机技术与发展 2019(04)
    • [15].提升处理器指针追逐访存性能的指令标签辅助的数据预取机制[J]. 高技术通讯 2017(Z2)
    • [16].申威处理器硬件数据预取技术的实现[J]. 计算机工程与科学 2015(11)
    • [17].Web预取技术综述[J]. 计算机研究与发展 2009(02)
    • [18].搜狗预取技术专利公开,网页或可实现极速秒开[J]. 电子知识产权 2014(08)
    • [19].增量预取技术在持久化框架中的研究与实现[J]. 微计算机信息 2010(18)
    • [20].一种改进的多核处理器硬件预取技术[J]. 计算机科学 2012(S2)
    • [21].基于MCU的Flash预取加速控制器设计与实现[J]. 电子与封装 2018(01)
    • [22].利用空间优化的增强学习Sarsa改进预取算法[J]. 计算机科学 2019(03)
    • [23].基于给定访问序列的NFS预取技术[J]. 计算机科学 2011(08)
    • [24].面向链式数据结构的间隔预取策略解析[J]. 自动化与仪器仪表 2018(07)
    • [25].基于多项式回归的预取技术的研究[J]. 现代电子技术 2012(22)
    • [26].基于线程的多路径数据预取技术研究[J]. 计算机研究与发展 2011(S1)
    • [27].基于云端的Web数据挖掘预取技术研究[J]. 统计与决策 2010(22)
    • [28].利用缓存预取技术优化在线考试系统[J]. 电脑知识与技术 2017(07)
    • [29].基于预测模型和缓存替换策略的网络资源访问研究[J]. 科技通报 2017(10)
    • [30].持久化系统中对象预取技术的研究[J]. 软件导刊 2010(06)

    标签:;  ;  ;  ;  ;  

    面向循环级数组访问的数据预取技术研究
    下载Doc文档

    猜你喜欢