Print

基于路暂停方法的高性能低功耗Cache研究

论文摘要

Cache通过解决高速处理器和低速主存之间的匹配问题,提高了计算机系统的性能。但是高性能Cache本身也消耗了处理器的大部分能量。高端处理器的温度不断升高,需要低功耗解决方案;嵌入式处理器芯片不仅缺乏散热能力,而且更需要低能耗技术来延长电池供电时间,因此设计者必须同时考虑性能、能量消耗等多个方面因素。首先,从计算机体系结构的角度对Cache的功耗进行了研究,分析了以往的系统级功耗优化方法。采用能够有效地减少Cache存取过程中内部活动的路暂停Cache模型,对其进行了修改,加入了分离比较器,提出了一种新的分离比较Cache原型。它能够在节省能耗的同时,显著地提高系统性能。在此基础上,引入有效位预判的方法,提出了一种带有效位预判的分离比较Cache原型。它进一步排除对无效块读取的能耗,从而确保同时获得高性能和低功耗。其次,分析研究了体系结构建模仿真工具Simplescalar和Wattch。Simplescalar是支持乱序流水线的处理器和动态调度的多级存储结构的体系结构级模拟器;Wattch在Simplescalar的基础上添加了计算Cache能耗和访存时间的功能。通过该平台,可以在系统结构的设计初期,确定Cache的组织结构,以达到要求的Cache能耗指标。最后,利用Wattch平台,通过具体实验验证了分离比较Cache方法和带有效位预判的分离比较Cache方法的有效性。模拟结果表明:带有效位预判的分离比较Cache能够节省传统四路组相联Cache平均8%的访存时间和60%的能耗。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究目的和意义
  • 1.2 论文工作
  • 1.3 论文结构
  • 第二章 背景知识及相关研究
  • 2.1 CACHE 工作机制
  • 2.1.1 映象规则
  • 2.1.2 查找方法
  • 2.1.3 替换算法
  • 2.1.4 Cache 的一致性问题
  • 2.2 高性能低功耗CACHE 的相关研究
  • 2.2.1 基于添加辅助Cache 的方法
  • 2.2.2 基于预测技术的方法
  • 2.2.3 基于动态可重构技术的方法
  • 2.2.4 基于部分标识比较的方法
  • 2.2.5 其他改进的方法
  • 2.3 小结
  • 第三章 分离比较CACHE
  • 3.1 传统组相联CACHE
  • 3.2 路暂停CACHE
  • 3.3 分离比较CACHE
  • 3.3.1 分离比较Cache 的结构
  • 3.3.2 访问时间和能耗分析
  • 3.4 小结
  • 第四章 带有效位预判的分离比较CACHE
  • 4.1 带有效位预判的路预测CACHE
  • 4.2 带有效位预判的分离比较CACHE
  • 4.2.1 带有效位预判的分离比较Cache 的结构
  • 4.2.2 访问时间和能耗分析
  • 4.3 小结
  • 第五章 仿真实验和结果
  • 5.1 实验平台介绍
  • 5.1.1 SimpleScalar 部分
  • 5.1.2 Wattch 部分
  • 5.1.3 SPEC95 基准测试程序部分
  • 5.2 仿真实验及分析
  • 5.2.1 分离比较Cache 部分
  • 5.2.2 带有效位预判的分离比较Cache 部分
  • 5.3 小结
  • 结论
  • 1.本文工作总结
  • 2.下一步工作展望
  • 参考文献
  • 致 谢
  • 附录 A (攻读学位期间所发表的学术论文目录)
  • 相关论文文献

    本文来源: https://www.lw50.cn/article/b6094aa0a0c83651f242c616.html