基于片上SRAM布局的存储子系统能耗优化研究

基于片上SRAM布局的存储子系统能耗优化研究

论文摘要

随着半导体制造工艺和集成电路设计能力的不断进步,涌现出大量功能强大且价格低廉的SoC芯片,使得电子终端设备具有了前所未有的强大处理能力,但这也导致系统的能耗问题日益突出,特别是在采用电池供电的手持娱乐通讯电子终端中。能耗过大除了会缩短电池供电时间外,还会引发其他问题,诸如导致系统发热量过大,进而影响系统稳定性,甚至缩短系统使用寿命等。研究表明,对基于RISC核的嵌入式系统来说,在面向影像、视频的应用中,能耗的主要来源不在于数据通路和控制器,而在于对存储器的频繁访问,其中片外存储器成为能耗主要的消费者,约占整个系统的50%-80%。降低存储子系统能耗已经成为降低整个系统能耗的有效手段。论文的研究点正在于此,它以Garfield系统为研究对象,以外部存储器接口EMI、片上SRAM,片外SDRAM为存储子系统的目标架构,提出一套通过修改应用程序的存储器布局进行存储子系统能耗优化的方法,并结合Garfield高层软件模型进行评估。论文首先详细分析了SimpleScalar模拟器,并和Garfield系统进行比较,根据两者在内核结构、流水线和存储器层次结构上的显著差异,指明了Garfield高层软件模型的架构。论文接着构建Garfield系统高层软件模型,包含ARM7TDMI内核软件模型、存储子系统软件模型、参数化可配的能耗评估模块三个部分,并实现了两级层次性体系结构级能耗评估的架构。该软件模型不仅考虑了ARM7TDMI内部功能单元的申请响应和延时,也考虑了存储子系统的操作延时。仿真实验表明,Garfield高层软件模型可以正确解释并执行ARM的可执行程序,具有时序精确度高,仿真速度快的优点。该模型还可以根据研究人员关注点的不同,完成程序执行过程中信息的统计和输出。这样,Garfield高层软件模型成为评估存储子系统能耗的实验平台。在研究片上SRAM布局优化的过程中,论文进行了大量深入细致的分析。在研究对象划分策略时,不仅考虑了全局变量、局部变量、栈等前人已经关注的因素,更通过粒度划分,将函数划分为指令块。分析对象时,不仅注重分析对象自身特性,如体积、访问次数等,而且首次考虑了对象之间的内在联系,并提出利用扩展控制流图(ECFG)体现函数和全局变量,以及函数之间的关系。计算能耗收益和片上SRAM容积时,不仅考虑了大跨度空间跳转引发的对象指令数和体积变化,更充分考虑了对象之间关系对系统能耗收益和片上SRAM容量的影响。分析对象的存储器分配问题时,首先将该问题表述为经典的0/1背包问题,接着指出该问题的特殊性,提出改进后的贪心算法。为解决片上SRAM容量过小和应用程序体积相对较大的矛盾,本文还探讨了动态布局优化技术,它将时间信息作为各个对象的属性,提出了对象的时间有效性概念,从而为解决生命期非交叠对象之间共享存储器空间的难题提供了条件,大大简化了问题的复杂度。该方法还弥补了前人研究中循环内部不能包含条件分支,以及研究对象种类不全面的缺陷。仿真实验表明,采用静态布局优化只需将为数不多的关键对象置入片上SRAM,存储子系统能耗大幅降低,一般为50%左右,同时程序的执行时间也显著下降。采用动态布局优化,和静态布局优化技术相比,达到相同的优化效果,所需片上SRAM容量更小。流片成功后,硬件实测结果表明基于片上SRAM的布局优化技术确实可以有效降低存储子系统能耗,降幅和仿真结果基本一致。论文还分析了片上SRAM能耗与面积的关系,指出Garfield芯片中片上SRAM的合理定制方案。论文最后比较了片上SRAM和Cache对能耗的优化效果,指出在嵌入式SoC芯片设计中,综合考虑性能、能耗、面积等限制因素,定制芯片的片上SRAM更具优势。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题研究的背景
  • 1.2 论文的主要工作和创新点
  • 1.2.1 论文的主要工作
  • 1.2.2 论文的创新点
  • 1.3 论文的组织结构
  • 第二章 系统级软件模型和存储子系统研究综述
  • 2.1 系统芯片的高层软件模型研究
  • 2.1.1 高层软件模型的发展现状
  • 2.1.2 高层软件模型中的能耗模型研究
  • 2.2 存储子系统的能耗优化技术综述
  • 2.2.1 存储子系统层次性结构及能耗优化方法
  • 2.2.1.1 定制存储器层次结构
  • 2.2.1.2 修改特定应用的存储要求和访问模式
  • 2.2.1.3 硬件定制和软件优化的综合
  • 2.2.2 基于SPM 的能耗优化技术研究
  • 2.2.2.1 SPM 和Cache 的比较
  • 2.2.2.2 SPM 布局优化技术的研究
  • 第三章 SimpleScalar 模拟器与Garfield 系统分析
  • 3.1 SimpleScalar 模拟器
  • 3.1.1 SimpleScalar 模拟器简介
  • 3.1.2 SimpleScalar 模拟器的软件架构
  • 3.1.3 SimpleScalar 模拟器的内核分析
  • 3.1.3.1 模拟器的主要数据结构
  • 3.1.3.2 Out-of-Order 模拟器流水线分析
  • 3.2 Garfield 芯片
  • 3.2.1 ARM7TDMI 内核
  • 3.2.1.1 ARM7TDMI 的基本特点
  • 3.2.1.2 ARM7TDMI 的架构
  • 3.2.1.3 ARM7TDMI 的三级流水特性
  • 3.2.1.4 ARM7TDMI 的存储器存储方式
  • 3.2.1.5 ARM7TDMI 的寄存器
  • 3.2.2 EMI(External Memory Interface)
  • 3.3 Garfield 系统中的层次性存储系统
  • 3.3.1 片上SRAM
  • 3.3.2 SDRAM
  • 3.4 简化的软件模型架构
  • 第四章 Garfield 系统高层软件模型
  • 4.1 ARM7TDMI Core 的高层软件模型
  • 4.1.1 寄存器模拟
  • 4.1.2 指令流水技术
  • 4.1.2.1 ARM7TDMI 的指令流水
  • 4.1.2.2 指令流水的软件模拟
  • 4.1.2.3 指令流水的性能模拟
  • 4.1.3 指令译码
  • 4.1.4 ARM7TDMI 高层软件模型小结
  • 4.2 存储器子系统的高层软件模型
  • 4.2.1 存储子系统高层软件模型的设计
  • 4.2.2 SPM 软件模型
  • 4.2.2.1 SPM 软件模型的初始化
  • 4.2.2.2 SPM 软件模型的实现
  • 4.2.3 SDRAM 软件模型
  • 4.2.3.1 SDRAM 的操作流程
  • 4.2.3.2 SDRAM 的访问延迟和BURST 特性
  • 4.2.3.3 SDRAM 软件模型的初始化
  • 4.2.3.4 SDRAM 软件模型的实现
  • 4.2.3.5 SDRAM 软件模型的时序
  • 4.2.4 外部存储器接口的软件模型
  • 4.2.4.1 Garfield 中的EMI
  • 4.2.4.2 EMI 对能耗优化作用的分析
  • 4.2.4.3 EMI 软件模型的初始化
  • 4.2.4.4 EMI 软件模型的实现
  • 4.2.4.5 EMI 的仿真实验
  • 4.2.5 存储子系统高层软件模型小结
  • 4.3 Garfield 高层软件模型精度分析
  • 4.4 基于Garfield 高层软件模型的能耗评估
  • 4.4.1 高层能耗模型研究
  • 4.4.2 能耗评估策略
  • 4.4.2.1 基于时钟周期的能耗评估策略
  • 4.4.2.2 基于操作统计的能耗评估策略
  • 4.4.3 Garfield 高层软件模型中的能耗评估方法
  • 4.4.3.1 处理器能耗评估
  • 4.4.3.2 存储子系统能耗评估
  • 4.5 Garfield 高层软件模型小结
  • 第五章 基于SPM 布局的存储子系统能耗优化研究
  • 5.1 基于SPM 的静态布局优化
  • 5.1.1 对象的划分策略
  • 5.1.1.1 对象划分的分析
  • 5.1.1.2 全局符号表
  • 5.1.1.3 函数对象分析
  • 5.1.1.4 DCD 指令分析
  • 5.1.1.5 函数划分分析
  • 5.1.1.6 数据分析
  • 5.1.1.7 堆栈分析
  • 5.1.1.8 划分策略小结
  • 5.1.2 对象之间的关系
  • 5.1.2.1 ECFG 的生成
  • 5.1.2.2 对象间关系的成因
  • 5.1.2.3 对象间关系对分配的影响
  • 5.1.3 静态能耗模型
  • 5.1.3.1 存储子系统能耗模型的形式化描述
  • 5.1.3.2 Garfield 系统中存储子系统的能耗收益模型
  • 5.1.3.3 改进后的存储子系统能耗收益模型
  • 5.1.4 静态分配算法
  • 5.1.4.1 背包问题
  • 5.1.4.2 可适算法分析
  • 5.1.4.3 贪心算法分配实现
  • 5.1.4.4 改进后的贪心算法
  • 5.1.5 代码生成
  • 5.1.5.1 SPM 代码生成
  • 5.1.5.2 SDRAM 代码生成
  • 5.1.6 仿真流程
  • 5.1.7 静态优化的仿真结果
  • 5.1.7.1 仿真参数
  • 5.1.7.2 仿真结果
  • 5.1.8 多个应用程序的SPM 共享
  • 5.2 基于SPM 的动态布局优化
  • 5.2.1 对象时间戳
  • 5.2.2 能耗模型
  • 5.2.3 动态分配算法
  • 5.2.4 代码生成
  • 5.2.5 动态优化的仿真结果
  • 5.3 SPM 能耗和面积的关系
  • 5.4 SPM 布局优化和Cache 的比较
  • 5.4.1 Cache 的实现方式
  • 5.4.2 Cache 对能耗的优化
  • 5.4.3 SPM 布局优化和Cache 的比较
  • 5.5 存储子系统能耗实测
  • 5.5.1 硬件实验平台
  • 5.5.2 测试方案
  • 5.5.3 测试结果
  • 5.6 本章小结
  • 第六章 总结和展望
  • 致谢
  • 参考文献
  • 博士阶段发表论文和研究成果
  • 相关论文文献

    • [1].项目增加值能耗对所在地能耗强度降低目标的影响研究[J]. 节能 2020(03)
    • [2].运动过程中人体能耗级别分析及预测模型[J]. 当代体育科技 2020(21)
    • [3].试论建筑能耗及节能目标[J]. 中国高新区 2018(14)
    • [4].商业模式的能耗悖论[J]. 销售与市场(管理版) 2017(03)
    • [5].如何优化建筑施工技术降低建筑能耗[J]. 建材与装饰 2017(09)
    • [6].数控机床能耗单元能耗成分分析数学模型[J]. 机床与液压 2015(11)
    • [7].减轻“指尖上的负担”[J]. 老年教育(长者家园) 2019(10)
    • [8].变频冰箱能耗低[J]. 少年科学 2008(S1)
    • [9].基于能耗评价指标的医院能源管理分析[J]. 中国医院 2020(11)
    • [10].能耗电耗现状分析及“十四五”能效发展预判[J]. 电力需求侧管理 2020(06)
    • [11].高效能数据中心全链路能耗管理技术研究[J]. 通信电源技术 2020(02)
    • [12].动态表皮类型对采光和能耗影响的比较研究——以折叠和旋转表皮为例[J]. 建筑节能 2020(03)
    • [13].一种基于迁移深度强化学习的建筑能耗预测方法[J]. 计算机应用研究 2020(S1)
    • [14].马马崖一级水电站的厂用能耗评估[J]. 水电站机电技术 2020(08)
    • [15].厦门市政府办公建筑能耗特征分析[J]. 福建建筑 2020(09)
    • [16].建筑施工技术与建筑能耗[J]. 时代农机 2018(05)
    • [17].浅谈我国医院能耗监管系统存在的问题[J]. 中国医院建筑与装备 2017(01)
    • [18].区域产业能耗评价研究——以四川为例[J]. 再生资源与循环经济 2017(04)
    • [19].浅议建筑施工技术与建筑能耗[J]. 建材与装饰 2017(29)
    • [20].建筑施工技术与建筑能耗的思考[J]. 江西建材 2016(13)
    • [21].论中国能耗权交易法律制度的构建[J]. 生产力研究 2013(10)
    • [22].云计算能耗资源调度优化关键技术研究[J]. 智能计算机与应用 2014(05)
    • [23].污水处理厂能耗降低措施研究[J]. 科技创新导报 2013(14)
    • [24].中国六个典型城市休闲能耗的调研与分析[J]. 城市发展研究 2011(01)
    • [25].试论节能与建筑能耗[J]. 黑龙江科技信息 2011(15)
    • [26].2010年上半年单位GDP能耗出现反弹[J]. 山西能源与节能 2010(04)
    • [27].北京湖北提前实现“十一五”节能降耗目标[J]. 领导决策信息 2010(20)
    • [28].鄞州自我加压,想方设法降低能耗[J]. 宁波节能 2010(05)
    • [29].浙江省单位GDP能耗水平国内领先[J]. 能源工程 2010(05)
    • [30].2008年中国万元GDP能耗下降4.21%[J]. 有色冶金节能 2009(02)

    标签:;  ;  ;  ;  ;  

    基于片上SRAM布局的存储子系统能耗优化研究
    下载Doc文档

    猜你喜欢