论文摘要
随着存储系统的访问速度与处理器的运算速度的差距越来越显著,访存性能已成为提高计算机系统性能的瓶颈。如何通过设计高性能存储系统弥补处理器与存储系统性能的差距长期以来是体系结构领域的研究热点。本文从提高处理器的IPC值和优化处理器的访存延时及带宽的角度出发,结合分析龙芯2号处理器运行SPEC CPU2000测试程序的访存行为特征,对存储系统性能优化技术进行研究,提出了一系列存储系统的性能优化技术并对所提出的优化技术进行性能评测与分析。本文主要的创新点及贡献包括:1.通过对Cache写失效行为的分析,提出一种新的提高处理器带宽利用率的Cache写失效处理策略——Cache自适应写分配策略。该策略在访存失效队列中收集全修改Cache块,对全修改Cache块采用非写分配策略,并能够自适应地切换为写分配策略。与传统的Cache写失效处理策略相比,Cache自适应写分配策略硬件代价小,避免了不必要的数据传输,降低Cache污染,减少存储管理队列阻塞的频率。结果表明,采用Cache自适应写分配策略,STREAM基准测试程序带宽平均提高62.6%,SPEC CPU2000程序的IPC值平均提高5.9%。2.通过对栈访问行为的分析,提出一种栈高速缓存方案——快速地址计算的自适应栈高速缓存组织方案。该方案将栈访问从数据高速缓存的访问中分离出来,充分利用栈空间数据访问的特点,提高指令级并行度,减少数据高速缓存污染,降低数据高速缓存失效率,并采用快速地址计算策略,减少栈访问的命中时间。该栈高速缓存在发生栈溢出时,能够自适应地关闭,以避免栈切换对处理器性能的影响。栈高速缓存标志中增加进程标识,进程切换时不需要将数据写到低层存储系统中,适用于多进程环境。SPEC CPU2000程序运行结果表明,采用快速地址计算的自适应栈高速缓存方案,25.8%的访存指令可以并行执行,数据高速缓存失效率平均降低9.4%,IPC值平均提高6.9%。3.通过对指令Cache和数据Cache失效行为的分析,提出一种预取策略——结合访存失效队列状态的预取策略。该预取策略保持了指令和数据访问的次序,有利于预取流的提取。并将指令流和数据流的预取相分离,避免相互替换。在预取发起时机的选择上,结合访存失效队列的状态,减小对处理器正常访问请求的影响。通过流过滤机制提高预取准确性,降低预取对访存带宽的需求。结果表明,采用结合访存失效队列状态的预取策略,处理器的平均访存延时减少30%,SPEC CPU2000程序的IPC值平均提高8.3%。4.通过对内存访问地址的空间局部性分析,提出一种内存控制策略——处理器核指导的内存Page模式控制策略。该策略由处理器核指导,自适应地根据程序访存地址的空间局部性特征动态调整Page模式,融合Open Page策略和Close Page策略的优点。处
论文目录
相关论文文献
- [1].面向替换延迟隐藏的Cache空间预约技术[J]. 航空计算技术 2020(03)
- [2].IO dependent SSD cache allocation for elastic Hadoop applications[J]. Science China(Information Sciences) 2018(05)
- [3].基于预取的Cache替换策略[J]. 微电子学与计算机 2017(01)
- [4].位置信息与替换概率相结合的多核共享Cache管理机制[J]. 国防科技大学学报 2016(05)
- [5].多核中Cache一致性延迟分析[J]. 信息通信 2016(03)
- [6].一种Cache一致性优化策略[J]. 信息系统工程 2016(04)
- [7].一种自适应的cache驱逐策略[J]. 信息通信 2016(05)
- [8].基于抽象解释技术的Cache分析方法[J]. 中小企业管理与科技(中旬刊) 2015(03)
- [9].基于抽象解释技术的多层Cache分析的设计与实现[J]. 计算机光盘软件与应用 2014(24)
- [10].Multi-bit soft error tolerable L1 data cache based on characteristic of data value[J]. Journal of Central South University 2015(05)
- [11].一种嵌入式系统的滑动Cache机制设计[J]. 单片机与嵌入式系统应用 2015(03)
- [12].处理器中非阻塞cache技术的研究[J]. 电子设计工程 2015(19)
- [13].Kaminsky Bug:DNSSEC的机遇?[J]. 中国教育网络 2009(Z1)
- [14].多核处理器Cache一致性的改进[J]. 西安邮电大学学报 2015(02)
- [15].嵌入式系统中低功耗动态可重构Cache的研究[J]. 电子技术与软件工程 2015(09)
- [16].Cache动态插入策略模型研究[J]. 计算机工程与科学 2013(10)
- [17].多核处理器可重构Cache功耗计算方法的研究[J]. 计算机科学 2014(S1)
- [18].嵌入式应用环境下Cache性能[J]. 信息与电脑(理论版) 2013(12)
- [19].基于分布式合作cache的私有cache划分方法[J]. 计算机应用研究 2012(01)
- [20].基于区间模型的一级指令Cache缺失损失分析[J]. 计算机工程 2012(07)
- [21].多核系统中共享Cache的冒泡替换算法[J]. 微电子学与计算机 2011(04)
- [22].浅析Cache命中率与块的大小之间的关系[J]. 价值工程 2011(32)
- [23].嵌入式编程需注意的Cache机制[J]. 单片机与嵌入式系统应用 2010(04)
- [24].多核处理器面向低功耗的共享Cache划分方案[J]. 计算机工程与科学 2010(10)
- [25].面向多核的共享多通道Cache体系及原型构建[J]. 哈尔滨工业大学学报 2010(11)
- [26].Cache结构的低功耗可重构技术研究[J]. 单片机与嵌入式系统应用 2009(01)
- [27].一种低功耗动态可重构cache方案[J]. 计算机应用 2009(05)
- [28].透过专利看微处理器的技术发展(六)——Cache专利技术的发展历程[J]. 中国集成电路 2009(06)
- [29].混合Cache的低功耗设计方案[J]. 计算机工程与应用 2009(20)
- [30].一种面向多核处理器粗粒度的应用级Cache划分方法[J]. 计算机工程与科学 2009(S1)
标签:龙芯号论文; 高速缓存论文; 存储系统论文; 写失效论文; 快速地址计算论文; 预取论文; 模式控制论文; 自适应论文;