论文题目: 值预测技术研究
论文类型: 博士论文
论文专业: 计算机科学与技术
作者: 肖勇
导师: 周兴铭
关键词: 值预测,前瞻执行,性能评估,低功耗设计,指令预取,数据预取
文献来源: 国防科学技术大学
发表年度: 2005
论文摘要: 随着集成电路技术的快速发展和应用需求的不断变化,微处理器体系结构的发展正面临新的挑战和创新机遇。一方面,多线程、多处理器等新技术得到广泛研究,拥有广阔的应用前景,尤其是在服务器和嵌入式应用领域;另一方面,多线程、多处理器技术的显式并行模型可能会导致软件模型相应改变,同时这些技术在开发细粒度、低层次并行性方面还存在一定困难。同多线程、多处理器技术的显示并行模型比较起来,指令级并行技术对程序员和应用的影响要小的多,因此开发指令级并行依然具有重要意义。 开发指令级并行需要解决程序中存在的数据相关、名相关和控制相关。其中,数据相关决定了指令结果产生的顺序,并决定了程序中可开发的并行性的上限,因此克服指令间的数据相关对提高微处理器的性能具有重要意义。近年来,为克服数据相关,值预测技术获得了广泛的研究。 值预测技术通过预测指令的产生结果,并允许后继与之存在数据相关的指令利用此结果前瞻执行,从而可以克服程序中存在的数据相关。除可应用于超标量结构,近年来的研究表明值预测技术与其他技术,如多线程、多处理器和VLIW等结合使用亦可获得较高的性能提升。 本文在广泛深入了解当前微处理器体系结构发展与值预测技术研究现状的基础上,对值预测技术进行了全面深入的研究。主要工作与创新点包括: 1.全面分析了各种因素对值预测机制设计的影响,构建了值预测机制研究平台。 研究了理想值预测机制和现有各种主要值预测机制的性能,总结了值预测在不同环境下的工作特点。 2.为在性能和设计复杂度间获得更好折衷,提出了增强型步长值预测器RSVP设计。通过对传统步长值预测器的改进,实现了值预测能力的增强。实验结果表明增强型步长值预测器比其他值预测器具有更高的性价比。 3.为减少RSVP的能量消耗,提出了公共子数据存储设计。通过避免信息的冗余存储,有效降低了RSVP的资源占用和能量消耗。研究了多种降低功耗的典型方法在RSVP中的应用。实验结果表明,通过低功耗设计,RSVP的性能仅有略微下降,但功耗和资源占用会大幅减少。 4.将值预测机制引入指令预取和数据预取机制中,利用RSVP预测预取地址,并设计了一种有效的更新反馈机制。实验结果表明,值预测技术、指令预取技术和数据预取技术混和使用可以获得较大的性能提升。 综合来说,值预测是克服程序数据相关提高微处理器性能的一种有效技术。实验结果表明:对SPEC INT2000基准测试程序集,通过低功耗设计,仅用约5k字节,增强型步长值预测器可获得4.7%的平均性能提升,此时值预测器能量消耗约为0.33nJ:值
论文目录:
摘要
ABSTRACT
第一章 绪论
1.1 课题研究背景
1.1.1 RISC结构的影响
1.1.2 主频提升的影响
1.1.3 存储墙
1.1.4 微处理器体系结构研究现状
1.2 值预测
1.2.1 数据相关、名相关和控制相关
1.2.2 值预测
1.3 本文的工作
1.4 本文的结构
第二章 相关研究现状
2.1 值预测
2.1.1 值预测机制
2.1.2 值预测机制设计因素与低功耗研究
2.1.3 值预测机制的应用
2.2 预取
2.2.1 指令预取机制
2.2.2 数据预取机制
2.3 本章小结
第三章 值预测机制设计因素分析及性能评价
3.1 值预测研究工作平台
3.1.1 SimpleScalar模拟器
3.1.2 SimpleScalar模拟器扩充值预测机制
3.2 值预测机制与微处理器其他部分的相互影响
3.3 值预测机制自身设计因素
3.3.1 前瞻执行指令处理
3.3.2 值预测失败后微处理器状态恢复
3.3.3 值预测正确性验证开销和重发射开销对值预测机制性能影响
3.3.4 值预测机制更新
3.3.5 值预测器信心系统机制
3.4 实验环境
3.4.1 测试程序
3.4.2 微处理器配置
3.4.3 值预测器配置
3.5 不同值预测机制性能评估
3.5.1 理想值预测
3.5.2 配置Conf4下值预测机制性能分析
3.5.3 配置Conf4_bP下值预测机制性能分析
3.5.4 配置Conf8下值预测机制性能分析
3.5.5 配置Conf8_bP下值预测机制性能分析
3.6 本章小结
第四章 增强型步长值预测器设计
4.1 工作机理
4.1.1 直观分析
4.1.2 理论分析
4.2 增强型步长值预测器结构
4.3 工作流程
4.4 实验环境
4.5 实验结果
4.5.1 增强型步长值预测器设计因素分析
4.5.2 不同值预测机制性能比较
4.6 本章小结
第五章 低功耗值预测器设计
5.1 值预测器功耗分析
5.2 低功耗值预测器设计
5.2.1 限制值预测器大小
5.2.2 限制端口数目
5.2.3 部分tag位存储
5.2.4 部分数据位存储
5.2.5 分体设计
5.2.6 低功耗RSVP设计
5.3 本章小结
第六章 基于值预测的预取技术研究
6.1 数据预取
6.1.1 数据预取机制结构
6.1.2 数据预取机制工作流程
6.1.3 数据预取机制性能评估
6.2 指令预取机制
6.2.1 指令预取机制结构
6.2.2 指令预取机制性能评估
6.3 值预测、指令预取和数据预取
6.3.1 值预测、指令预取和数据预取的性能
6.3.2 值预测器发出的数据预取和指令预取统计
6.3.3 各级cache访问量变化
6.4 本章小结
第七章 结束语
7.1 所作的工作与创新
7.2 未来的研究方向
致谢
攻读博士学位期间所发表的论文
参考文献表
发布时间: 2006-09-22
参考文献
- [1].面向多核处理器的令牌一致性协议优化技术研究[D]. 付桂涛.国防科学技术大学2014
- [2].类数据流驱动的分片式处理器上的编译及优化技术[D]. 王莉.中国科学技术大学2009
相关论文
- [1].前瞻多线程编译优化技术的研究与实现[D]. 邓鹍.国防科学技术大学2001
- [2].低功耗嵌入式微处理器的VLSI设计研究[D]. 李侠.复旦大学2004
- [3].面向微处理器设计的动态二进制翻译技术研究[D]. 曹宏嘉.国防科学技术大学2005
- [4].高性能嵌入式RISC微处理器核设计研究[D]. 姚英彪.浙江大学2006
- [5].龙芯2号处理器多线程技术研究[D]. 李祖松.中国科学院研究生院(计算技术研究所)2006
- [6].嵌入式流媒体处理器体系结构技术研究[D]. 黎铁军.国防科学技术大学2005
- [7].面向动态二进制翻译的动态优化和微处理器体系结构支撑技术研究[D]. 唐遇星.国防科学技术大学2005
- [8].单芯片多处理器关键技术的研究与实现[D]. 鲁建壮.国防科学技术大学2005
- [9].多核多线程处理器上任务调度技术研究[D]. 吴佳骏.中国科学院研究生院(计算技术研究所)2006
- [10].数据值预测与存储器预取技术研究[D]. 谢学军.哈尔滨工业大学2006