基于超长指令字处理器的同时多线程关键技术研究

基于超长指令字处理器的同时多线程关键技术研究

论文摘要

自1995年Tullsen基于超标量处理器提出“同时多线程”技术以来,越来越多的研究人员开始关注和研究这一技术。同时多线程技术允许多个线程(逻辑处理器)同时共享一套执行部件,不仅避免了线程切换的开销,也更充分地发挥了处理器的能力。由于程序本身指令级并行性不足、编译器的能力以及诸多动态因素的影响,超长指令字处理器尚未发挥出全部潜力。将同时多线程技术引入超长指令字处理器为进一步提高处理器的性能提供了一条新的技术途径。本文主要对同时多线程超长指令字处理器的设计和优化进行深入研究,分析了超长指令字执行语义带来的两种时序约束,研究了突破这些时序约束的方法,并提出了同时多线程微体系结构MOSI;针对超长指令字体系结构在MOSI微体系结构下呈现出的弊端,提出了新的性能优化方法;解决了同时多线程处理器中线程性能难以预测的问题;实现了双线程超长指令字处理器原型。本文的主要研究成果和创新点包括:1.改进了Rudd等人为实现精确中断而提出的重放缓冲机制,降低了硬件开销。2.提出了基于超长指令字处理器的同时多线程微体系结构MOSI。MOSI突破了超长指令字执行语义带来的时序约束,不仅满足了同时多线程技术的基本要求,也降低了硬件的开销。3.在MOSI微体系结构框架下,针对编译器静态指定功能单元带来的弊端,提出了指令迁移技术。该技术通过硬件动态地自动平衡各功能单元的负载,减少了功能单元冲突,提高了处理器的吞吐率。4.基于MOSI微体系结构模型,针对取指流水中无效取指请求带来的程序Cache冲突问题,提出了一种非阻塞的流水线控制方式。通过减少取指单元载入无效指令的几率,提高了取指单元以及整个处理器的吞吐率。5.针对同时多线程处理器中线程性能难以预测的问题,提出了一种线程性能控制机制。通过不断调整资源分配,使得各线程的性能趋于预先定义的值。6.设计并实现了基于MOSI微体系结构的双线程超长指令字处理器原型YHFT-DSP/SMT00,并完成了逻辑综合、延时分析以及性能测试,给出了硬件开销、引入的延迟等参数。扣除延迟的影响,YHFT-DSP/SMT00的吞吐率提高了12-26%。本文的研究成果为在超长指令字处理器中实现同时多线程技术提供了可行的方案,对于进一步研究如何更好地利用该技术提高超长指令字处理器的实际性能具有重要的理论和实践意义。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章绪论
  • 1.1 研究背景及目标
  • 1.1.1 主频提升以及ILP 开发的瓶颈
  • 1.1.2 新体系结构技术
  • 1.1.3 同时多线程与超长指令字技术的结合
  • 1.1.4 SMT VLIW 体系结构中的关键技术
  • 1.1.5 研究目标及技术路线
  • 1.2 本文的工作
  • 1.3 论文的结构
  • 第二章相关研究现状
  • 2.1 超长指令字技术
  • 2.1.1 超长指令字处理器的执行语义
  • 2.1.2 传统超长指令字处理器的不足及解决
  • 2.1.3 超长指令字动态发射技术
  • 2.2 SMT 技术
  • 2.2.1 SMT 技术的实现
  • 2.2.2 提高SMT 处理器的吞吐率
  • 2.2.3 提高单个任务的性能
  • 2.2.4 线程调度
  • 2.2.5 线程性能控制
  • 2.2.6 同时多线程超长指令字处理器
  • 第三章VLIW处理器中精确中断的实现
  • 3.1 VLIW 处理器中精确中断的概念
  • 3.2 RP 缓冲机制及其不足
  • 3.2.1 RP 缓冲机制
  • 3.2.2 RP 缓冲机制的不足
  • 3.3 RRP 缓冲机制
  • 3.3.1 RRP 缓冲机制的原理
  • 3.3.2 RRP 缓冲机制的实现
  • 3.3.3 RRP 缓冲机制的局限性
  • 3.4 小结
  • 第四章同时多数线程微体系结构MOSI
  • 4.1 MOSI 微体系结构
  • 4.1.1 多操作分离发射
  • 4.1.2 实现多操作分离发射的障碍
  • 4.1.3 保证结果写回顺序
  • 4.1.4 MOSI VLIW 总体结构
  • 4.2 体系结构模拟器的设计
  • 4.2.1 目标处理器的结构
  • 4.2.2 虚拟存储系统
  • 4.2.3 文件系统
  • 4.2.4 指令译码
  • 4.2.5 指令执行
  • 4.2.6 模拟器总体结构
  • 4.3 实验结果及分析
  • 4.3.1 测试程序及实验方法
  • 4.3.2 实验结果及分析
  • 4.4 小结
  • 第五章降低功能单元冲突
  • 5.1 引言
  • 5.2 降低功能单元冲突
  • 5.2.1 功能单元的使用频度
  • 5.2.2 指令迁移
  • 5.2.3 硬件代价
  • 5.3 实验结果及分析
  • 5.4 小结
  • 第六章降低程序Cache冲突
  • 6.1 引言
  • 6.2 减少无效取指
  • 6.2.1 目标处理器的取指流水线
  • 6.2.2 非阻塞的流水线
  • 6.2.3 非阻塞流水线的控制
  • 6.3 实验结果及分析
  • 6.4 小结
  • 第七章SMT处理器中线程性能的控制
  • 7.1 引言
  • 7.2 线程性能控制机制
  • 7.2.1 基本概念和假设
  • 7.2.2 任务划分算法
  • 7.2.3 线程性能控制机制
  • 7.2.4 误差分析
  • 7.2.5 设计实现
  • 7.3 实验结果及分析
  • 7.4 小结
  • 第八章YHFT-DSP/SMT00处理器原型的设计与实现
  • 8.1 YHFT-DSP/D4 处理器
  • 8.2 YHFT-DSP/SMT00 的设计
  • 8.2.1 线程状态控制
  • 8.2.2 分离发射机制
  • 8.2.3 写回缓冲
  • 8.3 YHFT-DSP/SMT00 的性能分析
  • 8.4 YHFT-DSP/SMT00 的逻辑综合及优化
  • 8.5 小结
  • 第九章结束语
  • 9.1 所作的工作与创新
  • 9.2 未来的研究方向
  • 致谢
  • 参考文献
  • 作者在学期间取得的学术成果及参与的研究工作
  • 附录A 编译器生成与手工优化代码的比较
  • 相关论文文献

    • [1].垃圾处理器进入大渠道的困境[J]. 现代家电 2019(22)
    • [2].基于FPGA的32位多并行2DFFT处理器的设计[J]. 广西科技大学学报 2020(01)
    • [3].废弃食物处理器选购有讲究[J]. 质量与标准化 2020(Z1)
    • [4].报告:到2026年,嵌入式处理器市场将达到363.8亿美元[J]. 功能材料信息 2019(06)
    • [5].垃圾处理器营销渠道走向前台[J]. 现代家电 2019(17)
    • [6].创新推动垃圾处理器本土化进程[J]. 现代家电 2020(07)
    • [7].用标准推动行业健康发展 保障消费者良好体验[J]. 现代家电 2020(07)
    • [8].风头正劲的垃圾处理器市场[J]. 现代家电 2020(07)
    • [9].后疫情时代 垃圾处理器步入稳健发展[J]. 现代家电 2020(07)
    • [10].垃圾处理器的B端市场突破[J]. 现代家电 2020(07)
    • [11].利用平台优势 推动垃圾处理器快速增长[J]. 现代家电 2020(07)
    • [12].2020二季度手机处理器市场[J]. 中国科技信息 2020(20)
    • [13].安全处理器研究进展[J]. 信息安全学报 2018(01)
    • [14].骁龙821处理器等于骁龙820超频版[J]. 个人电脑 2017(01)
    • [15].走近国产处理器[J]. 个人电脑 2016(09)
    • [16].众核处理器核间通信的研究[J]. 价值工程 2015(17)
    • [17].面向高性能计算的众核处理器轻量级错误恢复技术研究[J]. 计算机研究与发展 2015(06)
    • [18].“愚公号”垃圾处理器[J]. 小星星(低年级版) 2020(Z2)
    • [19].《污气处理器》[J]. 课堂内外(小学低年级) 2019(05)
    • [20].龙芯总设计师:明年将推出全自主可控处理器“3B3000”[J]. 电脑迷 2015(08)
    • [21].高效低能耗 未来处理器发展方向[J]. 电脑迷 2008(10)
    • [22].电脑靠什么来节能(3) 处理器篇[J]. 电脑迷 2008(09)
    • [23].陌生的处理器 新本怎么选?[J]. 电脑爱好者 2009(03)
    • [24].无处不在 嵌入式处理器解析[J]. 电脑迷 2010(12)
    • [25].22nm来袭 Intel Ivy Bridge处理器前瞻[J]. 电脑迷 2011(16)
    • [26].揭秘骗术 盒装处理器选购谈[J]. 电脑爱好者 2013(16)
    • [27].有必要追求最新64位处理器吗[J]. 电脑爱好者 2014(21)
    • [28].尾数有变! 读懂手机处理器的后缀密码[J]. 电脑爱好者 2017(07)
    • [29].不再是处理器 浅析高通骁龙835移动平台[J]. 电脑爱好者 2017(09)
    • [30].重新定义中端 AMD Ryzen 5 1600处理器[J]. 电脑爱好者 2017(14)

    标签:;  ;  ;  ;  ;  ;  

    基于超长指令字处理器的同时多线程关键技术研究
    下载Doc文档

    猜你喜欢