高可靠处理器体系结构研究

高可靠处理器体系结构研究

论文摘要

随着处理器逐步采用纳米级制造工艺,在处理器性能得到大幅提高的同时,由于集成电路特征尺寸的减小、电源电压的降低和频率的升高,使得处理器对于串扰、电压扰动、电磁干扰以及辐射等各种噪声干扰变得更加敏感,并可能引发错误的操作,处理器的可靠性成为一个日益严峻的课题。另一方面,对于航天等特殊应用场合,由于宇宙射线和高能粒子的辐照作用,使得处理器内部电路产生各种单粒子效应,并可能引起严重的事故,因此也对处理器可靠性提出了更高的要求。本文以龙芯1号处理器为研究原型,以瞬态故障引起的软错误为主要研究对象,通过故障行为分析,结合具体的处理器结构设计,从体系结构级探讨了纳米级制造工艺下与高可靠应用场合下处理器的可靠性设计方法,本文研究工作的主要创新点与贡献如下:1.提出一种连续快速的处理器仿真故障注入技术,通过同时运行两个处理器可综合RTL模型,在较短时间内对龙芯1号处理器快速注入了大约30万个软错误,保证了分析结果具有较好的统计意义,可以有效指导后续的可靠性设计。2.提出一种基于软错误敏感性分析的体系结构级低开销容错触发器设计技术,只对龙芯1号处理器中软错误敏感性高于3%的触发器采用容错触发器,节省了81.9%的触发器资源,同时却获得了与粗放加固方法相似的可靠性。3.提出一种基于局部性原理的处理器片内存储器可靠性设计技术,一方面,通过与虚拟地址历史记录进行比较,使得片内存储器在更多时间内处于空闲关闭状态,因而提高了可靠性;另一方面,采用了一种类write-through的更新算法,使得数据Cache片内存储器与内存始终保持数据一致,有效提高了数据Cache片内存储器的可靠性,降低了保护代价;通过采用这两步措施,处理器性能平均降低了4.09%,面积增加了4.4%,以较小的性能面积开销获得了片内存储器可靠性的较好提高。4.提出一种静态检测流水线与选择性重复执行技术,根据处理器中指令与面积分布的分析,对于ALU类指令,增加一条专门用于检测执行完整性的静态流水线,对于定点乘法类指令、浮点类指令,采用重新取指并执行两次的方法,只带来了4.6%的面积开销和2.93%的性能损失,却可以检测除访存类指令外所有指令的执行完整性。5.提出一种精确流水线超时恢复技术,针对不同情况,对流水线超时错误分别采用了结果总线增加操作码比较、产生超时例外重新取指执行指令、触发器超时重置、三模冗余与ECC校验等4种方法进行处理,整个处理器的面积只增加了0.5%,以较小的面积开销实现了处理器流水线超时错误的精确恢复。6.提供了龙芯1号处理器的一个体系结构级容错处理器版本,通过采用前述可靠性设计技术,处理器性能总共平均降低了7.22%,面积增加了9.8%,相对于文献报道的各种

论文目录

  • 摘要
  • 目录
  • 图目录
  • 表目录
  • 第一章 绪论
  • 1.1 研究背景
  • 1.1.1 开展处理器可靠性研究的必要性
  • 1.1.2 处理器发生软错误的主要原因
  • 1.1.3 冗余技术分类
  • 1.1.4 可靠性衡量指标
  • 1.2 研究现状
  • 1.2.1 在FPGA上实现可重构容错处理器
  • 1.2.2 单芯片处理器的容错与可靠性研究
  • 1.2.3 容错处理器阵列的可靠性研究
  • 1.2.4 计算机系统的可靠性研究
  • 1.2.5 工业界研发现状
  • 1.3 处理器可靠性设计的主要技术
  • 1.3.1 从工艺的角度
  • 1.3.2 从电路设计的角度
  • 1.3.3 从微结构设计的角度
  • 1.3.4 从软件设计的角度
  • 1.4 本文的研究目标与研究方法
  • 1.5 本文的主要贡献
  • 1.6 本文的组织结构
  • 第二章 连续快速的处理器仿真故障注入技术
  • 2.1 引言
  • 2.2 处理器故障注入常用方法
  • 2.2.1 硬件故障注入方法
  • 2.2.2 软件故障注入方法
  • 2.2.3 仿真故障注入方法
  • 2.2.4 混合故障注入方法
  • 2.2.5 电路模拟故障注入方法
  • 2.3 处理器故障模型
  • 2.4 龙芯1号处理器的故障注入方法
  • 2.4.1 仿真故障注入平台
  • 2.4.2 故障注入点
  • 2.4.3 软错误注入过程
  • 2.4.4 故障注入运行效果
  • 2.5 小结
  • 第三章 龙芯1号处理器的软错误敏感性分析
  • 3.1 引言
  • 3.2 龙芯1号处理器软错误敏感性分析
  • 3.2.1 取指与译码部件
  • 3.2.2 操作队列
  • 3.2.3 通用寄存器与浮点寄存器
  • 3.2.4 定点算术逻辑运算单元ALU与定点乘法器MUL
  • 3.2.5 浮点算术逻辑运算单元FALU与浮点乘法器FMUL
  • 3.2.6 地址运算部件
  • 3.2.7 TLB部件
  • 3.2.8 Cache部件
  • 3.2.9 时钟域转换部件与接口部件
  • 3.2.10 软错误敏感性分析小结
  • 3.3 小结
  • 第四章 体系结构级低开销容错触发器设计技术
  • 4.1 引言
  • 4.2 容错触发器单元设计
  • 4.2.1 晶体管级容错触发器
  • 4.2.2 门级容错触发器
  • 4.3 基于软错误敏感性分析的体系结构级低开销容错触发器设计技术
  • 4.4 小结
  • 第五章 处理器片内存储器的可靠性设计技术
  • 5.1 引言
  • 5.2 片内存储器的常用可靠性设计技术
  • 5.2.1 编码检错纠错技术
  • 5.2.2 冗余行列与内建自修复技术
  • 5.2.3 空闲单元关闭技术
  • 5.2.4 dirty数据块提前写回技术
  • 5.2.5 故障隔离技术
  • 5.2.6 高可靠存储单元电路与版图设计技术
  • 5.3 利用局部性减少处理器片内存储器的访问次数
  • 5.3.1 访存部件结构分析
  • 5.3.2 TLB部件初始设计结构分析
  • 5.3.3 Cache部件初始设计结构分析
  • 5.3.4 根据虚拟地址历史记录同时减少TLB和Cache对片内存储器的访问次数
  • 5.3.5 关键路径分析
  • 5.3.6 功耗降低情况分析
  • 5.4 类write-through更新算法
  • 5.4.1 Cache更新算法
  • 5.4.2 write-through更新算法与write-buffer
  • 5.4.3 类write-through更新算法
  • 5.4.4 进一步的编码保护
  • 5.5 小结
  • 第六章 静态检测流水线与选择性重复执行技术
  • 6.1 引言
  • 6.2 常用体系结构级冗余设计技术
  • 6.2.1 时间冗余技术
  • 6.2.2 硬件冗余技术
  • 6.3 静态检测流水线与选择性重复执行技术
  • 6.3.1 龙芯1号处理器的指令执行分布情况和面积分布情况
  • 6.3.2 静态检测流水线技术
  • 6.3.3 选择性重复执行技术
  • 6.3.4 验证环境
  • 6.4 小结
  • 第七章 精确流水线超时恢复技术
  • 7.1 引言
  • 7.2 常用流水线超时恢复技术
  • 7.3 精确流水线超时恢复技术
  • 7.3.1 流水线超时软错误敏感性分析
  • 7.3.2 结果总线增加操作码比较
  • 7.3.3 产生超时例外重新取指执行指令
  • 7.3.4 超时错误敏感触发器超时重置
  • 7.3.5 三模冗余与ECC校验
  • 7.3.6 性能面积开销
  • 7.4 小结
  • 第八章 结束语
  • 8.1 引言
  • 8.2 本文的主要贡献
  • 8.3 进一步的研究工作
  • 参考文献
  • 致谢
  • 作者简历
  • 相关论文文献

    • [1].垃圾处理器进入大渠道的困境[J]. 现代家电 2019(22)
    • [2].基于FPGA的32位多并行2DFFT处理器的设计[J]. 广西科技大学学报 2020(01)
    • [3].废弃食物处理器选购有讲究[J]. 质量与标准化 2020(Z1)
    • [4].报告:到2026年,嵌入式处理器市场将达到363.8亿美元[J]. 功能材料信息 2019(06)
    • [5].垃圾处理器营销渠道走向前台[J]. 现代家电 2019(17)
    • [6].创新推动垃圾处理器本土化进程[J]. 现代家电 2020(07)
    • [7].用标准推动行业健康发展 保障消费者良好体验[J]. 现代家电 2020(07)
    • [8].风头正劲的垃圾处理器市场[J]. 现代家电 2020(07)
    • [9].后疫情时代 垃圾处理器步入稳健发展[J]. 现代家电 2020(07)
    • [10].垃圾处理器的B端市场突破[J]. 现代家电 2020(07)
    • [11].利用平台优势 推动垃圾处理器快速增长[J]. 现代家电 2020(07)
    • [12].2020二季度手机处理器市场[J]. 中国科技信息 2020(20)
    • [13].安全处理器研究进展[J]. 信息安全学报 2018(01)
    • [14].骁龙821处理器等于骁龙820超频版[J]. 个人电脑 2017(01)
    • [15].走近国产处理器[J]. 个人电脑 2016(09)
    • [16].众核处理器核间通信的研究[J]. 价值工程 2015(17)
    • [17].面向高性能计算的众核处理器轻量级错误恢复技术研究[J]. 计算机研究与发展 2015(06)
    • [18].“愚公号”垃圾处理器[J]. 小星星(低年级版) 2020(Z2)
    • [19].《污气处理器》[J]. 课堂内外(小学低年级) 2019(05)
    • [20].龙芯总设计师:明年将推出全自主可控处理器“3B3000”[J]. 电脑迷 2015(08)
    • [21].高效低能耗 未来处理器发展方向[J]. 电脑迷 2008(10)
    • [22].电脑靠什么来节能(3) 处理器篇[J]. 电脑迷 2008(09)
    • [23].陌生的处理器 新本怎么选?[J]. 电脑爱好者 2009(03)
    • [24].无处不在 嵌入式处理器解析[J]. 电脑迷 2010(12)
    • [25].22nm来袭 Intel Ivy Bridge处理器前瞻[J]. 电脑迷 2011(16)
    • [26].揭秘骗术 盒装处理器选购谈[J]. 电脑爱好者 2013(16)
    • [27].有必要追求最新64位处理器吗[J]. 电脑爱好者 2014(21)
    • [28].尾数有变! 读懂手机处理器的后缀密码[J]. 电脑爱好者 2017(07)
    • [29].不再是处理器 浅析高通骁龙835移动平台[J]. 电脑爱好者 2017(09)
    • [30].重新定义中端 AMD Ryzen 5 1600处理器[J]. 电脑爱好者 2017(14)

    标签:;  ;  ;  ;  ;  ;  ;  

    高可靠处理器体系结构研究
    下载Doc文档

    猜你喜欢