多核微处理器容软错误设计关键技术研究

多核微处理器容软错误设计关键技术研究

论文摘要

微处理器受到高能粒子轰击或噪声干扰等恶劣环境的影响,将发生瞬态故障。这些瞬态故障可能引起软错误(Soft Error),甚至失效,这将对微处理器的可靠性产生较大的影响。随着集成电路制造工艺的进步,单片上能够集成的晶体管数目将呈指数增长,这将使得微处理器面临越来越严重的软错误威胁。目前,多核微处理器已经逐渐成为市场的主流。容软错误(Soft Error Tolerance)技术一般都需要某种程度的冗余,而多核微处理器中天然的冗余资源为容软错误设计提供了新的解决思路。如何有效地利用多核微处理器中的冗余资源来增强微处理器的容软错误能力,进而提高其可靠性,就成了亟待解决的问题,对其进行深入研究具有重要的理论意义和实用价值。本文的研究工作围绕多核微处理器容软错误设计中的一系列关键技术展开。首先研究了多核微处理器容软错误执行模型,容软错误执行模型关系到程序如何高效、正确、可靠地在多核微处理器上执行,这也是发挥多核冗余资源优势实现容软错误设计的关键所在。其次,本文对具体的容软错误加固技术进行了研究,任何容软错误微处理器都要采用不同层次的加固技术对软错误进行屏蔽、检测或恢复,本文主要研究了门级的冗余技术和体系结构级的控制流检测技术。最后,本文对微处理器可靠性评估模型进行了研究,以便能在设计流程的早期就对微处理器可靠性进行定量评估,从而对设计选择和优化进行有效地指导。本文所作的主要创新工作包括:(I)本文提出了两种多核微处理器容软错误执行模型,包括:(1)基于现场保存与恢复的双核冗余执行模型DCR。在该模型中,两份相同的线程在两个具有现场保存与恢复功能的内核上冗余执行。通过增强内核的功能,使得该模型在能够有效恢复软错误的同时,具有较低的容错专用核间队列带宽需求和实现复杂度。(2)可重构的三核冗余执行模型TCR。该模型通过增强内核的冗余,在三个不同的内核上执行三份相同的线程,发现软错误以后可以进行动态重构,从而以较低的容错专用核间队列带宽需求和较高的执行性能实现了对软错误的有效屏蔽。(II)本文提出了两种基于异步电路技术的门级冗余结构,包括:(1)基于异步C单元的双模冗余结构DMR。该结构采用异步C单元对双模冗余单元的输出进行屏蔽,有效地降低了硬件冗余度,在具有对SEU(Single Event Upset)故障屏蔽能力的同时,有效地降低了芯片的面积开销。(2)基于异步双沿触发寄存器的时空三模冗余结构TSTMR。本文借鉴异步电路中解同步电路显式分离主从锁存器的结构,提出了双沿触发寄存器(DCTREG)。TSTMR结构通过采用DCTREG,将时间冗余应用到门级,从而实现对SEU和SET(Single Event Transient)故障的全面屏蔽。(III)本文提出了一种增强型控制流检测技术ECFC,该技术主要包括检测方法和实现方法两部分:(1)基于节点和边的签名检测方法。该方法通过将签名同时赋予控制流图中的节点和边,实现了比经典的基于节点的签名检测方法更严格的控制流检测,并且可以杜绝经典检测方法中可能出现的非法转移误判和调整签名冲突的情况。(2)软硬件结合的控制流检测实现方法。该实现方法由编译器在程序中插入签名数据,在程序执行的过程中,执行完控制流转移指令后自动触发一次硬件检测操作。该实现方法具有二进制代码量小、性能高、检错及时等优点。(IV)本文提出了一种综合考虑芯片面积和性能开销的可靠性评估模型:该模型采用一种新的评估量化标准,以实现对微处理器可靠性的定量评估。采用该评估模型,可以在设计流程中对采用了不同容软错误技术的微处理器的可靠性进行准确的定量评估,有利于对设计选择和优化进行指导。本文还在此评估模型下,对上述容软错误执行模型、门级冗余结构和体系结构级控制流检测技术进行了可靠性评估。本文通过对容软错误执行模型、容软错误加固技术和可靠性评估模型的研究,对容软错误多核微处理器的设计实现进行了有益的探索。本文的实现、验证和评估结果表明,上述技术是有效的,能够应用于容软错误多核微处理器的设计和实现。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景:软错误
  • 1.1.1 高能粒子来源
  • 1.1.2 噪声来源
  • 1.1.3 故障机理
  • 1.1.4 故障种类
  • 1.1.5 故障、错误与失效
  • 1.2 课题动机:挑战与机遇
  • 1.2.1 制造工艺带来的挑战
  • 1.2.2 体系结构带来的机遇
  • 1.3 课题目标与来源
  • 1.4 国内外相关研究工作
  • 1.4.1 容软错误加固技术
  • 1.4.2 容软错误执行模型
  • 1.4.3 容软错误微处理器与系统实现
  • 1.4.4 可靠性评估模型
  • 1.5 本文研究内容
  • 1.5.1 容软错误执行模型
  • 1.5.2 容软错误加固技术
  • 1.5.3 微处理器可靠性评估模型
  • 1.6 本文主要创新工作
  • 1.7 论文结构
  • 第二章 多核微处理器容软错误执行模型
  • 2.1 研究动机与思路
  • 2.2 基本假设
  • 2.3 基于现场保存与恢复的双核冗余执行模型
  • 2.3.1 DCR 执行模型结构
  • 2.3.2 DCR 执行模型执行机制
  • 2.3.3 DCR 执行模型实现
  • 2.3.4 DCR 执行模型性能分析
  • 2.3.5 DCR 执行模型软错误恢复能力分析
  • 2.4 可重构的三核冗余执行模型
  • 2.4.1 TCR 执行模型结构
  • 2.4.2 TCR 执行模型执行机制
  • 2.4.3 TCR 执行模型实现
  • 2.4.4 TCR 执行模型性能分析
  • 2.4.5 TCR 执行模型软错误屏蔽能力分析
  • 2.5 实验与分析
  • 2.5.1 带宽评估
  • 2.5.2 性能评估
  • 2.5.3 容软错误能力评估
  • 2.6 与相关工作的比较
  • 2.7 小结
  • 第三章 门级容软错误加固技术——基于异步电路技术的门级冗余结构
  • 3.1 异步电路简介
  • 3.1.1 同步电路与异步电路
  • 3.1.2 异步电路优势与劣势
  • 3.1.3 异步电路基本概念
  • 3.2 基于异步C 单元的双模冗余结构
  • 3.2.1 DMR 冗余结构
  • 3.2.2 DMR 结构可靠性分析
  • 3.3 基于异步双沿触发寄存器的时空三模冗余结构
  • 3.3.1 TSTMR 冗余结构
  • 3.3.2 TSTMR 结构可靠性分析
  • 3.4 异步标准单元设计与实现
  • 3.4.1 设计流程
  • 3.4.2 异步标准单元实现
  • 3.5 实验与分析
  • 3.5.1 芯片面积评估
  • 3.5.2 性能评估
  • 3.5.3 容软错误能力评估
  • 3.6 与相关工作的比较
  • 3.7 小结
  • 第四章 体系结构级容软错误加固技术——增强型控制流检测技术
  • 4.1 控制流检测技术简介
  • 4.1.1 基本块和控制流图
  • 4.1.2 基于节点的签名检测方法
  • 4.1.3 纯软件控制流检测实现方法
  • 4.2 基于节点和边的签名检测方法
  • 4.3 软硬件结合的控制流检测实现方法
  • 4.3.1 编译签名算法
  • 4.3.2 硬件检测机制
  • 4.4 实验与分析
  • 4.4.1 二进制代码量评估
  • 4.4.2 芯片面积评估
  • 4.4.3 性能评估
  • 4.4.4 容软错误能力评估
  • 4.5 与相关工作的比较
  • 4.6 小结
  • 第五章 微处理器可靠性评估模型
  • 5.1 研究动机
  • 5.2 量化标准
  • 5.3 评估框架
  • 5.3.1 执行时间获取方法
  • 5.3.2 结构弱点因子获取方法
  • 5.3.3 芯片面积获取方法
  • 5.3.4 评估流程
  • 5.4 评估实例
  • 5.4.1 容软错误执行模型可靠性评估
  • 5.4.2 门级冗余结构可靠性评估
  • 5.4.3 控制流检测技术可靠性评估
  • 5.5 与相关工作的比较
  • 5.6 小结
  • 第六章 结束语
  • 6.1 工作总结
  • 6.2 工作展望
  • 致谢
  • 参考文献
  • 作者在学期间取得的学术成果
  • 相关论文文献

    • [1].近阈值低功耗8位微处理器的设计与实现[J]. 信息技术 2016(11)
    • [2].微处理器王国漫游记[J]. 少儿科学周刊(少年版) 2016(09)
    • [3].美欧积极发展新兴类脑微处理器[J]. 中国集成电路 2014(11)
    • [4].基于双微处理器的馈电开关智能保护器模块的设计[J]. 河北能源职业技术学院学报 2015(01)
    • [5].身边处处都有[J]. 少儿科学周刊(少年版) 2016(09)
    • [6].在哪儿?如何工作?[J]. 少儿科学周刊(少年版) 2016(09)
    • [7].使用低成本FPGA巧妙地扩展微处理器的连接[J]. 世界电子元器件 2014(03)
    • [8].长虹微处理器代换经验[J]. 家电检修技术 2010(10)
    • [9].中国嵌入式微处理器年产值近2500亿[J]. 半导体信息 2009(01)
    • [10].国防科学技术大学计算机学院微电子与微处理器研究所[J]. 电子科技 2009(12)
    • [11].嵌入式应用对微处理器的需求[J]. 今日电子 2008(05)
    • [12].微处理器[J]. 少儿科学周刊(少年版) 2016(09)
    • [13].真身大揭秘[J]. 少儿科学周刊(儿童版) 2016(09)
    • [14].AM335x:ARM Cortex-A8微处理器开发方案[J]. 世界电子元器件 2014(03)
    • [15].1750A微处理器指令系统浅析[J]. 黑龙江科技信息 2012(14)
    • [16].电动执行机构多微处理器的控制方法[J]. 自动化应用 2012(12)
    • [17].基于微处理器的工业除尘设备自动控制系统设计与仿真[J]. 机械科学与技术 2011(08)
    • [18].飞思卡尔推出全新系列8位微处理器[J]. 电子产品世界 2011(09)
    • [19].飞思卡尔推出全新系列8位微处理器[J]. 单片机与嵌入式系统应用 2011(10)
    • [20].嵌入式ARM微处理器选型指南[J]. 单片机与嵌入式系统应用 2009(06)
    • [21].面向应用型微处理器与系统设计实践教学改革[J]. 教育教学论坛 2019(40)
    • [22].当STM32遇见Linux会发生什么?[J]. 世界电子元器件 2019(11)
    • [23].微处理器硬件木马及其检测挑战[J]. 火力与指挥控制 2018(08)
    • [24].微处理器原理与接口课程教学改革探索与实践[J]. 教育教学论坛 2016(35)
    • [25].微处理器制作大揭秘[J]. 少儿科学周刊(少年版) 2016(09)
    • [26].飞思卡尔推出全新系列8位微处理器[J]. 电子技术应用 2012(01)
    • [27].一种32位异步嵌入式微处理器原型[J]. 计算机技术与发展 2008(01)
    • [28].基于微处理器系列课程的大学生创新能力培养与研究[J]. 教育现代化 2018(40)
    • [29].基于TCP/IP网络技术的嵌入式系统的研究分析[J]. 新媒体研究 2015(18)
    • [30].安卓借中低阶微处理器嵌入“嵌入式”[J]. 中国电子商情(基础电子) 2012(04)

    标签:;  ;  ;  ;  ;  ;  

    多核微处理器容软错误设计关键技术研究
    下载Doc文档

    猜你喜欢