面向空间应用的容错RISC处理器体系结构研究

面向空间应用的容错RISC处理器体系结构研究

论文摘要

我国目前星载计算机使用的微处理器不具备单粒子翻转(SEU,Single Event Upset)的容错能力,导致必须依靠系统级的容错设计达到空间应用的可靠性要求,制约了系统实时性能的提高,难以满足卫星与深空探测技术发展的需要。论文以星载计算机的需求为背景,重点研究应用于空间辐射环境中高性能微处理器的容错体系结构,提出了一套完整的微处理器片上容错设计方案,并研究其实现技术,设计实现了两款具有自主知识产权的能够容忍单粒子翻转故障的高性能微处理器芯片,并流片成功。论文取得了如下的创新性研究成果:1、全面分析了SEU对微处理器危害的机理,提出了一个体系完整的微处理器片上容错设计方案,并在LSFT32系列微处理器芯片的设计中进行了实验验证。2、提出了一种连续纠错的流水线结构,能够连续检测并纠正寄存器文件中的数据错误,并及时更新寄存器文件。3、提出了一种自主恢复的存储器控制器结构,设计了具有自动回写的存储器控制器,数据错误处理完全不需要处理器的干预。4、提出了一种可控的片上故障注入机制,提供了软件可控的故障模式,有力地支持了容错技术的验证。5、利用0.5μmCMOS工艺抗辐射工艺库和定制存储器,研制了我国第一个辐射加固型32位RISC微处理器芯片LSFT3201(BM3801),主频25MHz,抗辐射总剂量指标达到300krad(Si);在LSFT3201的基础上通过集成浮点处理单元,改进流水线纠错结构和故障注入机制,利用0.18μm常规CMOS工艺,研制成功能容忍单粒子翻转故障的浮点微处理器芯片LSFT3202(BM3802),主频达到175MHz。LSFT32系列容错微处理器的研制成功,对于缓解我国航天领域对国外抗辐射加固微处理器的依赖,将起到积极的作用。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题背景及意义
  • 1.2 我国空间计算机CPU应用现状与系统容错技术
  • 1.3 国内外辐射加固型微处理器的研究现状与基础
  • 1.4 论文的主要研究成果与创新点概要
  • 1.5 论文的结构安排
  • 第二章 LSFT32系统结构
  • 2.1 SPARC V8系统结构
  • 2.1.1 选择SPARC体系结构的原因
  • 2.1.2 SPARC中的RISC设计思想
  • 2.1.3 数据格式
  • 2.1.4 SPARC V8组成
  • 2.1.5 寄存器组
  • 2.1.6 指令系统
  • 2.1.7 陷阱
  • 2.2 LSFT32系统组成
  • 2.2.1 处理单元
  • 2.2.2 片上系统总线
  • 2.2.3 存储器接口
  • 2.2.4 嵌入式外设控制器
  • 2.3 小结
  • 第三章 体系结构的容错策略
  • 3.1 空间辐射效应及其影响
  • 3.2 SEU对LSFT32微处理器行为的影响分析
  • 3.2.1 SEU故障对星载计算机的影响
  • 3.2.2 SPARC指令集的SEU故障效应分析(FEA)
  • 3.3 计算机系统容错设计方案
  • 3.3.1 空间计算机的抗辐射性能保证
  • 3.3.2 空间计算机的容错设计方法
  • 3.4 LSFT32微处理器的设计目标与可实现性
  • 3.4.1 抗辐射加固处理器的常用设计方法
  • 3.4.2 LSFT32微处理器的设计目标
  • 3.4.3 LSFT32微处理器的可实现性
  • 3.4.4 总剂量加固与SEL加固
  • 3.5 体系结构的SEU组合容错策略
  • 3.5.1 非容错处理器的单粒子翻转概率
  • 3.5.2 常用的数据校验码
  • 3.5.3 寄存器的冗余设计
  • 3.5.4 寄存器文件的容错设计策略
  • 3.5.5 Cache的容错设计策略
  • 3.5.6 LSFT3202数据故障概率预计
  • 3.6 小结
  • 第四章 整数单元容错流水线结构
  • 4.1 LSFT32整数处理单元IU(Integrate Unit)
  • 4.1.1 流水级划分
  • 4.1.2 LSFT32 IU的体系结构
  • 4.1.4 寄存器文件
  • 4.1.5 操作数的获取与数据写回
  • 4.2 直接纠错流水线结构
  • 4.2.1 EDAC的插入方式
  • 4.2.2 在LSFT3201中的实现
  • 4.2.3 陷阱处理程序的考虑
  • 4.3 同步纠错流水线结构
  • 4.3.1 同步纠检错结构
  • 4.3.2 在LSFT3202处理器中的实现
  • 4.3.3 同步纠错流水线结构性能分析
  • 4.4 连续纠错流水线结构
  • 4.4.1 对同步纠错流水线结构的改进
  • 4.4.2 结果与分析
  • 4.5 小结
  • 第五章 存储系统的容错结构研究
  • 5.1 概述
  • 5.2 LSFT32的存储系统构成
  • 5.3 CACHE控制器的容错设计
  • 5.3.1 Cache映像方式与命中机制
  • 5.3.2 Cache-AHB总线接口单元
  • 5.3.3 指令Cache设计
  • 5.3.4 数据Cache设计
  • 5.3.5 基于分组校验的Cache数据重载
  • 5.4 自主恢复存储器控制器
  • 5.4.1 存储总线宽度确定
  • 5.4.2 存储器配置寄存器
  • 5.4.3 控制状态机的设计
  • 5.4.4 存储器控制器数据通路
  • 5.4.5 存储器区域保护
  • 5.4.6 EDAC结构
  • 5.4.7 自动恢复机制
  • 5.4.8 结果与分析
  • 5.5 小结
  • 第六章 片上可控故障注入机制
  • 6.1 容错设计的验证方法
  • 6.2 硬件故障注入机理
  • 6.2.1 单粒子事件故障模型
  • 6.2.2 单粒子故障注入器构成
  • 6.3 单粒子效应故障注入实现原理
  • 6.3.1 硬件故障注入系统级实现
  • 6.3.2 嵌入式硬件故障注入实现
  • 6.4 LSFT32单粒子故障注入的实现
  • 6.4.1 LSFT32嵌入式故障注入结构
  • 6.4.2 故障注入控制/监视寄存器
  • 6.4.3 LSFT32嵌入式故障监视器
  • 6.5 LSFT32嵌入式单粒子故障注入软件考虑
  • 6.5.1 故障注入原语
  • 6.5.2 LSFT32故障注入测试系统组成
  • 6.5.3 LSFT32故障注入测试系统软件
  • 6.6 小结
  • 第七章 LSFT32微处理器芯片设计与应用
  • 7.1 LSFT3201微处理器的芯片设计、流片及结果
  • 7.1.1 设计流程
  • 7.1.2 定制单元
  • 7.1.3 实现结果
  • 7.1.4 测试、验证与实验
  • 7.2 LSFT3202微处理器的芯片设计、流片及结果
  • 7.2.1 设计流程
  • 7.2.2 LSFT3202的实现结果
  • 7.2.3 可靠性设计保障
  • 7.2.4 测试、验证与实验
  • 7.3 与国外抗辐射处理器的性能对比
  • 7.4 LSFT3201及LSFT3202的工程应用
  • 7.5 LSFT32微处理器设计技术应用
  • 7.5.1 构建国产化星载计算机设计平台
  • 7.5.2 构建SOC设计平台
  • 7.6 小结
  • 第八章 总结与展望
  • 8.1 论文研究工作总结
  • 8.2 论文工作的后续设想
  • 致谢
  • 博士期间发表的论文与参加的工作
  • 参考文献
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  

    面向空间应用的容错RISC处理器体系结构研究
    下载Doc文档

    猜你喜欢