
论文摘要
当前,世界上太空探索的热潮再度兴起。人类探索太空的活动更加活跃的同时,太空辐射环境对探测器可靠性的负面影响也日益突出。空间辐射环境对电子器件的影响可分为单粒子效应和总剂量效应两类,其中单粒子效应尤其是单粒子翻转故障构成了对星载计算机安全的主要威胁。相关研究结果表明,相对于使用抗辐照器件的硬件容错技术,采用软件容错技术,即在商用器件上采用软件的方法容忍硬件故障,可以在保证系统可靠性的前提下,获得更高的系统性能。软件容错技术同时也具有低成本、低功耗、可灵活配置等优点。本文在分析当前已有软件容错技术成果的基础上,围绕故障检测算法、容错优化技术进行了深入研究。首先,本文提出了一种新的故障检测技术——基于层次分解的故障检测技术。不同于其它已有的故障检测技术,基于层次分解的故障检测技术将程序结构划分为不同的层次,并在不同的层级上使用不同的故障检测算法,通过这些检测算法相互配合、层层检测,实现了对不同种类故障、不同类型的程序错误进行检测,提高了程序运行的可靠性。然后,本文根据程序不同区域在应用故障检测算法后通常在可靠性和性能方面具有不同反应的特点,提出了一种可配置的故障检测算法。算法建立了容错程序的可靠性反应和性能反应分析模型,并基于分析结果获得具有最佳性价比的容错配置方案。最后,本文基于编译容错的思路,实现了基于层次分解的故障检测技术和可配置的故障检测算法,并通过故障注入实验对这些技术的故障检测能力和性能代价进行了测试。基于层次分解的故障检测技术对硬件故障的检测率达到了97.9%-99.1%。相比基于层次分解的故障检测技术,可配置的故障检测算法以0.5%-1.4%的故障检测率损失为代价,使容错的性能消耗下降了12%-20%。
论文目录
摘要ABSTRACT第一章 绪论1.1 研究背景及意义1.2 本文主要工作1.3 论文结构第二章 技术背景2.1 容错技术概述2.1.1 容错技术相关概念2.1.2 软件容错技术2.2 控制流校验技术2.2.1 控制流校验概述2.2.2 相关工作2.3 软件复算技术2.3.1 软件复算技术原理2.3.2 主要研究工作2.3.3 其它研究2.4 容错实现与验证技术2.4.1 容错实现技术2.4.2 容错验证技术第三章 基于层次分解的故障检测技术3.1 FDTPH 技术概述3.1.1 相关定义3.1.2 FDTPH 技术基本原理3.1.3 FDTPH 技术分析3.2 基于逆向恢复的故障检测算法3.2.1 EDCC 算法原理3.2.2 可恢复运算指令3.2.3 程序等价变换3.2.4 EDCC 实现算法3.2.5 EDCC 算法优缺点分析3.3 基于ECC 的存储错误检测算法3.3.1 SFDE 基本原理3.3.2 SFDE 实现算法3.3.3 SFDE 小结3.4 基于可靠标签的控制流校验算法3.4.1 静态标签的设计3.4.2 控制流错误检测原理3.4.3 CFCRS 实现算法3.4.4 CFCRS 控制流错误检测能力分析第四章 故障检测的优化技术4.1 容错优化概论4.2 可配置的故障检测算法4.2.1 程序容错特征分析4.2.2 可靠性反应分析模型4.2.3 性能反应模型及容错优化4.2.4 CFDA 小结第五章 容错算法的实现和验证5.1 容错转换系统总体设计5.2 容错转换系统详细设计5.2.1 寄存器分配策略5.2.2 容错转换系统数据结构设计5.2.3 容错转换实例分析5.3 故障注入实验结果及分析5.3.1 实验条件5.3.2 实验结果5.3.3 实验结论第六章 结束语致谢参考文献作者在学期间取得的学术成果
相关论文文献
标签:单粒子效应论文; 可配置的故障检测算法论文;