论文摘要
随着计算机系统在社会生活中的广泛应用,人们对其可靠稳定运行能力的要求也越来越提高。操作系统内核是计算机系统中最重要的部分,它包括了操作系统最基本的如内存管理、文件系统、任务调度、设备管理等功能,在统一的操作系统内核中,都以子系统的形式存在,这些子系统在运行期间共享一个内存地址空间,一旦出现错误,便会对整个系统产生影响,因此操作系统内核的可靠性研究显得尤为重要。故障注入作为一种有效的加速系统失效的实验方法,通过系统在模拟真实环境下的故障反应,收集系统的反应信息,对评测系统的可靠性提供数据支持。本文主要研究基于故障注入的操作系统内核可靠性评测方法,首先研究分析了影响操作系统可靠性的因素,国内外故障注入方法和工具的发展和研究现状,对可靠性评测技术、故障注入技术的方法和应用等进行了详细的介绍和分析。针对操作系统内核架构和可靠性属性特点,把操作系统运行时的内存地址和系统源码级别定义的内存数据结构进行一一对应,并测试操作系统内核中静态分配的内核数据在内存故障下对系统可靠性的影响,提高了系统评测的全面性和精确性,并以此为基础完成了基于故障注入的操作系统内核可靠性评测工具的设计和实现工作。通过分析故障注入的原理和过程,给出了操作系统内核可靠性评测工具的总体架构和各个功能结构,设计了系统控制模块、心跳检测模块、故障负载生成模块、内核内存故障注入模块、结果回收和数据分析模块,支持不同的故障类型,支持不同的故障注入间隔时间。最后应用开发的故障注入工具进行一系列的实际故障注入实验,验证了本文所设计的面向操作系统内核的故障注入工具的有效性,并给出实验初步结果及分析。