论文摘要
自从David Patterson等人在1988年提出RAID(Redundant Arrays of Inexpensive Disks)概念以来,RAID技术不断发展,并被广泛应用于当前的大型存储系统。随着信息量的爆炸性增长和新的多媒体应用的出现,经常出现磁盘阵列系统存储能力不足的情况,传统的阵列扩容方式往往需要中断系统服务,这对大多数的应用是不允许的,因此高效的磁盘阵列在线扩容系统成为一个重要的研究课题。磁盘阵列在线扩容过程中的核心问题是数据迁移算法的选取,现有RAID在线扩容产品大都采用数据布局不变的迁移算法,即目标RAID保持原RAID数据布局方式不变,该算法最大的缺点在于数据迁移量太大,因而需要非常长的扩容时间。在对数据布局不变的迁移算法的改进基础上,设计了一种高效的基于反馈控制的分组分区数据迁移策略,分组使得迁移过程可以乱序进行,分区则大大减小了数据迁移量,再通过反馈机制,控制迁移粒度的大小,使迁移速度能够根据用户请求的频率而调整,从而达到迁移速度和用户请求响应速度的平衡。使用基于反馈控制的分组分区数据迁移策略,设计了磁盘阵列在线扩容系统,该系统除了能够高效的满足扩容功能外,还加入了异常处理模块,对扩容过程中的掉电和磁盘故障进行处理,同时还提供了很多灵活的扩容管理功能,如扩容停止,扩容回退等。最后,通过对现有磁盘阵列扩容方式的对比研究,总结出六个在磁盘阵列在线扩容过程中应该尽量达到的目标,如快速扩容、用户响应及时、可连续扩容等,使用这六个目标对该阵列系统进行分析和评价,证明该磁盘阵列扩容系统具有较高的综合性能。