我们实验室自主完成的基于RAID2.0的大规模磁盘阵列的快速修复算法被计算机系统领域会议ICPP(CCF B类)收录。向各位参与研究工作的老师、同学表示祝贺。
论文题目:Fast Reconstruction for Large Disk Enclosures Based on RAID2.0
论文摘要:
随着数据的爆炸式增长,越来越多的企业使用RAID2.0来提供大容量的数据存储。由于内存、CPU、磁盘带宽等资源的限制,当RAID2.0中发生磁盘故障时,数据重构一般是分批进行的。RAID2.0中随机数据布局和重构方案使得在每一批修复的IO负载在幸存磁盘上的分布是不均衡的。这种方式极大地降低了数据重构的速度。为了解决这个问题,我们提出了一种快速修复算法DR-RAID,能够有效地避免在重构过程中IO负载不均衡的情况。相比于在RAID2.0中顺序的执行待重构的任务,DR-RAID动态的从所有的待重构任务中选择一批有着均衡读负载的任务。同时,我们将重构数据分布到幸存磁盘的问题转换为一个二分图模型,并通过在二分图模型中找最大匹配的方式实现了写负载的均衡分布。此外,DR-RAID可以应用在同构和异构的重构带宽的场景中。与目前RAID2.0中的的重构方案进行实验相比,DR-RAID在离线修复中最大能够提升61.90%的重构吞吐量,在变化重构带宽的场景下最大能够提升59.28%的重构吞吐量。DR-RAID能够在不依赖数据布局的情况下有效地消除数据重构过程中局部的IO负载不均衡,极大地缩短了重构负载对用户请求的干扰时间。