摘要
为了高效可靠的存储海量数据,分布式存储系统常利用纠删码来降低存储开销.Hitchhiker码是Piggybacking架构下易于工程实现的双条带MDS(Maximum Distance Separable Code)码,具有参数(k,r)取值任意、修复成本较低等特征.然而,目前Hitchhiker码只优化了数据单元的修复带宽,未优化校验单元的修复带宽.针对此问题,本文提出了利用LRC (Locally Repairable Code)的思想同时优化数据单元和校验单元的编码(Hitchhiker-LRC和Hitchhiker-LRC+).该方法是对第一个子条带中l个校验求局部校验,将其存放在第一个子条带的某个校验上,要求该校验的数据已通过局部校验的形式捎带在了第二个子条带的后r-1个校验中,并且对该校验单元做了横向减法.最后,理论和实验证明,Hitchhiker-LRC和Hitchhiker-LRC+这两种编码在2≤r <k/2时可降低1%~5%修复带宽和节省约10%的修复时间,在k/2≤r <k时,Hitchhiker-LRC+在r较大时,相比Hitchhiker-LRC具有更低的修复带宽;并存在l使得修复带宽率达到最优.
- 单位