摘要

FT-M7002是我国自主研发的高性能DSP,具有强大的向量处理能力。为有效发挥它的性能优势,亟待解决面向FT-M7002的高效矩阵分解算法。Cholesky分解是针对对称正定矩阵的一种快速分解方式,在FT-M7002处理器上研究优化Cholesky分解算法,通过生成上三角矩阵代替下三角矩阵、手工向量化、循环合并、循环展开和软件流水等手段提高算法性能。结果表明:优化后的算法相对于对应的TI库函数获得了1.90~2.82的加速比,在使用循环展开和软件流水等循环优化方法后相对于对应的TI库函数获得了3.29~7.01的加速比,加速效果较为明显。