矩阵三角分解是一个在科学与工程计算中经常使用且计算量巨大的问题.为能充分利用多核与多GPU系统的计算资源,设计开发了并行异构系统的分块矩阵并行分解算法.该算法根据多核与多GPU的性能,对矩阵进行分块,确保并行粒度与负载平衡;应用静态列块分配方法减少了通信开销并保持了代码的简洁性.