摘要
数字信号处理器(DSP)广泛应用于各类工业领域和军事装备领域,OpenCV是业界通用的开源图像处理算法库,但目前鲜有针对DSP平台的OpenCV移植和优化实现。在TI 6678平台上实现了OpenCV的移植,生成了支持绝大多数OpenCV功能的TI 6678底层支持库。在此基础上,深入分析了一类OpenCV库函数在TI 6678硬件平台运行的计算特征和数据流,提出了一种针对这类OpenCV库函数的优化方法,将TI 6678体系结构支持的DMA和Cache操作与OpenMP并行框架高效结合,实现这类OpenCV库函数在TI 6678芯片上的优化和多核并行。依据本文的方法,优化改造的OpenCV库函数在TI 6678上单核运行性能最多可提升3.6倍,在单核优化基础上并行改造的这类库函数8核加速比达到2.557.06。
- 单位