摘要
本文主要讨论了现有基于CNN的AI芯片及相关软硬件关键技术的发展情况,在此基础上基于现有加速单元模块和FPGA资源开发形成了可用于CNN硬件加速的运算电路平台;结合经典人脸识别算法进行了验证,并对该加速电路平台的算力、功耗和电路性能优化方面提出了优化和改进策略。
- 单位
本文主要讨论了现有基于CNN的AI芯片及相关软硬件关键技术的发展情况,在此基础上基于现有加速单元模块和FPGA资源开发形成了可用于CNN硬件加速的运算电路平台;结合经典人脸识别算法进行了验证,并对该加速电路平台的算力、功耗和电路性能优化方面提出了优化和改进策略。