摘要

统一染色器阵列是图形处理器(GPU)的重要功能部件,主要完成顶点、像素的统一染色功能。在统一染色器阵列中,提出了采用双发射指令并行执行4个周期的结构来隐藏流水线延迟,提升染色处理器的指令吞吐率。进行了取指译码单元(FDU)的方案设计、关键功能点的分析与设计,基于虚拟仿真平台和XilinxFPGA原型系统对设计进行了验证,结果表明设计各项功能正确且性能满足设计要求。在SMIC 65 nm CMOS工艺下,采用Synopsys Design Compiler对设计进行综合,电路工作频率达到600 MHz,满足系统应用要求。