面向机器学习的高性能SIMT处理器cache的设计与实现

许晓燕; 李涛; 孙哲; 邢立冬

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

面向机器学习的高性能SIMT处理器cache的设计与实现

作者：许晓燕; 李涛; 孙哲; 邢立冬

来源：计算机应用与软件, 2019, 36(07): 282-333.

摘要

为了满足机器学习中大数据、并行计算及降低处理器与主存之间的差距等要求,设计基于自主研发的SIMT处理器的流水线cache结构。依据局部性原理与LRU替换算法相结合设计专用的伪LRU替换算法,与通用的轮询、LFU、LRU替换算法共同完成cache替换算法的可配置要求,实现处理器与主存之间的快速交互。采用Xilinx公司virtex ultrascale系列的xcvu440-flga2892-2-e FPGA芯片对设计进行综合。结果表明该结构指令cache最大时延为2.923 ns,数据cache最大时延为3.258 ns,满足SIMT处理器性能要求。

单位
西安邮电大学; 电子工程学院

收藏分享被引浏览

更新时间：2024-04-11 17:52

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号