基于CUDA与CUBLAS的Tucker分解模块设计与实现

周琦; 柴小丽; 马克杰; 俞则人

doi:10.19678/j.issn.1000-3428.0052189

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于CUDA与CUBLAS的Tucker分解模块设计与实现

作者：周琦; 柴小丽; 马克杰; 俞则人

来源：计算机工程, 2019, 45(03): 41-46.

DOI：10.19678/j.issn.1000-3428.0052189

摘要

由于张量Tucker分解在图像处理、人脸识别与信号处理等领域中的大量应用,使得Tucker分解算法成为目前重点研究对象。但是当前流行的Tucker分解算法需要对张量进行多次展开,导致算法加速效率降低。针对上述问题,提出一种应用于统一计算设备架构(CUDA)平台上的改进Tucker分解模块,通过对Tucker分解算法与CUDA平台进行优化,在省略张量展开过程的同时,提高加速效率,从而降低对加速系统的要求。实验结果表明,改进Tucker分解算法在CUDA平台上的加速性能具有明显提高。

单位
中国电子科技集团公司第三十二研究所

全文

访问全文

收藏分享被引浏览

更新时间：2024-04-10 13:12

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号