×
分享到微信

打开微信,使用扫一扫进入页面后,点击右上角菜单,

点击“发送给朋友”或“分享到朋友圈”完成分享

编写nn.PixelShuffle时遇到的性能优化问题 待解决 幺白幺木2022-11-22 11:33:17 回复 2 查看 使用求助
编写nn.PixelShuffle时遇到的性能优化问题
分享到:

nn.PixelShuffle像素重组算子需要对输入tensor中的每一个元素进行打乱重组,我现在想到的策略是找到input和output之间的映射关系,然后通过memcpy将input中的元素一一映射到output中,本来用的是GDRAM2GDRAM,但是频繁访问GDRAM的开销太大,性能太差。但是如果把数据移动到NRAM上的话,NRAM只支持128倍数字节的数据移动,不能将元素一一对应起来。我想问是否有什么方法能让我更换存储空间计算,或者有什么高性能计算函数能实现矩阵打乱。

版权所有 © 2022 寒武纪 Cambricon.com 备案/许可证号:京ICP备17003415号-1
关闭