打开微信,使用扫一扫进入页面后,点击右上角菜单,
点击“发送给朋友”或“分享到朋友圈”完成分享
nn.PixelShuffle像素重组算子需要对输入tensor中的每一个元素进行打乱重组,我现在想到的策略是找到input和output之间的映射关系,然后通过memcpy将input中的元素一一映射到output中,本来用的是GDRAM2GDRAM,但是频繁访问GDRAM的开销太大,性能太差。但是如果把数据移动到NRAM上的话,NRAM只支持128倍数字节的数据移动,不能将元素一一对应起来。我想问是否有什么方法能让我更换存储空间计算,或者有什么高性能计算函数能实现矩阵打乱。
热门帖子
精华帖子