亲爱的开发者您好,您的代码需对齐下layout,cpu一般是nchw,mlu是nhwc。可参考 https://www.cambricon.com/docs/sdk_1.13.0/cntoolkit_3.5.2/cambricon_bang_c_4.5.1/2Builtin-Functions/Artificial%20Intelligence%20Functions.html#bang-conv。 [图片]展开
亲爱的开发者您好,您的代码需对齐下layout,cpu一般是nchw,mlu是nhwc。可参考 https://www.cambricon.com/docs/sdk_1.13.0/cntoolkit_3.5.2/cambricon_bang_c_4.5.1/2Builtin-Functions/Artificial%20Intelligence%20Functions.html#bang-conv。 [图片]展开
但我测试的时候src与kernel矩阵是全1的,layout应该不影响数据在内存中的存放吧?全1的1*4*4*16的kernel对src的卷积不就是1*4*4*16个1*1相加吗?
亲爱的开发者您好,您的代码需对齐下layout,cpu一般是nchw,mlu是nhwc。
请登录后评论