已经解决了
您好,我想复现您的第三步使用__bang_conv替换原始标量乘法,阅读您的代码我有点疑惑,按照您说的先把右矩阵部分从GDRAM拷贝到NRAM使用的__memcpy(input2NRAM_tmp,inptu2+i*ROUND*K,K*ROUND*sizeof(int 8),GDRAM2NRAM),我认为GDRAM的内存的排序方式应该是按照行进行排序,所以这样并不会像图画出来的取出来K*BOUND这样一个矩阵形状的内存,而是(n/ROUND)行的矩阵+(n%ROUND)列的这样一个形状的内存,不知道我的理解是否正确。
下一个调整为NHWC格式我看了BANGC开发者手册是不是后面的count应该是63,因为seg_nun=<count+1>,我理解是将input2NRAM_tmp中的内存重新间隔排序,希望能够解答一下
你好,请问GDRAM向SRAM拷贝数据异常报错该如何处理呢?(仅拷贝,不操作,且没有访问非法内存。。);报错如下:
2021-03-30 05:45:54.182706: [cnrtError] [1428] [Card : 0] unknown error2021-03-30 05:45:54.182760: [cnrtError] [1428] [Card : 0] for more information, please use core dump analysis tools. 2021-03-30 05:45:54.228904: [cnrtError] [1428] [Card : 0] mluLaunchKernel fail. 2021-03-30 05:45:54.228951: [cnrtError] [1428] [Card : 0] fail to lanuch kernel. 2021-03-30 05:45:54.229013: [cnrtError] [1428] [Card : 0] for more information, please use core dump analysis tools. 2021-03-30 05:45:54.375164: [cnrtError] [1428] [Card : 0] mluLaunchKernel fail. 2021-03-30 05:45:54.375225: [cnrtError] [1428] [Card : 0] fail to lanuch kernel. 2021-03-30 05:45:54.375245: [cnrtError] [1428] [Card : 0] for more information, please use core dump analysis tools.
下图是部分源代码:
请登录后评论