LV.1

liujing

255积分1赞

45 帖子 17 回复 1 收藏

TA的动态

TA的帖子

TA的回复

无法登录实验平台 我的回复：已经可以登陆了 0

综合实验二east编写mlu申请内存 3乘672乘1280 超出内存限制 我的回复：batch num表示一次传入的图片数量，core num表示参与计算的核的数量，一共有16个核，mlu上nram只有512k，数据不能太大 0

Error reading header 我的回复：请查看单算子测试是不是正确的，然后定位一下程序是在哪个位置报错的 0

选作实验 bang_softmax 编译失败 我的回复：没有source env 0

报错我的回复：#3ddddebug 回复定位错误后，发现是在融合算子的计算上出的问题，而且实验视频中通过单算子之后紧接着直接运行成功run_acise.sh，也没有进行融合算子等操作。展开如果单算子通过了的话可能是集成的时候出现了问题，bangc算子的注册是在batch_matmul_v2_op_mlu.h 和 batch_matmul_v2.cc这两个文件里的，是不是这两个文件里的接口和bangc算子没有对上？建议把tf-add-batchmatmulv2文件夹下的所有文件都看看检查一下。 0

如何把tensor转换为数组的形式？ 我的回复：#1w3jc 回复没有其他方法，必须要喂数据进去执行一次计算才能取出来数据，我理解tensor就是一个占位的东西，只有拿实际数据计算过了才有数据。展开顶 0

__bang_reshape_nchw2nhwc BUG？ 我的回复：4. <h> * <w> * sizeof(src) must be dividable by 64;5. <c> * sizeof(src) must be dividable by 64.这里写的是 h * w * sizeof(src) 必须能被64整除，你好像理解成了 h * w必须被64整除 0

实验1测试时os.environ['MLU_VISIBLE_DEVICES']与多核的问题 我的回复：#2icholaswilde 回复是的老师，第四个问题我之前没有写bangc的多核；另外问题2问题3可能是因为只有一个mlu，所以在os.environ['MLU_VISIBLE_DEVICES'] = "1"时根本没有计算，（不过也没有报错就很神奇）；现在只剩下问题1，多次循环时mlu运行时间一直递增，本来只需要40ms左右的计算量，循环到100次的时候就需要100ms左右，循环到200次的时候甚至达到了200ms，不知道这是什么原因产生的问题展开根据这个现象，也没有办法准确判断问题出在哪里。建议 export CNRT_PRINT_INFO=ON、 export CNRT_GET_HARDWARE_TIME=ON 这两个环境变量能看到mlu的硬件运行时间，让他看看这个硬件时间是否也是随循环增加的 1

__memcpy与文档描述不符 我的回复： dst_stride不能小于 size 1

实验1测试时os.environ['MLU_VISIBLE_DEVICES']与多核的问题 我的回复：第四个问题 ——config这样设置应该是没问题的，但多核不仅需要设置config，bangc算子也需要根据多核分配每个核的计算任务，是不是bangc的多核没写对？ 1

上一页 1 2 3 下一页