是的老师,第四个问题我之前没有写bangc的多核;另外问题2问题3可能是因为只有一个mlu,所以在os.environ['MLU_VISIBLE_DEVICES'] = "1"时根本没有计算,(不过也没有报错就很神奇);现在只剩下问题1,多次循环时mlu运行时间一直递增,本来只需要40ms左右的计算量,循环到100次的时候就需要100ms左右,循环到200次的时候甚至达到了200ms,不知道这是什么原因产生的问题展开
根据这个现象,也没有办法准确判断问题出在哪里。建议 export CNRT_PRINT_INFO=ON、 export CNRT_GET_HARDWARE_TIME=ON 这两个环境变量能看到mlu的硬件运行时间,让他看看这个硬件时间是否也是随循环增加的展开
是的老师,第四个问题我之前没有写bangc的多核;另外问题2问题3可能是因为只有一个mlu,所以在os.environ['MLU_VISIBLE_DEVICES'] = "1"时根本没有计算,(不过也没有报错就很神奇);现在只剩下问题1,多次循环时mlu运行时间一直递增,本来只需要40ms左右的计算量,循环到100次的时候就需要100ms左右,循环到200次的时候甚至达到了200ms,不知道这是什么原因产生的问题展开
第四个问题 ——config这样设置应该是没问题的,但多核不仅需要设置config,bangc算子也需要根据多核分配每个核的计算任务,是不是bangc的多核没写对?展开
请登录后评论