×

签到

分享到微信

打开微信,使用扫一扫进入页面后,点击右上角菜单,

点击“发送给朋友”或“分享到朋友圈”完成分享

用多卡跑MLU离线模型时出现Init kernel的报错 已解决 Xinqian2022-05-27 09:28:06 回复 8 查看 使用求助
用多卡跑MLU离线模型时出现Init kernel的报错
分享到:

求助各位大神,我在使用多张MLU270跑离线模型时,cnrtForkRuntimeContext这里会报错,具体报错信息如下图。但奇怪的是,整体程序还是能正常运行,且得到正确的结果。并且单独把这个函数拿出来能够正常运行不报错,但是放在整个离线代码里就会有报错提示,实在是很疑惑求解答。

代码:

for (auto device : deviceIds) {

    cnrtRuntimeContext_t ctx;

    prepareRuntimeContext(&ctx, function, device, channel_dup);

    std::vector<cnrtRuntimeContext_t> rctxs;

    rctxs.push_back(ctx);

    for (int i = 1; i < threads; i++) {

      cnrtRuntimeContext_t tmp_ctx;

      cnrtForkRuntimeContext(&tmp_ctx, ctx, NULL);

      rctxs.push_back(tmp_ctx);

    }

    dev_runtime_contexts_.push_back(rctxs);

}

报错图片:

image.png



版权所有 © 2024 寒武纪 Cambricon.com 备案/许可证号:京ICP备17003415号-1
关闭