×

签到

分享到微信

打开微信,使用扫一扫进入页面后,点击右上角菜单,

点击“发送给朋友”或“分享到朋友圈”完成分享

多个离线模型同时执行出错 已完结 mq2021-12-07 11:29:32 回复 7 查看 技术答疑 使用求助
多个离线模型同时执行出错
分享到:

多个进程,每个进程循环执行一个模型(yolov4),一段时间后打印如下错误:

start queue dump
queue dump success
2020-01-16 12:53:21.376605: [cnrtError] [2296] [Card : 0] MLU unfinished. cnrtStream fail.
2020-01-16 12:53:21.376654: [cnrtError] [2296] [Card : 0] fail to stream sync.
2020-01-16 12:53:21.376672: [cnrtError] [2296] [Card : 0] for more information, please use core dump analysis tools.
2020-01-16 12:53:21.376694: [cnrtError] [2296] [Card : 0] [cambricon_api.h:281] CNRT error, code=632025(Failure on Queue.) "cnrtSyncQueue(queue)"
  1. 运行模型少的话(比如2个进程),运行超过十小时,未报错;

  2. 运行模型多的话(比如12个进程),半小时左右出现上述错误,但程序任然在循环执行,并且循环报错。

版权所有 © 2024 寒武纪 Cambricon.com 备案/许可证号:京ICP备17003415号-1
关闭