×

签到

分享到微信

打开微信,使用扫一扫进入页面后,点击右上角菜单,

点击“发送给朋友”或“分享到朋友圈”完成分享

面向MLU220的模型离线化过程报错求助 echo_hwj2023-11-06 16:41:36 回复 1 查看 技术答疑 使用求助 经验交流
面向MLU220的模型离线化过程报错求助
分享到:

【寒武纪硬件产品型号】必填*:MLU220

【使用操作系统】必填*:ubuntu

【使用驱动版本】必填*:v1.7.0

【网络模型】:ERFNet (ubuntu, pytorch 1.12.1) 

【出错信息】必填*:

模型量化成功,在离线化过程中报错如下所示:

[cnmlError] Internal type: MLU::pool, Op name: UNSET dimension mismatch,output shape is wrong, the given shape is:(n=1, c=3,h=256,w=256, d=0, t=0, data in array:{1, 256, 256, 3, } , but the expected shape is:(n=1, c=4,h=256,w=256, d=0, t=0, data in array:{1, 256, 256, 4, }

图片_20231106155309.png


【当前已做了哪些信息确认】选填:
由于项目需要,刚刚接触寒武纪芯片的模型部署过程,所以对报错的处理还不甚清楚,甚至不知道怎么排查错误的原因,只是简单分析并验证了一下可能出现的原因,个人认为可能的原因有三种:1. 模型本身的问题,2. 离线化脚本的问题,3. 寒武纪的适配问题。

验证过程:

1. 针对模型本身:在主机环境 (ubuntu, pytorch 1.12.1) 下对ERFNet模型进行了多次推理测试,均运行正常,排除了模型自身问题的可能;

2. 针对离线化脚本:使用resnet50模型测试,离线化成功,排除了离线化脚本问题的可能;

因此,本人认为报错的原因应该是寒武纪适配的问题,不知道各位大佬有没有遇到过类似的问题,或者有没有进一步确定问题原因的方法。谢谢各位不吝赐教。



版权所有 © 2024 寒武纪 Cambricon.com 备案/许可证号:京ICP备17003415号-1
关闭