打开微信,使用扫一扫进入页面后,点击右上角菜单,
点击“发送给朋友”或“分享到朋友圈”完成分享
你好,我们正在移植一个点云目标检测模型(其中包括一个自定义算子),int16量化后转离线模型,如下是mlu220和gpu模型输出结果的比较:
然后经过cpu后处理后,结果偏差较大,如下,每一列分别是class、xyzwlh、dir、score(可以明显看到mlu上丢失了高score目标):
mlu220:
gpu:
量化代码如下:
尝试的方法:
更换量化方法,使用eqnm量化,结果精度差不多
使用分通道量化,量化过程耗时几十分钟最后放弃了,可能因为模型通道数太多?有几千通道
使用模拟量化工具,报错:RuntimeError: "sum_cpu" not implemented for 'Half'
没有MLU270,无法逐层
问题:
这个int16量化的mse和cosine_similarity误差算正常吗?
是否可以初步判定是算子的问题?
如果是算子问题,没有MLU270无法定位具体算子,可以提供其他帮助和建议吗?
热门帖子
精华帖子