你好请问,在后处理输出这块[64 + i * 7 + 0].item()),64 是什么意思呢
谢谢,确实前后处理出了问题。我现在在优化Yolov5的离线推理速度,不知道您能不能提供一下您优化的思路?
请问前后处理具体修改了那些部分呢
在线融合和离线的精度基本是一致的,排查下前处理部分
在寒武纪mlu270平台,yolov5 int8量化后,再逐层或者融合,输出目标框变得不准,目标框变大
[
64
+
i
*
7
0
].item()),64 是什么意思呢
请问您有比较过离线和在线,精度变化了多少吗?我现在也在弄离线推理,但MeanAP下降了2个百分点,有点多。
谢谢. 不过可能我没有表达清楚, 我的疑问是最终生成的.cambricon(_twin)文件中, Shape(dim)这块儿batch_size的选取对最终性能有啥影响?
这个一般选取4的倍数越大越好,到达性能极限时提升会变得非常缓慢,然后选一个比较合适的batch_size即可
了解, 另外请问下, 生成offline模型时, batch_size的选取对结果的影响, 对于yolov5s一般会怎样设置以达到最优性能?
嗯对 yolov5s 可以把focus层替换为conv优化一下
您说的v5.0是yolov5s嘛? 版本参考https://github.com/ultralytics/yolov5
您好,由于yolov5的版本太多,以及输入形状可变,我这边没有做太多的测试,不过yolov5在mlu上的优化一般需要通过用conv替换focus层,以及搜索cnml最佳配置来获取
yolov5 v5.0在270上优化后的吞吐性能大概在900fps左右
请登录后评论