开发者论坛

全部回复

LV.1 #24 qingxia回复
#16止战之殇回复
你好请问，在后处理输出这块[64 + i * 7 + 0].item()),64 是什么意思呢
展开
同问，64是怎么来的？
2025-01-06 16:18:36 0| 回复
LV.1 #23 htujun回复

yolov5_detection_output算子，你知道再那里吗，我想修改相应yolov5_detection_output。

2022-08-31 15:00:33 0| 回复

LV.1 #22 yangtuo250回复

#15YukSing回复

谢谢，确实前后处理出了问题。我现在在优化Yolov5的离线推理速度，不知道您能不能提供一下您优化的思路？

请问前后处理具体修改了那些部分呢

2022-03-08 17:20:31 0| 回复

LV.1 #21 htujun回复
#14kikyo回复
在线融合和离线的精度基本是一致的，排查下前处理部分
在寒武纪mlu270平台上生成yolov5模型离线文件，先进行int8量化后，后逐层或者融合，输出的目标框变得不准，目标框变大，且出现很多重复的框。
2022-01-11 14:16:08 0| 回复
LV.1 #20 htujun回复

在寒武纪mlu270平台，yolov5 int8量化后，再逐层或者融合，输出目标框变得不准，目标框变大

2022-01-11 14:15:24 0| 回复
LV.1 #19 htujun回复

在寒武纪mlu270平台，yolov5 int8量化后，再逐层或者融合，输出目标框变得不准，目标框变大

2022-01-11 14:15:19 0| 回复
LV.1 #18 htujun回复

在寒武纪mlu270平台，yolov5 int8量化后，再逐层或者融合，输出目标框变得不准，目标框变大

2022-01-11 14:15:14 0| 回复
LV.1 #17 htujun回复

在寒武纪mlu270平台，yolov5 int8量化后，再逐层或者融合，输出目标框变得不准，目标框变大

2022-01-11 14:14:04 0| 回复
LV.2 #16 止战之殇回复

你好请问，在后处理输出这块[64 + i * 7 + 0].item()),64 是什么意思呢

2021-11-11 13:39:59 1| 回复
LV.1 #15 YukSing回复
#14kikyo回复
在线融合和离线的精度基本是一致的，排查下前处理部分
谢谢，确实前后处理出了问题。我现在在优化Yolov5的离线推理速度，不知道您能不能提供一下您优化的思路？
2021-09-07 14:43:50 0| 回复

LV.9 #14 kikyo回复

#13YukSing回复

请问您有比较过离线和在线，精度变化了多少吗？我现在也在弄离线推理，但MeanAP下降了2个百分点，有点多。

在线融合和离线的精度基本是一致的，排查下前处理部分

2021-09-07 14:15:45 0| 回复

LV.1 #13 YukSing回复

请问您有比较过离线和在线，精度变化了多少吗？我现在也在弄离线推理，但MeanAP下降了2个百分点，有点多。

2021-09-02 14:57:21 0| 回复
LV.2 #12 sunxiaofeng回复

感谢！正好尝试移植中也遇到了您写出的问题

2021-08-17 20:44:54 0| 回复
LV.1 #11 徐浩然回复
#10陈叶飞回复
谢谢. 不过可能我没有表达清楚, 我的疑问是最终生成的.cambricon(_twin)文件中, Shape(dim)这块儿batch_size的选取对最终性能有啥影响?
展开
对于yolov5s这种小网络来说，batchsize是越大性能越好的，随着模型增大或者输入尺寸增大，batchsize的提升对性能的提升会逐渐降低。
2021-08-16 14:35:44 0| 回复
LV.2 #10 陈叶飞回复
#9徐浩然回复
这个一般选取4的倍数越大越好，到达性能极限时提升会变得非常缓慢，然后选一个比较合适的batch_size即可
谢谢. 不过可能我没有表达清楚, 我的疑问是最终生成的.cambricon(_twin)文件中, Shape(dim)这块儿batch_size的选取对最终性能有啥影响?
2021-08-12 16:10:32 0| 回复
LV.1 #9 徐浩然回复
#8陈叶飞回复
了解, 另外请问下, 生成offline模型时, batch_size的选取对结果的影响, 对于yolov5s一般会怎样设置以达到最优性能?
展开
这个一般选取4的倍数越大越好，到达性能极限时提升会变得非常缓慢，然后选一个比较合适的batch_size即可
2021-08-12 15:35:43 0| 回复
LV.2 #8 陈叶飞回复
#7kikyo回复
嗯对 yolov5s 可以把focus层替换为conv优化一下
了解, 另外请问下, 生成offline模型时, batch_size的选取对结果的影响, 对于yolov5s一般会怎样设置以达到最优性能?
2021-08-10 17:02:55 0| 回复
LV.9 #7 kikyo回复
#5陈叶飞回复
您说的v5.0是yolov5s嘛? 版本参考https://github.com/ultralytics/yolov5
展开
嗯对 yolov5s 可以把focus层替换为conv优化一下
2021-08-10 14:33:23 0| 回复

LV.2 #6 陈叶飞回复

#3徐浩然回复

您好，由于yolov5的版本太多，以及输入形状可变，我这边没有做太多的测试，不过yolov5在mlu上的优化一般需要通过用conv替换focus层，以及搜索cnml最佳配置来获取

展开

谢谢.

2021-08-10 10:53:20 0| 回复

LV.2 #5 陈叶飞回复
#4kikyo回复
yolov5 v5.0在270上优化后的吞吐性能大概在900fps左右
您说的v5.0是yolov5s嘛? 版本参考https://github.com/ultralytics/yolov5
2021-08-10 10:52:55 1| 回复

请登录后评论