使用的yolov3的模型是darknet官网上面的yolov3,然后转成pth
1) output的c是107584,输出的数据里面,第一个float32表示当前帧的目标总个数,后面接了63个没有实际含义的float32,跳过。从第65个数开始,是框信息,7个一组。所以count是一帧包含的float的size,64是一个目标数占位+63个无效数2)第一个视频有框,第二个没框?这估计是应用层代码的问题,模型应该没问题。第二个视频放在第一个跑,会有框吗展开
因为使用了firstconv,会把输入变成int8的rgba,需要送入4通道图像数据(c在低维),并且网络内部会做减均值除方差(在量化时设置进去的mean/std)展开
请登录后评论