开发者论坛

全部回复

LV.5 #11 goodchong回复
#10Gummary 回复
你给我个邮箱之类的?
您直接发到论坛上可方便？
2020-07-03 15:40:45 0| 回复

LV.1 #10 Gummary回复

#9goodchong 回复

谢谢~我觉得你分析的是有道理的。放不方便把这两个层的输入规模参数，输入的内容dump出来发上来？我想试着复现一下。还有软件栈的版本? 
这种情况确实很少见，谢谢您的反馈。

展开

你给我个邮箱之类的?

2020-03-24 22:59:18 0| 回复

LV.5 #9 goodchong回复
#8Gummary 回复
贴了，你看一下
谢谢~我觉得你分析的是有道理的。放不方便把这两个层的输入规模参数，输入的内容dump出来发上来？我想试着复现一下。还有软件栈的版本? 这种情况确实很少见，谢谢您的反馈。
2020-03-24 15:35:47 0| 回复

LV.1 #8 Gummary回复

#3goodchong 回复

放不方便把Proposal层和ROIPooling层的结果贴一下？你是用GPU的还是CPU比较的？放不方便都贴一下？谢谢~

展开展开

贴了，你看一下

2020-03-23 16:24:18 1| 回复

LV.1 #7 Gummary回复

在GPU模式下ROIPooling层的输出结果为：
在MLU模式下运行，结果为：
最后在CPU模式下使用ROIPooling算子，计算结果为：
对比CPU和GPU的运算结果可知，仅处理了第一个ROI，我修改了ROIPooling层部分代码才能得到正确结果。而MLU模式下的ROIPooling层的结果是完全错误的。

2020-03-23 16:23:23 2| 回复
LV.1 #6 Gummary回复

首先在GPU上使网络输出Proposal层的运算结果，如下：
使用寒武纪的Proposal算子在CPU模式下运行的结果为：
MLU模式下的结果为：
将寒武纪的Proposal层替换为Python的Proposal层，在CPU模式下的运算结果为：
与GPU计算结果是一致的，所以我认为Proposal算子有问题

2020-03-23 16:19:48 1| 回复

LV.1 #5 CodeLi回复

#3goodchong 回复

放不方便把Proposal层和ROIPooling层的结果贴一下？你是用GPU的还是CPU比较的？放不方便都贴一下？谢谢~

展开展开

楼主应该是使用的GPU的。

2020-03-22 11:44:51 0| 回复

LV.1 #4 CodeLi回复

#1qwer 回复

MLU100上的数据格式为FP16/INT8, 运算结果不一致是合理的，具体正确性要看误差，可以用MAPE度量一下误差，一般FP16不会超过%1。另外如果是faster-rcnn网络，不要直接比较proposal层之后的结果，只能直接比较proposal层前的结果。proposal层之后的结果因为涉及到bbox，无法直接比较，可以用IOU之类的方法比较。最后MLUfaster-rcnn的输出结果layout和CPU的输出结果layout不同，因此两者的后处理方式是不一致的，具体可以参考我司提供的后处理示例

展开

真厉害，从这个回复我也得到了解决问题的启发

2020-03-22 11:43:47 0| 回复

LV.5 #3 goodchong回复

#2Gummary 回复

我重新对比了一下GPU与MLU的输出结果，Proposal层之前的处理结果是正确的，但是MLU的Proposal和ROIPooling层有问题。在输入特征相同的情况下，使用FasterRCNN的Proposal层和MLU的Proposal层得到的结果是不一致的；使用FasterRCNN的Proposal层得到正确的ROI后，输入到ROIPooling层只处理了第一个ROI，我修改了CPU版本的ROIPooling层才可以得到正确的结果。

展开

放不方便把Proposal层和ROIPooling层的结果贴一下？你是用GPU的还是CPU比较的？放不方便都贴一下？谢谢~

2020-03-17 18:24:32 0| 回复

LV.1 #2 Gummary回复

#1qwer 回复

MLU100上的数据格式为FP16/INT8, 运算结果不一致是合理的，具体正确性要看误差，可以用MAPE度量一下误差，一般FP16不会超过%1。另外如果是faster-rcnn网络，不要直接比较proposal层之后的结果，只能直接比较proposal层前的结果。proposal层之后的结果因为涉及到bbox，无法直接比较，可以用IOU之类的方法比较。最后MLUfaster-rcnn的输出结果layout和CPU的输出结果layout不同，因此两者的后处理方式是不一致的，具体可以参考我司提供的后处理示例。

展开

我重新对比了一下GPU与MLU的输出结果，Proposal层之前的处理结果是正确的，但是MLU的Proposal和ROIPooling层有问题。在输入特征相同的情况下，使用FasterRCNN的Proposal层和MLU的Proposal层得到的结果是不一致的；使用FasterRCNN的Proposal层得到正确的ROI后，输入到ROIPooling层只处理了第一个ROI，我修改了CPU版本的ROIPooling层才可以得到正确的结果。

2020-03-03 20:19:46 3| 回复

优质回复

LV.2 #1 qwer回复

MLU100上的数据格式为FP16/INT8, 运算结果不一致是合理的，具体正确性要看误差，可以用MAPE度量一下误差，一般FP16不会超过%1。另外如果是faster-rcnn网络，不要直接比较proposal层之后的结果，只能直接比较proposal层前的结果。proposal层之后的结果因为涉及到bbox，无法直接比较，可以用IOU之类的方法比较。最后MLUfaster-rcnn的输出结果layout和CPU的输出结果layout不同，因此两者的后处理方式是不一致的，具体可以参考我司提供的后处理示例。

2020-02-27 11:24:54 8| 回复
优质回复

请登录后评论