LV.1

Gummary

88积分2赞

5 帖子 23 回复 1 收藏

TA的动态

TA的帖子

TA的回复

模型驱动安装出错。 我的回复：#1niubucai回复这么冷清吗是的。。。技术支持约等于0 0

请问为什么每次加载模型后，参数都不一样？ 我的回复：最终解决方案：经过排查是由于寒武纪的Caffe在读取由GPU训练的Caffe模型时，无法正确解析参数，如下图所示：解决方案是，先在GPU的Caffe版本下将caffe模型参数使用pyhton的pickle模块导出，在寒武纪服务器上读取模型参数，給网络赋值后使用寒武纪的Caffe保存该模型。 0

请问为什么每次加载模型后，参数都不一样？ 我的回复：我使用的板卡是MLU100，SDK是v8.0 0

Caffe框架GPU与MLU计算结果不一致请问如何调试？ 我的回复：#9goodchong 回复谢谢~我觉得你分析的是有道理的。放不方便把这两个层的输入规模参数，输入的内容dump出来发上来？我想试着复现一下。还有软件栈的版本? 这种情况确实很少见，谢谢您的反馈。展开你给我个邮箱之类的? 2

Caffe框架GPU与MLU计算结果不一致请问如何调试？ 我的回复：#3goodchong 回复放不方便把Proposal层和ROIPooling层的结果贴一下？你是用GPU的还是CPU比较的？放不方便都贴一下？谢谢~展开展开贴了，你看一下 2

Caffe框架GPU与MLU计算结果不一致请问如何调试？ 我的回复：在GPU模式下ROIPooling层的输出结果为：在MLU模式下运行，结果为：最后在CPU模式下使用ROIPooling算子，计算结果为：对比CPU和GPU的运算结果可知，仅处理了第一个ROI，我修改了ROIPooling层部分代码才能得到正确结果。而MLU模式下的ROIPooling层的结果是完全错误的。 2

Caffe框架GPU与MLU计算结果不一致请问如何调试？ 我的回复：首先在GPU上使网络输出Proposal层的运算结果，如下：使用寒武纪的Proposal算子在CPU模式下运行的结果为：MLU模式下的结果为：将寒武纪的Proposal层替换为Python的Proposal层，在CPU模式下的运算结果为：与GPU计算结果是一致的，所以我认为Proposal算子有问题 2

Caffe框架GPU与MLU计算结果不一致请问如何调试？ 我的回复：#1qwer 回复MLU100上的数据格式为FP16/INT8, 运算结果不一致是合理的，具体正确性要看误差，可以用MAPE度量一下误差，一般FP16不会超过%1。另外如果是faster-rcnn网络，不要直接比较proposal层之后的结果，只能直接比较proposal层前的结果。proposal层之后的结果因为涉及到bbox，无法直接比较，可以用IOU之类的方法比较。最后MLUfaster-rcnn的输出结果layout和CPU的输出结果layout不同，因此两者的后处理方式是不一致的，具体可以参考我司提供的后处理示例。展开我重新对比了一下GPU与MLU的输出结果，Proposal层之前的处理结果是正确的，但是MLU的Proposal和ROIPooling层有问题。在输入特征相同的情况下，使用FasterRCNN的Proposal层和MLU的Proposal层得到的结果是不一致的；使用FasterRCNN的Proposal层得到正确的ROI后，输入到ROIPooling层只处理了第一个ROI，我修改了CPU版本的ROIPooling层才可以得到正确的结果。 2