切换版块
×
基础软件平台
PyTorch开发
TensorFlow开发
编解码及SDK开发
BANG语言与计算库
开发工具链
MagicMind开发
软件栈百科
云平台集成
硬件产品专区
MLU370系列AI加速卡
MLU270系列AI加速卡
MLU220系列AI加速产品
经验方案交流区
经验案例与实践分享
开发者服务
开发者活动
公告与版务
高校支持
《智能计算系统》
签到
版块
社区
文档
SDK下载
370系列
200系列
开发平台
官网首页
注册
登录
全部版块
基础软件平台
硬件产品专区
经验方案交流区
开发者服务
高校支持
发布新帖
登录/注册
LV.1
Gummary
88
积分
2
赞
5
帖子
23
回复
1
收藏
TA的动态
TA的帖子
TA的回复
模型驱动安装出错。
我的回复:#1niubucai回复这么冷清吗是的。。。技术支持约等于0
0
请问为什么每次加载模型后,参数都不一样?
我的回复:最终解决方案:经过排查是由于寒武纪的Caffe在读取由GPU训练的Caffe模型时,无法正确解析参数,如下图所示:解决方案是,先在GPU的Caffe版本下将caffe模型参数使用pyhton的pickle模块导出,在寒武纪服务器上读取模型参数,給网络赋值后使用寒武纪的Caffe保存该模型。
0
请问为什么每次加载模型后,参数都不一样?
我的回复:我使用的板卡是MLU100,SDK是v8.0
0
Caffe框架GPU与MLU计算结果不一致请问如何调试?
我的回复:#9goodchong 回复谢谢~我觉得你分析的是有道理的。放不方便把这两个层的输入规模参数,输入的内容dump出来发上来?我想试着复现一下。还有软件栈的版本? 这种情况确实很少见,谢谢您的反馈。展开你给我个邮箱之类的?
2
Caffe框架GPU与MLU计算结果不一致请问如何调试?
我的回复:#3goodchong 回复放不方便把Proposal层和ROIPooling层的结果贴一下?你是用GPU的还是CPU比较的?放不方便都贴一下?谢谢~展开展开贴了,你看一下
2
Caffe框架GPU与MLU计算结果不一致请问如何调试?
我的回复:在GPU模式下ROIPooling层的输出结果为:在MLU模式下运行,结果为:最后在CPU模式下使用ROIPooling算子,计算结果为:对比CPU和GPU的运算结果可知,仅处理了第一个ROI,我修改了ROIPooling层部分代码才能得到正确结果。而MLU模式下的ROIPooling层的结果是完全错误的。
2
Caffe框架GPU与MLU计算结果不一致请问如何调试?
我的回复:首先在GPU上使网络输出Proposal层的运算结果,如下:使用寒武纪的Proposal算子在CPU模式下运行的结果为:MLU模式下的结果为:将寒武纪的Proposal层替换为Python的Proposal层,在CPU模式下的运算结果为:与GPU计算结果是一致的,所以我认为Proposal算子有问题
2
Caffe框架GPU与MLU计算结果不一致请问如何调试?
我的回复:#1qwer 回复MLU100上的数据格式为FP16/INT8, 运算结果不一致是合理的,具体正确性要看误差,可以用MAPE度量一下误差,一般FP16不会超过%1。另外如果是faster-rcnn网络,不要直接比较proposal层之后的结果,只能直接比较proposal层前的结果。proposal层之后的结果因为涉及到bbox,无法直接比较,可以用IOU之类的方法比较。最后MLUfaster-rcnn的输出结果layout和CPU的输出结果layout不同,因此两者的后处理方式是不一致的,具体可以参考我司提供的后处理示例。展开我重新对比了一下GPU与MLU的输出结果,Proposal层之前的处理结果是正确的,但是MLU的Proposal和ROIPooling层有问题。在输入特征相同的情况下,使用FasterRCNN的Proposal层和MLU的Proposal层得到的结果是不一致的;使用FasterRCNN的Proposal层得到正确的ROI后,输入到ROIPooling层只处理了第一个ROI,我修改了CPU版本的ROIPooling层才可以得到正确的结果。
2
Github
开发平台
文档中心
新手必读
官方微信
版权所有 © 2024 寒武纪 Cambricon.com 备案/许可证号:
京ICP备17003415号-1
关闭