切换版块
×
基础软件平台
PyTorch开发
TensorFlow开发
编解码及SDK开发
BANG语言与计算库
开发工具链
MagicMind开发
软件栈百科
云平台集成
硬件产品专区
大模型专区
寒武纪® AIDC® MLU370®系列加速卡
MLU200系列AI加速产品
经验方案交流区
经验案例与实践分享
开发者服务
开发者活动
公告与版务
高校支持
《智能计算系统》
签到
版块
社区
文档
SDK下载
370系列
200系列
开发平台
官网首页
注册
登录
全部版块
基础软件平台
硬件产品专区
经验方案交流区
开发者服务
高校支持
发布新帖
登录/注册
LV.1
Gummary
88
积分
2
赞
5
帖子
24
回复
1
收藏
TA的动态
TA的帖子
TA的回复
模型驱动安装出错。
我的回复:#1niubucai回复这么冷清吗是的。。。技术支持约等于0
0
请问为什么每次加载模型后,参数都不一样?
我的回复:最终解决方案:经过排查是由于寒武纪的Caffe在读取由GPU训练的Caffe模型时,无法正确解析参数,如下图所示:解决方案是,先在GPU的Caffe版本下将caffe模型参数使用pyhton的pickle模块导出,在寒武纪服务器上读取模型参数,給网络赋值后使用寒武纪的Caffe保存该模型。
0
请问为什么每次加载模型后,参数都不一样?
我的回复:我使用的板卡是MLU100,SDK是v8.0
0
Caffe框架GPU与MLU计算结果不一致请问如何调试?
我的回复:#9goodchong 回复谢谢~我觉得你分析的是有道理的。放不方便把这两个层的输入规模参数,输入的内容dump出来发上来?我想试着复现一下。还有软件栈的版本? 这种情况确实很少见,谢谢您的反馈。展开你给我个邮箱之类的?
2
Caffe框架GPU与MLU计算结果不一致请问如何调试?
我的回复:#3goodchong 回复放不方便把Proposal层和ROIPooling层的结果贴一下?你是用GPU的还是CPU比较的?放不方便都贴一下?谢谢~展开展开贴了,你看一下
2
Caffe框架GPU与MLU计算结果不一致请问如何调试?
我的回复:在GPU模式下ROIPooling层的输出结果为:在MLU模式下运行,结果为:最后在CPU模式下使用ROIPooling算子,计算结果为:对比CPU和GPU的运算结果可知,仅处理了第一个ROI,我修改了ROIPooling层部分代码才能得到正确结果。而MLU模式下的ROIPooling层的结果是完全错误的。
2
Caffe框架GPU与MLU计算结果不一致请问如何调试?
我的回复:首先在GPU上使网络输出Proposal层的运算结果,如下:使用寒武纪的Proposal算子在CPU模式下运行的结果为:MLU模式下的结果为:将寒武纪的Proposal层替换为Python的Proposal层,在CPU模式下的运算结果为:与GPU计算结果是一致的,所以我认为Proposal算子有问题
2
Caffe框架GPU与MLU计算结果不一致请问如何调试?
我的回复:#1qwer 回复MLU100上的数据格式为FP16/INT8, 运算结果不一致是合理的,具体正确性要看误差,可以用MAPE度量一下误差,一般FP16不会超过%1。另外如果是faster-rcnn网络,不要直接比较proposal层之后的结果,只能直接比较proposal层前的结果。proposal层之后的结果因为涉及到bbox,无法直接比较,可以用IOU之类的方法比较。最后MLUfaster-rcnn的输出结果layout和CPU的输出结果layout不同,因此两者的后处理方式是不一致的,具体可以参考我司提供的后处理示例。展开我重新对比了一下GPU与MLU的输出结果,Proposal层之前的处理结果是正确的,但是MLU的Proposal和ROIPooling层有问题。在输入特征相同的情况下,使用FasterRCNN的Proposal层和MLU的Proposal层得到的结果是不一致的;使用FasterRCNN的Proposal层得到正确的ROI后,输入到ROIPooling层只处理了第一个ROI,我修改了CPU版本的ROIPooling层才可以得到正确的结果。
2
Github
开发平台
文档中心
新手必读
官方微信
版权所有 © 2025 寒武纪 Cambricon.com 备案/许可证号:
京ICP备17003415号-1
关闭