切换版块
×
基础软件平台
PyTorch开发
TensorFlow开发
编解码及SDK开发
BANG语言与计算库
开发工具链
MagicMind开发
软件栈百科
云平台集成
硬件产品专区
大模型专区
寒武纪® AIDC® MLU370®系列加速卡
MLU200系列AI加速产品
经验方案交流区
经验案例与实践分享
开发者服务
开发者活动
公告与版务
高校支持
《智能计算系统》
签到
版块
社区
文档
SDK下载
370系列
200系列
开发平台
官网首页
注册
登录
全部版块
基础软件平台
硬件产品专区
经验方案交流区
开发者服务
高校支持
发布新帖
登录/注册
LV.1
Sunshine
342
积分
1
赞
34
帖子
120
回复
4
收藏
TA的动态
TA的帖子
TA的回复
MLU100卷积核维度不一致是否会导致计算结果不一致?
我的回复:#3HelloAI回复1、debug的方法,最原始的方法是逐步的将模型去掉一部分,然后再对比CPU和MLU的结果,看是从哪一层开始精度差异变得明显的。如果是逐步累计的,那看下输出的数值是否在某一层已经超出了FP16能表示的范围。2、即使裁剪后在GPU上训练过,在低精度(FP16)推理是也一样有可能出现精度飞掉的情况,因为一般通道越少,对精度的损失容忍度越低。展开好的 感谢
1
MLU100卷积核维度不一致是否会导致计算结果不一致?
我的回复:#1HelloAI回复MLU100是FP16精度和INT8精度,INT8就不说了,通道裁剪了这么多,肯定精度会有影响。FP16精度的话,我猜测有2种可能性:1、触发了SDK的bug,2、通道裁剪导致FP16的精度损失扩散了展开感谢您的回复:我们采用的是FP16精度的。2种可能性:1、触发了SDK的bug:请问这个怎么确定呢?怎么定位SDK的bug?2、通道裁剪导致FP16的精度损失扩散了:第二中情况的模型是在GPU上训练出来的,不是原始resnest50裁剪通道得到的。这种情况也会导致精度损失扩散吗?
1
CNML从入门到精通——(1)引言
我的回复:怎么不更新了呢?还是换地方了更新了?
7
MLU100 算子添加__sync_all后报错
我的回复:[cnrtError] [23063] [Card : 0] MLU unfinished. cnrtStream fail. [cnrtError] [23063] [Card : 0] barrier sync time out.
0
MLU270 SDK1.7.0 YOLOv5s模型离线部署
我的回复:#2hikck回复你的10分类可以在逐层模式正常输出吗?我用了四分类怎么输出的框不对80类别是可以正常预测的,可以按照80类别训练,10分类扩展为80分类。
0
YOLOv5版本
我的回复:#1andy_marvelous回复您好,论坛上提供的yolov5s是在pytorch框架下训练得到的,使用的代码和配置文件是v3.0。建议您使用https://github.com/ultralytics/yolov5/tree/v3.0 。展开好的 好的 感谢
0
MLU270 CNML样例编译问题
我的回复:#1lalalu回复这个怎么编译不是在寒武纪的文档里吗?CNGDB,BANG_C开发者文档。已找到解决办法! 谢谢!
0
MLU270 Pytorch-v1.7.0SDK 逐层dump失败
我的回复:#8zhaodeming回复您好,还需要gdb的bt命令,gdb的bt调试可以先参考下网上的一些教程。另外,是需要删除哪些回复呢您好 bt命令后结果如下: Thread 1 \"python\" received signal SIGSEGV, Segmentation fault. 0x00007fff30909322 in torch_mlu::MLUTensorImpl::cpu_data() () from /torch/venv3/pytorch/lib/python3.6/site-packages/torch_mlu/csrc/lib/libaten_mlu.so (cn-gdb) bt #0 0x00007fff30909322 in torch_mlu::MLUTensorImpl::cpu_data() () from /torch/venv3/pytorch/lib/python3.6/site-packages/torch_mlu/csrc/lib/libaten_mlu.so #1 0x0000000000000000 in ?? () (cn-gdb) 您好 bt信息如上,您方便的话可以加我下QQ吗,我截图发您(2637177427)
0
MLU100 SDKv8.1.0 Pytorch框架可以跑FasterRCNN吗
我的回复:#3zhaodeming回复您好,MLU100这个版本下不支持Faster RCNN的运行现在有一个mmdetection框架训练的Fasterrcnn(Pytorch模型),想要部署到MLU100上,有可行的方案或者建议吗
0
MLU100 SDKv8.1.0 Pytorch框架可以跑FasterRCNN吗
我的回复:MLU100 SDKv8.1.0 Pytorch 版本是1.0 torchvision版本是0.2.1; torchvision的model里面没有fasterrcnn,有没有办法在MLU100上编译一个高版本的Pytorch和torchvision呢?
0
上一页
1
2
3
4
5
6
下一页
Github
开发平台
文档中心
新手必读
官方微信
版权所有 © 2025 寒武纪 Cambricon.com 备案/许可证号:
京ICP备17003415号-1
关闭