切换版块
×
基础软件平台
PyTorch开发
TensorFlow开发
编解码及SDK开发
BANG语言与计算库
开发工具链
MagicMind开发
软件栈百科
云平台集成
硬件产品专区
大模型专区
MLU200系列AI加速产品
MLU370系列AI加速卡
经验方案交流区
经验案例与实践分享
开发者服务
开发者活动
公告与版务
高校支持
《智能计算系统》
签到
版块
社区
文档
SDK下载
370系列
200系列
开发平台
官网首页
注册
登录
全部版块
基础软件平台
硬件产品专区
经验方案交流区
开发者服务
高校支持
发布新帖
登录/注册
LV.1
Sunshine
342
积分
1
赞
34
帖子
120
回复
4
收藏
TA的动态
TA的帖子
TA的回复
MLU100卷积核维度不一致是否会导致计算结果不一致?
我的回复:#3HelloAI回复1、debug的方法,最原始的方法是逐步的将模型去掉一部分,然后再对比CPU和MLU的结果,看是从哪一层开始精度差异变得明显的。如果是逐步累计的,那看下输出的数值是否在某一层已经超出了FP16能表示的范围。2、即使裁剪后在GPU上训练过,在低精度(FP16)推理是也一样有可能出现精度飞掉的情况,因为一般通道越少,对精度的损失容忍度越低。展开好的 感谢
1
MLU100卷积核维度不一致是否会导致计算结果不一致?
我的回复:#1HelloAI回复MLU100是FP16精度和INT8精度,INT8就不说了,通道裁剪了这么多,肯定精度会有影响。FP16精度的话,我猜测有2种可能性:1、触发了SDK的bug,2、通道裁剪导致FP16的精度损失扩散了展开感谢您的回复:我们采用的是FP16精度的。2种可能性:1、触发了SDK的bug:请问这个怎么确定呢?怎么定位SDK的bug?2、通道裁剪导致FP16的精度损失扩散了:第二中情况的模型是在GPU上训练出来的,不是原始resnest50裁剪通道得到的。这种情况也会导致精度损失扩散吗?
1
CNML从入门到精通——(1)引言
我的回复:怎么不更新了呢?还是换地方了更新了?
7
MLU100 算子添加__sync_all后报错
我的回复:[cnrtError] [23063] [Card : 0] MLU unfinished. cnrtStream fail. [cnrtError] [23063] [Card : 0] barrier sync time out.
0
MLU270 SDK1.7.0 YOLOv5s模型离线部署
我的回复:#2hikck回复你的10分类可以在逐层模式正常输出吗?我用了四分类怎么输出的框不对80类别是可以正常预测的,可以按照80类别训练,10分类扩展为80分类。
0
YOLOv5版本
我的回复:#1andy_marvelous回复您好,论坛上提供的yolov5s是在pytorch框架下训练得到的,使用的代码和配置文件是v3.0。建议您使用https://github.com/ultralytics/yolov5/tree/v3.0 。展开好的 好的 感谢
0
MLU270 CNML样例编译问题
我的回复:#1lalalu回复这个怎么编译不是在寒武纪的文档里吗?CNGDB,BANG_C开发者文档。已找到解决办法! 谢谢!
0
MLU270 Pytorch-v1.7.0SDK 逐层dump失败
我的回复:#8zhaodeming回复您好,还需要gdb的bt命令,gdb的bt调试可以先参考下网上的一些教程。另外,是需要删除哪些回复呢您好 bt命令后结果如下: Thread 1 \"python\" received signal SIGSEGV, Segmentation fault. 0x00007fff30909322 in torch_mlu::MLUTensorImpl::cpu_data() () from /torch/venv3/pytorch/lib/python3.6/site-packages/torch_mlu/csrc/lib/libaten_mlu.so (cn-gdb) bt #0 0x00007fff30909322 in torch_mlu::MLUTensorImpl::cpu_data() () from /torch/venv3/pytorch/lib/python3.6/site-packages/torch_mlu/csrc/lib/libaten_mlu.so #1 0x0000000000000000 in ?? () (cn-gdb) 您好 bt信息如上,您方便的话可以加我下QQ吗,我截图发您(2637177427)
0
MLU100 SDKv8.1.0 Pytorch框架可以跑FasterRCNN吗
我的回复:#3zhaodeming回复您好,MLU100这个版本下不支持Faster RCNN的运行现在有一个mmdetection框架训练的Fasterrcnn(Pytorch模型),想要部署到MLU100上,有可行的方案或者建议吗
0
MLU100 SDKv8.1.0 Pytorch框架可以跑FasterRCNN吗
我的回复:MLU100 SDKv8.1.0 Pytorch 版本是1.0 torchvision版本是0.2.1; torchvision的model里面没有fasterrcnn,有没有办法在MLU100上编译一个高版本的Pytorch和torchvision呢?
0
上一页
1
2
3
4
5
6
下一页
Github
开发平台
文档中心
新手必读
官方微信
版权所有 © 2025 寒武纪 Cambricon.com 备案/许可证号:
京ICP备17003415号-1
关闭