切换版块
×
基础软件平台
PyTorch开发
TensorFlow开发
编解码及SDK开发
BANG语言与计算库
开发工具链
MagicMind开发
软件栈百科
云平台集成
硬件产品专区
大模型专区
寒武纪® AIDC® MLU370®系列加速卡
MLU200系列AI加速产品
经验方案交流区
经验案例与实践分享
开发者服务
开发者活动
公告与版务
高校支持
《智能计算系统》
签到
版块
社区
文档
SDK下载
370系列
200系列
开发平台
官网首页
注册
登录
全部版块
基础软件平台
硬件产品专区
经验方案交流区
开发者服务
高校支持
发布新帖
登录/注册
LV.1
liujing
255
积分
1
赞
45
帖子
17
回复
1
收藏
TA的动态
TA的帖子
TA的回复
无法登录实验平台
我的回复:已经可以登陆了
0
综合实验二east编写mlu申请内存 3乘672乘1280 超出内存限制
我的回复:batch num表示一次传入的图片数量,core num表示参与计算的核的数量,一共有16个核,mlu上nram只有512k,数据不能太大
0
Error reading header
我的回复:请查看单算子测试是不是正确的,然后定位一下程序是在哪个位置报错的
0
选作实验 bang_softmax 编译失败
我的回复:没有source env
0
报错
我的回复:#3ddddebug 回复定位错误后,发现是在融合算子的计算上出的问题,而且实验视频中通过单算子之后紧接着直接运行成功run_acise.sh,也没有进行融合算子等操作。展开如果单算子通过了的话可能是集成的时候出现了问题,bangc算子的注册是在batch_matmul_v2_op_mlu.h 和 batch_matmul_v2.cc这两个文件里的,是不是这两个文件里的接口和bangc算子没有对上?建议把tf-add-batchmatmulv2文件夹下的所有文件都看看检查一下。
0
如何把tensor转换为数组的形式?
我的回复:#1w3jc 回复没有其他方法,必须要喂数据进去执行一次计算才能取出来数据,我理解tensor就是一个占位的东西,只有拿实际数据计算过了才有数据。展开顶
0
__bang_reshape_nchw2nhwc BUG?
我的回复:4. <h> * <w> * sizeof(src) must be dividable by 64;5. <c> * sizeof(src) must be dividable by 64.这里写的是 h * w * sizeof(src) 必须能被64整除,你好像理解成了 h * w必须被64整除
0
实验1测试时os.environ['MLU_VISIBLE_DEVICES']与多核的问题
我的回复:#2icholaswilde 回复是的老师,第四个问题我之前没有写bangc的多核;另外问题2问题3可能是因为只有一个mlu,所以在os.environ['MLU_VISIBLE_DEVICES'] = "1"时根本没有计算,(不过也没有报错就很神奇);现在只剩下问题1,多次循环时mlu运行时间一直递增,本来只需要40ms左右的计算量,循环到100次的时候就需要100ms左右,循环到200次的时候甚至达到了200ms,不知道这是什么原因产生的问题展开根据这个现象,也没有办法准确判断问题出在哪里。建议 export CNRT_PRINT_INFO=ON、 export CNRT_GET_HARDWARE_TIME=ON 这两个环境变量能看到mlu的硬件运行时间,让他看看这个硬件时间是否也是随循环增加的
1
__memcpy与文档描述不符
我的回复: dst_stride不能小于 size
1
实验1测试时os.environ['MLU_VISIBLE_DEVICES']与多核的问题
我的回复:第四个问题 ——config这样设置应该是没问题的,但多核不仅需要设置config,bangc算子也需要根据多核分配每个核的计算任务,是不是bangc的多核没写对?
1
上一页
1
2
3
下一页
Github
开发平台
文档中心
新手必读
官方微信
版权所有 © 2025 寒武纪 Cambricon.com 备案/许可证号:
京ICP备17003415号-1
关闭