切换版块
×
基础软件平台
PyTorch开发
TensorFlow开发
编解码及SDK开发
BANG语言与计算库
开发工具链
MagicMind开发
软件栈百科
云平台集成
硬件产品专区
MLU370系列AI加速卡
MLU270系列AI加速卡
MLU220系列AI加速产品
经验方案交流区
经验案例与实践分享
开发者服务
开发者活动
公告与版务
高校支持
《智能计算系统》
签到
版块
社区
文档
SDK下载
370系列
200系列
开发平台
官网首页
注册
登录
全部版块
基础软件平台
硬件产品专区
经验方案交流区
开发者服务
高校支持
发布新帖
登录/注册
LV.1
liujing
255
积分
1
赞
45
帖子
17
回复
1
收藏
TA的动态
TA的帖子
TA的回复
无法登录实验平台
我的回复:已经可以登陆了
0
综合实验二east编写mlu申请内存 3乘672乘1280 超出内存限制
我的回复:batch num表示一次传入的图片数量,core num表示参与计算的核的数量,一共有16个核,mlu上nram只有512k,数据不能太大
0
Error reading header
我的回复:请查看单算子测试是不是正确的,然后定位一下程序是在哪个位置报错的
0
选作实验 bang_softmax 编译失败
我的回复:没有source env
0
报错
我的回复:#3ddddebug 回复定位错误后,发现是在融合算子的计算上出的问题,而且实验视频中通过单算子之后紧接着直接运行成功run_acise.sh,也没有进行融合算子等操作。展开如果单算子通过了的话可能是集成的时候出现了问题,bangc算子的注册是在batch_matmul_v2_op_mlu.h 和 batch_matmul_v2.cc这两个文件里的,是不是这两个文件里的接口和bangc算子没有对上?建议把tf-add-batchmatmulv2文件夹下的所有文件都看看检查一下。
0
如何把tensor转换为数组的形式?
我的回复:#1w3jc 回复没有其他方法,必须要喂数据进去执行一次计算才能取出来数据,我理解tensor就是一个占位的东西,只有拿实际数据计算过了才有数据。展开顶
0
__bang_reshape_nchw2nhwc BUG?
我的回复:4. <h> * <w> * sizeof(src) must be dividable by 64;5. <c> * sizeof(src) must be dividable by 64.这里写的是 h * w * sizeof(src) 必须能被64整除,你好像理解成了 h * w必须被64整除
0
实验1测试时os.environ['MLU_VISIBLE_DEVICES']与多核的问题
我的回复:#2icholaswilde 回复是的老师,第四个问题我之前没有写bangc的多核;另外问题2问题3可能是因为只有一个mlu,所以在os.environ['MLU_VISIBLE_DEVICES'] = "1"时根本没有计算,(不过也没有报错就很神奇);现在只剩下问题1,多次循环时mlu运行时间一直递增,本来只需要40ms左右的计算量,循环到100次的时候就需要100ms左右,循环到200次的时候甚至达到了200ms,不知道这是什么原因产生的问题展开根据这个现象,也没有办法准确判断问题出在哪里。建议 export CNRT_PRINT_INFO=ON、 export CNRT_GET_HARDWARE_TIME=ON 这两个环境变量能看到mlu的硬件运行时间,让他看看这个硬件时间是否也是随循环增加的
1
__memcpy与文档描述不符
我的回复: dst_stride不能小于 size
1
实验1测试时os.environ['MLU_VISIBLE_DEVICES']与多核的问题
我的回复:第四个问题 ——config这样设置应该是没问题的,但多核不仅需要设置config,bangc算子也需要根据多核分配每个核的计算任务,是不是bangc的多核没写对?
1
上一页
1
2
3
下一页
Github
开发平台
文档中心
新手必读
官方微信
版权所有 © 2024 寒武纪 Cambricon.com 备案/许可证号:
京ICP备17003415号-1
关闭