切换版块
×
基础软件平台
PyTorch开发
TensorFlow开发
编解码及SDK开发
BANG语言与计算库
开发工具链
MagicMind开发
软件栈百科
云平台集成
硬件产品专区
MLU370系列AI加速卡
MLU270系列AI加速卡
MLU220系列AI加速产品
经验方案交流区
经验案例与实践分享
开发者服务
开发者活动
公告与版务
高校支持
《智能计算系统》
签到
版块
社区
文档
SDK下载
370系列
200系列
开发平台
官网首页
注册
登录
全部版块
基础软件平台
硬件产品专区
经验方案交流区
开发者服务
高校支持
发布新帖
登录/注册
LV.1
nicholaswilde
58
积分
1
赞
3
帖子
12
回复
1
收藏
TA的动态
TA的帖子
TA的回复
8月积分兑换开始啦~~
我的回复:#6三叶虫 回复今天已顺丰寄出~注意查收哦~~thank you
0
8月积分兑换开始啦~~
我的回复:1. 您的昵称:nicholaswilde2. 您的积分总额:743. 您要扣减的积分额:-20积分4. 您要兑换的礼品:定制加长桌面鼠标垫5. 您的邮箱地址:1771838874@qq.com
0
关于bangC对于矩阵的处理问题
我的回复:256 * 256就__nram__ half input_nram [256 * 256],然后input_nram[m * 256 + n]就可以了吧,nram一共就512KB,256 * 256 * ONLINE放不下的
0
bert实验的dim0和dim1含义
我的回复:找到bug了。。跟dim0和dim1没关系,bert实验中不会用到broadcasting的,问题出在adj_x和adj_y:{adj_x, adj_y} = {False, True}时,输入矩阵是m * k和n * k的;{adj_x, adj_y} = {False, False}时,输入矩阵是m * k和k * n的。但是问题在于,老师给出的tf-implementation中的接口没有不能将adj_x和adj_y传递给kernal,需要自己再更改tf-implementation中的接口,emmm麻烦得很
0
bert实验的dim0和dim1含义
我的回复:#1w3jc 回复老师发过一贴http://forum.cambricon.com/show-8-356-1.html目前就看到两个做BERT的,你们加油展开感谢大佬:)
0
报错
我的回复:#6ddddebug 回复老师,没有找到adj_x adj_y赋给kernel的语句信息 ,adj只在维度获取出现一次,但是kernel感觉没有获得adj信息展开所以就不用管adj了吗
0
风格迁移生成的奇怪图片
我的回复:power_diff_numpy生成的暗黑风格
6
选作实验 bang_softmax 编译失败
我的回复:需要手动更改makefile中neuware的目录,将bangCosine/Makefile的第一行改为CXXFLAGS+= -I . -I $(NEUWARE_HOME)/include -std=c++11 -g,第二行改为LDFLAGS+= -L $(NEUWARE_HOME)/lib64 -Wl,-rpath=$(NEUWARE_HOME)/lib64 -lcnrt -lcnml -lpthread -lopenblas即可与source env.sh对应起来
0
实验1测试时os.environ['MLU_VISIBLE_DEVICES']与多核的问题
我的回复:#3liujing 回复根据这个现象,也没有办法准确判断问题出在哪里。建议 export CNRT_PRINT_INFO=ON、 export CNRT_GET_HARDWARE_TIME=ON 这两个环境变量能看到mlu的硬件运行时间,让他看看这个硬件时间是否也是随循环增加的展开mlu的硬件时间是不变的,应该跟mlu无关,cpu的测试中也有这种现象,python的for循环是这样的: start = time.time() res = power_difference_op(input_x, input_y, input_pow) end = time.time() - start time_list.append(end * 1000) 不知道是哪里出了问题
1
实验1测试时os.environ['MLU_VISIBLE_DEVICES']与多核的问题
我的回复:#1liujing 回复第四个问题 ——config这样设置应该是没问题的,但多核不仅需要设置config,bangc算子也需要根据多核分配每个核的计算任务,是不是bangc的多核没写对?展开是的老师,第四个问题我之前没有写bangc的多核;另外问题2问题3可能是因为只有一个mlu,所以在os.environ['MLU_VISIBLE_DEVICES'] = "1"时根本没有计算,(不过也没有报错就很神奇);现在只剩下问题1,多次循环时mlu运行时间一直递增,本来只需要40ms左右的计算量,循环到100次的时候就需要100ms左右,循环到200次的时候甚至达到了200ms,不知道这是什么原因产生的问题
1
Github
开发平台
文档中心
新手必读
官方微信
版权所有 © 2024 寒武纪 Cambricon.com 备案/许可证号:
京ICP备17003415号-1
关闭