切换版块
×
基础软件平台
PyTorch开发
TensorFlow开发
编解码及SDK开发
BANG语言与计算库
开发工具链
MagicMind开发
软件栈百科
云平台集成
硬件产品专区
MLU370系列AI加速卡
MLU270系列AI加速卡
MLU220系列AI加速产品
经验方案交流区
经验案例与实践分享
开发者服务
开发者活动
公告与版务
高校支持
《智能计算系统》
签到
版块
社区
文档
SDK下载
370系列
200系列
开发平台
官网首页
注册
登录
全部版块
基础软件平台
硬件产品专区
经验方案交流区
开发者服务
高校支持
发布新帖
登录/注册
LV.1
RhythmLian
45
积分
0
赞
4
帖子
14
回复
1
收藏
TA的动态
TA的帖子
TA的回复
以矩阵乘demo为例的BANG C编程指南
我的回复:#17wyy回复你好,能否提供以下完整的代码截图呢唔,您可以通过这个链接查看完整图片:https://doc.kmf.com/ke-feedback/2021/04/02/07/52/56/1617088685236289.png 源代码除了46,47行外,就没有与SRAM相关的操作了。
21
BANG: 如何在__nram__上开动态内存
我的回复:#1goodchong回复嗯,建议您可以一次性的把所有nram分配好,然后动态使用。反正本来能用的NRAM也就500KB左右,这么点空间手动管理下凑合吧。展开嗯嗯,目前也只能这么干了,hh
0
BANG: 使用什么工具分析core_dump?
我的回复:#2goodchong回复您好,建议使用下CNGDB。可以分析程序中断的位置。可惜的是我没有编译成功GitHub上的CNGDB。。QAQ
0
BANG: __bang_add无法使用float类型
我的回复:#4goodchong回复您好,您用的cncc是什么版本的?``` cncc v2.4.1-Pro clang version 5.0.1 (tags/RELEASE_501/final) (based on LLVM 5.0.1) Target: x86_64-unknown-linux-gnu Thread model: posix InstalledDir: /opt/AICSE-demo-student/env/neuware/bin ``` 版本是这个,然后我翻了一下库代码。。目前已经通过添加__BANG_ARCH__宏定义解决了这个问题。感谢您的关注~
0
BANG: 使用什么工具分析core_dump?
我的回复:似乎报错内容被css吞掉了,我放个原始文本:2021-03-23 02:15:31.977199: [cnrtError] [89757] [Card : 0] unknown error2021-03-23 02:15:31.977296: [cnrtError] [89757] [Card : 0] for more information, please use core dump analysis tools.2021-03-23 02:15:32.031839: [cnrtError] [89757] [Card : 0] mluLaunchKernel fail.2021-03-23 02:15:32.031898: [cnrtError] [89757] [Card : 0] fail to lanuch kernel.2021-03-23 02:15:32.031917: [cnrtError] [89757] [Card : 0] for more information, please use core dump analysis tools.2021-03-23 02:15:32.065131: [cnrtError] [89757] [Card : 0] MLU unfinished. cnrtStream fail.2021-03-23 02:15:32.065197: [cnrtError] [89757] [Card : 0] invalid stream.2021-03-23 02:15:32.065215: [cnrtError] [89757] [Card : 0] for more information, please use core dump analysis tools.
0
CUDA转BANG C示例指南系列连载之一 BANG C编程基础
我的回复:你好,请问NRAM上可以开辟动态内存吗?应该通过哪个API来申请呢?
3
BANG: __bang_add无法使用float类型
我的回复:__mlu_entry__ void addKernel(half *c, half *a, half *b, int n) { int level = n / ONELINE, cur_indx = 0; __nram__ half a_tmp[ONELINE]; __nram__ half b_tmp[ONELINE]; __nram__ half c_tmp[ONELINE]; for (int i = 0; i <= level; ++i) { int _sz = i < level? ONELINE: n - i * ONELINE; __memcpy(a_tmp, a + i * ONELINE, sizeof(half) * _sz, GDRAM2NRAM); __memcpy(b_tmp, b + i * ONELINE, sizeof(half) * _sz, GDRAM2NRAM); __bang_add(c_tmp, a_tmp, b_tmp, ONELINE); __memcpy(c + i * ONELINE, c_tmp, sizeof(half) * _sz, NRAM2GDRAM); } }↑这样写就能过编译(
0
BANG: __bang_add无法使用float类型
我的回复:#1wyy回复__memcpy(a_tmp, a + i * ONELINE, sizeof(half) * _sz, GDRAM2NRAM); 是不是要改成sizeof(float)展开唔,抱歉,尽管您说的确实是个错误; 但看报错原因明显是__bang_add不支持第一个参数为float*..
0
Github
开发平台
文档中心
新手必读
官方微信
版权所有 © 2024 寒武纪 Cambricon.com 备案/许可证号:
京ICP备17003415号-1
关闭