切换版块
×
基础软件平台
PyTorch开发
TensorFlow开发
编解码及SDK开发
BANG语言与计算库
开发工具链
MagicMind开发
软件栈百科
云平台集成
硬件产品专区
大模型专区
寒武纪® AIDC® MLU370®系列加速卡
MLU200系列AI加速产品
经验方案交流区
经验案例与实践分享
开发者服务
开发者活动
公告与版务
高校支持
《智能计算系统》
签到
版块
社区
文档
SDK下载
370系列
200系列
开发平台
官网首页
注册
登录
全部版块
基础软件平台
硬件产品专区
经验方案交流区
开发者服务
高校支持
发布新帖
登录/注册
LV.1
RhythmLian
45
积分
0
赞
4
帖子
14
回复
1
收藏
TA的动态
TA的帖子
TA的回复
以矩阵乘demo为例的BANG C编程指南
我的回复:#17wyy回复你好,能否提供以下完整的代码截图呢唔,您可以通过这个链接查看完整图片:https://doc.kmf.com/ke-feedback/2021/04/02/07/52/56/1617088685236289.png 源代码除了46,47行外,就没有与SRAM相关的操作了。
21
BANG: 如何在__nram__上开动态内存
我的回复:#1goodchong回复嗯,建议您可以一次性的把所有nram分配好,然后动态使用。反正本来能用的NRAM也就500KB左右,这么点空间手动管理下凑合吧。展开嗯嗯,目前也只能这么干了,hh
0
BANG: 使用什么工具分析core_dump?
我的回复:#2goodchong回复您好,建议使用下CNGDB。可以分析程序中断的位置。可惜的是我没有编译成功GitHub上的CNGDB。。QAQ
0
BANG: __bang_add无法使用float类型
我的回复:#4goodchong回复您好,您用的cncc是什么版本的?``` cncc v2.4.1-Pro clang version 5.0.1 (tags/RELEASE_501/final) (based on LLVM 5.0.1) Target: x86_64-unknown-linux-gnu Thread model: posix InstalledDir: /opt/AICSE-demo-student/env/neuware/bin ``` 版本是这个,然后我翻了一下库代码。。目前已经通过添加__BANG_ARCH__宏定义解决了这个问题。感谢您的关注~
0
BANG: 使用什么工具分析core_dump?
我的回复:似乎报错内容被css吞掉了,我放个原始文本:2021-03-23 02:15:31.977199: [cnrtError] [89757] [Card : 0] unknown error2021-03-23 02:15:31.977296: [cnrtError] [89757] [Card : 0] for more information, please use core dump analysis tools.2021-03-23 02:15:32.031839: [cnrtError] [89757] [Card : 0] mluLaunchKernel fail.2021-03-23 02:15:32.031898: [cnrtError] [89757] [Card : 0] fail to lanuch kernel.2021-03-23 02:15:32.031917: [cnrtError] [89757] [Card : 0] for more information, please use core dump analysis tools.2021-03-23 02:15:32.065131: [cnrtError] [89757] [Card : 0] MLU unfinished. cnrtStream fail.2021-03-23 02:15:32.065197: [cnrtError] [89757] [Card : 0] invalid stream.2021-03-23 02:15:32.065215: [cnrtError] [89757] [Card : 0] for more information, please use core dump analysis tools.
0
CUDA转BANG C示例指南系列连载之一 BANG C编程基础
我的回复:你好,请问NRAM上可以开辟动态内存吗?应该通过哪个API来申请呢?
3
BANG: __bang_add无法使用float类型
我的回复:__mlu_entry__ void addKernel(half *c, half *a, half *b, int n) { int level = n / ONELINE, cur_indx = 0; __nram__ half a_tmp[ONELINE]; __nram__ half b_tmp[ONELINE]; __nram__ half c_tmp[ONELINE]; for (int i = 0; i <= level; ++i) { int _sz = i < level? ONELINE: n - i * ONELINE; __memcpy(a_tmp, a + i * ONELINE, sizeof(half) * _sz, GDRAM2NRAM); __memcpy(b_tmp, b + i * ONELINE, sizeof(half) * _sz, GDRAM2NRAM); __bang_add(c_tmp, a_tmp, b_tmp, ONELINE); __memcpy(c + i * ONELINE, c_tmp, sizeof(half) * _sz, NRAM2GDRAM); } }↑这样写就能过编译(
0
BANG: __bang_add无法使用float类型
我的回复:#1wyy回复__memcpy(a_tmp, a + i * ONELINE, sizeof(half) * _sz, GDRAM2NRAM); 是不是要改成sizeof(float)展开唔,抱歉,尽管您说的确实是个错误; 但看报错原因明显是__bang_add不支持第一个参数为float*..
0
Github
开发平台
文档中心
新手必读
官方微信
版权所有 © 2025 寒武纪 Cambricon.com 备案/许可证号:
京ICP备17003415号-1
关闭