切换版块
×
基础软件平台
PyTorch开发
TensorFlow开发
编解码及SDK开发
BANG语言与计算库
开发工具链
MagicMind开发
软件栈百科
云平台集成
硬件产品专区
大模型专区
MLU200系列AI加速产品
MLU370系列AI加速卡
经验方案交流区
经验案例与实践分享
开发者服务
开发者活动
公告与版务
高校支持
《智能计算系统》
签到
版块
社区
文档
SDK下载
370系列
200系列
开发平台
官网首页
注册
登录
全部版块
基础软件平台
硬件产品专区
经验方案交流区
开发者服务
高校支持
发布新帖
登录/注册
LV.1
武力全开
62
积分
1
赞
8
帖子
31
回复
1
收藏
TA的动态
TA的帖子
TA的回复
以矩阵乘demo为例的BANG C编程指南
我的回复:host端关键代码问2个问题:1.malloc之后没有判断是否申请成功,这边需要判断的吧2.CNRT_CHECK失败的话会将之前malloc的内存释放吗,不释放的话不会内存泄露吗?3.host端代码为什么不用智能指针代替maloc呢
21
在MLU端进行超大规模数据测试时如何才能提高精度呢?
我的回复:代码贴一下吧,怎么复现?
3
量化和生成离线模型 跟CPU架构有关系吗
我的回复:量化跟cpu架构无关,但是离线模型不行,220的离线模型需要单独生成
0
如何使用pytorch工具转换成 .cambricon模型?
我的回复:你用的什么网络?pytorch的什么版本?
0
漫谈人工智能边缘硬件
我的回复:
5
CNStream pipeline的json怎么这么复杂
我的回复:
1
cambricon caffe入门资料分享
我的回复:
0
手把手教你如何为CNStream开源项目做贡献
我的回复:
7
寒武纪推出BANG编程语言
我的回复:(2)编写BANG语言代码kernel.mlu1<p style="line-height: 1.5em;"><span style="font-family: 微软雅黑, "Microsoft YaHei";">#include "macro.h"<br>#include "mlu.h"<br>__mlu_entry__ void ConvKernel(half* out_data, half* in_data, half* filter_data,<br> int in_channel, int in_height, int in_width,<br> int stride_height, int stride_width,<br> int out_channel) {<br> __nram__ half nram_out_data[OUT_DATA_NUM];<br> __nram__ half nram_in_data[OUT_DATA_NUM];<br> __wram__ half wram_filter[FILTER_DATA_NUM];<br> __memcpy(nram_in_data, in_data, IN_DATA_NUM * sizeof(half),GDRAM2NRAM); <br> __memcpy(wram_filter, filter_data, FILTER_DATA_NUM * sizeof(half),GDRAM2WRAM); <br> __bang_conv(nram_out_data, nram_in_data, wram_filter, in_channel,<br> IN_HEIGHT, IN_WIDTH, filter_height, filter_width, stride_height,<br> stride_width, out_channel);<br> __memcpy(out_data, nram_out_data, OUT_DATA_NUM * sizeof(half),NRAM2GDRAM);<br>}<br></span></p>这个改一下吧,格式不对
6
手把手教你如何为CNStream开源项目做贡献
我的回复:
7
上一页
1
2
3
4
下一页
Github
开发平台
文档中心
新手必读
官方微信
版权所有 © 2025 寒武纪 Cambricon.com 备案/许可证号:
京ICP备17003415号-1
关闭