切换版块
×
基础软件平台
PyTorch开发
TensorFlow开发
编解码及SDK开发
BANG语言与计算库
开发工具链
MagicMind开发
软件栈百科
云平台集成
硬件产品专区
大模型专区
寒武纪® AIDC® MLU370®系列加速卡
MLU200系列AI加速产品
经验方案交流区
经验案例与实践分享
开发者服务
开发者活动
公告与版务
高校支持
《智能计算系统》
签到
版块
社区
文档
SDK下载
370系列
200系列
开发平台
官网首页
注册
登录
全部版块
基础软件平台
硬件产品专区
经验方案交流区
开发者服务
高校支持
发布新帖
登录/注册
LV.1
武力全开
62
积分
1
赞
8
帖子
31
回复
1
收藏
TA的动态
TA的帖子
TA的回复
以矩阵乘demo为例的BANG C编程指南
我的回复:host端关键代码问2个问题:1.malloc之后没有判断是否申请成功,这边需要判断的吧2.CNRT_CHECK失败的话会将之前malloc的内存释放吗,不释放的话不会内存泄露吗?3.host端代码为什么不用智能指针代替maloc呢
21
在MLU端进行超大规模数据测试时如何才能提高精度呢?
我的回复:代码贴一下吧,怎么复现?
3
量化和生成离线模型 跟CPU架构有关系吗
我的回复:量化跟cpu架构无关,但是离线模型不行,220的离线模型需要单独生成
0
如何使用pytorch工具转换成 .cambricon模型?
我的回复:你用的什么网络?pytorch的什么版本?
0
漫谈人工智能边缘硬件
我的回复:
5
CNStream pipeline的json怎么这么复杂
我的回复:
1
cambricon caffe入门资料分享
我的回复:
0
手把手教你如何为CNStream开源项目做贡献
我的回复:
7
寒武纪推出BANG编程语言
我的回复:(2)编写BANG语言代码kernel.mlu1<p style="line-height: 1.5em;"><span style="font-family: 微软雅黑, "Microsoft YaHei";">#include "macro.h"<br>#include "mlu.h"<br>__mlu_entry__ void ConvKernel(half* out_data, half* in_data, half* filter_data,<br> int in_channel, int in_height, int in_width,<br> int stride_height, int stride_width,<br> int out_channel) {<br> __nram__ half nram_out_data[OUT_DATA_NUM];<br> __nram__ half nram_in_data[OUT_DATA_NUM];<br> __wram__ half wram_filter[FILTER_DATA_NUM];<br> __memcpy(nram_in_data, in_data, IN_DATA_NUM * sizeof(half),GDRAM2NRAM); <br> __memcpy(wram_filter, filter_data, FILTER_DATA_NUM * sizeof(half),GDRAM2WRAM); <br> __bang_conv(nram_out_data, nram_in_data, wram_filter, in_channel,<br> IN_HEIGHT, IN_WIDTH, filter_height, filter_width, stride_height,<br> stride_width, out_channel);<br> __memcpy(out_data, nram_out_data, OUT_DATA_NUM * sizeof(half),NRAM2GDRAM);<br>}<br></span></p>这个改一下吧,格式不对
6
手把手教你如何为CNStream开源项目做贡献
我的回复:
7
上一页
1
2
3
4
下一页
Github
开发平台
文档中心
新手必读
官方微信
版权所有 © 2025 寒武纪 Cambricon.com 备案/许可证号:
京ICP备17003415号-1
关闭