切换版块
×
基础软件平台
PyTorch开发
TensorFlow开发
编解码及SDK开发
BANG语言与计算库
开发工具链
MagicMind开发
软件栈百科
云平台集成
硬件产品专区
大模型专区
寒武纪® AIDC® MLU370®系列加速卡
MLU200系列AI加速产品
经验方案交流区
经验案例与实践分享
开发者服务
开发者活动
公告与版务
高校支持
《智能计算系统》
签到
版块
社区
文档
SDK下载
370系列
200系列
开发平台
官网首页
注册
登录
全部版块
基础软件平台
硬件产品专区
经验方案交流区
开发者服务
高校支持
发布新帖
登录/注册
LV.1
nku-stt
43
积分
3
赞
3
帖子
15
回复
1
收藏
TA的动态
TA的帖子
TA的回复
cnml控制流有完整示例吗?
我的回复:#2lhscau回复你好!请参考cnml的实例:/usr/local/neuware/samples/cnml看了一下,并没有control flow的示例,只有这几个例子active_op_test.cc atomic_op_test.cc compute_tops_test.cc imperative_op_test.cc multi_dim_op_test.cc compile_only_test.cc fusion_op_test.cc int8_op_test.cc
1
cnml控制流有完整示例吗?
我的回复:完整的代码示例?
1
Benchmark Docker 申请流程和使用指南
我的回复:
14
cnperf-cli dump出来的各个指标的含义是什么?
我的回复:#3wyy回复[图片]请问这个文档在哪里?官网上没找到。。。
1
cnperf-cli dump出来的各个指标的含义是什么?
我的回复:Anyone else help me?
1
cnperf-cli dump出来的各个指标的含义是什么?
我的回复:mac_count,vector_count,scalar_count,IO_rd_size,IO_wr_size是通过采样硬件的PMU得到的,还是代码中根据不同的op规模算出来的?看了几个例子感觉这几个值更像是软件根据op规模算出来的。。。
1
如何利用cnperf获取程序在MLU270上的内存带宽、FLOPS等信息?
我的回复:有cnperf-cli的使用手册吗?
1
书到了,不知不觉学到了第二章
我的回复:#3opabinia回复程序猿装备[图片]:梳子[图片]、耳机[图片]、拖鞋[图片]后两个还能理解,梳子是干嘛的?
0
关于循环控制变量的存储位置
我的回复:大概是想表达这个意思?不应该写成```for (__nram__ int i = 0; i<n; ++i) {...}```写成这样就可以了```for ( int i = 0; i<n; ++i) {...}```循环归纳变量i在栈上,而编译器默认把栈放在NRAM上,所以没必要标成__nram__?
0
【提问】CNNL CNML CNRT的含义与区别
我的回复:#2三叶虫回复好详细~赞赞赞类比于GPU: CNNL相当于GPU的NCCL,用于多卡间通讯; CNML类似CUDNN,基于CUDA做得高性能机器学习库; CNRT就是runtime库,用于管理设备,launch kernel等,跟cud runtime的功能类似;
1
上一页
1
2
下一页
Github
开发平台
文档中心
新手必读
官方微信
版权所有 © 2025 寒武纪 Cambricon.com 备案/许可证号:
京ICP备17003415号-1
关闭