切换版块
×
基础软件平台
PyTorch开发
TensorFlow开发
编解码及SDK开发
BANG语言与计算库
开发工具链
MagicMind开发
软件栈百科
云平台集成
硬件产品专区
MLU370系列AI加速卡
MLU270系列AI加速卡
MLU220系列AI加速产品
经验方案交流区
经验案例与实践分享
开发者服务
开发者活动
公告与版务
高校支持
《智能计算系统》
签到
版块
社区
文档
SDK下载
370系列
200系列
开发平台
官网首页
注册
登录
全部版块
基础软件平台
硬件产品专区
经验方案交流区
开发者服务
高校支持
发布新帖
登录/注册
LV.1
天晓得
38
积分
0
赞
4
帖子
20
回复
0
收藏
TA的动态
TA的帖子
TA的回复
在线逐层和在线融合推理
我的回复:#1zhangyanting回复您好,存在融合推理时占用显存大于逐层推理的可能,推理时请注意及时释放内存单元,相关操作可参考:在线实验 – 寒武纪开发者社区 (cambricon.com)展开您好,能不能给个具体的位置?
0
Profiler怎么看
我的回复:在线逐层推理(推理代码仍是2楼的代码)时:在线融合推理时:这个MLUFusionGroup是什么意思,为什么启动算子的时间这么长...还有中间为什么空了那么一大块
0
Profiler怎么看
我的回复:#4zhangyanting回复您好,建议您尝试使用一下cnperf profile工具,看看能不能正确显示您需要的性能结果,参考文档路径如下:文档中心 – 寒武纪开发者社区 (cambricon.com)[图片][图片]展开但我是在线推理,使用的仍是python文件,我试着使用了:cnperf-cli record "python test.py"但是运行有warning:stripped executable found, no executable's function will be traced It seems not to be complied with -pg, no executable's function will be traced It seems [fork] is called, only the first process will be traced而且我python文件里面是for循环+调用函数,为什么会有其他进程?虽然上面都是warning,能跑,但是最后使用cnperf-cli timechart不成功,Invalid log in dir "./dltrace_data/", please retrace log我还试着cnperf-cli info查看信息,但是现实open ./dltrace_data/metadata.json file failed! cannot find metadata.json明明cat metadata.json可以显示信息...这是为啥?
0
Profiler怎么看
我的回复:CPU的进程是CPU向MLU发出命令时间的话,和MLU计算的时间几乎一模一样也太怪了吧...
0
Profiler怎么看
我的回复:for batch_size in [1, 1<<10, 1<<20]: state = torch.zeros([batch_size, 200]).to(ct.mlu_device()) with torch.autograd.profiler.profile(use_mlu=True) as prof: probs = net_mlu(state) prof.export_chrome_trace(...)其中net_mlu是通过:mlu_quantize.quantize_dynamic_mlu(net, dtype='int8', gen_quant=True)生成的量化模型
0
INT8量化后模型反而变大
我的回复:为什么我生成离线模型的时候设置了core_version和core_number,但是查看cambricon_twins文件后,只有core_number显示,core_version部分是空白呢?
0
INT8量化后模型反而变大
我的回复:并且生成离线模型后,查看cambricon_twins文件发现Data type是CNRT_FLOAT32
0
cnrt例程cmake不成功
我的回复:#2Fu回复[图片]为啥改了还是没用
0
离线推理示例程序mlp的疑问
我的回复:请问现在在哪还能找到MLP的离线推理实例程序呢,上面的网址失效了
0
Github
开发平台
文档中心
新手必读
官方微信
版权所有 © 2024 寒武纪 Cambricon.com 备案/许可证号:
京ICP备17003415号-1
关闭