切换版块
×
基础软件平台
PyTorch开发
TensorFlow开发
编解码及SDK开发
BANG语言与计算库
开发工具链
MagicMind开发
软件栈百科
云平台集成
硬件产品专区
MLU370系列AI加速卡
MLU270系列AI加速卡
MLU220系列AI加速产品
经验方案交流区
经验案例与实践分享
开发者服务
开发者活动
公告与版务
高校支持
《智能计算系统》
签到
版块
社区
文档
SDK下载
370系列
200系列
开发平台
官网首页
注册
登录
全部版块
基础软件平台
硬件产品专区
经验方案交流区
开发者服务
高校支持
发布新帖
登录/注册
LV.1
Anomalocaris
114
积分
0
赞
14
帖子
36
回复
0
收藏
TA的动态
TA的帖子
TA的回复
FP16数据类型转换
我的回复: cnrtCastDataTypecnrtRet_t cnrtCastDataType(void *src_addr, cnrtDataType_tsrc_data_type, void *dst_addr, cnrt‑DataType_t dst_data_type, int data_num,cnrtQuantizedParam_t param)Caststhedatatypefromsourceaddresstodestinationaddressdependonparam.Iftheparamisnull,noneedquantized,supportthecastdatatype: float32‑>float16, float32‑>uint8, int64‑>float16, float16‑>float32, float16‑>uint8,uint8‑>float32, uint8‑>float16, float32‑>float32If the parm is not null, need quantized, support the case data type:float32‑>float16, float32‑>int16, float32‑>int8, float32‑>int32, int32‑>float32, float16‑>int16, int16‑>float32, int8‑>float32, float32‑>float32Parameters• src_addr[in]: A pointer to source address.• src_data_type[in]: The type of source data.• dst_addr[out]: A pointer to destination address.• dst_data_type[in]: The type of destination data.• data_num[in]: The number of need cast data.• param[in]: A pointer to cnrtQuantizedParam_t.Return Value• CNRT_RET_SUCCESS:Thefunctionendsnormally. Otherwise, theerrorcode is returned.可参考cnrt接口
0
多核性能问题
我的回复:#1HelloAI回复这得看你的计算规模了,加速你的模型计算量本身就非常小,你还是batchsize=1,可并发处理的并不多,那么多核也并不会带来明显的性能提升,就像你在CPU上跑了一个很小的程序,多线程也并不会带来性能提升。展开计算量大的模型多核性能会提升的多么?
0
请问寒武纪软件栈和英伟达的软件栈是否有区别和联系
我的回复:#1HelloAI回复英伟达的软件那可就复杂了,有支持科学计算的,支持图形处理的,机器学习相关的库只是其中一部分。而寒武纪是专注于机器学习的加速芯片,所以只能拿机器学习相关的库对比了。寒武纪的CNML里边实现了很多深度学习常用的算子,比如Conv,FC,激活之类的,而英伟达的CuDNN也是深度神经网络的算子库,算是对应关系吧。寒武纪也支持自定义算子编程,编程语言叫BangC,配套的CNCC编译器汇编器,对标的是英伟达的CUDA C的NVCC编译器。目前支持编程语言的AI加速器好像也就只有寒武纪和英伟达了吧,别的还没听说。寒武纪二次开发过的框架,可以讲框架原生的模型转换为一个.cambricon模型,然后就可以用CNRT库直接加载部署了,其实有点类似于英伟达的TensorRT,先Build了一个Engine,然后直接用Engine部署。不过背后的优化策略除了一些图融合以为,应该还各有神通。展开学习到了,感谢
0
请问寒武纪软件栈和英伟达的软件栈是否有区别和联系
我的回复:#3流水回复希望寒武纪官方给出一个比对说明,从底层硬件到上层应用,这样更直观一些同意
0
在调试寒武纪Caffe框架的模型时,有哪些可用的精度优化手段?
我的回复:可以试下分通道量化
0
安装neuware报错
我的回复:#1含含回复1.可以按照提示 安装下对应的安装包,如gflags,另外,是使用apt install -f 安装下相关依赖。展开可以了,感谢
0
如何快速搭建Windows FFMPEG命令行环境?
我的回复:1. 到ffmpeg官方下载已经编译好的Windows shared库;2. 将执行文件ffmpeg.exe ffplay.exe ffprobe.exe拷贝到C:\\Windows目录;3. 将相应的动态库拷贝到C:\\Windows\\SysWOW64目录; 注:WOW64 (Windows-on-Windows 64-bit)4. 在命令行窗口输入ffmpeg -version 查看版本,以却确定环境是否搭建成功。
0
模型优化问题
我的回复:寒武纪二次开发过得深度学习框架会对模型做图融合和图优化
0
寒武纪二次开发过的模型支持转onnx吗?
我的回复:寒武纪没有对转换工具做过修改,如公开版本可转,那么应该就没问题
0
如何使用CNStream实现拉流、解码、推理、编码、推流?
我的回复:可参考https://github.com/CambriconKnight/cnstream-docker-image ,很快能搭建起整套流程
0
上一页
1
2
下一页
Github
开发平台
文档中心
新手必读
官方微信
版权所有 © 2024 寒武纪 Cambricon.com 备案/许可证号:
京ICP备17003415号-1
关闭