切换版块
×
基础软件平台
PyTorch开发
TensorFlow开发
编解码及SDK开发
BANG语言与计算库
开发工具链
MagicMind开发
软件栈百科
云平台集成
硬件产品专区
MLU370系列AI加速卡
MLU270系列AI加速卡
MLU220系列AI加速产品
经验方案交流区
经验案例与实践分享
开发者服务
开发者活动
公告与版务
高校支持
《智能计算系统》
签到
版块
社区
文档
SDK下载
370系列
200系列
开发平台
官网首页
注册
登录
全部版块
基础软件平台
硬件产品专区
经验方案交流区
开发者服务
高校支持
发布新帖
登录/注册
LV.1
jiapeiyuan
190
积分
2
赞
2
帖子
8
回复
2
收藏
TA的动态
TA的帖子
TA的回复
python调用cnrt接口封装示例
我的回复:#6hxb112266回复mlu220不是不提供python的算子吗 那这个也能用吗不是调python算子,是直接调cnrt的接口。相当于把cnrt的c接口包装成python的。最终还是调到c的cnrt库,以及同一个离线模型
1
python调用cnrt接口封装示例
我的回复:#4hxb112266回复这个可以在板端用吗 还是只能在PC的docker内板子上有python环境吗,有的话,应该就可以用(但是需要arm的cambricon库)
1
特征点检测模型在MLU270和RTX 2070上的单帧推理速度对比
我的回复:#2ChinaCVNumberOne回复感谢您的回复。最近刚接触这方面的内容,我还想问一个问题。在那个cuda转bang c的帖子中,我看到说“BANG C并不是靠将计算拆分成多个线程来获得性能提升的”,那么MLU的优势主要是靠什么呢?展开作者的本意是指:不像cuda那种写法(cuda不写for循环,只写一个加法操作,然后自动分配到cuda线程去分别执行),而是更像cpu的c++写法(需要自己写for循环),mlu也是会拆分的,只是mlu270只有16个大核,跟cuda几千个的线程核不是一个架构。可参考一下这个解释:https://www.jianshu.com/p/47411d5a87f3
0
yolov5推理错误
我的回复:#7zwb回复请问寒武纪与英码合作的evm220_a2开发板上的sdk如何升级呢可以先联系一下购买evm时的技术支持,看能不能要到新一点的版本。我们这边的版本,不确定是否跟英码的os一致,我不清楚他们有没有做定制化修改,所以尽量跟他们要sdk
0
特征点检测模型在MLU270和RTX 2070上的单帧推理速度对比
我的回复:如果模型里面包含大量的标量计算,mlu270可能性能没有发挥出来,需要看实际情况具体分析,看看有无优化空间。另外由于硬件架构的特点,mlu270更有利于吞吐的模式,能发挥出很大的fps;只看单帧时延的话,单核不能达到最优,16核能快一点,但受限于模型结构,可能达不到线性的增加
0
yolov5离线模型移植
我的回复:你好,可以把 非80类的 整个工程(包括代码、模型和图片)发给我们吗,我们本地复现一下
0
220 demo 测试结果问题
我的回复:第一个问题应该是得分太低的目标也画出来了,在代码里增加一下对得分的过滤。第二个是不是因为某个上级目录没有写权限,导致无法在该目录下创建文件,尝试把上级目录都增加权限
0
视频解码报错vpu-server is no alive
我的回复:你使用的是370卡,打印显示的是270的错误日志,应该是装错sdk包了。请检查一下,应该安装370对应版本的驱动和cntoolkit
0
CNCodec 做视频编码的时候可以改变分辨率吗?
我的回复:cncodec只能解出原始尺寸,不能缩放。cncv库,可以联系你们对口的技术支持获取对应的版本
0
mlu220边缘计算盒离线推理yolov5报错
我的回复:#9yinyin123456回复root@localhost:/opt/yolov5_offline_simple_demo# ./build/yolov5_offline_simple_demo model/yolov5s-220.cambricon subnet0 0 0 data/000000315719.jpg 2 data/label_map_coco.txtCNRT: 4.7.12 03ea1d9input shape:1 640 640 3output shape:1 1 1 7232HardwareTime:46.116000(ms) E2ETime:55.762000(ms)boxnum:9=========================504.777 172.691 590.322 380.455 0.772659 0345.08 120.341 505.737 428.227 0.723597 09.69883 210.268 28.9566 244.928 0.559216 0184.052 259.124 605.077 528.237 0.842521 17.43911 214.137 137.276 291.024 0.920868 2165.675 213.27 419.95 412.953 0.813765 2117.277 220.207 156.041 271.607 0.766291 2140.894 217.468 188.346 272.17 0.765653 2174.697 218.276 216.731 264.947 0.636769 2不知道 从图像输入到结果输出 包括后处理的时间(坐标画框)的时间展开可以在代码里,在 前处理之前,和后处理之后,自己增加cpu统计时间的代码
0
上一页
1
2
3
4
5
6
7
8
9
10
..
13
下一页
Github
开发平台
文档中心
新手必读
官方微信
版权所有 © 2024 寒武纪 Cambricon.com 备案/许可证号:
京ICP备17003415号-1
关闭