切换版块
×
基础软件平台
PyTorch开发
TensorFlow开发
编解码及SDK开发
BANG语言与计算库
开发工具链
MagicMind开发
软件栈百科
云平台集成
硬件产品专区
MLU370系列AI加速卡
MLU270系列AI加速卡
MLU220系列AI加速产品
经验方案交流区
经验案例与实践分享
开发者服务
开发者活动
公告与版务
高校支持
《智能计算系统》
签到
版块
社区
文档
SDK下载
370系列
200系列
开发平台
官网首页
注册
登录
全部版块
基础软件平台
硬件产品专区
经验方案交流区
开发者服务
高校支持
发布新帖
登录/注册
LV.1
HelloAI
414
积分
5
赞
5
帖子
26
回复
4
收藏
TA的动态
TA的帖子
TA的回复
yolov6 单机多卡训练出错
我的回复:可否提供下你的步骤?另外,如果方便的话,是否有开源实现的github链接?
0
yolox移植220平台出错
我的回复:#6lcxzzz回复你好,论坛里提供的yolox移植代码只能在mlu_core为270正常运行,改为220后代码无法正常运行(后处理没有框输出)。由于缺乏对yolox后处理API支持,导致生成的220离线模型用起来比yolov5后面需要添加nms等操作,请问有针对yolox的后处理代码(220端)?展开您说的是包含yolobox和nms的DetectionOutput大算子吧?这个算子只有yolov3和yolov5版本,没有yolox的版本。
0
解码器 outputBufNum 缓存数量设置为1,CNCODEC_CB_EVENT_SEQUENCE 回调后回调更新后变为了5?
我的回复:#5leiyong1413回复我们的目标是降低时延:ip相机解复用作为输入,如果buffer 为5的话,需要输入4-5帧数据后,才会得到一帧解码数据,ip相机25帧,那么 40ms *4 (40 ms* 5)这样延迟就用160-200ms 很大。目前尝试方法:尝试主动构建一段i帧数据,目标是让buffer 变成1, 然后开始正常的输入解码流程,但是无法根本解决,因为不知道buffer 具体是怎么计算出来的。 或者还有其他解决方案?展开参考HandleSeqCallback()函数,params接口就是在sequence回调里配置的,这个sequence返回的是推荐使用值,改不了的,设置小于sequence返回的值,可能会出错。
0
yolox移植220平台出错
我的回复:#4lcxzzz回复你好,将mlu设备设置成220后,逐层推理postprocess后mlu_output输出为None,将阈值调低也没用,请问这是什么原因导致的?展开将设备设置为了220,您当前用的设备是否实际也是220呢?如果实际设备是270,但是设备为220只为生成离线cambricon模型,则不必在意结果,因为结果很有可能就是错的,正确结果需要在实际的220设备上验证。
0
解码器 outputBufNum 缓存数量设置为1,CNCODEC_CB_EVENT_SEQUENCE 回调后回调更新后变为了5?
我的回复:#3leiyong1413回复解码 cnvideoDecFeedData(m_pContext->handle, &decinput, 10000); 是否必须在主线程调用, demo 测试开始送数据到eventcallback 第一次收到数据需要26ms , 在我们的程序里面从开始送数据到第一次eventcallback 需要200多ms 展开一般情况下,是否再主线程调用并不影响,除非CPU很弱。这里demo测试和程序里用的码流是否是同一个呢?启动的并发路数是否一致呢?一般不同码流延时可能会有差异,最好统一用一个码流来对比验证。
0
yolox移植220平台出错
我的回复:#2lcxzzz回复你好,丢掉了一个置信度较低的框,将置信度调低就不会丢失。未使用YOLODetectionOuput大算子进行替换,yolox是否可以使用这个在postprocess阶段丢失的,通过对比逐层和融合模式下的decode_output输出结果,虽然输出的矩阵大小相同,但是具体结果数字存在差异,这可能就是导致逐层模式和融合模式在同一阈值下输出不同的原因请问融合模式和逐层模式输出不一致的原因是什么?展开逐层模式是朴素模式,就是严格按照模型的图结构一层一层的逐步执行。而融合模式是基于完整的图结构,结合一些图优化的手段,对图结构做一定的等效优化,图结果的变化,一般会导致一些精度上的差异,体现在结果上就会有比较微小的差异。针对你这个问题,可能是某些框的置信度正在在阈值附近,由于精度偏差就丢框了
0
【MLU370S4】写一个kernel,跑多次时间不一样,第一次最快,后面越来越慢,是什么原因?
我的回复:#3菜头回复我试了,主频没变化,温度54度。不是这个原因吧可否贴一下代码?
0
torch.cosine_similarity 使用报错
我的回复:#3shimin.an回复谢谢回复,后面有没有更新的版本适配呢,MLU3系列版本可以用吗?MLU3系列的版本也还没有支持torch.cosine_similarity这个算子,您的需求我们会评估是否加入到后续的版本计划中,谢谢。
0
【MLU370S4】写一个kernel,跑多次时间不一样,第一次最快,后面越来越慢,是什么原因?
我的回复:可否贴以下你的代码?另外,如果散热环境不太好的话,运行的时候,watch cnmon info观察下设备的主频是否低于了1000MHz或者温度高于了80度?
0
yolox移植220平台出错
我的回复:1、是丢掉了一个置信度较低(0.34433)的框是吗?2、是否使用了YoloDetectionOutput大算子替换了yolobox和nms呢?3、能否确定框是在推理阶段就丢了,还是在postprocess才丢掉的吗?
0
上一页
1
...
10
11
12
13
14
15
16
17
18
..
23
下一页
Github
开发平台
文档中心
新手必读
官方微信
版权所有 © 2024 寒武纪 Cambricon.com 备案/许可证号:
京ICP备17003415号-1
关闭