【寒武纪硬件产品型号】必填*:
MLU220
【使用操作系统】必填*:
ubuntu20.04
【使用驱动版本】必填*:
CNRT: 4.10.7 a16cc83
【出错信息】必填*:我用的cnstream做视频分析任务,我们的场景需要较高的实时性。但是生产环境发现延迟很高。于是我逐个模块排查,最后发现是解码模块延迟较高,进一步发现只有当解码和编码同时进行时,解码延迟才会升高。
于是我修改流水线,只有解码和编码模块,解码延迟=500-700ms每帧。但是只有解码时,延迟很低,解码延迟仅为3-4ms每帧。
如果流水线有解码,推理,跟踪,osd,编码等模块,则解码延迟高达1000+ms每帧
实际场景测试,我们需要解码延迟在3-4ms每帧的情况下,才能有较好的实时性。
所以
我的问题:
如何在不删除编码的同时, 能够降低解码延迟 ???
编解码同时进行产生解码延迟,是否是芯片内部有调度或者竞争?还是host device拷贝?
如何排查延迟产生的原因?