打开微信,使用扫一扫进入页面后,点击右上角菜单,
点击“发送给朋友”或“分享到朋友圈”完成分享
各位朋友好,我在寒武纪上移植了两个特征点检测模型,算是像素级预测任务中的一种,在精度上没有什么问题。不过我和我自己电脑上的RTX 2070显卡比较了一下寒武纪上的融合模型与nvidia显卡的加速效果,如下:
寒武纪MLU270服务器
CPU(Hygon C86 7165 24-core Processor) | 单核 | 4核 | 16核 | |
D2-Net | 2676ms | 145ms | 124ms | 113ms |
SuperPoint | 455ms | 35ms | 16ms | 8ms |
我自己的电脑,Nvidia RTX 2070
CPU(i7-10750H) | 显卡 | |
D2-net | 1240ms | 2.1ms |
SuperPoint | 254ms | 1ms |
输入都是一样的,只是比较了模型推理的部分,不包含后处理部分的内容,我想问一下这种差距合理吗,还是说单帧的推理限制了寒武纪的发挥?
热门帖子
精华帖子