基础软件平台
硬件产品专区
经验方案交流区
开发者服务
高校支持
签到
注册 登录
打开微信,使用扫一扫进入页面后,点击右上角菜单,
点击“发送给朋友”或“分享到朋友圈”完成分享
跑MLP模型的在线推理,我已经将输入放到MLU设备上,为什么还有CPU算子的计算时间,并且CPU算子计算时间,和MLU算子计算时间几乎一模一样?
而且我看CPU进程那写的也是torch_mlu::linear啊?
并且在大batch_size的情况下,二者的时间会有大量的错开?所以这个CPU时间是包括传输数据的时间吗?
热门帖子
精华帖子