打开微信,使用扫一扫进入页面后,点击右上角菜单,
点击“发送给朋友”或“分享到朋友圈”完成分享
最近在做220的流水并行,想用四块卡实现一个模型的流水并行,目前已经完成了把模型拆四份,想问一问将四份模型分配个四张卡,让他们执行的流程是不是直接使用离线模型进行推理的固定套路。
ps:https://sky-x.blog.csdn.net/article/details/121595649 , 这个是我看的连接,我按照这个链接中的代码,更改之后复制了四份,让它跑起来了得到了一个推理结果。
关于流水并行我还需要考虑哪些问题?模型的划分?离线部署?
热门帖子
精华帖子