×

签到

分享到微信

打开微信,使用扫一扫进入页面后,点击右上角菜单,

点击“发送给朋友”或“分享到朋友圈”完成分享

是否支持与其他厂家如英伟达的卡进行分布式训练? 已完结 张三2122023-08-01 10:59:01 回复 1 查看 技术答疑
是否支持与其他厂家如英伟达的卡进行分布式训练?
分享到:

目前我使用 两个节点,一个节点用MLU 370X8 ,另一个节点使用英伟达的卡, 进行分布式训练,跑同一个脚本,寒武纪这边使用了转换脚本进行转换,启动时寒武纪这边 --dist-backend 使用CNCL ,另一边 --dist-backend 使用 NCCL,节点加入后无法感知,训练进程会一直挂住,等待节点加入。

版权所有 © 2024 寒武纪 Cambricon.com 备案/许可证号:京ICP备17003415号-1
关闭