270和A100都是物理拆分,GPU一般的虚拟化是分时复用,软件拆分。
简单来说:
SRIOV虚拟化是基于PCIe SRIOV技术,将一个PF虚拟出多个VF,让系统看起来有多个“物理”设备。同时,寒武纪的SRIOV虚拟化还将设备内部资源做了“物理”切分,使其分别服务于不同VF设备。
优点:多虚拟化设备之间物理资源隔离,不会出现互相抢占资源情况。
缺点:虚拟化设备资源只有物理设备的1/4,有可能在物理设备上可以运行的网络在虚拟设备上由于资源不足无法运行。
vGPU更像是CPU的多线程的分时复用技术。寒武纪SRIOV更像是硬盘分区概念。
MIG的技术背景更高端,A100还做到了不同instance的错误隔离,调度资源隔离,总线带宽隔离等等。
请登录后评论