英伟达的软件那可就复杂了,有支持科学计算的,支持图形处理的,机器学习相关的库只是其中一部分。而寒武纪是专注于机器学习的加速芯片,所以只能拿机器学习相关的库对比了。寒武纪的CNML里边实现了很多深度学习常用的算子,比如Conv,FC,激活之类的,而英伟达的CuDNN也是深度神经网络的算子库,算是对应关系吧。寒武纪也支持自定义算子编程,编程语言叫BangC,配套的CNCC编译器汇编器,对标的是英伟达的CUDA C的NVCC编译器。目前支持编程语言的AI加速器好像也就只有寒武纪和英伟达了吧,别的还没听说。寒武纪二次开发过的框架,可以讲框架原生的模型转换为一个.cambricon模型,然后就可以用CNRT库直接加载部署了,其实有点类似于英伟达的TensorRT,先Build了一个Engine,然后直接用Engine部署。不过背后的优化策略除了一些图融合以为,应该还各有神通。展开