打开微信,使用扫一扫进入页面后,点击右上角菜单,
点击“发送给朋友”或“分享到朋友圈”完成分享
Cambricon Neuware 机器学习库(Cambricon Neuware Machine Learning Library,CNML)提供了一套高效、通用、灵活、可扩展的编程接口,用于在MLU上加速各种机器学习/深度学习算法。CNML主要包含以下几个特性:
1、支持丰富的基本算子,通过基本算子的组合实现多样的机器学习/深度学习算法,从而满足通用性、灵活性、可扩展性需求。目前已支持的基本算子包含以下几类:
常见神经网络算子
a、卷积/反卷积
b、池化
c、激活(ReLU、Sigmoid、TANH等)
d、LRN、批规范化
e、Softmax
f、全连接
矩阵、向量、标量算子
a、矩阵乘
b、张量加、减
c、张量逻辑运算
d、Tensor变换(Crop、Reshape、Slice、Concat等)
e、ROIPooling
f、Proposal
循环神经网络算子
a、LSTM
b、BasicRNN、RNN
c、SVDF
2、支持对基本算子进行融合:融合后的算子在编译期会采用内存复用,访存优化,指令流水,数据类型选优(针对可以使用的不同的数据类型进行选择)等编译优化手段,从而显著提升融合算子的整体性能。
3、支持生成离线模型:序列化已编译好的算子(基本/融合)到离线文件,生成离线模型。离线模型可以脱离CNML,基于Cambricon Neuware Runtime Library(CNRT)单独运行。由于脱离了上层软件栈,离线模型的执行具有更好的性能和通用性。
热门帖子
精华帖子