×

签到

分享到微信

打开微信,使用扫一扫进入页面后,点击右上角菜单,

点击“发送给朋友”或“分享到朋友圈”完成分享

寒武纪机器学习库-CNML feng2019-06-04 18:48:55 回复 8 查看 CNML
寒武纪机器学习库-CNML
分享到:

Cambricon Neuware 机器学习库(Cambricon Neuware Machine Learning Library,CNML)提供了一套高效、通用、灵活、可扩展的编程接口,用于在MLU上加速各种机器学习/深度学习算法。CNML主要包含以下几个特性:

1、支持丰富的基本算子,通过基本算子的组合实现多样的机器学习/深度学习算法,从而满足通用性、灵活性、可扩展性需求。目前已支持的基本算子包含以下几类:


常见神经网络算子

    a、卷积/反卷积

    b、池化

    c、激活(ReLU、Sigmoid、TANH等)

    d、LRN、批规范化

    e、Softmax

    f、全连接


矩阵、向量、标量算子

    a、矩阵乘

    b、张量加、减

    c、张量逻辑运算

    d、Tensor变换(Crop、Reshape、Slice、Concat等)

    e、ROIPooling

    f、Proposal


循环神经网络算子

    a、LSTM

    b、BasicRNN、RNN

    c、SVDF



2、支持对基本算子进行融合:融合后的算子在编译期会采用内存复用,访存优化,指令流水,数据类型选优(针对可以使用的不同的数据类型进行选择)等编译优化手段,从而显著提升融合算子的整体性能。

3、支持生成离线模型:序列化已编译好的算子(基本/融合)到离线文件,生成离线模型。离线模型可以脱离CNML,基于Cambricon Neuware Runtime Library(CNRT)单独运行。由于脱离了上层软件栈,离线模型的执行具有更好的性能和通用性。

版权所有 © 2024 寒武纪 Cambricon.com 备案/许可证号:京ICP备17003415号-1
关闭