×

签到

分享到微信

打开微信,使用扫一扫进入页面后,点击右上角菜单,

点击“发送给朋友”或“分享到朋友圈”完成分享

cnrtConvertFloatToHalf转换慢 已解决 hxf02232021-08-11 17:01:39 回复 6 查看 使用求助
cnrtConvertFloatToHalf转换慢
分享到:

写一个浮点矩阵乘法,使用的__conv。需要先使用cnrtConvertFloatToHalf把浮点转换成int16类型。

使用1024*1024矩阵测试,这个转换性能有些不满足我们测试要求:cnrtConvertFloatToHalf耗时27毫秒,作为对比,1024*1024个浮点数乘以一个系数,时间是2毫秒


问题是,1) 不知道是否能优化这一块?2) 针对一块内存buffer进行批处理,能否作优化?

请问,能把这部分代码公开吗?

或者可以提供量化公式吗?

版权所有 © 2024 寒武纪 Cambricon.com 备案/许可证号:京ICP备17003415号-1
关闭