×
分享到微信

打开微信,使用扫一扫进入页面后,点击右上角菜单,

点击“发送给朋友”或“分享到朋友圈”完成分享

MLU270性能问题:请问这样写的代码,是同时开启16个核心计算吗 已解决 hxf02232021-05-28 17:09:26 回复 2 查看
MLU270性能问题:请问这样写的代码,是同时开启16个核心计算吗
分享到:

参照示例 samples/BANG/bang-c++/union4/pipeline_nmem_union4,编写的一个简单 matrix_ptr


测试性能,MLU270比至强服务器(使用单CPU Xeon(R) Gold 6248R)慢不少:6038 us VS 2790us。

mlu270_perf_cmp.jpg


感到疑惑的是,按照我的理解 kernelFunc应该也是在16个核心上执行吧?如果是这样的话,那kernelFunc应该就重复执行很多次了。

如果这样写不对的话,该怎么写这段代码呢?



版权所有 © 2022 寒武纪 Cambricon.com 备案/许可证号:京ICP备17003415号-1
关闭