×

签到

分享到微信

打开微信,使用扫一扫进入页面后,点击右上角菜单,

点击“发送给朋友”或“分享到朋友圈”完成分享

【MLU370S4】写一个kernel,跑多次时间不一样,第一次最快,后面越来越慢,是什么原因? 解决中 菜头2023-01-17 11:24:41 回复 4 查看 技术答疑 使用求助
【MLU370S4】写一个kernel,跑多次时间不一样,第一次最快,后面越来越慢,是什么原因?
分享到:

写了一个kernel, D = A x B,第一批次运行最快,后面批次越来越慢,最终稳定在20ms,这是什么原理?

Total Time(getmillisecs): 7.863 ms, A:216314618994982912, B:216314615624105984, C:216314618997080064

Total Time 2(getmillisecs): 9.494 ms, A:216314619010023424, B:216314615489888256, C:216314607839477760

Total Time 3(getmillisecs): 13.651 ms, A:216314607852421120, B:216314615355670528, C:216314607854518272

Total Time 4(getmillisecs): 19.265 ms, A:216314607867461632, B:216314615221452800, C:216314613677948928

Total Time 5(getmillisecs): 22.403 ms, A:216314613690892288, B:216314615087235072, C:216314613692989440

Total Time 6(getmillisecs): 21.423 ms, A:216314613705932800, B:216314614953017344, C:216314607973695488

版权所有 © 2022 寒武纪 Cambricon.com 备案/许可证号:京ICP备17003415号-1
关闭