打开微信,使用扫一扫进入页面后,点击右上角菜单,
点击“发送给朋友”或“分享到朋友圈”完成分享
硬件:mlu370 x8
软件:python3.10 torch2.1 torch-mlu1.20.0+torch2.1.0
模型运行到上述代码时,耗时31s。
该代码是某个head forward里的代码,整个head forward 耗时32s,该部分代码耗时31s。我将代码进行了拆分,分别为:
a = torch.zero([num_vec, num_vec])
a = a.bool()
a = a.to(query.device),query.device为"mlu"
其中a = a.to(query.device)耗时几乎为31s
矩阵维度为24 * 24,很小
该如何解决
热门帖子
精华帖子