打开微信,使用扫一扫进入页面后,点击右上角菜单,
点击“发送给朋友”或“分享到朋友圈”完成分享
Tensorflow里面AddV2性能问题
Tensorflow在计算half加法时两个Tensor[1,100,1,152,1,256], [1,100,2,152,2,256]相加需要时间接近10ms。
在计算小尺寸的时候,比如[1,50,1,76,1,256], [1,50,2,76,2,256]相加,没有问题,时间约为0.15ms。
环境为cambricon- /tensorflow:v25.01.0-tensorflow2.12-v1.28.1-ubuntu22.04-py310
370
测试代码和profile结果在附件中。
热门帖子
精华帖子