×

签到

分享到微信

打开微信,使用扫一扫进入页面后,点击右上角菜单,

点击“发送给朋友”或“分享到朋友圈”完成分享

实训心得 1951314 黄辰晨 19513142022-07-05 20:32:30 回复 查看 经验交流
实训心得 1951314 黄辰晨
分享到:

重新编译cnplugin时报错。使用rm -rf /root/.cache/bazel/_bazel_root/install/7da6a92c096ada842b8d48c251312343清除缓存后,重新进行编译,解决了问题

集成到TensorFlow框架。将CNPluginlibcnplugin.so文件、cnplugin.h文件以及tf-SBC文件夹中的文件复制到TensorFlow的相关目录中,对TensorFlow进行编译即可。

提升运行速度。对块赋值可以直接赋值,而不是采用for循环,在使用这种方法的情况下,查看运行时间,然后把这些赋值的代码全部注释掉,再查看运行时间。经过比较得到结论:直接赋值的速度更快。

块的大小设置。由于图像数据的排列方式,means3个数字是交错的。而MLU处理连续的数据比较迅速,所以简单的对每个位置求余数,根据余数减去相应的值,耗时一定会比较长。所以需要在nram上构造一些数据块,以便进行整体的减法。

实际本次项目的实现最困难的部分不是模型,而是数据的前后处理,特别是对一些检测类的任务,往往标注的时候会比较简单,那么处理上就相对比较复杂,如果有一处地方处理错误,往往会导致整个模型往错误的方向进行学习,所以学好numpy还是很有必要的。

在本次实验中我做的也是不够好的,仅仅是做到了完成 BANGC 算子的实现与 CNRT 测试,CNRT 测试时延时低于 30ms,刚刚达到了一个及格的标准。在各个方面都还有所不足,对于本次实验所用的算法和模型还有很多理解不透彻的地方,需要在未来的日子里继续学习努力提升。与此同时,在边写项目边学习的过程中,我首次了解了智能计算处理器,了解了host端和device端,对于智能编程语言也有了初步的了解。同时,我还学到了人工智能算法编写时分层次的思想,让我对python和机器学习的理解更深一层,自身得到了进步,使我受益颇丰。

版权所有 © 2024 寒武纪 Cambricon.com 备案/许可证号:京ICP备17003415号-1
关闭