打开微信,使用扫一扫进入页面后,点击右上角菜单,
点击“发送给朋友”或“分享到朋友圈”完成分享
Q:ImportError: libcnml.so: cannot open shared object file: No such file or directory 等找不到依赖库的问题。
A:确认否完成了 source env.sh 操作。每次启动容器都需要执行 source env.sh 命令来初始化环境变量,否则程序会找不到依赖库的位置。可以通过 env |grep NEUWARE 命令来确认当前环境变量是否正确。另外,环境变量只对当前会话起效,所以每次新开终端都需要重新初始化环境变量。
Q:编译 TensorFlow 时遇到 Socket closed 问题:Server terminated abruptly (error code: 14, error message: 'Socket closed', log file: '/root/.cache/bazel/_bazel_root/ab7cb2ab1051074a0e27f83141d17e93/server/jvm.out')
A:这种情况应该是编译占用的资源过大导致进程被 kill 了,可以修改编译脚本中的 jobs_num , 设置为16或8即可。
Q:请问bangc算子部分的运算结果为什么和准确结果都有些偏差呢?
A:数据拷贝到加速卡上进行计算之前有一个convertFlowToHalf的过程,float类型转换为half类型会导致精度的损失。
Q:实验中的传参为什么建议用结构体?
A:使用结构体主要是为了提高代码的可读性,同时也方便维护接口。
Q:提交时显示提交错误,怎么办?
A:如果是以压缩文件夹的方式提交而导致的错误,那么要改为直接将文件压缩为一个压缩包,而不是汇总为一个文件夹后再压缩。
Q:开发环境一直显示在创建中,怎么办?
A:应该是卡的配额不足了。若是做完实验要把旧的容器都删掉,不要一次开多个容器。如果实验容器显示还在排队,原因是每个人都配额只有一张卡,而目前已经使用了一张了。
热门帖子
精华帖子