×

签到

分享到微信

打开微信,使用扫一扫进入页面后,点击右上角菜单,

点击“发送给朋友”或“分享到朋友圈”完成分享

《智能计算系统》常见问题解答-环境配置 huxiaojie2022-07-28 13:49:30 回复 1 查看 技术答疑
《智能计算系统》常见问题解答-环境配置
分享到:

  1. Q:ImportError: libcnml.so: cannot open shared object file: No such file or directory 等找不到依赖库的问题。

    A:确认否完成了 source env.sh 操作。每次启动容器都需要执行 source env.sh 命令来初始化环境变量,否则程序会找不到依赖库的位置。可以通过 env |grep NEUWARE 命令来确认当前环境变量是否正确。另外,环境变量只对当前会话起效,所以每次新开终端都需要重新初始化环境变量


  2. Q:编译 TensorFlow 时遇到 Socket closed 问题:Server terminated abruptly (error code: 14, error message: 'Socket closed', log file: '/root/.cache/bazel/_bazel_root/ab7cb2ab1051074a0e27f83141d17e93/server/jvm.out')

    A:这种情况应该是编译占用的资源过大导致进程被 kill 了,可以修改编译脚本中的 jobs_num , 设置为16或8即可。


  3. Q:请问bangc算子部分的运算结果为什么和准确结果都有些偏差呢?

    A:数据拷贝到加速卡上进行计算之前有一个convertFlowToHalf的过程,float类型转换为half类型会导致精度的损失。


  4. Q:实验中的传参为什么建议用结构体?

    A:使用结构体主要是为了提高代码的可读性,同时也方便维护接口。


  5. Q:提交时显示提交错误,怎么办?

    A:如果是以压缩文件夹的方式提交而导致的错误,那么要改为直接将文件压缩为一个压缩包,而不是汇总为一个文件夹后再压缩。


  6. Q:开发环境一直显示在创建中,怎么办?

    A:应该是卡的配额不足了。若是做完实验要把旧的容器都删掉,不要一次开多个容器。如果实验容器显示还在排队,原因是每个人都配额只有一张卡,而目前已经使用了一张了。



版权所有 © 2024 寒武纪 Cambricon.com 备案/许可证号:京ICP备17003415号-1
关闭