【Linux】【Docker】CentOS6.9主机上Docker Ubuntu14.04系统安装CUDA问题Module nvidia-uvm not found
2017-07-26 11:03
901 查看
CUDA: 8.0
CUDNN: 5.1
NVIDIA: 375.66
这个问题真是, RLGL....
感觉还是因为服务器造成的问题.
花了点时间才解决掉.
先是 ./deviceQuery
遇到问题:
已经编译安装好nvidia-uvm, 只是没找对
还是提示找不到 nvidia-uvm
会让你输入一个数字, 如果星星在3 前面,那就输入0,1,2都可以解决问题.
如果问题没解决, 或者没有类似0,1,2的选项. 看方法二.
方法一参考自: https://devtalk.nvidia.com/default/topic/760872/cuda-setup-and-installation/ubuntu-12-04-error-cudagetdevicecount-returned-30/
http://blog.csdn.net/ddqqfree123/article/details/52388337
我看了一下, ubuntu的系统内核跟centos6.9走的, 我刚把centos6.9内核升级到了3.10.107
但是ubuntu系统内并没有3.10.107内核的头文件啊什么的, 所以也就没有nvidia-uvm
下面开始处理这些问题
先检查几个文件夹内容, 如果发现ubuntu没有相关内核的文件夹, 就从centos主机中拷贝过来
如果你是Centos系统可以直接运行:
几个主要文件夹路径是:
上面这些目录, 哪个没有, 就从centos主机中拷贝过来!!
docker拷贝命令:
开始编译安装nvidia-uvm:
所以接着运行:
然后就可以重启了
试一下./deviceQuery
PASS!
方法二参考自: http://blog.csdn.net/yijuan_hw/article/details/53439408
CUDNN: 5.1
NVIDIA: 375.66
这个问题真是, RLGL....
感觉还是因为服务器造成的问题.
花了点时间才解决掉.
先是 ./deviceQuery
遇到问题:
CUDA Device Query (Runtime API) version (CUDART static linking) modprobe: FATAL: Module nvidia-uvm not found. cudaGetDeviceCount returned 30 -> unknown error Result = FAIL
解决方法一:
先试试这个方法, 不管用再试方法二已经编译安装好nvidia-uvm, 只是没找对
sudo modinfo nvdia sudo modinfo nvidia-uvm
还是提示找不到 nvidia-uvm
sudo update-alternatives --config x86_64-linux-gnu_gl_conf显示:
Selection Path Priority Status ------------------------------------------------------------ * 0 /usr/lib/nvidia-375/ld.so.conf 8604 auto mode 1 /usr/lib/nvidia-375-prime/ld.so.conf 8603 manual mode 2 /usr/lib/nvidia-375/ld.so.conf 8604 manual mode 3 /usr/lib/x86_64-linux-gnu/mesa/ld.so.conf 500 manual mode
会让你输入一个数字, 如果星星在3 前面,那就输入0,1,2都可以解决问题.
如果问题没解决, 或者没有类似0,1,2的选项. 看方法二.
方法一参考自: https://devtalk.nvidia.com/default/topic/760872/cuda-setup-and-installation/ubuntu-12-04-error-cudagetdevicecount-returned-30/
http://blog.csdn.net/ddqqfree123/article/details/52388337
解决方法二:
因为是在服务器centos6.9系统上运行daocker中ubuntu14.04系统..哈哈..有点绕..我看了一下, ubuntu的系统内核跟centos6.9走的, 我刚把centos6.9内核升级到了3.10.107
但是ubuntu系统内并没有3.10.107内核的头文件啊什么的, 所以也就没有nvidia-uvm
下面开始处理这些问题
先检查几个文件夹内容, 如果发现ubuntu没有相关内核的文件夹, 就从centos主机中拷贝过来
如果你是Centos系统可以直接运行:
sudo yum install -y kernel-devel kernel-headers
几个主要文件夹路径是:
/var/lib/dkms/nvidia/original_module /var/lib/dkms/nvidia/kernel-3.10.107-1.el6.elrepo.x86_64-x86_64 这个目录是软链接的下面目录 /var/lib/dkms/nvidia/375.66/3.10.107-1.el6.elrepo.x86_64 /lib/modules/3.10.107-1.el6.elrepo.x86_64 /lib/modules/3.10.107-1.el6.elrepo.x86_64/build 删除这个目录并软链接的下面目录 /usr/src/kernels/3.10.107-1.el6.elrepo.x86_64/
上面这些目录, 哪个没有, 就从centos主机中拷贝过来!!
docker拷贝命令:
sudo docker cp FILENAME CONTAINER-ID:/PATH/
开始编译安装nvidia-uvm:
sudo dkms status我的显示:
nvidia-375, 375.66: added
所以接着运行:
sudo dkms build -m nvdia-375 -v 375.66 sudo dkms install -m nvdia-375 -v 375.66
然后就可以重启了
sudo modinfo nvdia sudo modinfo nvidia-uvm
试一下./deviceQuery
PASS!
方法二参考自: http://blog.csdn.net/yijuan_hw/article/details/53439408
相关文章推荐
- Ubuntu 14.04 Linux系统安装Subversion结合Eclipse的一些问题
- [原创]在Linux系统Ubuntu14.04上安装部署docker。
- 基于Ubuntu14.04系统的nvidia tesla K40驱动和cuda 7.5安装笔记
- UBUNTU下android安装更新包的问题(File not found:... android-sdk-linux_x86/temp (权限不够))
- XP硬盘安装Ubuntu双系统遇到的vmlinuz File Not Found问题原因分析及解决
- Ubuntu系统安装CUDA或NVIDIA驱动后出现循环登录问题的Solution (附:building kernel modules error)
- 轻松学习之Linux教程一 ubuntu14.04+windows双系统安装
- window(win7)+linux(ubuntu)双系统的安装以及windows重装后的引导修复问题
- Ubuntu 14.04安装搜狗拼音linux版应该注意的问题
- [Linux]ubuntu 下安装NVIDIA显卡驱动出现X service error问题解决方法
- 在Hyper-V下安装Centos Linux系统的网卡驱动问题
- 使用 EasyBCD 安装Ubuntu 14.04 Error 15: file not found错误的解决方法
- linux系统(阿里云机CentOs 6.3验证)mysql5.5安装及可能遇到问题
- pandaboard安装ubuntu14.04系统遇到的问题
- LINUX、centos 系统安装需要注意的问题
- ubuntu14.04 安装LAMP中访问info.php提示The requested URL /index.php was not found on this server.
- Ubuntu Linux系统下安装NVIDIA显卡驱动
- Ubuntu14.04安装ti-sdk-am335x-evm-07.00.00.00-Linux-x86-Install.bin问题
- Thinkpad E420 安装ubuntu 等linux系统无线网卡问题
- Win7,Ubuntu14.04 amd64下安装CentOS7三系统后无法启动CentOS7