您的位置:首页 > 其它

ubuntu16.04+tnesorflow1.5+anaconda5+cuda9.0+cudnn7不走弯路安装方法

2018-03-28 13:17 736 查看
本文方法跟其他文章安装顺序略有不同,保证少走弯路
新的ubuntu16.04的系统安装好后,把源改成清华源
1.直接安装最新的anaconda,哪个新就装哪个,我是这版Anaconda3-5.1.0-Linux-x86_64.sh
    sudo bash Anaconda3-5.1.0-Linux-x86_64.sh就好,一路继续,有一个在~/.bashrc里面添加环境变量那一块一定要yes
    装完之后,重启命令行,再输入python,就会发现Python 3.6.4 |Anaconda, Inc.,这就说明安装成功
2.然后也换源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config --set show_channel_urls yes
3.建立并激活Tensorflow环境继续在命令行输入:
conda create --name=tensorflow python=3.6,这句话十分好,不管你anaconda安装的是什么版本,这里创建的环境都是按照你设定的python版本安装的,十分便于安装多版本python

这里,由于在Anaconda3安装的时候,选择了默认Python3.6版本,因此新建立的tensorflow环境就是基于Python3.6。再输入:
source activate tensorflow

即可激活tensorflow环境,用deactivate可以取消激活。

4.安装Tensorflow
在激活tensorflow环境状态下,输入:
pip install tensorflow_gpu
会自动选择目前最新的版本(本文是1.5.0)进行安装,一路下一步就OK
测试tensorflow获得应该安装的cuda和cudnn版本
输入python后,import tensorflow
这时候会出一大堆报错,找到cublas后面的版本号,我这里是9.0,所以我们应该安装cuda9,至于cudnn可以等到cuda装完后,再看需要什么版本再下载。
5.安装cuda9.0
官网下载,我这里是cuda_9.0.176_384.81_linux.run,这里提醒一点,cublas后面是9.0就千万不要下载9.1,全都是随着tf报错走的

5.1 确认之前的准备工作已经完成

5.2 Disable the Nouveau drivers(禁用nouveau,这一步至关重要!!!)

5.2.1使用以下命令查看Noueau驱动是否被加载了
$ lsmod | grep nouveau
# 如果打印出一些信息,说明Noueau被加载了,正常情况下会打印出一些关于nouveau的信息
5.2.2 Create a file at /etc/modprobe.d/blacklist-nouveau.conf with the following contents:
创建sudo gedit /etc/modprobe.d/blacklist-nouveau.conf,写入:
blacklist nouveau
options nouveau modeset=0
5.2.3 使配置生效
             sudo update-initramfs -u
             再次lsmod | grep nouveau,发现没有输出
5.3重启安装
进入到登录界面后不要登录,直接ctrl+alt+f1
停止X服务
sudo /etc/init.d/lightdm stop
运行可执行文件
sudo sh cuda_9.0.176_384.81_linux.run
如果是单显卡的话,opengl一定选no,否则会循环登录,其他都按默认来,没有默认就是y

安装完成后
check device nodes (检查设备节点):
Check if /dev/nvidia* files exist
。如果没有的话
$ sudo modprobe nvidia

重启桌面服务
$ sudo service lightdm start
此时能够登录,则没有问题。
5.4安装后的一系列设置

然后在NVIDIA_CUDA-9.0_Samples里 make -j4一下
编译后的二进制文件默认存放在NVIDIA_CUDA-9.0_Samples/bin中。
接着在终端中输入 :
$ cd bin/x86_64/linux/release
$ ./deviceQuery
结果如下图所示:看到类似如下图片中的显示,则代表CUDA安装且配置成功,其中 Result = PASS代表成功,若失败 Result = FAIL
此时在ls /dev 里面就能发现nvidia开头的三个文件。
然后需要给cuda设置一个环境变量
 在系统环境里设置CUDA的路径
$ sudo gedit ~/.bashrc # 编辑
~/.bashrc 的最后中添加如下代码
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:/usr/local/cuda-9.0/extras/CUPTI/lib64:$LD_LIBRARY_PATH
export CUDA_HOME=/usr/local/cuda-9.0
export PATH=/usr/local/cuda-9.0/bin:$PATH
$source ~/.bashrc #配置立即生效
这时执行一下 nvcc -V可以看到显卡型号

此时,cuda应该已经安装完毕了,我们还通过之前的方法打开tensorflow,发现依然报错,这次是缺cudnn的库,看到版本,我这里是cudnn7.0
6.安装cudnn7.0

所以还是去下载,我们找到那个tar.gz的压缩包,不是power8,别下错了,power8是一个独立平台。,解压缩后得到cuda文件夹

$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
以上步骤都做完后
开一个新的terminal,进入tensorflow,发现已经没有报错了,安装完成。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐