您的位置:首页 > 其它

记一次在ubuntu16.04上安装tensorflow-gpu的过程

2018-01-05 19:36 441 查看
前言:
tensorflow已经安装了很多遍了,也填平了好多坑了。XX说过:“世界上本来没有大牛,爬的坑多了就有了大牛”。
这是一篇安装类的文章,这类文章的时效性非常高。注意我安装的时间是2018-01-05。这个时候这个世界的snapshot是:ubuntu17.04, tensorflow-gpu 1.5.0, cuda9.1, cudnn7.1都已经有了。但是我这次安装是在阿里云上安装的,在阿里云的pypi镜像上只有1.4.1的所以我也只安装1.4.1的。(pip配置http://mirrors.aliyun.com/pypi/simple/tensorflow-gpu/)
因此我本次安装的是:ubuntu16.04 + tensorflow1.4.1 + cuda8.0 + cudnn6.0 .
硬件是 NVIDIA Corporation GM200GL [Tesla M40] (rev a1)。 阿里云上最便宜的gn4。
主要思路是参考:https://tensorflow.google.cn/install/install_linux。无非三部:一,cuda,二cudnn,三tensorflow
1 安装cuda8.0

大而全的无用的完全安装手册: http://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#post-installation-actions
这个手册太复杂了,简直不能看。万不得已,不要看。
1.1 下载软件
https://developer.nvidia.com/cuda-80-ga2-download-archive
这里点开直接给出了8.0的下载地址。参考下面的图选择安装方式。我选择的是deb(local)。网上也有很多教程是runfile的。

注意我们都在linux下面了,直接用wget命令下载,不用什么浏览器打开吧。
1.2 local deb方式
wget "https://developer.nvidia.com//compute/cuda/8.0/prod/local_installers/cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64-deb" -O cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64.deb
然后根据图上的命令执行:
`sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb`
`sudo apt-get update`
`sudo apt-get install cuda`坑王在此,他坑退避。这样执行的话,直接安装了最新版本(当前是9.1,而tensorflow1.4.1不支持,所以这如果安装错误,那么得卸载重装)。所以这里一定执行sudo apt-get install cuda-8-0。更详细的描述见https://devtalk.nvidia.com/default/topic/1024342/cuda-setup-and-installation/unable-to-uninstall-cuda-9-0-completely-and-install-8-0-instead/

1.3 deb(network) 这里是和1.2并列的。按照1.2安装,这里可以跳过了。
wget "http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_8.0.44-1_amd64.deb" -O "cuda-repo-ubuntu1604_8.0.44-1_amd64.deb" 这里只给出命令,后续步骤和1.2中类似。
NOTE:怎么得到各个版本的下载地址呢?每个版本点击右键有惊喜。
1.4 检查安装是否成功
能正常运行nvidia-smi即可
1.5设置环境变量
export PATH=/usr/local/cuda-9.1/bin${PATH:+:${PATH}}export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH #有一个坑。nvidia的安装说明中没说要这个,但是你要自己设置。

1.6 卸载命令
NOTE:千万不要顺序执行到这里
sudo apt-get --purge remove cuda
sudo apt autoremove
sudo apt-get clean

2 安装cudnn 6.0
网上各种中文教程,但是nvidia的教程是最权威,又最简单的 http://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html。参见2.3.1章节 2.1 下载软件 https://developer.nvidia.com/rdp/cudnn-download
2 安装软件
参考http://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html。参见2.3.1章节
Navigate to your <cudnnpath> directory containing the cuDNN Tar file.Unzip the cuDNN package.
$ tar -xzvf cudnn-9.0-linux-x64-v7.tgz
Copy the following files into the CUDA Toolkit directory.
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h
/usr/local/cuda/lib64/libcudnn*
3 安装tensorflow-gpu版本
最简单了,直接执行:pip install tensorflow-gpu注意1: 墙高无法翻越,需要设置pip源。自行baidu。
注意2:可以指定tensorflow版本pip install tensorflow-gpu==1.4.1

4 运行测试程序保证安装成功
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: