您的位置：首页 > 其它

Ubuntu16.04+GTX 960 安装tensorflow-gpu教程

2017-12-28 14:12 781 查看

最近项目需要用tensorflow跑程序，在实验室服务器挂掉的前提下，只能用简陋的台式机搭环境救急，也是第一次从头到尾搭建好环境，期间掉坑若干次，这里做个记录：

1. 下载并安装显卡驱动

驱动需要和电脑的gpu配套，上官网:https://www.geforece.cn/drivers 搜索最新的驱动型号，我这里是nvidia-384

#终端依次输入如下命令行下载安装：
1.删除旧的驱动：sudo apt-get purge nvidia-*

2.添加第三方安装源：
sudo add-apt-repository ppa:graphics-drivers/ppa

3.更新软件源：sudo apt-get update

4.下载安装nvidia-384驱动【需下载大概80M，网速不好的情况会比较慢，可以采用run文件tty界面安装，这里不详述，只记录最简单的方式】：
sudo apt-get install nvidia-384

5.重启：reboot

6.检查驱动是否安装成功【成功则可以看到表格显示GPU信息】：nvidia-smi

2. 下载并安装cuda

可以在官网https://developer.nvidia.com/cuda-downloads注册下载，文件较大，约2G，下载很慢很慢，我这里下载的是cuda-8，为大家提供一个网盘链接：https://pan.baidu.com/s/1bo4RLCV，提取密码：4vf7 ，感谢原分享者~

#命令行安装：
1.安装软件包：
sudo dpkg -i cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64.deb

2.更新下载源：sudo apt-get update

3.安装【注意：一定要指定版本号，这里会自动下载当前版本下最新的显卡驱动，可能会覆盖第一步安装驱动的过程，不用管，没报错即可】：
sudo apt-get install cuda-8.0

3. 下载并安装cudnn

同样要在navidia官网下载cudnn文件，依旧很慢，我这里下载的CudNN V5，这里也提供一个网盘链接：https://pan.baidu.com/s/1gfeq0Ob，密码: 1172

#终端输入
1. sudo tar -xzvf cudnn-8.0-linux-x64-v5.1.tgz
2. sudo cp cuda/include/cudnn.h /usr/local/cuda/include
3. sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
4. sudo chmod a+r /usr/local/cuda/include/cudnn.h/usr/local/cuda/lib64/libcudnn*
5.在~/.bashrc文件中添加环境变量：
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64"
export CUDA_HOME=/usr/local/cuda
6.使环境变量生效：source ~/.bashrc

4. 下载并安装tensorflow-gpu

由于前面下载的cudnn v5.1，而tf1.3之后会自动寻找V6里面的文件，所以这里要限定版本，否则使用时会有错

终端输入：pip3 install tensorflow-gpu==1.2

5. python3环境下检查是否安装成功：

import tensorflow as tf
hello = tf.constant('hello world')
sess = tf.Session()
#这里,输出显示使用GPU建立了device：0，则安装tensorflow-gpu成功！！

掉坑记录

1. 修改默认Python为python3.5，导致第一次安装显卡驱动之后，循环登录，并且删除nvidia驱动并重新安装不成功，解决方案：修改默认python版本为2.7即可

2. 按照网上教程修改了gcc版本为4.9，说是为了兼容cudnn v5，事情证明其实不用修改！导致后面安装、删除显卡驱动等操作均不成功，编译内核阶段就失败，因为5之下内核某些函数执行失败，解决方案：修改gcc版本为5之上即可

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航