您的位置:首页 > 其它

Ubuntu16.04+GTX 960 安装tensorflow-gpu教程

2017-12-28 14:12 781 查看
最近项目需要用tensorflow跑程序,在实验室服务器挂掉的前提下,只能用简陋的台式机搭环境救急,也是第一次从头到尾搭建好环境,期间掉坑若干次,这里做个记录:

1. 下载并安装显卡驱动

驱动需要和电脑的gpu配套,上官网:https://www.geforece.cn/drivers 搜索最新的驱动型号,我这里是nvidia-384

#终端依次输入如下命令行下载安装:
1.删除旧的驱动:sudo apt-get purge nvidia-*

2.添加第三方安装源:
sudo add-apt-repository ppa:graphics-drivers/ppa

3.更新软件源:sudo apt-get update

4.下载安装nvidia-384驱动【需下载大概80M,网速不好的情况会比较慢,可以采用run文件tty界面安装,这里不详述,只记录最简单的方式】:
sudo apt-get install nvidia-384

5.重启:reboot

6.检查驱动是否安装成功【成功则可以看到表格显示GPU信息】:nvidia-smi


2. 下载并安装cuda

可以在官网https://developer.nvidia.com/cuda-downloads注册下载,文件较大,约2G,下载很慢很慢,我这里下载的是cuda-8,为大家提供一个网盘链接:https://pan.baidu.com/s/1bo4RLCV,提取密码:4vf7 ,感谢原分享者~

#命令行安装:
1.安装软件包:
sudo dpkg -i cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64​.deb

2.更新下载源:sudo apt-get update

3.安装【注意:一定要指定版本号,这里会自动下载当前版本下最新的显卡驱动,可能会覆盖第一步安装驱动的过程,不用管,没报错即可】:
sudo apt-get install cuda​-8.0


3. 下载并安装cudnn

同样要在navidia官网下载cudnn文件,依旧很慢,我这里下载的CudNN V5,这里也提供一个网盘链接:https://pan.baidu.com/s/1gfeq0Ob,密码: 1172

#终端输入
1. sudo tar -xzvf cudnn-8.0-linux-x64-v5.1.tgz
2. sudo cp cuda/include/cudnn.h /usr/local/cuda/include
3. sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
4. sudo chmod a+r /usr/local/cuda/include/cudnn.h/usr/local/cuda/lib64/libcudnn*
5.在~/.bashrc文件中添加环境变量:
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64"
export CUDA_HOME=/usr/local/cuda
6.使环境变量生效:source ~/.bashrc


4. 下载并安装tensorflow-gpu

由于前面下载的cudnn v5.1,而tf1.3之后会自动寻找V6里面的文件,所以这里要限定版本,否则使用时会有错

终端输入:pip3 install tensorflow-gpu==1.2


5. python3环境下检查是否安装成功:

import tensorflow as tf
hello = tf.constant('hello world')
sess = tf.Session()
#这里,输出显示使用GPU建立了device:0,则安装tensorflow-gpu成功!!


掉坑记录

1. 修改默认Python为python3.5,导致第一次安装显卡驱动之后,循环登录,并且删除nvidia驱动并重新安装不成功,解决方案:修改默认python版本为2.7即可

2. 按照网上教程修改了gcc版本为4.9,说是为了兼容cudnn v5,事情证明其实不用修改!导致后面安装、删除显卡驱动等操作均不成功,编译内核阶段就失败,因为5之下内核某些函数执行失败,解决方案:修改gcc版本为5之上即可

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: