Ubuntu16.04+tensorflow1.8.0+GTX1070+drivers390+cuda9.0+cudnn7.0.5
牢骚
上来必须牢骚一下这几天的装机感受,准确的说是5天!就为这么点破玩意。
- 1
- 2
首先是准备Ubuntu16.04 ,一开始以为win10家和ubuntu家是吵架了,Ubuntu装完开机引导各种失败各种看贴,最终总结出2点经验:
- 主板Boot Mode 必须改成uefi模式;
- Ubuntu的“安装启动引导器的设备”必须选择/boot所在分区;
花了两天解决了Ubuntu系统的种种问题后,完美。直奔主题开始准备安装Tensorflow,不对准确的说是Tensorflow-gpu,毕竟我的1080已经饥渴难耐了,区区一个cpu版怎么能满足我向朋友们扯犊子的深度需要呢。下面是所需的软件清单:
- Python2.7
- 显卡驱动
- CUDA 8.0 (请不要处女座,非得要求最新版本,不要问我是怎么死的)
- cuDNN v6.0 (同样,请不要作死,非得要最新版本)
- tensorflow-gpu1.4.1
- pycharm
准备工作
一开始使用的是系统默认的源,50M的宽带供养一个tensorflow时居然只有20来k,虽说男人不能太快,但是过于持久实在扛不住,果断换源。
- 更新Ubuntu16.04源,用的是中科大的源:
cd /etc/apt/ sudo nano sources.list
- 1
- 2
把下面的这些源添加到source.list文件头部: deb http://mirrors.ustc.edu.cn/ubuntu/ xenial main restricted universe multiverse deb http://mirrors.ustc.edu.cn/ubuntu/ xenial-security main restricted universe multiverse deb http://mirrors.ustc.edu.cn/ubuntu/ xenial-updates main restricted universe multiverse deb http://mirrors.ustc.edu.cn/ubuntu/ xenial-proposed main restricted universe multiverse deb http://mirrors.ustc.edu.cn/ubuntu/ xenial-backports main restricted universe multiverse deb-src http://mirrors.ustc.edu.cn/ubuntu/ xenial main restricted universe multiverse deb-src http://mirrors.ustc.edu.cn/ubuntu/ xenial-security main restricted universe multiverse deb-src http://mirrors.ustc.edu.cn/ubuntu/ xenial-updates main restricted universe multiverse deb-src http://mirrors.ustc.edu.cn/ubuntu/ xenial-proposed main restricted universe multiverse deb-src http://mirrors.ustc.edu.cn/ubuntu/ xenial-backports main restricted universe multiverse 最后更新源和更新已安装的包: sudo apt-get update sudo apt-get upgrade
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- [p]将pip源指向清华大学的源镜像:https://mirrors.tuna.tsinghua.edu.cn/help/pypi/,具体添加一个 ~/.config/pip/pip.conf 文件,设置为:
[global] index-url = https://pypi.tuna.tsinghua.edu.cn/simple
[li]1 2[/li] - 3
sudo apt-get install python-pip sudo apt-get install python-numpy swig python-dev python-wheel
- 1
- 2
1.显卡驱动安装
打开terminal输入以下指令:sudo apt-get update
- 1
[/p]
2.安装CUDA
本着新得就是好得的原则,我上来就从官网上选了CUDA9.0,然和事实却不是这样的.tensorflow官方版本目前不支持CUDA9, 但CUDA8是妥投没问题的。不信请看大神如何优雅刨坑。
CUDA下载地址如下:https://developer.nvidia.com/cuda-80-ga2-download-archive
请勇敢地选择 runfile[local] 版本。
下载完毕,进入文件的保存路径,运行如下代码:
sudo sh cuda_8.0.61_375.26_linux.run
- 1
Do you accept the previously read EULA? accept/decline/quit: accept Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 367.48? (y)es/(n)o/(q)uit: n Install the CUDA 8.0 Toolkit? (y)es/(n)o/(q)uit: y Enter Toolkit Location [ default is /usr/local/cuda-8.0 ]: Do you want to install a symbolic link at /usr/local/cuda? (y)es/(n)o/(q)uit: y Install the CUDA 8.0 Samples? (y)es/(n)o/(q)uit: y
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 367.48? (y)es/(n)o/(q)uit: n
- 1
- 2
方法多样,我选择了修改~/.bashrc。勇敢地打开它,在尾部加上这么两句话,然后请默默离开。
export PATH=/usr/local/cuda-8.0/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH
- 1
- 2
source ~/.bashrc
- 1
- sudo apt-get install gcc-4.8
- 查看默认的gcc版本 ,指令如下:
gcc --version
- 1
不出意外的话会返回ubuntu16.04自带的5.4.0这个版本号,现在使用gcc命令编译时还是会用新版本。
- 1
- 2
3. 接着设置默认gcc版本,代码如下:
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.8 100
- 1
- 2
cd /usr/local/cuda/samples/1_Utilities/deviceQuery sudo make ./deviceQuery
- 1
- 2
- 3
此情此景不经想让人吟诗一首:啊!~~~
3.安装cuDNN
下载地址如下:
https://developer.nvidia.com/rdp/cudnn-download
头一次又是抱着买贵的就买对的传统美德,下载了V7.0.5,最后运行tensorflow报错,报错是这样子的:
libcudnn.so.6:cannot open sharedobjectfile: No such file or directory
- 1
所以千万不要被这花花世界迷惑了,成功的标配—-v6.0 for CUDA8.0。载下来以后,发现是一个tgz的压缩包,使用tar进行解压:
tar -xvf cudnn-8.0-linux-x64-v6.0.tgz
- 1
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ sudo chmod a+r /usr/local/cuda/include/cudnn.h sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
- 1
- 2
- 3
- 4
4.安装Tensorflow1.4.1
在安装Tensorflow之前,按照Tensorflow官方安装文档的说明,需要先安装一个libcupti-dev库:
sudo apt-get install libcupti-dev
- 1
- 2
- 3
pip install tensorflow-gpu
- 1
安装完毕,进入python:
>>> import tensorflow as tf >>> hello = tf.constant('Hello, TensorFlow!') >>> sess = tf.Session() >>> print(sess.run(hello))
- 1
- 2
- 3
- 4
但是我们怎么能满足于在控制台里静静的装逼呢。
安装pycharm
从官网下载pycharm,地址如下:
http://www.jetbrains.com/pycharm/download/#section=linux
- 1
随便敲了几行代码进去,结果怎么跟想象的不一样呢,十分尴尬!
报错为:
ImportError:libcublas.so.8.0:cannot open shared object file:No such file or dircetory
- 1
于是依照另一位大神的指导重新配置了cuda的环境变量:
- 更改~/.bashrc
export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}} export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
- 1
- 2
- 设置环境变量和动态链接库,在命令行输入:
sudo gedit /etc/profile
在打开的文件末尾加入:
export PATH = /usr/local/cuda/bin:$PATH
- 1
- 创建链接文件,在命令行输入:
sudo gedit /etc/ld.so.conf.d/cuda.conf
在打开的文件中添加如下语句:
/usr/local/cuda/lib64
- 1
- 最后使链接立即生效:
sudo ldconfig
- 1
总结
刚翻过了几座山
又越过了几条河
崎岖坎坷怎么它就这么多用了将近五天时间终于从一个又一个坑里爬了出来,谁知道八年抗战才刚刚开始。
以上均为抛砖引玉,希望能给还在痛苦挣扎的朋友一些借鉴,同时也欢迎各位大神前来拍砖,在交流中不断进步!史料参考:
阅读更多https://www.geek-share.com/detail/2693079966.html
http://www.52nlp.cn/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E4%B8%BB%E6%9C%BA%E7%8E%AF%E5%A2%83%E9%85%8D%E7%BD%AE-ubuntu-16-04-nvidia-gtx-1080-cuda-8
http://www.52nlp.cn/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E6%9C%8D%E5%8A%A1%E5%99%A8%E7%8E%AF%E5%A2%83%E9%85%8D%E7%BD%AE-ubuntu17-04-nvidia-gtx-1080-cuda-9-0-cudnn-7-0-tensorflow-1-3
http://www.linuxidc.com/Linux/2017-01/139321.htm
- ubuntu16.04 + tensorflow1.5-gpu + cuda9.0 +cudnn
- Ubuntu16.04 nvidia显卡驱动 cuda9.0 cudnn7.0.5 简要配置流程
- Caffe(1)--环境配置(Ubuntu16.04+opencv3.1+Anaconda3+CUDA9.0+cuDNN7.0.5)
- ubuntu16.04系统GTX1050装tensorflow1.6+cuda9.0+cudnn7.0+anaconda
- 成功安装ubuntu16.04+cuda9.0+cuDNN7.0.5+caffe+digits(附错误汇总)
- Ubuntu 16.04 GTX950M + cuda9.0 + cuDNN7.0 + TensorFlow 1.5 安装记录
- Ubuntu16.04搭建GTX1080+CUDA9.0+cuDNN7.0.4+Tensorflow1.6.0环境
- Ubuntu16.04安装gpu版tensorflow1.2+cuda+cudnn
- windows 10+Tensorflow 1.5+python 3.5+CUDA 9.0+CUDNN7.0.5配置
- Ubuntu16.04_Cuda8.0_CUDNN6.0_caffe_tensorflow
- ubuntu16.04安装NIVIDIA显卡驱动,cuda8.0,cuDNN6.0以及基于Anaconda安装Tensorflow-GPU
- ubuntu 16.04 安装 tensorflow-gpu 包括 CUDA ,CUDNN,CONDA
- torch在ubuntu16.04下的搭建(cuda9.0+cudnn7.0)
- 深度学习服务器环境配置: Ubuntu17.04+Nvidia GTX 1080+CUDA 9.0+cuDNN 7.0+TensorFlow 1.3
- ubuntu16.04 安装CUDA 8.0 和 cuDNN 5.1 /cudnn6.0,可适用于gpu版本的(tensorflow,caffe,mxnet)
- ubuntu16.04 64位安装tensorflow+cuda8.0+cudnn7.0
- 人脸关键点检测 ubuntu 16.04 + DLib + GPU(CUDA9 + cudnn7.0.5)
- Ubuntu16.04 安装tensorflow+Fast-RCNN+cuda+cudnn过程
- Ubuntu 16.04+Gtx1050Ti+cuda 8.0+cudnn 5.1 tensorflow 安装