您的位置:首页 > 其它

ubuntu18.04 从零搭建深度学习环境 Anaconda+NVIDIA Driver+CUDA+CUDNN+PyTorch

2019-08-30 10:01 3351 查看
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/foxqz/article/details/100043820

新安装的ubuntu双系统,从头开始搭建深度学习环境记录

文章目录

  • 二、安装显卡驱动
  • 三、安装CUDA
  • 查看是否安装成功
  • 四、安装CUDNN
  • 五、安装PyTorch
  • 参考
  • 一、安装python

    下载Anaconda

    https://www.anaconda.com/distribution/ 选择合适的版本,右键复制链接地址,进入命令行

    sudo wget -c https://repo.anaconda.com/archive/Anaconda3-2019.07-Linux-x86_64.sh

    国外地址,下载比较慢

    安装Anaconda

    sh Anaconda3-2019.07-Linux-x86_64.sh

    读协议疯狂回车,然后yes,yes,安装完成

    查看是否安装成功

    退出命令行,再打开一个新的,可以看到直接进入了python虚拟环境base
    输入python可以看到python版本号,安装成功

    取消默认进入python虚拟环境

    可根据个人情况决定是否修改

    conda config --set auto_activate_base false

    再重新打开终端就没有base了
    注:禁用后再想使用自己安装的python版本需要先进入虚拟环境
    conda activate base

    二、安装显卡驱动

    下载驱动

    首先查看显卡型号

    lspci | grep -i vga

    然后去NVIDIA官网查看显卡驱动版本,记得选LINUX系统,然后搜索,下载
    复制链接地址到命令行用wget下载,我下载的是430.40版本驱动,根据显卡情况会有所不同
    wget -c http://cn.download.nvidia.com/XFree86/Linux-x86_64/430.40/NVIDIA-Linux-x86_64-430.40.run

    禁用ubuntu系统自带显卡驱动

    sudo gedit /etc/modprobe.d/blacklist.conf

    在配置文件的最后一行加上blacklist nouveau,保存

    更新配置

    sudo update-initramfs -u

    之后重启系统
    在别的教程看到重启系统后图形化界面可能会出现问题,点这里供参考,不过我没遇到

    安装新驱动

    sudo sh NVIDIA-Linux-x86_64-430.40.run

    按提示确认即可

    查看是否安装成功

    nvidia-smi


    出现以上方框即为安装成功

    三、安装CUDA

    下载CUDA

    根据驱动版本选择合适的CUDA版本,英伟达官方给出的对应关系点这里

    这里选择CUDA 10.0版本,然后进入官网下载
    其它CUDA版本下载点这里,CUDA历史版本
    官网下载巨慢可以先去干点别的

    退出图形界面

    下载完成后,先按CTRL+ALT+F2进入命令行界面,然后用下面这个命令关闭图形界面

    sudo service lightdm stop

    (不退出图形界面直接安装的话会报错说你的显卡在被使用blabla然后无法安装)

    安装CUDA

    在这个命令行界面运行安装程序

    sudo sh cuda_10.0.130_410.48_linux.run

    以下部分因为在命令行界面无法截图,所以只能文字描述没有图片

    • 首先是一长串协议,按住回车直到阅读完毕,会问是否接受,输入accept
    • 下一个提示是是否安装显卡驱动,选择no,这里很重要!!!因为我们已经装过了显卡驱动,如果这里选了yes会覆盖掉之前安装的并且出很多错= =亲身经历
    • 之后的可以一路选择默认选项yes
    • 然后进入安装

    报错:空间不足

    这里我遇到了一个错误提示tmp空间不足无法安装,查阅资料后选择新建tmp2文件夹放在home下(我装系统时home分区比较大),这个tmpdir路径可以自己设置,用如下命令安装cuda

    sudo sh cuda_10.0.130_410.48_linux.run --tmpdir=/home/tmp2

    然后要重新经历一遍阅读协议,accept,然后记得还是选择不安装显卡驱动!!!
    之后就可以成功安装了

    错误:安装CUDA后nvidia-smi命令出错

    我遇到这个错误是因为装了驱动后安装CUDA时又选择了安装驱动,会覆盖掉之前装的驱动但是会出错用不了,最终解决方法是卸载CUDA卸载驱动,然后重新安装驱动安装CUDA

    查看是否安装成功

    nvcc -V


    出现版本号即为安装成功

    四、安装CUDNN

    下载CUDNN

    官网下载合适的版本
    下载完成后解压

    tar -xzvf cudnn*.tgz

    安装CUDNN

    sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
    sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
    sudo chmod a+r /usr/local/cuda/include/cudnn.h
    sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

    查看是否安装成功

    cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

    显示如下信息即为安装成功

    五、安装PyTorch

    官网下载并安装,按照自己的版本来选择,我的选择如下
    将命令复制到命令行直接进行下载安装,也会下载很久可以去干点别的
    如果下载多次中断可以从这里,via pip部分,按照你的CUDA版本,选择合适的whl文件下载,然后用pip进行安装

    查看是否安装成功

    进入python

    import torch
    torch.cuda.is_available()

    出现True即为成功,torch可以调用GPU进行计算

    参考

    [1] Linux系统安装NVIDIA显卡驱动详细步骤(以Ubuntu系统为例) | 逸·文鹤
    [2] 显卡驱动版本 与 cuda版本
    [3] 安装CUDA时提示空间不足
    [4] Ubuntu16.04下安装cuda和cudnn的三种方法(亲测全部有效)

    内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
    标签: 
    相关文章推荐