您的位置:首页 > Web前端

II——caffe+ubuntu14.04 64bit+cuda6.5配置说明——补充

2015-12-11 21:27 561 查看
原文章链接:http://www.cnblogs.com/platero/p/3993877.html

谢谢原作者,但是Gist的文章链接访问超时,不知道是不是我网络环境的问题。

不管怎么说,我计算机视觉菜鸟,最近刚刚在学习深度学习。老是听实验室大神们念叨caffe,刚好捡了个大便宜坐在有GPU的机器的位置,机器上系统前段时间上不了网(至今原因不明,确定该端口上网没有问题)被我重装了呵呵,新装的系统就跟新生的娃一样纯洁,我心一痒就想自己装装看,于是搜索引擎一下...(顺便恭喜作者,百度搜索排名一位)

这篇文章一方面是转载转转人气,另外一方面把整个过程我所遇到的困难记录一下。因为写文章时我没在实验室了,可能有些错误原因没办法准确定位,只能提供一些解决方案的参考。为了跟原文有所区分,字体颜色调为死尸绿。


1. 安装build-essentials

安装开发所需要的一些基本包

sudo apt-get install build-essential



2. 安装NVIDIA驱动 (3.4.0)


2.1 准备工作(2014-12-03更新)

在关闭桌面管理 lightdm 的情况下安装驱动似乎可以实现Intel 核芯显卡 来显示 + NVIDIA 显卡来计算。具体步骤如下:

1. 首先在BIOS设置里选择用Intel显卡来显示或作为主要显示设备

2. 进入Ubuntu, 按 ctrl+alt+F1 进入tty,
登录tty后输入如下命令

sudo service lightdm stop


该命令会关闭lightdm。如果你使用 gdm或者其他的desktop manager, 请在安装NVIDIA驱动前关闭他。

这里没问题,不过我本身重新装过系统后,BIOS中显示是intel核心显卡来显示的,所以不需要调整,直接切换tty关闭lightdm。
这里附上查看显卡的命令和说明。

[root@machinename]# lspci | grep -i vga

非root用户加sudo(没有permission 问题就不用啦,这里具体加不加忘记了),显示的形式:(这里可以参考大大的:http://blog.csdn.net/wind19/article/details/17095541

01:00.0 VGA compatible controller: nVidia Corporation Device 1081 (rev a1) 

02:00.0 VGA compatible controller: nVidia Corporation GT215 [GeForce GT 240] (rev a2) 

08:05.0 VGA compatible controller: ASPEED Technology, Inc. ASPEED Graphics Family (rev 10)

其中在上面显示a加数字的表示正在使用,这样可以省去进入bios查看更改启动的时间。


2.2 安装驱动

输入下列命令添加驱动源

sudo add-apt-repository ppa:xorg-edgers/ppa
sudo apt-get update


安装340版驱动 (CUDA 6.5.14目前最高仅支持340版驱动, 343, 346版驱动暂不支持)

sudo apt-get install nvidia-340


安装完成后, 继续安装下列包 (否则在运行sample时会报错)

sudo apt-get install nvidia-340-uvm


安装完成后 reboot.

首先reboot记得加sudo(这里我记得)

这里安装得很顺利,不过已经可以安装更高版本了(安装完后担心兼容跑去问师兄,师兄说不用管,直接最新版),但是我还是装的旧版,毕竟新版可能存在一些兼容性和稳定性的问题,而且新版好大,校园网伤不起。
但是一重启动我就傻了。

直接黑屏啊有木有!我拿着笔记本各种查,各述其辞就是药不对症。什么,兼容问题,超级不靠谱好吗,这是好大一个问题啊,没有给出任何对策,就直接叫我重装(我才懒得);还有进入tty重新启动图形界面(这里其实有个问题后面谈)或者卸了驱动(我就是要装这个你叫我卸...)重启,搞笑吗,我连tty的界面都看不到真的是神解答...

其实我面临的问题超级简单好嘛,小的也实在是蠢,请不要看不起小的。后来我谁的解答都没采用,直接BIOS中disable了intelGPU再重启就好了。实际上就是显卡与驱动不对口吧(貌似还是兼容问题..)。所以还得请各位耐烦在重启的时候进入bios看看显卡是否已经切换成了nvidia GPU,否则真的耽搁很多事情。 

还有就是网上有推荐一款nvidia驱动的好基友bumblebee,小的因为觉得战线拖太长没有装,以后有需要有机会再看,不过看官们有兴趣可以试试看,附一链接:http://www.bumblebee-project.org/


3. 安装CUDA 6.5

【点击此链接】 下载CUDA 6.5. 

然后通过下列命令, 将下载得到的.run文件解压成三个文件, 分别为
CUDA安装包: cuda-linux64-rel-6.5.14-18749181.run
NVIDIA驱动: NVIDIA-Linux-x86_64-340.29.run
SAMPLE包: cuda-samples-linux-6.5.14-18745345.run

这里不安装NVIDIA驱动

cuda6.5.run --extract=extract_path


注意, 需要通过下面命令给所有.run文件可执行权限

chmod +x *.run



这里没有问题,建议分开装。我偷懒直接运行,驱动选择了no,后面各种报错首先就是toolkit的问题


Toolkit:Installation failed:using unsupported compiler


使用sudo cuda6.5.run --override解决了一部分说:


incomplete installation让我用sudo cuda6.5.run -silent -driver索性连-override都一起写上了,结果给我没有反应!?


所以,还是老老实实拆开装。


3.1 安装CUDA

通过下列命令安装CUDA, 按照说明一步一步安装至完成.

sudo ./cuda-linux64-rel-6.5.14-18749181.run


3.1.1 添加环境变量

安装完成后需要在/etc/profile中添加环境变量, 在文件最后添加:

PATH=/usr/local/cuda-6.5/bin:$PATH
export PATH


保存后, 执行下列命令, 使环境变量立即生效

source /etc/profile


3.1.2 添加lib库路径

在 /etc/ld.so.conf.d/加入文件 cuda.conf, 内容如下

/usr/local/cuda-6.5/lib64


执行下列命令使之立刻生效

sudo ldconfig



这边出现了大问题。

首先是装的时候中断了一下,我被叫去开会了。回来时已经很晚,我赶公交回宿舍啊,所以匆匆忙忙就走了(事实证明实在太匆忙我连钥匙也没拿),第二天来发现图形界面启动不了,tty可以进,于是试着启动了一下lightdm和xwindow,应该是不能用了,只有桌面没有文件管理器,终端倒是能用(快捷键启动),觉得问题没有解决,于是重新装了另外一个轻桌面kde更改了默认桌面,再次启动就额没有问题了


第一步运行得正欢时就报错:E:dependes on :libcheese-gtk231(>=3.4.0)but it will not be installed

E:depends on :libcheese7(>=3.0.1)but it will not be installed.
这是什么!?
我使用sudo apt-get 这几个lib之后,显示是0 update,0 newly installed,显然就是apt-get install 的lib都比较老旧了。这里查了一下,一个解决方案,很有效,别的微博上也有提到:
安装一个工具包,类似于apt-get
sudo apt-get install aptitude
它的不同在于它会更新
sudo aptitude install <your lib>
再次运行就没有问题了。


3.2 安装CUDA SAMPLE

首先安装下列依赖包

sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libglu1-mesa-dev


然后用下述命令安装sample文件

sudo ./cuda-samples-linux-6.5.14-18745345.run


完成后编译Sample文件, 整个过程大概10分钟左右

cd /usr/local/cuda-6.5/samples
sudo make


 全部编译完成后, 进入 samples/bin/x86_64/linux/release, sudo下运行deviceQuery

sudo ./deviceQuery


如果出现下列显卡信息, 则驱动及显卡安装成功:

./deviceQuery Starting...

CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce GTX 670"
CUDA Driver Version / Runtime Version          6.5 / 6.5
CUDA Capability Major/Minor version number:    3.0
Total amount of global memory:                 4095 MBytes (4294246400 bytes)
( 7) Multiprocessors, (192) CUDA Cores/MP:     1344 CUDA Cores
GPU Clock rate:                                1098 MHz (1.10 GHz)
Memory Clock rate:                             3105 Mhz
Memory Bus Width:                              256-bit
L2 Cache Size:                                 524288 bytes
Maximum Texture Dimension Size (x,y,z)         1D=(65536), 2D=(65536, 65536), 3D=(4096, 4096, 4096)
Maximum Layered 1D Texture Size, (num) layers  1D=(16384), 2048 layers
Maximum Layered 2D Texture Size, (num) layers  2D=(16384, 16384), 2048 layers
Total amount of constant memory:               65536 bytes
Total amount of shared memory per block:       49152 bytes
Total number of registers available per block: 65536
Warp size:                                     32
Maximum number of threads per multiprocessor:  2048
Maximum number of threads per block:           1024
Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)
Maximum memory pitch:                          2147483647 bytes
Texture alignment:                             512 bytes
Concurrent copy and kernel execution:          Yes with 1 copy engine(s)
Run time limit on kernels:                     Yes
Integrated GPU sharing Host Memory:            No
Support host page-locked memory mapping:       Yes
Alignment requirement for Surfaces:            Yes
Device has ECC support:                        Disabled
Device supports Unified Addressing (UVA):      Yes
Device PCI Bus ID / PCI location ID:           1 / 0
Compute Mode:
< Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 6.5, CUDA Runtime Version = 6.5, NumDevs = 1, Device0 = GeForce GTX 670
Result = PASS



这里我其实报了一下错,好像是编译的问题,不过我忘了记了... 


4. 安装Intel MKL 

(如果没有可以安装OpenBLAS代替)解压安装包,下面有一个install_GUI.sh文件, 执行该文件,会出现图形安装界面,根据说明一步一步执行即可。

注意: 安装完成后需要添加library路径

sudo gedit /etc/ld.so.conf.d/intel_mkl.conf


在文件中添加内容

/opt/intel/lib
/opt/intel/mkl/lib/intel64


注意把路径替换成自己的安装路径。 编辑完后执行

sudo ldconfig


 我装的是openblas,附一个链接,http://launchpad.net/ubuntu/+source/openblas下载openblas的安装包。当然也可以站在巨人的肩膀上:http://blog.sina.com.cn/s/blog_6d09848701018smp.html


5. 安装OpenCV

这个尽量不要手动安装, Github上有人已经写好了完整的安装脚本:https://github.com/jayrambhia/Install-OpenCV

下载该脚本,进入Ubuntu/2.4 目录, 给所有shell脚本加上可执行权限

chmod +x *.sh


然后安装最新版本 (当前为2.4.9)

sudo ./opencv2_4_9.sh


脚本会自动安装依赖项,下载安装包,编译并安装OpenCV。整个过程大概半小时左右。 

注意,中途可能会报错

opencv-2.4.9/modules/gpu/src/nvidia/core/NCVPixelOperations.hpp(51): error: a storage class is not allowed in an explicit specialization


解决方法在此:http://code.opencv.org/issues/3814  下载 NCVPixelOperations.hpp 替换掉opencv2.4.9内的文件,
重新build。


这里也有问题,虽然解决方法的确是博主所提到的的方法,但是整个过程及其惊心动魄,我装了好几次,一直报错,但我没有找到所谓的opencv2.4.9内的文件(是我太天真...)后来我没有在它安装的时候跑去干别的事,才发现整个openCV的安装过程完了之后会将所有安装文件删除(怪我无知),如果要替换,要在安装的过程中,在还没有调用这个文件之前就将其替换!我当时傻不拉几地还在usr/local/下装,还有一系列权限问题,当时差点没赶上趟。。不过替换过后果然是一帆风顺。


6. 安装其他依赖项

Ubuntu14.04用户执行

sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libboost-all-dev libhdf5-serial-dev libgflags-dev libgoogle-glog-dev liblmdb-dev protobuf-compiler


其他版本用户参考官方说明:http://caffe.berkeleyvision.org/installation.html

这里其实都可以全部用aptitude来装。


7. 安装Caffe所需要的Python环境

首先安装pip和python-dev (系统默认有python环境的, 不过我们需要的使python-dev)

sudo apt-get install python-dev python-pip


然后执行如下命令安装编译caffe python wrapper 所需要的额外包

for req in $(cat requirements.txt); do sudo pip install $req; done


在执行上述命令时, 会报错导致不能完全安装所有需要的包。 可以按照官方建议安装anaconda包。 在anaconda官网下载.sh文件,执行,最后添加bin目录到环境变量即可。

(2014-12-03更新)

建议安装Anaconda包,这个包能独立于系统自带的python库,并且提供大部分Caffe需要的科学运算Python库。这里需要注意,在运行Caffe时,可能会报一些找不到libxxx.so的错误,而用 locate libxxx.so命令发现已经安装在anaconda中,这时首先想到的是在/etc/ld.so.conf.d/ 下面将 $your_anaconda_path/lib 加入 LD_LIBRARY_PATH中。 但是这样做可能导致登出后无法再进入桌面!!!原因(猜测)可能是anaconda的lib中有些内容于系统自带的lib产生冲突。

正确的做法是:为了不让系统在启动时就将anaconda/lib加入系统库目录,可以在用户自己的~/.bashrc 中添加library path, 比如我就在最后添加了两行

# add library path
LD_LIBRARY_PATH=your_anaconda_path/lib:$LD_LIBRARY_PATH
export LD_LIBRARY_PATH


开启另一个终端后即生效,并且重启后能够顺利加载lightdm, 进入桌面环境。


我完全没有照做,首先我之前装过很多次Anaconda,不知道为什么这个玩意儿有时候相同版本不同机器下有时会自动修改环境变量,导致我好多工具包没法使用比如我觉得比较好编码但是运行很慢的浏览器模拟器selenium,很多人是用的java来使用这个库,用Python慢是慢了点,但是结果好得令人发指,下次把我爬谷歌的代码发上来。

废话太多了,我。
Anaconda我这次在实验室的机器上装就没有影响我的环境变量,可能也是因为我之前更改了lightdm所以也没有影响我的桌面管理器。直接就按照Anaconda的一般安装就行了。这里附个链接(请叫我附链接小公举):http://askubuntu.com/questions/505919/installing-anaconda-python-on-ubuntu
小的不会讲这些东西用作商业盈利,纯属学习,请审核时千万不要不给过啊....(吓得我都变色了)


8. 安装MATLAB

Caffe提供了MATLAB接口, 有需要用MATLAB的同学可以额外安装MATLAB。 安装教程请自行搜索。 

安装完成后添加图标 http://www.linuxidc.com/Linux/2011-01/31632.htm

sudo vi /usr/share/applications/Matlab.desktop


输入以下内容

[Desktop Entry]
Type=Application
Name=Matlab
GenericName=Matlab 2010b
Comment=Matlab:The Language of Technical Computing
Exec=sh /usr/local/MATLAB/R2010b/bin/matlab -desktop
Icon=/usr/local/MATLAB/Matlab.png
Terminal=false
Categories=Development;Matlab;


(I use the R2013b patched package. First you should uncompress the .iso file. Then use sudo cp to copy the patch file)


安装过程既然大大懒得附我来附啦:http://blog.csdn.net/lj695242104/article/details/16849397提醒一下创建快捷方式时是写自己的安装路径哦。以上写的是R2010b版,教程是R2013b版的。我试着搜索了一下网上MATLABlinux的资源少的可怜,而且太大了不支持网盘下载。我这里是做了个备份,当时是师兄用的种子下载的,在实验室里广为流传。所以,如果实在找不到,可以联系我看看,恰好有时间会传的哦。


9. 编译Caffe

终于完成了所有环境的配置,可以愉快的编译Caffe了! 进入caffe根目录, 首先复制一份Makefile.config

cp Makefile.config.example Makefile.config


然后修改里面的内容,主要需要修改的参数包括

CPU_ONLY 是否只使用CPU模式,没有GPU没安装CUDA的同学可以打开这个选项

BLAS (使用intel mkl还是OpenBLAS)

MATLAB_DIR 如果需要使用MATLAB wrapper的同学需要指定matlab的安装路径, 如我的路径为 /usr/local/MATLAB/R2013b (注意该目录下需要包含bin文件夹,bin文件夹里应该包含mex二进制程序)

DEBUG 是否使用debug模式,打开此选项则可以在eclipse或者NSight中debug程序

完成设置后, 开始编译

make all -j4
make test
make runtest


注意 -j4 是指使用几个线程来同时编译, 可以加快速度, j后面的数字可以根据CPU core的个数来决定, 我的CPU使4核, 所以-j4.

然后去尿个尿,喝杯茶, 回来就差不多编译好了..


9.1. 编译Matlab wrapper

执行如下命令

make matcaffe


然后就可以跑官方的matlab demo啦。


9.2. 编译Python wrapper

make pycaffe


然后基本就全部安装完拉.

接下来大家尽情地跑demo吧~

----------------------------------

大大写到这看得出来都懒了,其实我也是,一直写到12点真的很耽搁时间....

附个caffe的下载链接:https://github.com/BVLC/caffe剩下步骤按照大大的来。

我在编译
make all -j4

时报了错,改成sudo cmake -DBUILD_TIFF=ON之后就没有问题了。目前我对make和cmake之间的差别和联系还没有了解,各位可以自行查找。


10. 安装cuDNN

为了加速Caffe,可以安装cuDNN,参见这篇文章:NVIDIA CuDNN 安装说明 
这个我懒了,不装了,有需要再说,先自己玩一玩caffe..
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: