您的位置:首页 > 其它

初学者深度学习工作站配置

2017-03-17 12:01 197 查看
本文使用人群为:

深度学习小白或者入门者

配置工作站预算不高者(1w内)

穷书生

若有预算高者或深度学习进阶的朋友,推荐几篇关于深度学习工作站配置文章

1.知乎匿名用户

2.Time Dettmers经典文章:A Full Hardware Guide to Deep Learning

3.Roelof Pieter:深度 | 从硬件配置到软件安装,一台深度学习机器的配备指南

4.成本14,000元,如何自己动手搭建深度学习服务器?

本人是某穷实验室搬砖学生,想学习深度学习只能自己配置工作站,由于自身也数据深度学习初学者,因此也不敢配太好的电脑,本着一颗学医不成当游戏机的心态,组装了人生第一台电脑

先列出个人配置,建议大家可以通过pcpartpicker.com建立自己的配置清单,这个网站可以检测你的配件是否会存在兼容性的问题

CPU:I5 7500散片 ¥1189

CPU散热器玄冰300:¥78

GPU:微星 MSI GTX 1080 8G DUKE 闇黑龙爵 256BIT 8GB GDDR5X PCI-E3.0 显卡¥3999

主板: 华硕PRIME B250M-PLUS ¥619

固态SSD:Intel 600P 256G ¥789

机械硬盘:西部数据蓝盘7200转2T ¥429

内存: 金士顿(Kingston)骇客神条 Fury系列 DDR4 2400 8G 台式机内存¥449

机箱: 先马(SAMA)塔里克侧透版黑 游戏电脑机箱 ¥159

电源: 航嘉(Huntkey) 额定500W jumper500 电源 ¥289

共¥7980

1.CPU

最好选择越多PCI-e lanes的CPU越好,由于酷睿i5-7500的通道数只有16个,所以未来拓展显卡会有瓶颈。由于独显都是通过PCI-e 通道进行连接,而GPU可以通过x4、x8、x16通道进行驱动。由于i5-7500本身具有集成显卡,以及m.2接口的ssd会占据4条通道,因此16条通道会分配成 1X8、2X4,因此基本使用了i5-7500的通道数限制下无法进行GPU拓展。8个通道分配给1080,4个通道分配给集成显卡,4个通道分配给ssd



个人考虑到目前只是入门级别,而且硬件的更新换代比较快,并且整体预算不高,想着目前想用一块1080显卡玩一玩,就没考虑多通道的CPU。

如果是想要未来能够拓展更多的显卡,可以通过以下方式选择E5 CPU,若预算不够可选择上一代的,或者选择双路CPU。

查询intel官网,发现大部分i5和i7的PCI-e通道只有16,i7至尊系列能达到40通道,不过此时的你需要考虑下预算问题。退而求其次,可以选择上代E5系列产品,可以淘宝搜索相关产品,不过都是几年前的CPU了,性能上可能会有所欠缺,但是如果不是拿来做游戏机只是拿来做深度学习的话是可以用的。不过淘宝水很深,得自己辨别

2.GPU

显卡基本上推荐至少1080以上的显卡。显卡才是关键的要素,组机器来搞深度,就是为了获得足够的CUDA单元,以及配套的显存资源。所以数CUDA个数和单个CUDA可用的平均显存量就是衡量整体能力的基本考量方法。



可对比目前几块消费级具有CUDA计算单元的显卡对比

最新2017三月份上市的1080ti堪称性价比之最,11.5TFLOPS,11GB显存,苦于,最终只是入手了1080

TFLOPS(teraFLOPS FLoating-point Operations Per Second每秒浮点运算次数)



CUDA Cores



显存



3.主板

主板也是选购的关键,若预算足够或者足够折腾,尽量选择足够多的PCI-e插槽,切勿选择一些小板,只有2个内存插槽或只有一个PCI-e,待你需要拓展内存和显卡时只能够整体换掉。上面有提到GPU主要是通过PCI-e插槽连接,板子上只有有足够多的x4/x8接口就已经足够了,x8与x16的性能基本相差不大,x8与x4接口性能理论上相差近20%。

整体选择原则是:尽可能多的PCI-e插槽,如果主板长下面样子那会是非常喜人的



当然主板的预算也会和PCI-e插槽的数量成正相关

在这里需要提醒的是,请先了解清楚CPU的PCI-e通道数(可通过芯片官网查询),如果CPU没有那么多通道,主板上再多插槽也没有作用

这次我选择了话说B250M-PLUS的板子,这个是B150M的更新换代版本。具有2个PCI-e x16的插槽,并且支持M.2的SSD插槽,有4个内存条插槽,对于目前我来说够用了。价格也不贵,基于以上考虑就选择了这个板子。

4.硬盘

SSD最好选择M2接口的盘,注意主板是否支持相应接口,使用SSD存放训练数据会提升训练速度,注意实际训练时,把数据从硬盘复制到SSD再开始,平时请及时腾出SSD空间,SSD的性能是和容量同步的。SSD切勿买SATA接口的,直接上M2的盘,用下面这种转接设备可以获得超过6Gbps以上的传输速度,缺点就是占用PCI-e.因此CPU的PCI-e通道也会被ssd所占据。另外Log和Data存放在机械硬盘就好。当然SSD的话看个人预算,越贵越好

5,内存

保证至少是你所有GPU加起来的两倍即可,注意确认主板支持的内存类型,目前我只使用了一个8G显存的1080,因此内存先购买8G的,若以后需要可以继续拓展,B160M-PLUS总共支持共4个DDR4口,共可以拓展64G内存

6.电源

电源在50%负载情况下转换效率最高,因此可以将CPU和GPU以及其他配件的TDP相加获得一个大概的负载功耗数值。CPU和GPU是耗电大户,1080 GPU的功耗为180W, i5-7500的功耗为65W,其他配件功耗不高,具体大家可以网上查一查。我的接近300W并且考虑到有时候GPU以及CPU满载情况下超过了额定功耗,防止功耗不足,因此我选择了一个500W的电源。选择电源时注意选择具有80PLUS认证的电源。

以上,就是我在配置个人的工作站的一些选择,对于深度学习入门者来说是一个参考,至于大神级别的要拓展4块/8块显卡的,自认为短时间内技术水平达不到需要那么多快显存来能完成实例的水准,并且更多得支持深度学习的硬件平台也在不断更新迭代,况且还有AWS可以用,因此目前一块显卡的配置已经适合自己目前入门玩玩了。如果真正得想要一次到位:建议参考开头推荐的几个帖子慢慢琢磨。

第一篇博文,发现要把所有了解到的东西慢慢说清楚实在是不简单,要有足够得耐心以及知识整理能力。还是得慢慢坚持下来写博客这件事,以此鼓励自己在深度学习的这个坑上越挖越深。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  深度学习 硬件
相关文章推荐