tensorflow-gpu 和cpu使用训练ssd模型感想(显卡内存不足解决办法)
2018-08-02 11:56
891 查看
ssd 模型对于GPU ,CPU来说都适用,但是通过我的训练de'd得到的一下经验来说,GPU训练时基本不到1秒每步,而cpu在使用avx2的基础上,训练的每步需要将近1分钟,可想而知GPU训练是cpu训练的60倍左右,这将大大提高大家的训练速度。
而且,之前我yong用cpu版本训练时ssd model训练1000步需要花7-8个小时,现在用GPU只需要10分钟就足以,由此可见,对于Tensorflow版本的选择,还是以GPU为首选比较好,当然,不进行大的项目的运算,对于神经元数量较少,完成tensorflow教程的简单例子的实现,cpu版本和gpu版本随便就好。
如果我的GPU显存才2G怎么办?
笔者的GPU为GTX950M显存大小为2G,此时对于balancap ssd model来说,你在训练的时候可能会报错,说你的内存不够,这是由于batch_size 为32,让你的显卡一次装不下这么多的东西,那么减小batch_size的大小直到不报错为止即可!比如我的batch_size为4,此时GPU可以顺利运行!!!
下面上图:
[code]INFO:tensorflow:global step 700: loss = 75.7585 (0.838 sec/step) INFO:tensorflow:global step 710: loss = 68.1864 (0.847 sec/step) INFO:tensorflow:global step 720: loss = 141.8700 (0.833 sec/step) INFO:tensorflow:global step 730: loss = 70.4635 (0.839 sec/step) INFO:tensorflow:global step 740: loss = 17.7308 (0.844 sec/step) INFO:tensorflow:global step 750: loss = 20.5915 (0.852 sec/step) INFO:tensorflow:global step 760: loss = 270.5725 (0.882 sec/step) INFO:tensorflow:Recording summary at step 761. INFO:tensorflow:global step 770: loss = 69.5534 (0.843 sec/step) INFO:tensorflow:global step 780: loss = 27.5434 (0.820 sec/step) INFO:tensorflow:global step 790: loss = 78.9974 (0.838 sec/step) INFO:tensorflow:global step 800: loss = 62.6840 (0.824 sec/step) INFO:tensorflow:global step 810: loss = 40.8120 (0.820 sec/step) INFO:tensorflow:global step 820: loss = 38.0882 (0.847 sec/step) INFO:tensorflow:global step 830: loss = 73.9964 (0.850 sec/step) INFO:tensorflow:Recording summary at step 831. INFO:tensorflow:global step 840: loss = 24.8218 (0.856 sec/step) INFO:tensorflow:global step 850: loss = 101.3560 (0.826 sec/step) INFO:tensorflow:global step 860: loss = 63.4505 (0.847 sec/step) INFO:tensorflow:global step 870: loss = 31.3807 (0.844 sec/step) INFO:tensorflow:global step 880: loss = 20.8094 (0.846 sec/step) INFO:tensorflow:global step 890: loss = 88.3870 (0.863 sec/step)阅读更多
相关文章推荐
- CPU配置Caffe训练SSD遇到Cannot use GPU in CPU-only Caffe: check mode问题解决办法
- TensorFlow使用GPU训练网络时多块显卡的显存使用问题
- tensorflow 在cpu的环境中无法导入gpu训练好的模型(Make sure the device specification refers to a valid device.)
- 【经验】-- 虚拟机显示“物理内存不足,无法使用配置的设置开启虚拟机”的解决办法
- tensorflow 使用多块GPU同时训练多个模型
- 关于训练深度学习模型deepNN时,训练精度维持固定值,模型不收敛的解决办法(tensorflow实现)
- SQLServer2005获取大数据集时内存不足的解决办法
- Weka加载大数据量内存不足的解决办法
- 使用Genymotion调试出现错误INSTALL_FAILED_CPU_ABI_INCOMPATIBLE解决办法
- Eclipse报告内存不足和PermSize space错误的解决办法
- Eclipse报告内存不足和PermSize space错误,Eclipse死掉的解决办法
- 使用Genymotion调试出现错误INSTALL_FAILED_CPU_ABI_INCOMPATIBLE解决办法
- 使用Genymotion调试出现错误INSTALL_FAILED_CPU_ABI_INCOMPATIBLE解决办法
- Firefox占用CPU、内存太高解决办法
- VMWARE 磁盘容量不足的解决办法 linux下fdisk的使用
- Eclipse-junit调试内存不足解决办法
- 使用Genymotion调试出现错误INSTALL_FAILED_CPU_ABI_INCOMPATIBLE解决办法
- 使用Genymotion调试出现错误INSTALL_FAILED_CPU_ABI_INCOMPATIBLE解决办法
- 使用WebBrowser,内存一直增加的解决办法
- 使用Genymotion调试出现错误INSTALL_FAILED_CPU_ABI_INCOMPATIBLE解决办法