[置顶] TensorFlow 入门之训练 MNIST 数据
2016-07-25 15:51
281 查看
学习深度神经网络一段时间了,把当初跑的代码贴上来,这篇博文是看完极客学院的文档后写的的,我把指导重新整理和汇总了一下贴出来。主要有以下几步:
1. 新建module,我命名为my_tensorflow_code,里面新建文件__init__.py,可以是空文件
2. 新建input_data.py,用于下载 MNIST 数据集并且当做输入,具体见下面代码:
3. 接下来再新建一个文件,我命名为test_mnist.py,这个是用一个简单的 Softmax 回归来进行训练的代码,具体在代码里面有很详细的注释:
有一些注意的地方就是,当在一定程度上增加训练次数的时候,正确率会有一点的提高。还有一点就是取的batch大的时候,进行BP传播的时候收敛速度会快一些,但是相应的训练的时间消耗的就会增加。
以上就是 TensorFlow入门的第一个demo。
1. 新建module,我命名为my_tensorflow_code,里面新建文件__init__.py,可以是空文件
2. 新建input_data.py,用于下载 MNIST 数据集并且当做输入,具体见下面代码:
from __future__ import absolute_import from __future__ import division from __future__ import print_function import gzip import os import tempfile import numpy from six.moves import urllib from six.moves import xrange # pylint: disable=redefined-builtin import tensorflow as tf from tensorflow.contrib.learn.python.learn.datasets.mnist import read_data_sets
3. 接下来再新建一个文件,我命名为test_mnist.py,这个是用一个简单的 Softmax 回归来进行训练的代码,具体在代码里面有很详细的注释:
#!/usr/bin/env python3 # -*- coding: utf-8 -*- import input_data import tensorflow as tf #MNIST数据输入 mnist = input_data.read_data_sets("MNIST_data/", one_hot=True) x = tf.placeholder(tf.float32,[None, 784]) #图像输入向量 W = tf.Variable(tf.zeros([784,10])) #权重,初始化值为全零 b = tf.Variable(tf.zeros([10])) #偏置,初始化值为全零 #进行模型计算,y是预测,y_ 是实际 y = tf.nn.softmax(tf.matmul(x,W) + b) y_ = tf.placeholder("float", [None,10]) #计算交叉熵 cross_entropy = -tf.reduce_sum(y_*tf.log(y)) #接下来使用BP算法来进行微调,以0.01的学习速率 train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy) #上面设置好了模型,添加初始化创建变量的操作 init = tf.initialize_all_variables() #启动创建的模型,并初始化变量 sess = tf.Session() sess.run(init) #开始训练模型,循环训练1000次 for i in range(1000): #随机抓取训练数据中的100个批处理数据点 batch_xs, batch_ys = mnist.train.next_batch(100) sess.run(train_step, feed_dict={x:batch_xs,y_:batch_ys}) ''' 进行模型评估 ''' #判断预测标签和实际标签是否匹配 correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(y_,1)) accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float")) #计算所学习到的模型在测试数据集上面的正确率 print( sess.run(accuracy, feed_dict={x:mnist.test.images, y_:mnist.test.labels}) )
有一些注意的地方就是,当在一定程度上增加训练次数的时候,正确率会有一点的提高。还有一点就是取的batch大的时候,进行BP传播的时候收敛速度会快一些,但是相应的训练的时间消耗的就会增加。
以上就是 TensorFlow入门的第一个demo。
相关文章推荐
- FlexPaper使用教程
- 图像像素处理_明度/亮度/平均值/灰褐色/滤镜/灰色_canvas_js动画
- 听大咖分享《俞军的产品方法》有感
- 简析TCP的三次握手与四次分手
- 【C/C++】关键字之sizeof(sizeof()用法汇总)
- Spring 框架学习
- IT-个人运维经验小计
- JS模块化写法
- 如何利用sql包下的ResultSet来获取查询数据的列数及行数
- HBuilder底部选项卡,如何换图标呢
- 记录webstorm注册码
- Windows Azure中WebSite 网站, Cloud Service 云服务,Virtual Machine 虚拟机的比较
- winform让子窗体始终居于父窗体的中间
- C# return、continue、break
- scp不用密码远程拷贝
- mysql,连接缓存问题 flush hosts
- Android 5.0 部分新特性学习
- vector与list使用与剖析1
- fork()子进程复制父进程的缓冲区的一个例子
- 读书笔记--逻辑回归拟合--人口预测模型