您的位置:首页 > 其它

[置顶] TensorFlow 入门之训练 MNIST 数据

2016-07-25 15:51 281 查看
学习深度神经网络一段时间了,把当初跑的代码贴上来,这篇博文是看完极客学院的文档后写的的,我把指导重新整理和汇总了一下贴出来。主要有以下几步:

1.  新建module,我命名为my_tensorflow_code,里面新建文件__init__.py,可以是空文件

2.  新建input_data.py,用于下载 MNIST 数据集并且当做输入,具体见下面代码:

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import gzip
import os
import tempfile

import numpy
from six.moves import urllib
from six.moves import xrange  # pylint: disable=redefined-builtin
import tensorflow as tf
from tensorflow.contrib.learn.python.learn.datasets.mnist import read_data_sets


3. 接下来再新建一个文件,我命名为test_mnist.py,这个是用一个简单的 Softmax 回归来进行训练的代码,具体在代码里面有很详细的注释:

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import input_data
import tensorflow as tf

#MNIST数据输入
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

x = tf.placeholder(tf.float32,[None, 784]) #图像输入向量
W = tf.Variable(tf.zeros([784,10]))  #权重,初始化值为全零
b = tf.Variable(tf.zeros([10]))  #偏置,初始化值为全零

#进行模型计算,y是预测,y_ 是实际
y = tf.nn.softmax(tf.matmul(x,W) + b)

y_ = tf.placeholder("float", [None,10])

#计算交叉熵
cross_entropy = -tf.reduce_sum(y_*tf.log(y))
#接下来使用BP算法来进行微调,以0.01的学习速率
train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy)

#上面设置好了模型,添加初始化创建变量的操作
init = tf.initialize_all_variables()
#启动创建的模型,并初始化变量
sess = tf.Session()
sess.run(init)
#开始训练模型,循环训练1000次
for i in range(1000):
#随机抓取训练数据中的100个批处理数据点
batch_xs, batch_ys = mnist.train.next_batch(100)
sess.run(train_step, feed_dict={x:batch_xs,y_:batch_ys})

''' 进行模型评估 '''

#判断预测标签和实际标签是否匹配
correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(y_,1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))
#计算所学习到的模型在测试数据集上面的正确率
print( sess.run(accuracy, feed_dict={x:mnist.test.images, y_:mnist.test.labels}) )


有一些注意的地方就是,当在一定程度上增加训练次数的时候,正确率会有一点的提高。还有一点就是取的batch大的时候,进行BP传播的时候收敛速度会快一些,但是相应的训练的时间消耗的就会增加。

以上就是 TensorFlow入门的第一个demo。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: