学习笔记(五)Tensorflow实现Soft Regression简单识别MNIST手写数字
2018-01-15 14:48
956 查看
MNIST数据库官网
推荐阅读Tensorflow官方文档中文版 MNIST机器学习入门
以及黄文坚、唐源编著的《TensorFlow实战》
一、加载MNIST数据
在这之前需要先安装IPYTHON以便能在terminal中编写python代码
虽然直接输入python命令也可以编写python代码,但ipython的优点是提供了代码自动补全,自动缩进,高亮显示等功能。
打开terminal输入
输入以下代码:
每行代码的含义在《TensorFlow实战》中有详细介绍
极客学院中TensorFlow官方文档中文版 MNIST机器学习入门也有介绍
如下图是运行成功后的截图:
如图最后一行可以看到训练的结果的平均准确率为91.99%
以上例子仅是使用tensorflow实现了一个简单的机器学习算法Soft Regressin,结果是较为不精确的,这可以算作是一个没有隐含层的最浅的神经网络。
整个流程我们做的事情有4个部分:
这几个步骤是我们使用TensorFlow进行算法设计、训练的核心步骤,也贯穿其他类型神经网络。接下来我将继续学习其他算法提高准确率
二、可能出现的错误
1.
解决方法:
解决方法参考网址:https://stackoverflow.com/questions/39844772/cxxabi-1-3-8-not-found-in-tensorflow-gpu-install-from-source
2.
那么由这两行代码
替代
这两行代码的作用是在MNIST_data目录中加载生成这四个小可爱
其实就是MNIST的训练集和测试集
3.报错
大概是网络不稳,重新再来一次就行了
三、查看MNIST数据集的情况
可以看到训练集有55000个样本,测试集有10000个样本,验证集有5000个样本
每个样本都有它对应的标注信息,就是label
训练数据是55000×784的Tensor:
训练数据label是一个55000×10的Tensor:
只有一个值为1,其余为0,label是一个十维向量。
如图,0为[1,0,0,0,0,0,0,0,0,0,0]
1为[0,1,0,0,0,0,0,0,0,0,0]以此类推,数字n就表示为对应位置的值为1。
四、Soft Regression算法
以上代码使用了Soft Regression算法,这个算法是训练手写数字识别的分类模型。
数字0~9一共有10个类别,Soft Regression对每一个类别估算概率,比如当模型对数字3的图片进行预测时,假设预测是数字3的概率为80%,预测是数字5的概率是5%,最后取概率最大的那个为模型的输出结果。
如图,明亮区域代表负的权重,灰暗区域代表真正的权重。
推荐阅读Tensorflow官方文档中文版 MNIST机器学习入门
以及黄文坚、唐源编著的《TensorFlow实战》
一、加载MNIST数据
在这之前需要先安装IPYTHON以便能在terminal中编写python代码
sudo apt-get install ipython-notebook
虽然直接输入python命令也可以编写python代码,但ipython的优点是提供了代码自动补全,自动缩进,高亮显示等功能。
打开terminal输入
ipython
输入以下代码:
from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.read_data_sets("./MNIST_data/", one_hot=True) #在MNIST_data目录中加载MNIST数据集 import tensorflow as tf sess = tf.InteractiveSession() x = tf.placeholder(tf.float32, [None, 784]) W = tf.Variable(tf.zeros([784,10])) b = tf.Variable(tf.zeros([10])) y = tf.nn.softmax(tf.matmul(x,W) + b) y_ = tf.placeholder(tf.float32, [None,10]) cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y),reduction_indices=[1])) train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy) tf.global_variables_initializer().run() #执行 for i in range(1000): batch_xs,batch_ys = mnist.train.next_batch(100) train_step.run({x:batch_xs,y_:batch_ys}) correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(y_,1)) accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32)) print(accuracy.eval({x:mnist.test.images,y_:mnist.test.labels})) #打印准确率
每行代码的含义在《TensorFlow实战》中有详细介绍
极客学院中TensorFlow官方文档中文版 MNIST机器学习入门也有介绍
如下图是运行成功后的截图:
如图最后一行可以看到训练的结果的平均准确率为91.99%
以上例子仅是使用tensorflow实现了一个简单的机器学习算法Soft Regressin,结果是较为不精确的,这可以算作是一个没有隐含层的最浅的神经网络。
整个流程我们做的事情有4个部分:
(1)定义算法公式 (2)定义loss,选定优化器 (3)迭代地对数据进行训练 (4)在测试集或验证集上对准确率进行评测
这几个步骤是我们使用TensorFlow进行算法设计、训练的核心步骤,也贯穿其他类型神经网络。接下来我将继续学习其他算法提高准确率
二、可能出现的错误
1.
version `CXXABI_1.3.8' not found
解决方法:
conda update libgcc cd ~/anaconda3/lib mv libstdc++.so libstdc++.so.bkp mv libstdc++.so.6 libstdc++.so.6.bkp 进一步(可选)在anoconda库中创建一个软链接 ln -s /usr/lib/x86_64-linux-gnu/libstdc++.so.6 libstdc++.so.6
解决方法参考网址:https://stackoverflow.com/questions/39844772/cxxabi-1-3-8-not-found-in-tensorflow-gpu-install-from-source
2.
name 'input_data' is not defined
那么由这两行代码
from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.read_data_sets("./MNIST_data/", one_hot=True)
替代
import tensorflow.examples.tutorials.mnist.input_data mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
这两行代码的作用是在MNIST_data目录中加载生成这四个小可爱
其实就是MNIST的训练集和测试集
3.报错
urlopen error [Errno 101] Network is unreachable
大概是网络不稳,重新再来一次就行了
三、查看MNIST数据集的情况
print(mnist.train.images.shape,mnist.train.labels.shape) print(mnist.test.images.shape,mnist.test.labels.shape) print(mnist.validation.images.shape,mnist.validation.labels.shape)
可以看到训练集有55000个样本,测试集有10000个样本,验证集有5000个样本
每个样本都有它对应的标注信息,就是label
训练数据是55000×784的Tensor:
训练数据label是一个55000×10的Tensor:
只有一个值为1,其余为0,label是一个十维向量。
如图,0为[1,0,0,0,0,0,0,0,0,0,0]
1为[0,1,0,0,0,0,0,0,0,0,0]以此类推,数字n就表示为对应位置的值为1。
四、Soft Regression算法
以上代码使用了Soft Regression算法,这个算法是训练手写数字识别的分类模型。
数字0~9一共有10个类别,Soft Regression对每一个类别估算概率,比如当模型对数字3的图片进行预测时,假设预测是数字3的概率为80%,预测是数字5的概率是5%,最后取概率最大的那个为模型的输出结果。
如图,明亮区域代表负的权重,灰暗区域代表真正的权重。
相关文章推荐
- 深度学习笔记(四)用Torch实现MNIST手写数字识别
- 深度学习-传统神经网络使用TensorFlow框架实现MNIST手写数字识别
- tensorflow 学习笔记7 普通神经网络实现mnist手写识别
- 深度学习笔记5torch实现mnist手写数字识别
- tensorflow 学习专栏(五):在mnist数据集上使用tensorflow实现临近算法(Nearest-Neighbor)进行手写数字识别
- 深度学习-CNN卷积神经网络使用TensorFlow框架实现MNIST手写数字识别
- TensorFlow学习---实现mnist手写数字识别
- TensorFlow学习(2):非线性回归和简单的MNIST手写数字识别
- tensorflow 学习笔记12 循环神经网络RNN LSTM结构实现MNIST手写识别
- 学习笔记TF024:TensorFlow实现Softmax Regression(回归)识别手写数字
- tensorflow 学习笔记9 卷积神经网络(CNN)实现mnist手写识别
- TensorFlow代码实现(一)[MNIST手写数字识别]
- Deep Learning-TensorFlow (1) CNN卷积神经网络_MNIST手写数字识别代码实现
- Tensorflow的Helloword:使用简单Softmax Regression模型来识别Mnist手写数字
- 深度学习- 用Torch实现MNIST手写数字识别
- Python代码实现简单的MNIST手写数字识别(适合初学者看)
- [TensorFlow]入门学习笔记(2)-卷积神经网络mnist手写识别
- tensorflow学习之识别单张图片的实现(python手写数字)
- TensorFlow学习笔记之源码分析(2)----手写数字识别mnist example
- 【深度学习】笔记3_caffe自带的第一个例子,Mnist手写数字识别所使用的LeNet网络模型的详细解释