小白学Tensorflow之多层神经网络
2016-07-25 20:52
811 查看
在本博客中,我们将利用Tensorflow来构建一个多层神经网络。因为本博客是为了学习目的,所以我们就来构建一个四层神经网络,即一个输入层,两个隐藏层,一个输出层。
第一,我们需要定义层与层之间的转移矩阵
第二,构建模型。在此模型中,我们加入了dropout参数,该参数是为了防止过拟合。也就是说,如果在某一层中使用了dropout参数,那么该层只有一部分神经元放电。比如,dropout = 0.8,那么只有80%的神经元是出于放电状态的,其他都是关闭状态。
完整代码,如下:
简书同步:http://www.jianshu.com/p/f481b19031a6
第一,我们需要定义层与层之间的转移矩阵
# 定义输入层到第一个隐藏层之间的连接矩阵 w_layer_1 = init_weights([784, 625]) # 定义第一个隐藏层到第二个隐藏层之间的连接矩阵 w_layer_2 = init_weights([625, 625]) # 定义第二个隐藏层到输出层之间的连接矩阵 w_layer_3 = init_weights([625, 10])
第二,构建模型。在此模型中,我们加入了dropout参数,该参数是为了防止过拟合。也就是说,如果在某一层中使用了dropout参数,那么该层只有一部分神经元放电。比如,dropout = 0.8,那么只有80%的神经元是出于放电状态的,其他都是关闭状态。
def model(X, w_layer_1, w_layer_2, w_layer_3, p_keep_input, p_keep_hidden): X = tf.nn.dropout(X, p_keep_input) hidden_1 = tf.nn.relu(tf.matmul(X, w_layer_1)) hidden_1 = tf.nn.dropout(hidden_1, p_keep_hidden) hidden_2 = tf.nn.relu(tf.matmul(hidden_1, w_layer_2)) hidden_2 = tf.nn.dropout(hidden_2, p_keep_hidden) return tf.matmul(hidden_2, w_layer_3)
完整代码,如下:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import numpy as np
import tensorflow as tf
import input_data
def init_weights(shape):
return tf.Variable(tf.random_normal(shape, stddev = 0.01))
def model(X, w_layer_1, w_layer_2, w_layer_3, p_keep_input, p_keep_hidden): X = tf.nn.dropout(X, p_keep_input) hidden_1 = tf.nn.relu(tf.matmul(X, w_layer_1)) hidden_1 = tf.nn.dropout(hidden_1, p_keep_hidden) hidden_2 = tf.nn.relu(tf.matmul(hidden_1, w_layer_2)) hidden_2 = tf.nn.dropout(hidden_2, p_keep_hidden) return tf.matmul(hidden_2, w_layer_3)
# 导入数据
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
trX, trY, teX, teY = mnist.train.images, mnist.train.labels, mnist.test.images, mnist.test.labels
X = tf.placeholder("float", [None, 784])
Y = tf.placeholder("float", [None, 10])
# 在该模型中我们一共有4层,一个输入层,两个隐藏层,一个输出层
# 定义输入层到第一个隐藏层之间的连接矩阵 w_layer_1 = init_weights([784, 625]) # 定义第一个隐藏层到第二个隐藏层之间的连接矩阵 w_layer_2 = init_weights([625, 625]) # 定义第二个隐藏层到输出层之间的连接矩阵 w_layer_3 = init_weights([625, 10])
# dropout 系数
# 定义有多少有效的神经元将作为输入神经元,比如 p_keep_intput = 0.8,那么只有80%的神经元将作为输入
p_keep_input = tf.placeholder("float")
# 定义有多少的有效神经元将在隐藏层被激活
p_keep_hidden = tf.placeholder("float")
# 构建模型
py_x = model(X, w_layer_1, w_layer_2, w_layer_3, p_keep_input, p_keep_hidden)
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(py_x, Y))
train_op = tf.train.RMSPropOptimizer(0.001, 0.9).minimize(cost)
predict_op = tf.argmax(py_x, 1)
with tf.Session() as sess:
init = tf.initialize_all_variables()
sess.run(init)
for i in xrange(100):
for start, end in zip(range(0, len(trX), 128), range(128, len(trX), 128)):
sess.run(train_op, feed_dict = {X: trX[start:end], Y: trY[start:end],
p_keep_input: 0.8, p_keep_hidden: 0.5})
print i, np.mean(np.argmax(teY, axis = 1) == sess.run(predict_op,
feed_dict = {X: teX, Y: teY, p_keep_input: 1.0, p_keep_hidden: 1.0}))
简书同步:http://www.jianshu.com/p/f481b19031a6
相关文章推荐
- 卷积神经网络CNN经典模型整理(AlexNet,GoogleNet,VGG,Deep Residual Learning)
- In Korean, Multipath TCP is pronounced GIGA Path
- 在 Web 请求中使用 XMLHttpRequest
- MPTCP port for Android
- OkHttpUtils - 封装了okhttp的网络框架
- 好厉害 http://blog.csdn.net/zq602316498/
- 思科网络设备如何打出问号?字符
- Torch7学习(四)——学习神经网络包的用法(2)
- 网络编程的几个函数
- http缓存浅谈
- 基本控件使用(一)(遮罩、HTTP请求、ControlSlider、ControlSwitch、ProgressTo)
- 远程更新公告---目标软件-----枫彩网络工具箱
- 0143 [HLS]做自己的m3u8点播系统使用HTTP Live Streaming(HLS技术)
- 网络Http 相关 工具 类
- vagrant 网络
- HttpClient4.5和RestTemplate使用
- HTTP 介绍
- 跳转至系统网络设置界面
- CentOS tcpflow抓包
- java网络socket编程(六)之HTTP请求/响应报文