使用Tensorflow实现一个简单的神经网络
输入数据:
- 输入数据的形状是[300, 1], 也就是每个元素有一个特征,所以输入神经元是一个。
隐藏层:
- 输出神经元10个。输出数据会成为[300, 10]的形状。也就是300个元素,每个元素的特征变成了10个。
- 激活函数使用Relu
输出层:
- 输出数据是[300, 1]
- 不使用激活函数
import tensorflow as tfimport numpy as npimport matplotlib.pyplot as plt# 添加层(输入层,隐藏层,输出层)# inputs,输入数据# insize,输入神经数,out_size,输出神经数# activation_function,激活函数,None就是不作处理def add_layer(inputs, in_size, out_size, activation_function=None): # (1,10) 正态分布随机数 Weights = tf.Variable(tf.random_normal([in_size, out_size])) biases = tf.Variable(tf.zeros([1, out_size]) + 0.1) # 点积 Wx_plus_b = tf.matmul(inputs, Weights) + biases if activation_function is None: outputs = Wx_plus_b else: outputs = activation_function(Wx_plus_b) return outputs# np.newaxis, 增加一维,[300, 1]x_data = np.linspace(-1, 1, 300, dtype=np.float32)[:, np.newaxis]# 躁点noise = np.random.normal(0, 0.05, x_data.shape).astype(np.float32)y_data = np.square(x_data) - 0.5 + noise# 占位符# [None,1], 任意行,1列xs = tf.placeholder(tf.float32, [None, 1])ys = tf.placeholder(tf.float32, [None, 1])# 隐藏层# 激活函数使用Relu,非线性化函数# 为什么使用激活函数参考# https://www.cnblogs.com/silence-tommy/p/7113405.htmll1 = add_layer(xs, 1, 10, activation_function=tf.nn.relu)# 输出层prediction = add_layer(l1, 10, 1, activation_function=None)# 损失函数# reduct_sum, axis=【1】,将整行的所有列相加loss = tf.reduce_mean(tf.reduce_sum(tf.square(ys - prediction), axis=[1]))# 优化,梯度下降,减少损失函数的值# 得到使损失函数最低的W,也就是最优解train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)init = tf.global_variables_initializer()with tf.Session() as sess: sess.run(init) for i in range(1000): sess.run(train_step, feed_dict={xs: x_data, ys: y_data}) if i % 50 == 0: print(sess.run(loss, feed_dict={xs: x_data, ys: y_data}))fig = plt.figure()ax = fig.add_subplot(1,1,1)ax.scatter(x_data, y_data)plt.show()
相关方法
tf:
- tf.random_normal,取正态分布分布的随机值,得到一个列表
- tf.Variable,tf中定义变量需要用这个方法,不能直接声明
- tf.zeros,类似于np.zeros
- tf.matmul, 矩阵点积
- tf.placeholder,占位符
- tf.reduce_mean, tf.reduce_sum, tf.square,和numpy类似
- tf.train.GradientDescentOptimizer,优化方法使用梯度下降方法
np:
- np.linspace,做等分,得到一个一维的array
- [:, np.newaxis], array后面接这个,表示增加一个维度。例如作用在一维数组上(100,),会得到 [ 100,1 ]
- np.random.normal,正态分布随机数
- astype,拷贝一份制定类型的数组
Reference: