DNN网络（三）python下用Tensorflow实现DNN网络以及Adagrad优化器

一、DNN 简介

DNN一共可以分为三层。

输入层（input layer）
隐藏层（hidden layer）
输出层（output layer）

DNN的前向传播即由输入经过一些列激活函数得到最终的输出

在对DNN参数求解的时候，通过反向传播，以及链式法则求得。

二、Tensorflow下的DNN实现

1、实现功能简介：

本文摘自Kaggle的一篇房价预测题目，找了一篇比较全的，当作自己的Tensorflow入门。链接：

https://www.kaggle.com/zoupet/neural-network-model-for-house-prices-tensorflow

数据和题目可以在文章开头的地址找的。

主要是给定了一个区域的房子价格以及房子特征，要预测一下房价。

2、挑选数据

 # 为了使得代码在 python2 或者3下都运行，加的 __future__包。如果是python3，下面的包可以不加。

 from __future__ import absolute_import

 from __future__ import division

 from __future__ import print_function

 import itertools

 import pandas as pd

 import numpy as np

 import matplotlib.pyplot as plt

 from pylab import rcParams

 import matplotlib

 from sklearn.model_selection import train_test_split

 # scaler, put the value range from min to max

 from sklearn.preprocessing import MinMaxScaler

 import tensorflow as tf

 # 定义多少条记录会被当作log。

 tf.logging.set_verbosity(tf.logging.INFO)

 # InteractiveSession 与 Session的区别是不用每一次执行命令时，前面都加一个session。可以自己查一下

 sess = tf.InteractiveSession()

 # 文件目录

 path_train = '/Users/adrian.wu/Desktop/learn/kaggle/price/data/all/train.csv'

 '''

 首先只用数字特征进行预测，去除掉其它特征，比如类别等

 '''

 train = pd.read_csv(path_train)

 print('所有特征下，矩阵纬度:', train.shape)

 # 挑选出只是数字类型的特征

 train = train.select_dtypes(exclude=['object'])

 print('数字类型特征矩阵的纬度:', train.shape)

 # 去掉没用的特征Id

 train.drop('Id', axis=1, inplace=True)

 # 处理缺失值，简单的填充0

 train.fillna(0, inplace=True)

 print("\n特征:", list(train.columns))

 '''

 用Isolation Forest去掉异常值

 '''

 from sklearn.ensemble import IsolationForest

 clf = IsolationForest(max_samples=100, random_state=42)

 clf.fit(train)

 y_noano = clf.predict(train)

 print(y_noano)

 y_noano = pd.DataFrame(y_noano, columns=['Top'])

 # y_noano[y_noano['Top'] == 1].index.values, 等于1的不是异常值，-1为异常值

 train = train.iloc[y_noano[y_noano['Top'] == 1].index.values]

 train.reset_index(drop=True, inplace=True)

 print("异常值数量:", y_noano[y_noano['Top'] == -1].shape[0])

 print("正常数据数量:", train.shape[0])

3、特征预处理

 '''

 特征预处理

 '''

 import warnings

 warnings.filterwarnings('ignore')

 # 得到特征名字，并存为list类型

 col_train = list(train.columns)

 col_train_bis = list(train.columns)

 # 去除要预测的值，SalePrice

 col_train_bis.remove('SalePrice')

 # 用numpy转为可操作的矩阵

 mat_train = np.mat(train)

 mat_y = np.array(train.SalePrice).reshape((1314, 1))

 # 归一化方法，把所有特征归一化到0～1之间

 prepro_y = MinMaxScaler()

 prepro_y.fit(mat_y)

 prepro = MinMaxScaler()

 prepro.fit(mat_train)

 # 将处理过后的数据转为DataFrame

 train = pd.DataFrame(prepro.transform(mat_train), columns=col_train)

4、train test数据集合处理

 '''

 train test集合数据处理

 '''

 # 把列都列出来

 COLUMNS = col_train

 FEATURES = col_train_bis

 LABEL = "SalePrice"

 # 暂且理解将DataFrame的数据转为对应的输入值，因此要指定一列列的值。

 feature_cols = [tf.contrib.layers.real_valued_column(k) for k in FEATURES]

 # 得到Feature 和 预测值

 training_set = train[COLUMNS]

 prediction_set = train.SalePrice

 # 将Train test 分为2:1分

 x_train, x_test, y_train, y_test = train_test_split(training_set[FEATURES], prediction_set, test_size=0.33,

                                                     random_state=42)

 # 整合特征和预测值，对train集

 y_train = pd.DataFrame(y_train, columns=[LABEL])

 training_set = pd.DataFrame(x_train, columns=FEATURES).merge(y_train, left_index=True, right_index=True)

 # 整合特征和预测值，对test集

 y_test = pd.DataFrame(y_test, columns=[LABEL])

 testing_set = pd.DataFrame(x_test, columns=FEATURES).merge(y_test, left_index=True, right_index=True)

 # 打log的，可以忽略

 tf.logging.set_verbosity(tf.logging.ERROR)

5、DNN网络

 '''

  快速创建一个DNN网络,

  optimizer = tf.train.GradientDescentOptimizer( learning_rate= 0.1 )) 可以自己选优化方式

  激活函数为relu

  都有哪些feature

  隐藏层的神经元个数，递减，200，100，50，25，12个

 '''

 regressor = tf.contrib.learn.DNNRegressor(feature_columns=feature_cols,

                                           activation_fn=tf.nn.relu,

                                           hidden_units=[200, 100, 50, 25, 12])

 training_set.reset_index(drop=True, inplace=True)

 # 定义一个函数用来train网络

 def input_fn(data_set, pred=False):

     if pred == False:

         feature_cols = {k: tf.constant(data_set[k].values) for k in FEATURES}

         labels = tf.constant(data_set[LABEL].values)

         return feature_cols, labels

     if pred == True:

         feature_cols = {k: tf.constant(data_set[k].values) for k in FEATURES}

         return feature_cols

 # trainDNN网络

 regressor.fit(input_fn=lambda: input_fn(training_set), steps=2000)

 # 估计测试集

 ev = regressor.evaluate(input_fn=lambda: input_fn(testing_set), steps=1)

 loss_score = ev["loss"]

 print("test集的损失为: {0:f}".format(loss_score))

6、Adagrad优化器

看了下代码。这里的优化器用的是Adagrad。形式大致和SGD差不多，在其基础通过对梯度的迭代相加，对学习率进行了更新，从而控制学习率。

学习率随着梯度的和会逐渐变小。

1、迭代公式

eta也就是分子项是初始学习率。G为梯度迭代和，G旁边长的很像E的那一项是一个小常数，防止分母为0。

由上式可得到，G越大，学习率越小。

三、Tensorflow一步一步搭建一个简单DNN

1、创建网络

 import tensorflow as tf

 from numpy.random import RandomState

 from sklearn.model_selection import train_test_split

 batch_size = 8

 # 定义网络

 w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))

 b1 = tf.Variable(tf.zeros([1, 3], name="bias1"))

 b2 = tf.Variable(tf.zeros([1], name="bias2"))

 w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))

 x = tf.placeholder(tf.float32, shape=(None, 2), name='x-input')

 y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y-input')

 a = tf.matmul(x, w1) + b1

 # 这里一定不要写成 tf.sigmoid

 y_last = tf.nn.sigmoid(tf.matmul(a, w2) + b2)

2、定义损失函数

 # 损失与准确率

 loss = tf.losses.sigmoid_cross_entropy(y_, y_last)

 train_step = tf.train.AdamOptimizer(0.07).minimize(loss)

 correct_prediction = tf.equal(tf.round(y_last), y_)

 acc = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

3、造数据

# 造数据，X为二维数据例如：[[0.1, 0.8]]， 当X的第一项和第二项相加 < 1 时 Y为1， 当X的第一项和第二项相加 >= 1时为 0

rdm = RandomState(1)

data_set_size = 128000

X = rdm.rand(data_set_size, 2)

Y = [[int(x1 + x2 < 1)] for (x1, x2) in X]

X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.3)

4、训练与测试

with tf.Session() as sess:

    init_op = tf.global_variables_initializer()

    sess.run(init_op)

    STEPS = 7000

    for i in range(0, 8900 - batch_size, batch_size):

        start = i

        sess.run(train_step, feed_dict={x: X_train[start: start + batch_size], y_: y_train[start: start + batch_size]})

        if i % 800 == 0:

            # 计算所有数据的交叉熵

            total_cross_entropy = sess.run(loss, feed_dict={x: X, y_: Y})

            # 输出交叉熵之和

            # print("After %d training step(s),cross entropy on all data is %g" % (i, total_cross_entropy))

    acc_ = sess.run(acc, feed_dict={x: X_test, y_: y_test})

    print("accuracy on test data is ", acc_)

    test = sess.run(y_last, feed_dict={x: X_test, y_: y_test})

5、结果

accuracy on test data is  0.96091145

DNN网络（三）python下用Tensorflow实现DNN网络以及Adagrad优化器的更多相关文章

TensorFlow使用记录 (六）：优化器
0. tf.train.Optimizer tensorflow 里提供了丰富的优化器,这些优化器都继承与 Optimizer 这个类.class Optimizer 有一些方法,这里简单介绍下: 0 ...
莫烦大大TensorFlow学习笔记（8）----优化器
一.TensorFlow中的优化器 tf.train.GradientDescentOptimizer:梯度下降算法 tf.train.AdadeltaOptimizer tf.train.Adagr ...
『TensorFlow』网络操作API_下
一.优化器基类介绍标注一点,优化器中的学习率可以是tensor,这意味着它可以feed, learning_rate: A Tensor or a floating point value. 正常使 ...
TensorFlow之DNN（二）：全连接神经网络的加速技巧(Xavier初始化、Adam、Batch Norm、学习率衰减与梯度截断)
在上一篇博客<TensorFlow之DNN(一):构建“裸机版”全连接神经网络>中,我整理了一个用TensorFlow实现的简单全连接神经网络模型,没有运用加速技巧(小批量梯度下降不算哦) ...
centos7下安装docker（12docker网络）
docker 网络荣覆盖范围可分为:单个host上的容器网络和跨多个host的网络 docker 安装时会自动在host上创建三个网络,我们可以使用docker network ls查看到 1.non ...
Tensorflow 中的优化器解析
Tensorflow:1.6.0 优化器(reference:https://blog.csdn.net/weixin_40170902/article/details/80092628) I: t ...
三分钟快速上手TensorFlow 2.0 （下）——模型的部署、大规模训练、加速
前文:三分钟快速上手TensorFlow 2.0 (中)——常用模块和模型的部署 TensorFlow 模型导出使用 SavedModel 完整导出模型不仅包含参数的权值,还包含计算的流程(即计算 ...
TensorFlow之DNN（三）：神经网络的正则化方法(Dropout、L2正则化、早停和数据增强)
这一篇博客整理用TensorFlow实现神经网络正则化的内容. 深层神经网络往往具有数十万乃至数百万的参数,可以进行非常复杂的特征变换,具有强大的学习能力,因此容易在训练集上过拟合.缓解神经网络的过拟 ...
python下的复杂网络编程包networkx的使用（摘抄）
原文:http://blog.sciencenet.cn/home.php?mod=space&uid=404069&do=blog&classid=141080&vi ...

随机推荐

8、16、32-BIT系列单片机区别与特点
一.8位单片机 8031/8051/8751是Intel公司早期的产品 1.8031的特点 8031片内不带程序存储器ROM,使用时用户需外接程序存储器和一片逻辑电路373,外接的程序存储器多为EPR ...
Linux下启动,停止,重启Nginx、Mysql、PHP
LINUX启动Nginx的命令: 一.查询是否启动 [root@jiang php-fpm.d]# ps -ef | grep nginx root 25225 1 0 19:26 ? 00:00:0 ...
用python批量向数据库(MySQL)中导入数据
用python批量向数据库(MySQL)中导入数据现有数十万条数据,如下的经过打乱处理过的数据进行导入数据库内部的表格的数据格式如下与下面的表格结构相同 Current database: pyt ...
hibernate 5的二级缓存案例讲解
hibernate 5的二级缓存案例讲解本帖最后由鱼丸儿于 2018-1-20 11:44 编辑大家好,今天来记录讲解一下磕磕绊绊的hibernate5 的二级缓存配置,一条路摸到黑那么在这 ...
js 获取对象属性个数
js 获取对象属性个数方法一: var attributeCount = function(obj) { var count = 0; for(var i in obj) { if(obj.hasO ...
[HEOI2014]平衡
[HEOI2014]平衡转化为求选择k个数,和为(n+1)*k的方案数保证,每个数[1,2*n+1]且最多选择一次. 限制k个很小,所以用整数划分的第二种方法 f[i][j],用了i个,和为j 整 ...
（转）MySQL中In与Exists的区别
背景:总结mysql相关的知识点. 如果A表有n条记录,那么exists查询就是将这n条记录逐条取出,然后判断n遍exists条件. select * from user where exists s ...
（转）每天一个linux命令（44）：top命令
背景:在面试时候面试官问到关于linux服务器下内存优化的问题.自己之前可能接触过也没有深入总结过. top命令每天一个linux命令(44):top命令
内部git常用总结
上库git常用命令总结 http://3ms.huawei.com/hi/group/1531/wiki_4955279.html?for_statistic_from=all_group_wik ...
parallels tools 安装
│ - kernel-devel-2.6.32-358.el6.x86_64 │ │ - dkms