用Tensorflow实现简单多层神经网络

觉得有用的话,欢迎一起讨论相互学习~

参考文献

Tensorflow机器学习实战指南

源代码见下方链接

ReLU激活函数/L1范数版本

Sigmoid激活函数/交叉熵函数版本

数据集及网络结构

数据集

使用预测出生体重的数据集csv格式，其中数据的第2列至第8列为训练属性，第9列为体重数据即标签，第一列为标记是否为低出生体重的标记，本博文中不对其进行讨论。

Low Birthrate data:

Columns(列)   Variable（值）                             Abbreviation

-----------------------------------------------------------------------------

Low Birth Weight (0 = Birth Weight >= 2500g,            LOW

                         1 = Birth Weight < 2500g)

低出生体重

Age of the Mother in Years                              AGE

母亲妊娠年龄

Weight in Pounds at the Last Menstrual Period           LWT

在最后一次月经期间体重增加。

Race (1 = White, 2 = Black, 3 = Other)                  RACE

肤色

Smoking Status During Pregnancy (1 = Yes, 0 = No)       SMOKE

怀孕期间吸烟状态

History of Premature Labor (0 = None  1 = One, etc.)    PTL

早产的历史

History of Hypertension (1 = Yes, 0 = No)               HT

高血压历史

Presence of Uterine Irritability (1 = Yes, 0 = No)      UI

子宫刺激性的存在

Birth Weight in Grams                                   BWT

以克为单位的体重

网络结构

所使用网络结构十分简单为三层隐层网络分别为25-10-3 的结构。其中loss 函数为L1损失范数，激活函数为ReLU.

少说废话多写代码

数据读取

import tensorflow as tf

import matplotlib.pyplot as plt

import csv

import os

import numpy as np

import requests

from tensorflow.python.framework import ops

# name of data file

# 数据集名称

birth_weight_file = 'birth_weight.csv'

# download data and create data file if file does not exist in current directory

# 如果当前文件夹下没有birth_weight.csv数据集则下载dat文件并生成csv文件

if not os.path.exists(birth_weight_file):

    birthdata_url = 'https://github.com/nfmcclure/tensorflow_cookbook/raw/master/01_Introduction/07_Working_with_Data_Sources/birthweight_data/birthweight.dat'

    birth_file = requests.get(birthdata_url)

    birth_data = birth_file.text.split('\r\n')

    # split分割函数,以一行作为分割函数，windows中换行符号为'\r\n',每一行后面都有一个'\r\n'符号。

    birth_header = birth_data[0].split('\t')

    # 每一列的标题，标在第一行，即是birth_data的第一个数据。并使用制表符作为划分。

    birth_data = [[float(x) for x in y.split('\t') if len(x) >= 1] for y in birth_data[1:] if len(y) >= 1]

    # 数组第一维表示遍历行从第一行开始，所以不包含标题，数组第二维遍历列(使用制表符进行分割)

    # print(np.array(birth_data).shape)

    # (189, 9)不包含标题

    # 此为list数据形式不是numpy数组不能使用np,shape函数,但是我们可以使用np.array函数将list对象转化为numpy数组后使用shape属性进行查看。

    # 注意，向其中写入文件时一定要去掉换行等操作符号，如果在csv中有换行符，也会作为一行数据的。

    # 读文件时，我们把csv文件读入列表中，写文件时会把列表中的元素写入到csv文件中。

    #

    # list = ['1', '2', '3', '4']

    # out = open(outfile, 'w')

    # csv_writer = csv.writer(out)

    # csv_writer.writerow(list)

    # 可能遇到的问题：直接使用这种写法会导致文件每一行后面会多一个空行。

    #

    # 解决办法如下：

    #

    # out = open(outfile, 'w', newline='')  注意newline属性

    # csv_writer = csv.writer(out, dialect='excel')

    # csv_writer.writerow(list)

    with open(birth_weight_file, "w", newline='') as f:

        # 创建当前目录下birth_weight.csv文件

        writer = csv.writer(f)

        writer.writerows([birth_header])

        writer.writerows(birth_data)

        f.close()

# 将出生体重数据读进内存

birth_data = []

with open(birth_weight_file, newline='') as csvfile:

    csv_reader = csv.reader(csvfile)  # 使用csv.reader读取csvfile中的文件

    birth_header = next(csv_reader)  # 读取第一行每一列的标题

    for row in csv_reader:  # 将csv 文件中的数据保存到birth_data中

        birth_data.append(row)

birth_data = [[float(x) for x in row] for row in birth_data]  # 将数据转换为float格式

# 对于每组数据而言，第8列(序号从0开始)即为标签序列-体重

y_vals = np.array([x[8] for x in birth_data])

# 特征序列

cols_of_interest = ['AGE', 'LWT', 'RACE', 'SMOKE', 'PTL', 'HT', 'UI']

x_vals = np.array(

    [[x[ix] for ix, feature in enumerate(birth_header) if feature in cols_of_interest] for x in birth_data])

# 数组一维使用for x in birth_data遍历整个数组

# enumerate(birth_header)函数返回ix索引和feature特征，用读取的feature和cols_of_interest进行匹配

# 使x[ix]数据存入数组中

数据预处理

# 重置Tensorflow图模型

ops.reset_default_graph()

# Create graph session

sess = tf.Session()

# set batch size for training

batch_size = 100

# make results reproducible

seed = 3

np.random.seed(seed)

tf.set_random_seed(seed)

# 将所有数据分割成训练集80%测试集20%

train_indices = np.random.choice(len(x_vals), round(len(x_vals)*0.8), replace=False)

# np.random.choice（a,n,p）可以传入一个一维数组a或者一个int值a，如果是一维数组a将可以设定几率P返回数组中的n个值。

# 如果是int值a，则返回一个随机生成0~(a-1)之间的n个数的数组。利用该数组可以作为数据的索引值来选定数据集中一定比例的样本。

'''

 Examples

            Generate a uniform random sample from np.arange(5) of size 3:

            >>> np.random.choice(5, 3)

            array([0, 3, 4])

            >>> #This is equivalent to np.random.randint(0,5,3)

            Generate a non-uniform random sample from np.arange(5) of size 3:

            >>> aa_milne_arr = ['pooh', 'rabbit', 'piglet', 'Christopher']

            >>> np.random.choice(aa_milne_arr, 5, p=[0.5, 0.1, 0.1, 0.3])

            array(['pooh', 'pooh', 'pooh', 'Christopher', 'piglet'],

                  dtype='|S11')

'''

test_indices = np.array(list(set(range(len(x_vals))) - set(train_indices)))

'''example

------------------------------

a = range(8)

print('a:', a)

b = set(a)

print('b=set(a):', b)

a1 = np.array([1, 4, 6])

print('a1=np.array:', a1)

b1 = set(a1)

print('b1=set(a1):', b1)

c = list(b - b1)

print('list(b-b1)', c)

# a: range(0, 8)

# b=set(a): {0, 1, 2, 3, 4, 5, 6, 7}

# a1=np.array: [1 4 6]

# b1=set(a1): {1, 4, 6}

# list(b-b1) [0, 2, 3, 5, 7]

'''

x_vals_train = x_vals[train_indices]

x_vals_test = x_vals[test_indices]

y_vals_train = y_vals[train_indices]

y_vals_test = y_vals[test_indices]

# 标准化操作，将数据标准化到0~1的区间

def normalize_cols(m):

    col_max = m.max(axis=0)

    col_min = m.min(axis=0)

    return (m - col_min)/(col_max - col_min)

x_vals_train = np.nan_to_num(normalize_cols(x_vals_train))

x_vals_test = np.nan_to_num(normalize_cols(x_vals_test))

# 解决NaN无法处理的问题，如果是很大的(正/负)数用一个很大的(正/负)实数代替，如果是很小的数用0代替

构建神经网络模型

# 定义变量函数(权重和偏差)，stdev参数表示方差

def init_weight(shape, st_dev):

    weight = tf.Variable(tf.random_normal(shape, stddev=st_dev))

    return (weight)

def init_bias(shape, st_dev):

    bias = tf.Variable(tf.random_normal(shape, stddev=st_dev))

    return (bias)

# 创建数据占位符

x_data = tf.placeholder(shape=[None, 7], dtype=tf.float32)

y_target = tf.placeholder(shape=[None, 1], dtype=tf.float32)

# 创建一个全连接层函数

def fully_connected(input_layer, weights, biases):

    layer = tf.add(tf.matmul(input_layer, weights), biases)

    return (tf.nn.relu(layer))

# --------Create the first layer (25 hidden nodes)--------

weight_1 = init_weight(shape=[7, 25], st_dev=10.0)

bias_1 = init_bias(shape=[25], st_dev=10.0)

layer_1 = fully_connected(x_data, weight_1, bias_1)

# --------Create second layer (10 hidden nodes)--------

weight_2 = init_weight(shape=[25, 10], st_dev=10.0)

bias_2 = init_bias(shape=[10], st_dev=10.0)

layer_2 = fully_connected(layer_1, weight_2, bias_2)

# --------Create third layer (3 hidden nodes)--------

weight_3 = init_weight(shape=[10, 3], st_dev=10.0)

bias_3 = init_bias(shape=[3], st_dev=10.0)

layer_3 = fully_connected(layer_2, weight_3, bias_3)

# --------Create output layer (1 output value)--------

weight_4 = init_weight(shape=[3, 1], st_dev=10.0)

bias_4 = init_bias(shape=[1], st_dev=10.0)

final_output = fully_connected(layer_3, weight_4, bias_4)

# 绝对值L1损失范数

loss = tf.reduce_mean(tf.abs(y_target - final_output))

# 定义优化器

my_opt = tf.train.AdamOptimizer(0.01)  # 使用Adam优化器，学习率使用0.01

train_step = my_opt.minimize(loss)

填充数据与训练

# Initialize Variables

init = tf.global_variables_initializer()

sess.run(init)

# 训练

loss_vec = []

test_loss = []

for i in range(2000):

    rand_index = np.random.choice(len(x_vals_train), size=batch_size)

    rand_x = x_vals_train[rand_index]  # shape=[batch_size,7]

    rand_y = y_vals_train[rand_index].reshape([batch_size, 1])

    # 使用训练数据对网络进行训练

    sess.run(train_step, feed_dict={x_data: rand_x, y_target: rand_y})

    temp_loss = sess.run(loss, feed_dict={x_data: rand_x, y_target: rand_y})

    loss_vec.append(temp_loss)  # 将训练集上的误差存进loss_vec中

    test_temp_loss = sess.run(loss, feed_dict={x_data: x_vals_test, y_target: np.transpose([y_vals_test])})

    test_loss.append(test_temp_loss)  # 将测试集上的误差存进test_loss中

    if (i + 1)%200 == 0:

        print('Generation: ' + str(i + 1) + '. Loss = ' + str(temp_loss))

# 结果展示

Generation: 200. Loss = 2763.73

Generation: 400. Loss = 1717.1

Generation: 600. Loss = 1218.89

Generation: 800. Loss = 1493.56

Generation: 1000. Loss = 1634.2

Generation: 1200. Loss = 1392.12

Generation: 1400. Loss = 1388.24

Generation: 1600. Loss = 1055.66

Generation: 1800. Loss = 1105.95

Generation: 2000. Loss = 1205.54

使用matplotlib绘制loss值

# 使用matplotlib显示loss

plt.plot(loss_vec, 'k-', label='Train Loss')

plt.plot(test_loss, 'r--', label='Test Loss')

plt.title('Loss (MSE) per Generation')

plt.legend(loc='upper right')

plt.xlabel('Generation')

plt.ylabel('Loss')

plt.show()

升级版本

使用sigmoid激活函数交叉熵函数作为Cost Function

只需做如下修改

# activation 标志位Ture则使用非线性函数sigmoid，否则使用线性函数方式

def logistic(input_layer, multiplication_weight, bias_weight, activation=True):

    linear_layer = tf.add(tf.matmul(input_layer, multiplication_weight), bias_weight)

    if activation:

        return (tf.nn.sigmoid(linear_layer))

    else:

        return (linear_layer)

# 交叉熵函数

loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=final_output, labels=y_target))

用Tensorflow实现多层神经网络的更多相关文章

TensorFlow 训练MNIST数据集（2）—— 多层神经网络
在我的上一篇随笔中,采用了单层神经网络来对MNIST进行训练,在测试集中只有约90%的正确率.这次换一种神经网络(多层神经网络)来进行训练和测试. 1.获取MNIST数据 MNIST数据集只要一行代码 ...
tensorflow实现循环神经网络
包括卷积神经网络(CNN)在内的各种前馈神经网络模型, 其一次前馈过程的输出只与当前输入有关与历史输入无关. 递归神经网络(Recurrent Neural Network, RNN)充分挖掘了序列数 ...
NO.1：自学tensorflow之路------神经网络背景知识
引言从本周,我将开始tensorflow的学习.手头只有一本<tensorflow:实战Google深度学习框架>,这本书对于tensorflow的入门有一定帮助.tensorflow中 ...
TensorFlow实现多层感知机函数逼近
TensorFlow实现多层感知机函数逼近准备工作对于函数逼近,这里的损失函数是 MSE.输入应该归一化,隐藏层是 ReLU,输出层最好是 Sigmoid. 下面是如何使用 MLP 进行函数逼近的 ...
多层神经网络BP算法原理及推导
首先什么是人工神经网络?简单来说就是将单个感知器作为一个神经网络节点,然后用此类节点组成一个层次网络结构,我们称此网络即为人工神经网络(本人自己的理解).当网络的层次大于等于3层(输入层+隐藏层(大于 ...
使用TensorFlow的卷积神经网络识别自己的单个手写数字，填坑总结
折腾了几天,爬了大大小小若干的坑,特记录如下.代码在最后面. 环境: Python3.6.4 + TensorFlow 1.5.1 + Win7 64位 + I5 3570 CPU 方法: 先用MNI ...
使用TensorFlow的递归神经网络（LSTM）进行序列预测
本篇文章介绍使用TensorFlow的递归神经网络(LSTM)进行序列预测.作者在网上找到的使用LSTM模型的案例都是解决自然语言处理的问题,而没有一个是来预测连续值的. 所以呢,这里是基于历史观察数 ...
Spark2.0机器学习系列之7： MLPC（多层神经网络）
Spark2.0 MLPC(多层神经网络分类器)算法概述 MultilayerPerceptronClassifier(MLPC)这是一个基于前馈神经网络的分类器,它是一种在输入层与输出层之间含有一层 ...
ufldl学习笔记与编程作业：Multi-Layer Neural Network(多层神经网络+识别手写体编程)
ufldl学习笔记与编程作业:Multi-Layer Neural Network(多层神经网络+识别手写体编程) ufldl出了新教程,感觉比之前的好,从基础讲起,系统清晰,又有编程实践. 在dee ...

随机推荐

Manacher算法——求最长回文子串
首先,得先了解什么是回文串.回文串就是正反读起来就是一样的,如“abcdcba”.我们要是直接采用暴力方法来查找最长回文子串,时间复杂度为O(n^3),好一点的方法是枚举每一个字符,比较较它左右距离相 ...
模仿qq列表信息滑动删除效果
这个效果的完成主要分为两个部分自定义view作为listview的列表项一个view里面包括显示头像,名字,消息内容等的contentView和滑动才能显示出来的删除,置顶的右边菜单menuVi ...
0429团队项目-Scrum团队成立
Scrum团队成立团队名称:开拓者团队目标:努力让每一个小伙伴在学会走路的基础上学会跑. 团队口号:我们要的只是这片天而已. 团队照:正面照+背影照(那就是为什么组名叫开拓者) 5.2 角色分配 ...
lintcode-202-线段树的查询
202-线段树的查询对于一个有n个数的整数数组,在对应的线段树中, 根节点所代表的区间为0-n-1, 每个节点有一个额外的属性max,值为该节点所代表的数组区间start到end内的最大值. 为Se ...
PAT 甲级 1129 Recommendation System
https://pintia.cn/problem-sets/994805342720868352/problems/994805348471259136 Recommendation system ...
利用canvas对上传图片进行上传前压缩
利用谷歌调式工具发现,图片大小直接影响着首屏加载时间. 且考虑到后期服务端压力,图片压缩特别必要. 本文是前端利用canvas实现图片.参考文章:https://www.cnblogs.com/007 ...
对Excle的行和列进行检查单元格类型转换代码；
对Excle的行和列进行检查转换代码 : ** * 导入信息 */ @Override public List<Object> add(HttpServletRequest reque ...
Tomcat+JDK安装和配置
Tomcat+JDK安装和配置一.打开FlashFXP软件,建立连接,选择需要的包,右击传输到 /home/guest中二.进入到:cd /home/guest中,对tomcat包进行解压三.将 ...
【Mybatis】简单的mybatis增删改查模板
简单的mybatis增删改查模板: <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE map ...
ORZ hzwer——OI省选算法汇总
简单列了一点 1.1 基本数据结构 1. 数组 2. 链表,双向链表 3. 队列,单调队列,双端队列 4. 栈,单调栈 1.2 中级数据结构 1. 堆 2. 并查集与带权并查集 3. hash 表自 ...

用Tensorflow实现多层神经网络

用Tensorflow实现简单多层神经网络

觉得有用的话,欢迎一起讨论相互学习~

源代码见下方链接

数据集及网络结构

数据集

网络结构

少说废话多写代码

数据读取

数据预处理

构建神经网络模型

填充数据与训练

使用matplotlib绘制loss值

升级版本

使用sigmoid激活函数交叉熵函数作为Cost Function

用Tensorflow实现多层神经网络的更多相关文章

随机推荐

热门专题