TensorFlow入门－Tianic数据集训练

import pandas as pd

import tensorflow as tf

from sklearn.model_selection import train_test_split

import numpy as np

train_step = 5

train_path = 'train.csv'

is_train = False

learn_rate = 0.0001

epochs = 10

data = pd.read_csv(train_path)

# 取部分特征字段用于分类，并将所有缺失的字段填充为0

data['Sex'] = data['Sex'].apply(lambda s: 1 if s == 'male' else 0)

data = data.fillna(0)

dataset_X = data[['Sex', 'Age', 'Pclass', 'SibSp', 'Parch', 'Fare']]

dataset_X = dataset_X.as_matrix()

# 两种分类分别是幸存和死亡，'Survived'字段是其中一种分类的标签

# 新增'Deceased'字段表示第二种分类的标签，取值为'Survived'字段取非

data['Deceased'] = data['Survived'].apply(lambda s: int(not s))

dataset_Y = data[['Deceased', 'Survived']]

dataset_Y = dataset_Y.as_matrix()

# 使用sklearn的train_test_split函数将标记数据切分为‘训练数据集和验证数据集’

# 将全部标记数据随机洗牌后切分，其中验证数据占20%，由test_size参数指定

X_train, X_test, Y_train, Y_test = train_test_split(dataset_X, dataset_Y,

                                                    test_size=0.2, random_state=42)

# 声明输入数据点位符

X = tf.placeholder(tf.float32, shape=[None, 6])

Y = tf.placeholder(tf.float32, shape=[None, 2])

# 声明变量（参数）

W = tf.Variable(tf.random_normal([6, 2]), name='weights')

b = tf.Variable(tf.zeros([2]), name='bias')

# 构造前向传播计算图

y_pred = tf.nn.softmax(tf.matmul(X, W) + b)

# 使用交叉熵作为代价函数 Y * log(y_pred + e-10),程序中e-10,防止y_pred十分接近0或者1时，

# 计算（log0）会得到无穷，导致非法，进一步导致无法计算梯度，迭代陷入崩溃。

cross_entropy = -tf.reduce_sum(Y * tf.log(y_pred + 1e-10), reduction_indices=1)

# 批量样本的代价为所有样本交叉熵的平均值

cost = tf.reduce_mean(cross_entropy)

# 使用随机梯度下降算法优化器来最小化代价，系统自动构建反向传播部分的计算图

train_op = tf.train.GradientDescentOptimizer(learn_rate).minimize(cost)

saver = tf.train.Saver()

if is_train:

    with tf.Session() as sess:

        writer = tf.summary.FileWriter('logfile', sess.graph)

        # 初始化所有变量，必须最先执行

        tf.global_variables_initializer().run()

        # 以下为训练迭代，迭代10轮

        for epoch in range(10):

            total_loss = 0

            for i in range(len(X_train)):

                _, loss = sess.run([train_op, cost], feed_dict={X:[X_train[i]], Y:[Y_train[i]]})

                total_loss += loss

            print('Epoch: %04d, total loss=%.9f' % (epoch + 1, total_loss))

            # 保存model

            if (epoch + 1) % train_step == 0:

                save_path = saver.save(sess, './model/model.ckpt', global_step=epoch + 1)

        print('Training complete!')

        pred = sess.run(y_pred, feed_dict={X: X_test})

        # np.argmax的axis＝1表示第2轴最大值的索引（这里表示列与列对比，最大值的索引）

        correct = np.equal(np.argmax(pred, axis=1), np.argmax(Y_test, axis=1))

        accuracy = np.mean(correct.astype(np.float32))

        print("Accuracy on validation set: %.9f" % accuracy)

else:

    # 恢复model,继续训练

    with tf.Session() as sess1:

        # 从'checkpoint'文件中读出最新存档的路径

        ckpt = tf.train.get_checkpoint_state('./model')

        if ckpt and ckpt.model_checkpoint_path:

            saver.restore(sess1, ckpt.model_checkpoint_path)

            print('restore model sucess!')

        else:

            sys(0)

        print('continue train …………')

        for epoch in range(epochs):

            total_loss = 0

            for i in range(len(X_train)):

                _, loss = sess1.run([train_op, cost], feed_dict={X:[X_train[i]], Y:[Y_train[i]]})

                total_loss += loss

            print('Epoch: %04d, total loss=%.9f' % (epoch + 1, total_loss))

            # 保存model

            if (epoch + 1) % train_step == 0:

                save_path = saver.save(sess1, './model/model.ckpt', global_step=epoch + 1)

        print('Training complete!')

        pred = sess1.run(y_pred, feed_dict={X: X_test})

        # np.argmax的axis＝1表示第2轴最大值的索引（这里表示列与列对比，最大值的索引）

        correct = np.equal(np.argmax(pred, axis=1), np.argmax(Y_test, axis=1))

        accuracy = np.mean(correct.astype(np.float32))

        print("Accuracy on validation set: %.9f" % accuracy)

# 恢复model参数

with tf.Session() as sess2:

    # 从'checkpoint'文件中读出最新存档的路径

    print('restore lastest model, compute Accuracy!')

    ckpt = tf.train.get_checkpoint_state('./model')

    if ckpt and ckpt.model_checkpoint_path:

        saver.restore(sess2, ckpt.model_checkpoint_path)

    pred = sess2.run(y_pred, feed_dict={X: X_test})

    # np.argmax的axis＝1表示第2轴最大值的索引（这里表示列与列对比，最大值的索引）

    correct = np.equal(np.argmax(pred, axis=1), np.argmax(Y_test, axis=1))

    accuracy = np.mean(correct.astype(np.float32))

    print("Accuracy on validation set: %.9f" % accuracy)

TensorFlow自带的可视化工具TensorBoard

在当前目录的命令行下键入：tensorboard --logdir=logfile

根据命令行的提示，在浏览器里输入相应的网址。

TensorFlow入门－Tianic数据集训练的更多相关文章

搭建 MobileNet-SSD 开发环境并使用 VOC 数据集训练 TensorFlow 模型
原文地址:搭建 MobileNet-SSD 开发环境并使用 VOC 数据集训练 TensorFlow 模型 0x00 环境 OS: Ubuntu 1810 x64 Anaconda: 4.6.12 P ...
tensorflow中使用mnist数据集训练全连接神经网络-学习笔记
tensorflow中使用mnist数据集训练全连接神经网络 ——学习曹健老师“人工智能实践:tensorflow笔记”的学习笔记, 感谢曹老师前期准备:mnist数据集下载,并存入data目录: ...
FaceRank，最有趣的 TensorFlow 入门实战项目
FaceRank,最有趣的 TensorFlow 入门实战项目 TensorFlow 从观望到入门! https://github.com/fendouai/FaceRank 最有趣? 机器学习是不是 ...
TensorFlow 入门之手写识别(MNIST) 数据处理一
TensorFlow 入门之手写识别(MNIST) 数据处理一 MNIST Fly softmax回归准备数据解压与重构手写识别入门 MNIST手写数据集图片以及标签的数据格式处理准备 ...
（转）TensorFlow 入门
TensorFlow 入门本文转自:http://www.jianshu.com/p/6766fbcd43b9 字数3303 阅读904 评论3 喜欢5 CS224d-Day 2: 在 Da ...
TensorFlow 入门之手写识别(MNIST) softmax算法
TensorFlow 入门之手写识别(MNIST) softmax算法 MNIST flyu6 softmax回归 softmax回归算法 TensorFlow实现softmax softmax回归算 ...
一个简单的TensorFlow可视化MNIST数据集识别程序
下面是TensorFlow可视化MNIST数据集识别程序,可视化内容是,TensorFlow计算图,表(loss, 直方图, 标准差(stddev)) # -*- coding: utf-8 -*- ...
分享《机器学习实战基于Scikit-Learn和TensorFlow》中英文PDF源代码+《深度学习之TensorFlow入门原理与进阶实战》PDF+源代码
下载:https://pan.baidu.com/s/1qKaDd9PSUUGbBQNB3tkDzw <机器学习实战:基于Scikit-Learn和TensorFlow>高清中文版PDF+ ...
TensorFlow入门（五）多层 LSTM 通俗易懂版
欢迎转载,但请务必注明原文出处及作者信息. @author: huangyongye @creat_date: 2017-03-09 前言: 根据我本人学习 TensorFlow 实现 LSTM 的经 ...

随机推荐

00.嵌入式Linux开发环境搭建
3.虚拟机上网配置虚拟机如果要从网上获取资源,就要能够访问外网.虚拟机有三种上网方式:桥接上网,NAT上网,单主机模式[没用过].本节从原理和操作2个方面讲了NAT方式和桥接方式这2种不同的虚拟机 ...
[转]Spring事务<tx:annotation-driven/>
在使用SpringMVC的时候,配置文件中我们经常看到 annotation-driven 这样的注解,其含义就是支持注解,一般根据前缀 tx.mvc 等也能很直白的理解出来分别的作用.<tx: ...
Angular 4 父组件调用子组件中的方法
1. 创建工程 ng new demo3 2. 创建子组件 ng g component child 3. 在子组件中定义方法greeting 4. 父组件html(第三行是模板中调用子组件的方法) ...
基于ionic框架封装一个图片轮播指令的几点
在这里我想在项目中封装一个图片轮播的指令 (本项目使用的是ionic框架) 1)定义指令 define(['app'],function(myapp){ myapp.directive('myslid ...
【Spring学习笔记-MVC-5】利用spring MVC框架，实现ajax异步请求以及json数据的返回
作者:ssslinppp 时间:2015年5月26日 15:32:51 1. 摘要本文讲解如何利用spring MVC框架,实现ajax异步请求以及json数据的返回. Spring MV ...
spring boot学习(1) hello world
第一节:SpringBoot 简介主要是简化开发: 1. 创建独立的Spring应用程序 2. 嵌入的Tomcat,无需部署WAR文件 3. 简化Maven配置 4. 自动配置Spring 5. 提 ...
request响应码记录
响应 -- r.status_code #响应状态码 -- r.content #会自动为你解码字节方 ...
zufe oj 引水工程（巧妙地把在i建水设为e[0][i]）
引水工程时间限制: 3 Sec 内存限制: 128 MB提交: 11 解决: 6[提交][状态][讨论版] 题目描述南水北调工程是优化水资源配置.促进区域协调发展的基础性工程,是新中国成立以来 ...
JSON: JSON 用法
ylbtech-JSON: JSON 用法 1. JSON Object creation in JavaScript返回顶部 1. <!DOCTYPE html> <html> ...
PAT-甲级刷题笔记和总结
本帖主要记录一些自己在刷题过程中的一些笔记,包括: 1.常用的函数 2.STL中常用方法 3.常见错误 4.其他常用方法 5.刷题过程中的常见算法:https://www.cnblogs.com/M ...

TensorFlow入门－Tianic数据集训练

TensorFlow入门－Tianic数据集训练的更多相关文章

随机推荐

热门专题