tensorflow实现二分类

读万卷书，不如行万里路。之前看了不少机器学习方面的书籍，但是实战很少。这次因为项目接触到tensorflow，用一个最简单的深层神经网络实现分类和回归任务。

首先说分类任务，分类任务的两个思路：

如果是多分类，输出层为计算出的预测值Z3(1,classes)，可以利用softmax交叉熵损失函数，将Z3中的值转化为概率值，概率值最大的即为预测值。

在tensorflow中，多分类的损失函数为：

cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=Z3, labels=Y))

为了匹配Z3和Y的尺寸，需要将输入Y进行one-hot编码，

from keras.utils import to_categorical

Y_train = to_categorical(Y_train)
计算准确性：

correct_prediction = tf.equal(tf.argmax(Z3,axis=1), tf.argmax(Y,1) )  # tf.argmax找出每一列最大值的索引
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))  # tf.cast转化数据类型
print("Train Accuracy:", sess.run(accuracy,feed_dict={X: X_train, Y: Y_train}))
print("Test Accuracy: ",sess.run(accuracy,feed_dict={X:X_test,Y:Y_test}))
完整代码如下：

# -*- coding: utf-8 -*-

import numpy as np

import tensorflow as tf

import math

from sklearn.model_selection import train_test_split

from keras.utils import to_categorical

import keras

import scipy

import os

import csv

import pandas as pd

from keras.utils import to_categorical

from sklearn.preprocessing import normalize

#创建placeholders对象

def create_placeholders(n_x,n_y):

    """

    placeholder是TensorFlow的占位符节点，由placeholder方法创建，其也是一种常量，但是由用户在调用run方法是传递的.

    也可以将placeholder理解为一种形参。

    即其不像constant那样直接可以使用，需要用户传递常数值。

    """

    X=tf.placeholder(tf.float32,shape=[None,n_x],name='X')

    Y=tf.placeholder(tf.float32,shape=[None,n_y],name='Y')

    return X,Y

#初始化参数

def initialize_parameters(m,n):

    #设置种子后，每次生成的参数都是相同的，保证重复实验的结果可以参考

    tf.set_random_seed(1)

    W1 = tf.get_variable("W1", shape=[n, n], initializer=tf.contrib.layers.xavier_initializer(seed=1))

    b1 = tf.get_variable("b1", shape=[1, n], initializer=tf.zeros_initializer())

    W2=tf.get_variable("W2",shape=[n,2],initializer=tf.contrib.layers.xavier_initializer(seed=1))

    b2=tf.get_variable("b2",shape=[1,2],initializer=tf.zeros_initializer())

    parameters={

        "W1": W1,

        "b1":b1,

        "W2":W2,

        "b2":b2

    }

    return parameters

#前向传播

def forward_propagation(X,parameters,lambd):

    W1=parameters['W1']

    b1=parameters['b1']

    W2 = parameters['W2']

    b2 = parameters['b2']

    #使用L1正则化

    tf.add_to_collection('losses',tf.contrib.layers.l1_regularizer(lambd)(W1))

    tf.add_to_collection('losses', tf.contrib.layers.l1_regularizer(lambd)(W2))

    A1=tf.nn.relu(tf.matmul(X,W1)+b1)

    Z3=tf.matmul(A1,W2)+b2

    return  Z3

def compute_cost(Z3, Y):

    cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=Z3, labels=Y))

    tf.add_to_collection('losses',cost)

    return tf.add_n(tf.get_collection('losses'))

def model(X_train, Y_train,X_test,Y_test, learning_rate=0.01,minibatch_size=10, num_epochs=30000, print_cost=True):

    tf.set_random_seed(1)

    (m, n_x) = X_train.shape

    n_y = Y_train.shape[1]

    costs = []

    # 创建Placeholders,一个张量

    X,Y=create_placeholders(n_x,n_y)

    print(X.shape, Y.shape)

    # 初始化参数

    parameters=initialize_parameters(m,n_x)

    # 前向传播

    Z3=forward_propagation(X,parameters,0.002)

    # 计算代价

    cost = compute_cost(Z3, Y)

    # 后向传播: 定义tensorflow optimizer对象，这里使用AdamOptimizer.

    optimizer=tf.train.AdadeltaOptimizer(learning_rate=learning_rate).minimize(cost)

    # optimizer = tf.train.GradientDescentOptimizer(learning_rate=learning_rate).minimize(cost)

    # 初始化所有参数

    init=tf.global_variables_initializer()

    # 启动session来计算tensorflow graph

    with tf.Session() as sess:

        sess.run(init)

        for epoch in range(num_epochs):

            epoch_cost=sess.run([optimizer,cost],feed_dict={X:X_train,Y:Y_train})

            test_cost=sess.run(cost,feed_dict={X:X_test,Y:Y_test})

            epoch_cost=epoch_cost[1]

            if print_cost==True and epoch%100==0:

                print("Cost after epoch %i: %f" %(epoch,epoch_cost))

                print("test_cost: ",test_cost)

        # lets save the parameters in a variable

        parameters = sess.run(parameters)

        print("Parameters have been trained!")

        # 神经网络经过训练后得到的值

        correct_prediction = tf.equal(tf.argmax(Z3,axis=1), tf.argmax(Y,1) )  # tf.argmax找出每一列最大值的索引

        accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))  # tf.cast转化数据类型

        print("Train Accuracy:", sess.run(accuracy,feed_dict={X: X_train, Y: Y_train}))

        print("Test Accuracy: ",sess.run(accuracy,feed_dict={X:X_test,Y:Y_test}))

        return parameters

def loaddata(file):

    fr=open(file,'r', encoding='utf-8-sig')

    reader = csv.reader(fr)

    data=[]

    fltLine=[]

    for line in reader:

        data.append(line)

    data=np.mat(data)

    data=data.astype(np.float32)

    X=data[1:,0:-1]

    Y=data[1:,-1]

    X=normalize(X,axis=0,norm='max')

    X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=42)

    return X_train, X_test, Y_train, Y_test

if __name__=='__main__':

    X_train, X_test, Y_train, Y_test= loaddata('./data3.csv')

    Y_train=to_categorical(Y_train)

    Y_test = to_categorical(Y_test)

    parmeters=model(X_train,Y_train,X_test,Y_test)

另一种是单纯的针对二分类，主要有两点不同，一是损失函数的使用：

输出层Z3为(1,1)

cost= tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=Z3, labels=Y))
另一个就是计算准确率：

one = tf.ones_like(Z3)
zero = tf.zeros_like(Z3)
label = tf.where(tf.less(Z3, 0.5), x=zero, y=one)

correct_prediction = tf.equal(label, Y)  # tf.argmax找出每一列最大值的索引
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))  # tf.cast转化数据类型
print("Train Accuracy:", sess.run(accuracy, feed_dict={X: X_train, Y: Y_train}))
print("Test Accuracy: ", sess.run(accuracy, feed_dict={X: X_test, Y: Y_test}))
完整代码如下：

# -*- coding: utf-8 -*-

import numpy as np

import tensorflow as tf

import math

from sklearn.model_selection import train_test_split

from keras.utils import to_categorical

import keras

import scipy

import os

import csv

import pandas as pd

from keras.utils import to_categorical

from sklearn.preprocessing import normalize

# 创建placeholders对象

def create_placeholders(n_x, n_y):

    """

    placeholder是TensorFlow的占位符节点，由placeholder方法创建，其也是一种常量，但是由用户在调用run方法是传递的.

    也可以将placeholder理解为一种形参。

    即其不像constant那样直接可以使用，需要用户传递常数值。

    """

    X = tf.placeholder(tf.float32, shape=[None, n_x], name='X')

    Y = tf.placeholder(tf.float32, shape=[None, n_y], name='Y')

    return X, Y

# 初始化参数

def initialize_parameters(m, n):

    # 设置种子后，每次生成的参数都是相同的，保证重复实验的结果可以参考

    tf.set_random_seed(1)

    W1 = tf.get_variable("W1", shape=[n, n], initializer=tf.contrib.layers.xavier_initializer(seed=1))

    b1 = tf.get_variable("b1", shape=[1, n], initializer=tf.zeros_initializer())

    W2 = tf.get_variable("W2", shape=[n, 1], initializer=tf.contrib.layers.xavier_initializer(seed=1))

    b2 = tf.get_variable("b2", shape=[1, 1], initializer=tf.zeros_initializer())

    parameters = {

        "W1": W1,

        "b1": b1,

        "W2": W2,

        "b2": b2

    }

    return parameters

# 前向传播

def forward_propagation(X, parameters, lambd):

    W1 = parameters['W1']

    b1 = parameters['b1']

    W2 = parameters['W2']

    b2 = parameters['b2']

    # 使用L1正则化

    #tf.add_to_collection('losses', tf.contrib.layers.l2_regularizer(lambd)(W1))

    #tf.add_to_collection('losses', tf.contrib.layers.l2_regularizer(lambd)(W2))

    #A1 = tf.nn.relu(tf.matmul(X, W1) + b1)

    Z3 = tf.matmul(X, W2) + b2

    #Z3=tf.sigmoid(Z3)

    return Z3

def compute_cost(Z3, Y):

    # 经过激活函数处理后的交叉熵

    #cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=Z3, labels=Y))

    cost= tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=Z3, labels=Y))

    #cost=-tf.reduce_mean(Y*tf.log(tf.clip_by_value(Z3,1e-10,1.0)))

    tf.add_to_collection('losses', cost)

    return tf.add_n(tf.get_collection('losses'))

def model(X_train, Y_train, X_test, Y_test, learning_rate=0.05, minibatch_size=10, num_epochs=50000, print_cost=True):

    tf.set_random_seed(1)

    (m, n_x) = X_train.shape

    n_y = Y_train.shape[1]

    costs = []

    # 创建Placeholders,一个张量

    X, Y = create_placeholders(n_x, n_y)

    print(X.shape, Y.shape)

    # 初始化参数

    parameters = initialize_parameters(m, n_x)

    # 前向传播

    Z3 = forward_propagation(X, parameters, 0.001)

    # 计算代价

    cost = compute_cost(Z3, Y)

    # 后向传播: 定义tensorflow optimizer对象，这里使用AdamOptimizer.

    optimizer = tf.train.AdadeltaOptimizer(learning_rate=learning_rate).minimize(cost)

    # optimizer = tf.train.GradientDescentOptimizer(learning_rate=learning_rate).minimize(cost)

    # 初始化所有参数

    init = tf.global_variables_initializer()

    # 启动session来计算tensorflow graph

    with tf.Session() as sess:

        sess.run(init)

        for epoch in range(num_epochs):

            epoch_cost = sess.run([optimizer, cost], feed_dict={X: X_train, Y: Y_train})

            test_cost = sess.run(cost, feed_dict={X: X_test, Y: Y_test})

            epoch_cost = epoch_cost[1]

            if print_cost == True and epoch % 100 == 0:

                print("Cost after epoch %i: %f" % (epoch, epoch_cost))

                print("test_cost: ", test_cost)

        # lets save the parameters in a variable

        parameters = sess.run(parameters)

        print("Parameters have been trained!")

        # 神经网络经过训练后得到的值

        # print(sess.run(Y,feed_dict={Y:Y_train}))

        # Y=tf.cast(Y,tf.int64)

        one = tf.ones_like(Z3)

        zero = tf.zeros_like(Z3)

        label = tf.where(tf.less(Z3, 0.5), x=zero, y=one)

        correct_prediction = tf.equal(label, Y)  # tf.argmax找出每一列最大值的索引

        accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))  # tf.cast转化数据类型

        print("Train Accuracy:", sess.run(accuracy, feed_dict={X: X_train, Y: Y_train}))

        print("Test Accuracy: ", sess.run(accuracy, feed_dict={X: X_test, Y: Y_test}))

        return parameters

def loaddata(file):

    fr = open(file, 'r', encoding='utf-8-sig')

    reader = csv.reader(fr)

    data = []

    fltLine = []

    for line in reader:

        data.append(line)

    data = np.mat(data)

    data = data.astype(np.float32)

    X = data[1:, 0:-1]

    Y = data[1:, -1]

    X = normalize(X, axis=0, norm='max')

    X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=42)

    return X_train, X_test, Y_train, Y_test

if __name__ == '__main__':

    X_train, X_test, Y_train, Y_test = loaddata('./data3.csv')

    #Y_train = to_categorical(Y_train)

    #Y_test = to_categorical(Y_test)

    parmeters = model(X_train, Y_train, X_test, Y_test)

tensorflow实现二分类的更多相关文章

Tensorflow mlp二分类
只是简单demo, 可以看出tensorflow非常简洁,适合快速实验 import tensorflow as tf import numpy as np import melt_datas ...
Tensorflow CIFAR10 (二分类)
数据的下载: (共有三个版本:python,matlab,binary version 适用于C语言) http://www.cs.toronto.edu/~kriz/cifar-10-python. ...
tensorflow实现svm iris二分类——本质上在使用梯度下降法求解线性回归（loss是定制的而已）
iris二分类 # Linear Support Vector Machine: Soft Margin # ---------------------------------- # # This f ...
SVM原理以及Tensorflow 实现SVM分类(附代码)
1.1. SVM介绍 1.2. 工作原理 1.2.1. 几何间隔和函数间隔 1.2.2. 最大化间隔 - 1.2.2.0.0.1. $L( {x}^*)$对$ {x}^*$求导为0 - 1.2.2 ...
Kaggle实战之二分类问题
0. 前言 1. MNIST 数据集 2. 二分类器 3. 效果评测 4. 多分类器与误差分析 5. Kaggle 实战 0. 前言 "尽管新技术新算法层出不穷,但是掌握好基础算法就能解决手 ...
深度学习之 TensorFlow（二）：TensorFlow 基础知识
1.TensorFlow 系统架构: 分为设备层和网络层.数据操作层.图计算层.API 层.应用层.其中设备层和网络层.数据操作层.图计算层是 TensorFlow 的核心层. 2.TensorFlo ...
keras实现简单性别识别（二分类问题）
keras实现简单性别识别(二分类问题) 第一步:准备好需要的库 tensorflow 1.4.0 h5py 2.7.0 hdf5 1.8.15.1 Keras 2.0.8 opencv-p ...
tensorflow 教程文本分类 IMDB电影评论
昨天配置了tensorflow的gpu版本,今天开始简单的使用一下主要是看了一下tensorflow的tutorial 里面的 IMDB 电影评论二分类这个教程教程里面主要包括了一下几个内容:下载 ...
二分类问题 - 【老鱼学tensorflow2】
什么是二分类问题? 二分类问题就是最终的结果只有好或坏这样的一个输出. 比如,这是好的,那是坏的.这个就是二分类的问题. 我们以一个电影评论作为例子来进行.我们对某部电影评论的文字内容为好评和差评. ...

随机推荐

windows环境下ElasticSearch6 安装head插件
转: https://blog.csdn.net/shubingzhuoxue/article/details/80998738 https://blog.csdn.net/camelcanoe/ar ...
VB 调用 webservice 出现：WSDLReader:Loading of the WSDL file failed HRESULT=0×80040154: 没有注册类别解决方案
有些 VB 程序在调用 webservice 的时候出现“WSDLReader:Loading of the WSDL file failed HRESULT=0×80040154: 没有注册类别 ...
mybatis逆向工程没有报错,但是也没有pojo和Mapper文件问题
如果你使用的逆向工程是自己手写上去的配置文件,那么错误的范围就太大了.如果是你导入以前使用过的逆向工程,那么没有生成文件很可能是使用的操作系统不同. 原因:逆向工程中的路径问题,windows和mac ...
Kettle通过Webservice获取天气信息
Kettle通过Webservice获取天气信息需求: 通过kettle工具,通过webservice获取天气信息,写成xml格式文件. 思路: Kettle可通过两种选择获取webservic ...
sql获取时间段内的所有日期
,'2015-01-01 00:00:00') h INTO vinson_h DELETE vinson_h DECLARE @h int SELECT @h=DATEDIFF(HOUR,'2015 ...
RestTemplate invoke JSON and convert to Object
@Test public void webTest() throws JsonProcessingException { Map<String, String> a = new HashM ...
如何解决iOS界面操作导致导致NSTimer暂停计时的问题？
在NSTimer代码后面加上以下代码,这样滚动scroll的时候就不会暂停了.NSRunLoop *t = [NSRunLoop currentRunLoop];[t addTimer: timer ...
thingsboard填坑之路
因为thingsboard都是国外的资料,国内基本没有参考资料.所以,记录下来源码安装当中,遇到的问题. thingsboard官网源码安装连接: https://thingsboard.io/doc ...
利用IDM工具下载ESA上的Sentinel数据
由于美国政府关门,NASA,USGS,NOAA等机构中的非核心部门也都放假了,暂时无法提供Sentinel数据下载,而直接从ESA下载数据比蜗牛上山都慢,幸好发现了IDM工具. 利用浏览器或wget工 ...
Maven 错误 :The POM for com.xxx:jar:0.0.1-SNAPSHOT is invalid, transitive dependencies (if any) will not be available
一个大的maven 项目,结构是一个根pom,下面几个小的module,包括了appservice-darc,appservice-entity等,其中appservice-darc 依赖了 apps ...

tensorflow实现二分类

tensorflow实现二分类的更多相关文章

随机推荐

热门专题