Tensorflow2.0使用Resnet18进行数据训练

在今年的3月7号，谷歌在 Tensorflow Developer Summit 2019 大会上发布 TensorFlow 2.0 Alpha

版，随后又发布了Beta版本。

Resnet18结构

Tensorflow搭建Resnet18

导入第三方库

import tensorflow as tf

from tensorflow import keras

from tensorflow.keras import layers,Sequential

搭建BasicBlock

class BasicBlock(layers.Layer):

    def __init__(self,filter_num,stride=1):

        super(BasicBlock, self).__init__()

        self.conv1=layers.Conv2D(filter_num,(3,3),strides=stride,padding='same')

        self.bn1=layers.BatchNormalization()

        self.relu=layers.Activation('relu')

        self.conv2=layers.Conv2D(filter_num,(3,3),strides=1,padding='same')

        self.bn2 = layers.BatchNormalization()

        if stride!=1:

            self.downsample=Sequential()

            self.downsample.add(layers.Conv2D(filter_num,(1,1),strides=stride))

        else:

            self.downsample=lambda x:x

    def call(self,input,training=None):

        out=self.conv1(input)

        out=self.bn1(out)

        out=self.relu(out)

        out=self.conv2(out)

        out=self.bn2(out)

        identity=self.downsample(input)

        output=layers.add([out,identity])

        output=tf.nn.relu(output)

        return output

搭建ResNet



class ResNet(keras.Model):

    def __init__(self,layer_dims,num_classes=10):

        super(ResNet, self).__init__()

        # 预处理层

        self.stem=Sequential([

            layers.Conv2D(64,(3,3),strides=(1,1)),

            layers.BatchNormalization(),

            layers.Activation('relu'),

            layers.MaxPool2D(pool_size=(2,2),strides=(1,1),padding='same')

        ])

        # resblock

        self.layer1=self.build_resblock(64,layer_dims[0])

        self.layer2 = self.build_resblock(128, layer_dims[1],stride=2)

        self.layer3 = self.build_resblock(256, layer_dims[2], stride=2)

        self.layer4 = self.build_resblock(512, layer_dims[3], stride=2)

        # there are [b,512,h,w]

        # 自适应

        self.avgpool=layers.GlobalAveragePooling2D()

        self.fc=layers.Dense(num_classes)

    def call(self,input,training=None):

        x=self.stem(input)

        x=self.layer1(x)

        x=self.layer2(x)

        x=self.layer3(x)

        x=self.layer4(x)

        # [b,c]

        x=self.avgpool(x)

        x=self.fc(x)

        return x

    def build_resblock(self,filter_num,blocks,stride=1):

        res_blocks= Sequential()

        # may down sample

        res_blocks.add(BasicBlock(filter_num,stride))

        # just down sample one time

        for pre in range(1,blocks):

            res_blocks.add(BasicBlock(filter_num,stride=1))

        return res_blocks

def resnet18():

    return  ResNet([2,2,2,2])

训练数据

为了数据获取方便，这里使用的是CIFAR10的数据，可以在代码中直接使用keras.datasets.cifar10.load_data()方法获取，非常的方便

训练代码如下：

import os

import tensorflow as tf

from Resnet import resnet18

from tensorflow.keras import datasets,layers,optimizers,Sequential,metrics

os.environ["TF_CPP_MIN_LOG_LEVEL"]='2'

tf.random.set_seed(2345)

def preprocess(x,y):

    x=2*tf.cast(x,dtype=tf.float32)/255.-1

    y=tf.cast(y,dtype=tf.int32)

    return x,y

(x_train,y_train),(x_test,y_test)=datasets.cifar10.load_data()

y_train=tf.squeeze(y_train,axis=1)

y_test=tf.squeeze(y_test,axis=1)

# print(x_train.shape,y_train.shape,x_test.shape,y_test.shape)

train_data=tf.data.Dataset.from_tensor_slices((x_train,y_train))

train_data=train_data.shuffle(1000).map(preprocess).batch(64)

test_data=tf.data.Dataset.from_tensor_slices((x_test,y_test))

test_data=test_data.map(preprocess).batch(64)

sample=next(iter(train_data))

print('sample:',sample[0].shape,sample[1].shape,

      tf.reduce_min(sample[0]),tf.reduce_max(sample[0]))

def main():

    model=resnet18()

    model.build(input_shape=(None,32,32,3))

    model.summary()

    optimizer=optimizers.Adam(lr=1e-3)

    for epoch in range(50):

        for step,(x,y) in enumerate(train_data):

            with tf.GradientTape() as tape:

                logits=model(x)

                y_onehot=tf.one_hot(y,depth=10)

                loss=tf.losses.categorical_crossentropy(y_onehot,logits,from_logits=True)

                loss=tf.reduce_mean(loss)

            grads=tape.gradient(loss,model.trainable_variables)

            optimizer.apply_gradients(zip(grads,model.trainable_variables))

            if step%100==0:

                print(epoch,step,'loss',float(loss))

        total_num=0

        total_correct=0

        for x,y in test_data:

            logits=model(x)

            prob=tf.nn.softmax(logits,axis=1)

            pred=tf.argmax(prob,axis=1)

            pred=tf.cast(pred,dtype=tf.int32)

            correct=tf.cast(tf.equal(pred,y),dtype=tf.int32)

            correct=tf.reduce_sum(correct)

            total_num+=x.shape[0]

            total_correct+=int(correct)

        acc=total_correct/total_num

        print(epoch,'acc:',acc)

if __name__ == '__main__':

    main()

训练数据

_________________________________________________________________

Layer (type)                 Output Shape              Param #

=================================================================

sequential (Sequential)      multiple                  2048

_________________________________________________________________

sequential_1 (Sequential)    multiple                  148736

_________________________________________________________________

sequential_2 (Sequential)    multiple                  526976

_________________________________________________________________

sequential_4 (Sequential)    multiple                  2102528

_________________________________________________________________

sequential_6 (Sequential)    multiple                  8399360

_________________________________________________________________

global_average_pooling2d (Gl multiple                  0

_________________________________________________________________

dense (Dense)                multiple                  5130

=================================================================

Total params: 11,184,778

Trainable params: 11,176,970

Non-trainable params: 7,808

_________________________________________________________________

0 0 loss 2.2936558723449707

0 100 loss 1.855604887008667

0 200 loss 1.9335857629776

0 300 loss 1.508711576461792

0 400 loss 1.5679863691329956

0 500 loss 1.5649926662445068

0 600 loss 1.147849202156067

0 700 loss 1.3818628787994385

0 acc: 0.5424

1 0 loss 1.3022596836090088

1 100 loss 1.4624202251434326

1 200 loss 1.3188159465789795

1 300 loss 1.1521495580673218

1 400 loss 0.9550357460975647

1 500 loss 1.2304189205169678

1 600 loss 0.7009983062744141

1 700 loss 0.8488335609436035

1 acc: 0.644

2 0 loss 0.9625152945518494

2 100 loss 1.174363374710083

2 200 loss 1.1750390529632568

2 300 loss 0.7221378087997437

2 400 loss 0.7162064909934998

2 500 loss 0.926654040813446

2 600 loss 0.6159981489181519

2 700 loss 0.6437114477157593

2 acc: 0.6905

3 0 loss 0.7495195865631104

3 100 loss 0.9840961694717407

3 200 loss 0.9429250955581665

3 300 loss 0.5575872659683228

3 400 loss 0.5735365152359009

3 500 loss 0.7843905687332153

3 600 loss 0.6125107407569885

3 700 loss 0.6241222620010376

3 acc: 0.6933

4 0 loss 0.7694090604782104

4 100 loss 0.5488263368606567

4 200 loss 0.9142876863479614

4 300 loss 0.4908181428909302

4 400 loss 0.5889899730682373

4 500 loss 0.7341771125793457

4 600 loss 0.4880038797855377

4 700 loss 0.5088012218475342

4 acc: 0.7241

5 0 loss 0.5378311276435852

5 100 loss 0.5630106925964355

5 200 loss 0.8578733205795288

5 300 loss 0.3617972433567047

5 400 loss 0.29359108209609985

5 500 loss 0.5915042757987976

5 600 loss 0.3684327006340027

5 700 loss 0.40654802322387695

5 acc: 0.7005

6 0 loss 0.5005596280097961

6 100 loss 0.40528279542922974

6 200 loss 0.4127967953681946

6 300 loss 0.4062516987323761

6 400 loss 0.40751856565475464

6 500 loss 0.45849910378456116

6 600 loss 0.4571283459663391

6 700 loss 0.32558882236480713

6 acc: 0.7119

可以看到使用ResNet18网络结构，参数量是非常大的，有 11,184,778，所以训练起来的话，很耗时间，这里笔者没有训练完，有兴趣的同学，可以训练一下

Tensorflow2.0使用Resnet18进行数据训练的更多相关文章

【tensorflow2.0】处理时间序列数据
国内的新冠肺炎疫情从发现至今已经持续3个多月了,这场起源于吃野味的灾难给大家的生活造成了诸多方面的影响. 有的同学是收入上的,有的同学是感情上的,有的同学是心理上的,还有的同学是体重上的. 那么国内的 ...
【tensorflow2.0】处理文本数据
一,准备数据 imdb数据集的目标是根据电影评论的文本内容预测评论的情感标签. 训练集有20000条电影评论文本,测试集有5000条电影评论文本,其中正面评论和负面评论都各占一半. 文本数据预处理较为 ...
TensorFlow初探之简单神经网络训练mnist数据集（TensorFlow2.0代码）
from __future__ import print_function from tensorflow.examples.tutorials.mnist import input_data #加载 ...
【tensorflow2.0】处理结构化数据-titanic生存预测
1.准备数据 import numpy as np import pandas as pd import matplotlib.pyplot as plt import tensorflow as t ...
基于tensorflow2.0 使用tf.keras实现Fashion MNIST
本次使用的是2.0测试版,正式版估计会很快就上线了 tf2好像更新了蛮多东西虽然教程不多还是找了个试试的确简单不少,但是还是比较喜欢现在这种写法老样子先导入库 import tensorflo ...
Google工程师亲授 Tensorflow2.0－入门到进阶
第1章 Tensorfow简介与环境搭建本门课程的入门章节,简要介绍了tensorflow是什么,详细介绍了Tensorflow历史版本变迁以及tensorflow的架构和强大特性.并在Tensor ...
TensorFlow2.0（9）：TensorBoard可视化
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...
TensorFlow2.0（11）：tf.keras建模三部曲
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...
tensorflow2.0 学习（三）
用tensorflow2.0 版回顾了一下mnist的学习代码如下,感觉这个版本下的mnist学习更简洁,更方便关于tensorflow的基础知识,这里就不更新了,用到什么就到网上取搜索相关的知识 ...
记录二：tensorflow2.0写MNIST手写体
最近学习神经网络,tensorflow,看了好多视频,查找了好多资料,感觉东西都没有融入自己的思维中.今天用tensorflow2.0写了一个MNIST手写体的版本,记录下学习的过程. 复现手写体识别 ...

随机推荐

hihocoder offer收割赛。。#1284
好久没刷题,水一水,反正排不上名次..这道题记下我想着蛋疼的做了质因数分解,然后再算的因子个数..慢的一比,结果导致超时,还不如直接一个for循环搞定..也是醉了最后其实就是算两个数的gcd,然后 ...
webgl 刷底色的基本步骤
1.在html中建立画布 <canvas id="canvas"><canvas> 2.在js中获取canvas画布 const canvas = docu ...
4.3 IAT Hook 挂钩技术
IAT(Import Address Table)Hook是一种针对Windows操作系统的API Hooking 技术,用于修改应用程序对动态链接库(DLL)中导入函数的调用.IAT是一个数据结构, ...
dedebiz实时时间调用
{dede:tagname runphp='yes'}@me = date("Y-m-d H:i:s", time());{/dede:tagname}
「ABC 218」解集
E 倒流一下,然后把负权边置零后跑 MST 即可. #include<cstdio> #include<vector> #include<algorithm> us ...
LSP 链路状态协议
转载请注明出处: 链路状态协议(Link State Protocol)是一种在计算机网络中用于动态计算路由的协议.它的主要作用是收集网络拓扑信息,为每个节点构建一个准确的网络图,并基于这些信息计算出 ...
Markdown 包含其他文件静态渲染工具
1. 前言在 GitHub 上写文档,很多时候要插入 uml,像 mermaid 这种可以直接在 GitHub/GitLab 中渲染的一般直接写个 code block 进去,但是这样造成一个问题就 ...
[NSSCTF 2022 Spring Recruit]babyphp
打开靶机,先看了一遍代码,发现要拿到flag,就必须先满足三个条件,即分别为a,b,c 第一层:需要a满足条件 isset($_POST['a'])&&!preg_match('/[0 ...
Java 深度优先搜索 and 广度优先搜索的算法原理和代码展示
111. 二叉树的最小深度题目:给定一个二叉树,找出其最小深度.最小深度是从根节点到最近叶子节点的最短路径上的节点数量. 说明:叶子节点是指没有子节点的节点. 方法1:深度优先搜索原理:深度优先搜 ...
Amazon MSK 可靠性最佳实践
1. Amazon MSK介绍 Kafka作为老牌的开源分布式事件流平台,已经广泛用于如数据集成,流处理,数据管道等各种应用中. 亚马逊云科技也于2019年2月推出了Apache Kafka的云托管版 ...

Tensorflow2.0使用Resnet18进行数据训练

Resnet18结构

Tensorflow搭建Resnet18

训练数据

训练数据

Tensorflow2.0使用Resnet18进行数据训练的更多相关文章

随机推荐

热门专题