基于tensorflow2.0和cifar100的VGG13网络训练

VGG是2014年ILSVRC图像分类竞赛的第二名，相比当年的冠军GoogleNet在可扩展性方面更胜一筹，此外，它也是从图像中提取特征的CNN首选算法，VGG的各种网络模型结构如下：

今天代码的原型是基于VGG13，也就是上图的B类，可以看到它的参数量是很可观的。

因为设备和时间问题，网络并没有训练完成，但是已经看到参数变化的效果。（毕竟VGG团队在最初训练时使用4块显卡并行计算还训练了2-3周，虽然当今显卡性能已经有了明显的提升，但是只能CPU训练的小可怜实在不敢继续下去了）

直接上代码吧

import tensorflow as tf

from tensorflow import keras

import os

os.environ['TF_CPP_MIN_LOG'] = ''

conv_layers = [

    # part 1

    keras.layers.Conv2D(64,kernel_size=[3,3],padding='same',activation=tf.nn.relu),

    keras.layers.Conv2D(64,kernel_size=[3,3],padding='same',activation=tf.nn.relu),

    keras.layers.MaxPool2D(pool_size=[2,2],strides=2,padding='same'),

    # part 2

    keras.layers.Conv2D(128,kernel_size=[3,3],padding='same',activation=tf.nn.relu),

    keras.layers.Conv2D(128,kernel_size=[3,3],padding='same',activation=tf.nn.relu),

    keras.layers.MaxPool2D(pool_size=[2,2],strides=2,padding='same'),

    # part 3

    keras.layers.Conv2D(256,kernel_size=[3,3],padding='same',activation=tf.nn.relu),

    keras.layers.Conv2D(256,kernel_size=[3,3],padding='same',activation=tf.nn.relu),

    keras.layers.MaxPool2D(pool_size=[2,2],strides=2,padding='same'),

    # part 4

    keras.layers.Conv2D(512,kernel_size=[3,3],padding='same',activation=tf.nn.relu),

    keras.layers.Conv2D(512,kernel_size=[3,3],padding='same',activation=tf.nn.relu),

    keras.layers.MaxPool2D(pool_size=[2,2],strides=2,padding='same'),

    # part 5

    keras.layers.Conv2D(512,kernel_size=[3,3],padding='same',activation=tf.nn.relu),

    keras.layers.Conv2D(512,kernel_size=[3,3],padding='same',activation=tf.nn.relu),

    keras.layers.MaxPool2D(pool_size=[2,2],strides=2,padding='same'),

]

fc_layers =[

    keras.layers.Dense(4096,activation = tf.nn.relu),

    keras.layers.Dense(4096,activation = tf.nn.relu),

    keras.layers.Dense(10)

]

def preprocess(x,y):

    x = tf.cast(x,dtype=tf.float32)/255.

    y = tf.cast(y,dtype=tf.int32)

    return x,y

(x,y),(x_test,y_test) = keras.datasets.cifar100.load_data()

y = tf.squeeze(y,axis=1)

y_test = tf.squeeze(y_test,axis=1)

print(x.shape,y.shape,x_test.shape,y_test.shape)

train_db = tf.data.Dataset.from_tensor_slices((x,y))

train_db = train_db.shuffle(1000).map(preprocess).batch(64)

test_db = tf.data.Dataset.from_tensor_slices((x_test,y_test))

test_db = train_db.map(preprocess).batch(64)

def main():

    conv_net = keras.Sequential(conv_layers)

    conv_net.build(input_shape=[None,32,32,3])

    fc_net = keras.Sequential(fc_layers)

    fc_net.build(input_shape=[None,512])

    optimizer = keras.optimizers.Adam(lr=1e-4)

    for epoch in range(50):

        for step,(x,y) in enumerate(train_db):

            with tf.GradientTape() as tape:

                out = conv_net(x)

                out = tf.reshape(out,[-1,512])

                logits = fc_net(out)

                y_onehot = tf.one_hot(y,depth=10)

                loss = tf.losses.categorical_crossentropy(y_onehot,logits,from_logits=True)

                loss = tf.reduce_mean(loss)

            gradient = tape.gradient(loss,conv_net.trainable_variables + fc_net.trainable)

            optimizer.apply_gradients(zip(gradient,conv_net.trainable_variables + fc_net.trainable))

            if step % 100 == 0:

                print(epoch,step,'loss:',float(loss))

        total_num = 0

        total_correct = 0

        for x,y in test_db:

            out = conv_net(x)

            out = tf.reshape(out,[-1,512])

            logits = fc_net(out)

            prob = tf.nn.softmax(logits,axis=1)

            pred = tf.argmax(prob,axis=1)

            pred = tf.cast(pred,dtype=tf.int32)

            correct = tf.cast(tf.equal(pred,y),dtype=tf.int32)

            correct = tf.reduce_sum(correct)

            total_num += x.shape[0]

            total_correct += correct

            acc = total_correct/total_num

            print("acc:",acc)

if __name__ == '__main__':

    main()

通过这样一个网络模型的搭建，确实又加深了我对神经网络的认识以及tensorflow使用的熟练度，果然上机才是最佳学习方式！

基于tensorflow2.0和cifar100的VGG13网络训练的更多相关文章

colab上基于tensorflow2.0的BERT中文多分类
bert模型在tensorflow1.x版本时,也是先发布的命令行版本,随后又发布了bert-tensorflow包,本质上就是把相关bert实现封装起来了. tensorflow2.0刚刚在2019 ...
基于tensorflow2.0 使用tf.keras实现Fashion MNIST
本次使用的是2.0测试版,正式版估计会很快就上线了 tf2好像更新了蛮多东西虽然教程不多还是找了个试试的确简单不少,但是还是比较喜欢现在这种写法老样子先导入库 import tensorflo ...
推荐模型DeepCrossing: 原理介绍与TensorFlow2.0实现
DeepCrossing是在AutoRec之后,微软完整的将深度学习应用在推荐系统的模型.其应用场景是搜索推荐广告中,解决了特征工程,稀疏向量稠密化,多层神经网路的优化拟合等问题.所使用的特征在论文中 ...
Pytorch半精度浮点型网络训练问题
用Pytorch1.0进行半精度浮点型网络训练需要注意下问题: 1.网络要在GPU上跑,模型和输入样本数据都要cuda().half() 2.模型参数转换为half型,不必索引到每层,直接model. ...
基于AFNetworking3.0网络封装
概述对于开发人员来说,学习网络层知识是必备的,任何一款App的开发,都需要到网络请求接口.很多朋友都还在使用原生的NSURLConnection一行一行地写,代码到处是,这样维护起来更困难了. 对于 ...
iOS_SN_基于AFNetworking3.0网络封装
转发文章,原地址:http://www.henishuo.com/base-on-afnetworking3-0-wrapper/?utm_source=tuicool&utm_medium= ...
一文上手Tensorflow2.0之tf.keras（三）
系列文章目录: Tensorflow2.0 介绍 Tensorflow 常见基本概念从1.x 到2.0 的变化 Tensorflow2.0 的架构 Tensorflow2.0 的安装(CPU和GPU ...
推荐模型AutoRec:原理介绍与TensorFlow2.0实现
1. 简介本篇文章先简单介绍论文思路,然后使用Tensoflow2.0.Keras API复现算法部分.包括: 自定义模型自定义损失函数自定义评价指标RMSE 就题目而言<AutoRec: ...
推荐模型NeuralCF：原理介绍与TensorFlow2.0实现
1. 简介 NCF是协同过滤在神经网络上的实现--神经网络协同过滤.由新加坡国立大学与2017年提出. 我们知道,在协同过滤的基础上发展来的矩阵分解取得了巨大的成就,但是矩阵分解得到低维隐向量求内积是 ...

随机推荐

Typora常用快捷键
目录无序列表:输入-之后输入空格有序列表:输入数字+"."之后输入空格任务列表:-[空格]空格文字标题:ctrl+数字表格:ctrl+t 生成目录:按回车选中一整行: ...
SpringCloud与微服务Ⅶ --- Feign负载均衡
官方文档:https://projects.spring.io/spring-cloud/spring-cloud.html#spring-cloud-feign 一.Feign是什么 Feign是一 ...
Springboot | 私人订制你的banner
1. 搭建一个springboot模块 2. 配置POM文件 3. 自定义banner 3.1 自定义文字字符图案banner 3.2 自定义图案字符图案banner 自定义banner有什么用呢? ...
Struts2与OGNL的联系
1.Struts与OGNL的结合原理 (1)值栈: OGNL表达式要想运行就要准备一个OGNLContext对象,Struts2内部含有一个OGNLContext对象,名字叫做值栈. 值栈也由两部分组 ...
你都这么拼了，面试官TM怎么还是无动于衷
面试,对于每个人而然并不陌生,可以说是必须经历的一个过程了,小到一场考试,大到企业面试,甚至大型选秀...... 有时自己明明很努力了,但偏偏会在面试环节出了插曲,比如,紧张就是最容易出现的了. 我相 ...
基于TensorFlow的MNIST手写数字识别-初级
一:MNIST数据集下载地址 MNIST是一个包含很多手写数字图片的数据集,一共4个二进制压缩文件分别是test set images,test set labels,training se ...
《Python学习手册第五版》 -第4章介绍Python对象类型
本章的内容主要是介绍了Python的核心对象类型,后续的5.6.7.8.9章针对这些核心类型分别展开详细的说明本章我认为重要的有几点 1.作者有谈到Python的知识结构,这个我感觉是一个大框架,可 ...
mongo 集群（副本）搭建过程记录
最近搭建mongo集群,回忆总结,作以记录.整个过程主要参考以下两篇文章,但是过程并不顺利,有些问题需要记录.https://www.cnblogs.com/dba-devops/p/7130710. ...
Spring Boot从入门到精通（二）配置GitHub并上传Maven项目
简单介绍一下GitHub,它是一个面向开源及私有软件项目的托管平台,因为只支持git作为唯一的版本库格式进行托管,故名GitHub. GitHub于2008年4月10日正式上线,除了Git代码仓库托管 ...
Oracle 12C In-Memory特性研究
Oracle 12C In-Memory特性研究一.Oracle In-Memory1.1 In-Memory 开启方法1.2 开启与关闭IM column store1.3 inmemory优先级调 ...

基于tensorflow2.0和cifar100的VGG13网络训练

基于tensorflow2.0和cifar100的VGG13网络训练的更多相关文章

随机推荐

热门专题