Keras 最新《面向小数据集构建图像分类模型》

本文地址：http://blog.keras.io/building-powerful-image-classification-models-using-very-little-data.html

本文作者：Francois Chollet

按照官方的文章实现过程有一些坑，彻底理解代码细节实现，理解keras的api具体使用方法
也有很多人翻译这篇文章，但是有些没有具体实现细节
另外keres开发者自己有本书的jupyter:Companion Jupyter notebooks for the book "Deep Learning with Python"
另外我自己实验三收敛的准确率并没有0.94+，可以参考前面这本书上的实现
文章一共有三个实验：
1. 第一个实验使用自定义的神经网络对数据集进行训练，三层卷积加两层全连接，训练并验证网络的准确率；
2. 第二个实验使用VGG16网络对数据进行训练，为了适应自定义的数据集，将VGG16网络的全连接层去掉，作者称之为 “Feature extraction”, 再在上面添加自己实现的全连接层，然后训练并验证网络准确性；
3. 第三个实验称为 “fine-tune” ，利用第二个实验的实验模型和weight，重新训练VGG16的最后一个卷积层和自定义的全连接层，然后验证网络准确性；
实验二的代码：

'''This script goes along the blog post

"Building powerful image classification models using very little data"

from blog.keras.io.

It uses data that can be downloaded at:

https://www.kaggle.com/c/dogs-vs-cats/data

In our setup, we:

- created a data/ folder

- created train/ and validation/ subfolders inside data/

- created cats/ and dogs/ subfolders inside train/ and validation/

- put the cat pictures index - in data/train/cats

- put the cat pictures index - in data/validation/cats

- put the dogs pictures index - in data/train/dogs

- put the dog pictures index - in data/validation/dogs

So that we have  training examples for each class, and  validation examples for each class.

In summary, this is our directory structure:

```

data/

    train/

        dogs/

            dog001.jpg

            dog002.jpg

            ...

        cats/

            cat001.jpg

            cat002.jpg

            ...

    validation/

        dogs/

            dog001.jpg

            dog002.jpg

            ...

        cats/

            cat001.jpg

            cat002.jpg

            ...

```

'''

import numpy as np

from keras.preprocessing.image import ImageDataGenerator

from keras.models import Sequential

from keras.layers import Dropout, Flatten, Dense

from keras import applications

# dimensions of our images.

img_width, img_height = , 

top_model_weights_path = 'bottleneck_fc_model.h5'

data_root = 'M:/dataset/dog_cat/'

train_data_dir =data_root+ 'data/train'

validation_data_dir = data_root+'data/validation'

nb_train_samples =

nb_validation_samples =

epochs =

batch_size = 

def save_bottlebeck_features():

    datagen = ImageDataGenerator(rescale=. / )

    # build the VGG16 network

    model = applications.VGG16(include_top=False, weights='imagenet')

    generator = datagen.flow_from_directory(

        train_data_dir,

        target_size=(img_width, img_height),

        batch_size=batch_size,

        class_mode=None,

        shuffle=False)

    bottleneck_features_train = model.predict_generator(

        generator, nb_train_samples // batch_size) #####2000//batch_size！！！！！！！！！！

    np.save('bottleneck_features_train.npy',

            bottleneck_features_train)

    generator = datagen.flow_from_directory(

        validation_data_dir,

        target_size=(img_width, img_height),

        batch_size=batch_size,

        class_mode=None,

        shuffle=False)

    bottleneck_features_validation = model.predict_generator(

        generator, nb_validation_samples // batch_size)

    np.save('bottleneck_features_validation.npy',

            bottleneck_features_validation)

def train_top_model():

    train_data = np.load('bottleneck_features_train.npy')

    train_labels = np.array([] * int(nb_train_samples / ) + [] * int(nb_train_samples / ))

    validation_data = np.load('bottleneck_features_validation.npy')

    validation_labels = np.array([] * int(nb_validation_samples / ) + [] * int(nb_validation_samples / ))

    model = Sequential()

    model.add(Flatten(input_shape=train_data.shape[:]))

    model.add(Dense(, activation='relu'))

    model.add(Dropout(0.5))

    model.add(Dense(, activation='sigmoid'))

    model.compile(optimizer='rmsprop',

                  loss='binary_crossentropy', metrics=['accuracy'])

    model.fit(train_data, train_labels,

              epochs=epochs,

              batch_size=batch_size,

              validation_data=(validation_data, validation_labels))

    model.save_weights(top_model_weights_path)

#save_bottlebeck_features()

train_top_model()

实验三代码，自己添加了一些api使用方法，也是以后可以参考的：

'''This script goes along the blog post

"Building powerful image classification models using very little data"

from blog.keras.io.

It uses data that can be downloaded at:

https://www.kaggle.com/c/dogs-vs-cats/data

In our setup, we:

- created a data/ folder

- created train/ and validation/ subfolders inside data/

- created cats/ and dogs/ subfolders inside train/ and validation/

- put the cat pictures index - in data/train/cats

- put the cat pictures index - in data/validation/cats

- put the dogs pictures index - in data/train/dogs

- put the dog pictures index - in data/validation/dogs

So that we have  training examples for each class, and  validation examples for each class.

In summary, this is our directory structure:

```

data/

    train/

        dogs/

            dog001.jpg

            dog002.jpg

            ...

        cats/

            cat001.jpg

            cat002.jpg

            ...

    validation/

        dogs/

            dog001.jpg

            dog002.jpg

            ...

        cats/

            cat001.jpg

            cat002.jpg

            ...

```

'''

# thanks sove bug @http://blog.csdn.net/aggresss/article/details/78588135

from keras import applications

from keras.preprocessing.image import ImageDataGenerator

from keras import optimizers

from keras.models import Sequential

from keras.layers import Dropout, Flatten, Dense

from keras.models import Model

from keras.regularizers import l2

# path to the model weights files.

weights_path = '../keras/examples/vgg16_weights.h5'

top_model_weights_path = 'bottleneck_fc_model.h5'

# dimensions of our images.

img_width, img_height = , 

data_root = 'M:/dataset/dog_cat/'

train_data_dir =data_root+ 'data/train'

validation_data_dir = data_root+'data/validation'

nb_train_samples =

nb_validation_samples =

epochs =

batch_size = 

# build the VGG16 network

base_model = applications.VGG16(weights='imagenet', include_top=False, input_shape=(,,)) # train 指定训练大小

print('Model loaded.')

# build a classifier model to put on top of the convolutional model

top_model = Sequential()

top_model.add(Flatten(input_shape=base_model.output_shape[:]))  # base_model.output_shape[:])

top_model.add(Dense(, activation='relu',kernel_regularizer=l2(0.001),))

top_model.add(Dropout(0.8))

top_model.add(Dense(, activation='sigmoid'))

# note that it is necessary to start with a fully-trained

# classifier, including the top classifier,

# in order to successfully do fine-tuning

top_model.load_weights(top_model_weights_path)

# add the model on top of the convolutional base

# model.add(top_model) # bug

model = Model(inputs=base_model.input, outputs=top_model(base_model.output))

# set the first  layers (up to the last conv block)

# to non-trainable (weights will not be updated)

for layer in model.layers[:]:  # : bug

    layer.trainable = False

# compile the model with a SGD/momentum optimizer

# and a very slow learning rate.

model.compile(loss='binary_crossentropy',

              optimizer=optimizers.SGD(lr=1e-, momentum=0.9),

              metrics=['accuracy'])

# prepare data augmentation configuration

train_datagen = ImageDataGenerator(

    rescale=. / ,

    shear_range=0.2,

    zoom_range=0.2,

    horizontal_flip=True)

test_datagen = ImageDataGenerator(rescale=. / )

train_generator = train_datagen.flow_from_directory(

    train_data_dir,

    target_size=(img_height, img_width),

    batch_size=batch_size,

    class_mode='binary')

validation_generator = test_datagen.flow_from_directory(

    validation_data_dir,

    target_size=(img_height, img_width),

    batch_size=batch_size,

    class_mode='binary')

model.summary() # prints a summary representation of your model.

# let's visualize layer names and layer indices to see how many layers

# we should freeze:

for i, layer in enumerate(base_model.layers):

    print(i, layer.name)

from keras.utils import plot_model

plot_model(model, to_file='model.png')

from keras.callbacks import History

from keras.callbacks import ModelCheckpoint

import keras

history = History()

model_checkpoint = ModelCheckpoint('temp_model.hdf5', monitor='loss', save_best_only=True)

tb_cb = keras.callbacks.TensorBoard(log_dir='log', write_images=, histogram_freq=)

# 设置log的存储位置，将网络权值以图片格式保持在tensorboard中显示，设置每一个周期计算一次网络的

# 权值，每层输出值的分布直方图

callbacks = [

        history,

        model_checkpoint,

        tb_cb

    ]

# model.fit()

# fine-tune the model

history=model.fit_generator(

    train_generator,

    steps_per_epoch=nb_train_samples // batch_size,

    epochs=epochs,

    callbacks=callbacks,

    validation_data=validation_generator,

    validation_steps=nb_validation_samples // batch_size,

    verbose = )

model.save('fine_tune_model.h5')

model.save_weights('fine_tune_model_weight')

print(history.history)

from matplotlib import pyplot as plt

history=history

plt.plot()

plt.plot(history.history['val_acc'])

plt.title('model accuracy')

plt.ylabel('accuracy')

plt.xlabel('epoch')

plt.legend(['train', 'test'], loc='upper left')

plt.show()

# summarize history for loss

plt.plot(history.history['loss'])

plt.plot(history.history['val_loss'])

plt.title('model loss')

plt.ylabel('loss')

plt.xlabel('epoch')

plt.legend(['train', 'test'], loc='upper left')

plt.show()

import  numpy as np

accy=history.history['acc']

np_accy=np.array(accy)

np.savetxt('save_acc.txt',np_accy)

result

Model loaded.

Found  images belonging to  classes.

Found  images belonging to  classes.

_________________________________________________________________

Layer (type)                 Output Shape              Param #

=================================================================

input_1 (InputLayer)         (None, , , )

_________________________________________________________________

block1_conv1 (Conv2D)        (None, , , )

_________________________________________________________________

block1_conv2 (Conv2D)        (None, , , )

_________________________________________________________________

block1_pool (MaxPooling2D)   (None, , , )

_________________________________________________________________

block2_conv1 (Conv2D)        (None, , , )

_________________________________________________________________

block2_conv2 (Conv2D)        (None, , , )

_________________________________________________________________

block2_pool (MaxPooling2D)   (None, , , )

_________________________________________________________________

block3_conv1 (Conv2D)        (None, , , )

_________________________________________________________________

block3_conv2 (Conv2D)        (None, , , )

_________________________________________________________________

block3_conv3 (Conv2D)        (None, , , )

_________________________________________________________________

block3_pool (MaxPooling2D)   (None, , , )

_________________________________________________________________

block4_conv1 (Conv2D)        (None, , , )

_________________________________________________________________

block4_conv2 (Conv2D)        (None, , , )

_________________________________________________________________

block4_conv3 (Conv2D)        (None, , , )

_________________________________________________________________

block4_pool (MaxPooling2D)   (None, , , )

_________________________________________________________________

block5_conv1 (Conv2D)        (None, , , )

_________________________________________________________________

block5_conv2 (Conv2D)        (None, , , )

_________________________________________________________________

block5_conv3 (Conv2D)        (None, , , )

_________________________________________________________________

block5_pool (MaxPooling2D)   (None, , , )

_________________________________________________________________

sequential_1 (Sequential)    (None, )

=================================================================

Total params: ,,

Trainable params: ,,

Non-trainable params: ,,

_________________________________________________________________

 input_1

 block1_conv1

 block1_conv2

 block1_pool

 block2_conv1

 block2_conv2

 block2_pool

 block3_conv1

 block3_conv2

 block3_conv3

 block3_pool

 block4_conv1

 block4_conv2

 block4_conv3

 block4_pool

 block5_conv1

 block5_conv2

 block5_conv3

 block5_pool

Backend TkAgg is interactive backend. Turning interactive mode on.

reference: 第八期使用 Keras 训练神经网络《显卡就是开发板》

Keras 最新《面向小数据集构建图像分类模型》的更多相关文章

面向小数据集构建图像分类模型Keras
文章信息本文地址:http://blog.keras.io/building-powerful-image-classification-models-using-very-little-data. ...
我的Keras使用总结（2）——构建图像分类模型（针对小数据集）
Keras基本的使用都已经清楚了,那么这篇主要学习如何使用Keras进行训练模型,训练训练,主要就是“练”,所以多做几个案例就知道怎么做了. 在本文中,我们将提供一些面向小数据集(几百张到几千张图片) ...
硬货 | 手把手带你构建视频分类模型（附Python演练））
译者 | VK 来源 | Analytics Vidhya 概述了解如何使用计算机视觉和深度学习技术处理视频数据我们将在Python中构建自己的视频分类模型这是一个非常实用的视频分类教程,所以准 ...
使用 keras 和 tfjs 构建血细胞分类模型
欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识!
Recorder︱深度学习小数据集表现、优化（Active Learning）、标注集网络获取
一.深度学习在小数据集的表现深度学习在小数据集情况下获得好效果,可以从两个角度去解决: 1.降低偏差,图像平移等操作 2.降低方差,dropout.随机梯度下降先来看看深度学习在小数据集上表现的具 ...
ML.NET 示例：图像分类模型训练-首选API（基于原生TensorFlow迁移学习）
ML.NET 版本 API 类型状态应用程序类型数据类型场景机器学习任务算法 Microsoft.ML 1.5.0 动态API 最新控制台应用程序和Web应用程序图片文件图像分类基 ...
keras入门（三）搭建CNN模型破解网站验证码
项目介绍在文章CNN大战验证码中,我们利用TensorFlow搭建了简单的CNN模型来破解某个网站的验证码.验证码如下: 在本文中,我们将会用Keras来搭建一个稍微复杂的CNN模型来破解以上的 ...
Keras（一）Sequential与Model模型、Keras基本结构功能
keras介绍与基本的模型保存思维导图 1.keras网络结构 2.keras网络配置 3.keras预处理功能模型的节点信息提取 config = model.get_config() 把mod ...
PLUTO平台是由美林数据技术股份有限公司下属西安交大美林数据挖掘研究中心自主研发的一款基于云计算技术架构的数据挖掘产品，产品设计严格遵循国际数据挖掘标准CRISP-DM（跨行业数据挖掘过程标准），具备完备的数据准备、模型构建、模型评估、模型管理、海量数据处理和高纬数据可视化分析能力。
http://www.meritdata.com.cn/article/90 PLUTO平台是由美林数据技术股份有限公司下属西安交大美林数据挖掘研究中心自主研发的一款基于云计算技术架构的数据挖掘产品, ...

随机推荐

[转] Vuex入门（2）—— state,mapState,...mapState对象展开符详解
1.state state是什么? 定义:state(vuex) ≍ data (vue) vuex的state和vue的data有很多相似之处,都是用于存储一些数据,或者说状态值.这些值都将被挂载 ...
Selenium WebDriver- 隐式等待
隐式等待是只要有一个元素在设置的时间内没有找到,就会报超时隐式等待是一个全局的设置,只要放在找东西语句的前面,它后面的找东西的语句都会默认等待设置的时间(这里是10秒),这是死等,除非立刻找到了,5 ...
python - work - 2
#-*- coding:utf-8 -*-# author:jiaxy# datetime:2018/11/3 11:48# software: PyCharm Community Edition d ...
js多少时间之前
<?php $time = time()*1000; $end_time = strtotime("2018-01-01")*1000; $time_ago = $time ...
Welcome-to-Swift-14构造过程（Initialization）
构造过程是为了使用某个类.结构体或枚举类型的实例而进行的准备过程.这个过程包含了为实例中的每个属性设置初始值和为其执行必要的准备和初始化任务. 构造过程是通过定义构造器(Initializers)来实 ...
R语言处理1975-2011年的人口信息
1975-2011年的数据中. 1)分别统计每年人口最多的国家是哪个?有多少 2)统计出各个国家的1975-2011年的平均人口增长率 3)统计每年人口最多的十个国家 4)统计出每年人口最少的十个国家 ...
IE7中a标签包含img,点击img,链接失效的bug
在做列表时,我们经常会这样写: <ul class="works-list"> <li> <a href=""> <d ...
HDU-1534 Schedule Problem
四种约束条件..照做就行了.. 最长路建图. #include <cstdio> #include <cstdlib> #include <cstring> #in ...
BZOJ1195 [HNOI2006]最短母串【状压dp】
题目给定n个字符串(S1,S2,„,Sn),要求找到一个最短的字符串T,使得这n个字符串(S1,S2,„,Sn)都是T的子串. 输入格式第一行是一个正整数n(n<=12),表示给定的字符串的 ...
BZOJ4816 [Sdoi2017]数字表格【莫比乌斯反演】
题目 Doris刚刚学习了fibonacci数列.用f[i]表示数列的第i项,那么 f[0]=0 f[1]=1 f[n]=f[n-1]+f[n-2],n>=2 Doris用老师的超级计算机生成了 ...

Keras 最新《面向小数据集构建图像分类模型》

Keras 最新《面向小数据集构建图像分类模型》的更多相关文章

随机推荐

热门专题