keras BatchNormalization 之坑

任务简述：最近做一个图像分类的任务，一开始拿vgg跑一个baseline，输出看起来很正常：

随后，我尝试其他的一些经典的模型架构，比如resnet50, xception，但训练输出显示明显异常：

val_loss 一直乱蹦，val_acc基本不发生变化。

检查了输入数据没发现问题，因此怀疑是网络构造有问题，对比了vgg同xception， resnet在使用layer上的异同，认为问题可能出在BN层上，将vgg添加了BN层之后再训练果然翻车。

翻看keras BN 的源码，原来keras 的BN层的call函数里面有个默认参数traing，默认是None。此参数意义如下：

training=False/0, 训练时通过每个batch的移动平均的均值、方差去做批归一化，测试时拿整个训练集的均值、方差做归一化

training=True/1/None，训练时通过当前batch的均值、方差去做批归一化，测试时拿整个训练集的均值、方差做归一化

当training=None时，训练和测试的批归一化方式不一致，导致validation的输出指标翻车。

当training=True时，拿训练完的模型预测一个样本和预测一个batch的样本的差异非常大，也就是预测的结果根据batch的大小会不同！导致模型结果无法准确评估！也是个坑！

用keras的BN时切记要设置training=False!!!

def build_model():

    Inputs = Input(shape=intput_shape, name='input')

    x_tmp = Lambda(lambda c: tf.image.rgb_to_grayscale(c))(Inputs)

    x_tmp = Conv2D(64, (3, 3), activation='relu')(x_tmp)

    x_tmp = Conv2D(64, (3, 3), activation='relu')(x_tmp)

    x_tmp = BatchNormalization(x_tmp, training=False)

    x_tmp = MaxPooling2D(pool_size=(2, 2))(x_tmp)

    x_tmp = Flatten()(x_tmp)

    x_tmp = Dense(128, activation='relu')(x_tmp)

    outputs = Dense(10, activation='softmax')(x_tmp)

    model = Model(Inputs, outputs)

    return model

参考：

https://arxiv.org/pdf/1502.03167v3.pdf

https://github.com/keras-team/keras/blob/master/keras/layers/normalization.py#L16

keras BatchNormalization 之坑的更多相关文章

win10+anaconda安装tensorflow和keras遇到的坑小结
win10下利用anaconda安装tensorflow和keras的教程都大同小异(针对CPU版本,我的gpu是1050TI的MAX-Q,不知为啥一直没安装成功),下面简单说下步骤. 一 Anaco ...
tensorflow 2.0 技巧 | 自定义tf.keras.Model的坑
自定义tf.keras.Model需要注意的点 model.save() subclass Model 是不能直接save的,save成.h5,但是能够save_weights,或者save_form ...
tf.keras遇见的坑：Output tensors to a Model must be the output of a TensorFlow `Layer`
经过网上查找,找到了问题所在:在使用keras编程模式是,中间插入了tf.reshape()方法便遇到此问题. 解决办法:对于遇到相同问题的任何人,可以使用keras的Lambda层来包装张量流操作, ...
keras用法
关于Keras的“层”(Layer) 所有的Keras层对象都有如下方法: layer.get_weights():返回层的权重(numpy array) layer.set_weights(weig ...
『计算机视觉』Mask-RCNN_推断网络其二：基于ReNet101的FPN共享网络暨TensorFlow和Keras交互简介
零.参考资料有关FPN的介绍见『计算机视觉』FPN特征金字塔网络. 网络构架部分代码见Mask_RCNN/mrcnn/model.py中class MaskRCNN的build方法的"in ...
[Tensorflow] 使用 Mask_RCNN 完成目标检测与实例分割，同时输出每个区域的 Feature Map
Mask_RCNN-2.0 网页链接:https://github.com/matterport/Mask_RCNN/releases/tag/v2.0 Mask_RCNN-master(matter ...
Windows 下安装 tensorflow & keras & opencv 的避坑指南！
安装 Anaconda3 关键的一步: conda update pip 下面再去安装各种你需要的包,一般不会再报错. pip install -U tensorflow pip install -U ...
Keras实现Hierarchical Attention Network时的一些坑
Reshape 对于的张量x,x.shape=(a, b, c, d)的情况若调用keras.layer.Reshape(target_shape=(-1, c, d)), 处理后的张量形状为(?, ...
Keras + Flask 提供接口服务的坑~~~
最近在搞Keras,训练完的模型要提供个预测服务出来.就想了个办法,通过Flask提供一个http服务,后来发现也能正常跑,但是每次预测都需要加载模型,效率非常低. 然后就把模型加载到全局,每次要用的 ...

随机推荐

mysql—information_schema数据库
一.介绍 MySQL中有一个默认数据库名为information_schema,在MySQL中我们把 information_schema 看作是一个数据库,确切说是信息数据库.其中保存着关于MySQ ...
buuctf刷题之旅—web—EasySQL
打开环境,发现依旧是sql注入 GitHub上有源码(https://github.com/team-su/SUCTF-2019/tree/master/Web/easy_sql) index.php ...
4、python+selenium实现12306模拟登录
简介: 这里是利用了selenium+图片识别验证,来实现12306的模拟登录,中间也参考了好几个项目,实现了这个小demo,中间也遇到了很多的坑,主要难点在于图片识别和滑动验证这两个方面,图片识别是 ...
SAP里会话结束方法（杀死进程）
在SAP的ERP里,有很多方法可以结束一个会话,然而在不同情况下,需要使用的方法也不同.下面从先后顺序来简单说明:1.SM04:最常用的方法,在SM04点击工具栏的会话->结束会话,来关闭一个会 ...
SAP中的密码输入框
在SAP中的密码输入框,可分为两种情况: 1.用selection语句书写的选择屏幕上的密码输入框实现的方式就是在AT SELECTION-SCREEN OUTPUT事件中写入如下代码: LOOP ...
缓存淘汰算法 LRU 和 LFU
LRU (Least Recently Used), 即最近最少使用用算法,是一种常见的 Cache 页面置换算法,有利于提高 Cache 命中率. LRU 的算法思想:对于每个页面,记录该页面自上一 ...
jenkins Windows下自动化部署.netcore
(1) 安装java-sdk (Jdk5-11)不用配置环境变量 https://www.oracle.com/java/technologies/javase/javase-jdk8-downloa ...
uni-app开发经验分享九：组件传值
一.父组件向子组件传值通过props来实现,子组件通过props来接收父组件传过来的值! 1.逻辑梳理父组件中: 第一步:引入子组件: import sonShow from '../../com ...
【Azure 应用服务】App Service中，为Java应用配置自定义错误页面，禁用DELETE, PUT方法
问题定义使用Azure应用服务(App Service),部署Java应用,使用Tomcat容器,如何自定义错误页面呢?同时禁用DELETE, PUT方法解决办法如何自定义错误页面呢?需要在 J ...
一文说通Dotnet的委托
简单的概念,也需要经常看看. 一.前言先简单说说Delegate的由来.最早在C/C++中,有一个概念叫函数指针.其实就是一个内存指针,指向一个函数.调用函数时,只要调用函数指针就可以了,至于函 ...

keras BatchNormalization 之坑

keras BatchNormalization 之坑的更多相关文章

随机推荐

热门专题