批标准化 批标准化(batch normalization,BN)是为了克服神经网络层数加深导致难以训练而诞生的.深度神经网络随着深度加深,收敛会越来越慢,会导致梯度弥散问题(vanishing gradient problem). 统计机器学习有一个ICS理论,这是一个经典假设:源域和目标域的数据分布是一致的. 解决思路是根据训练样本和目标样本的比例对训练样本做一个矫正. 方法 批标准化一般用在非线性映射(激活函数)之前,对x=Wu+b做规范化,使结果(输出信号各个维度)的均值为0,方差为1,