本文从梯度学习算法的角度中看学习率对于学习算法性能的影响,以及介绍如何调整学习率的一般经验和技巧. 在机器学习中,监督式学习(Supervised Learning)通过定义一个模型,并根据训练集上的数据估计最优参数.梯度下降法(Gradient Descent)是一个广泛被用来最小化模型误差的参数优化算法.梯度下降法通过多次迭代,并在每一步中最小化成本函数(cost function)来估计模型的参数(weights). 梯度下降的伪代码如下: 重复已下过程,直到收敛为止{ ωj = ωj -…