梯度检验是一种对求导结果进行数值检验的方法，该方法可以验证求导代码是否正确。

1. 数学原理

　　考虑我们想要最小化以 θ 为自变量的目标函数 J(θ)（θ 可以为标量和可以为矢量，在 Numpy 的编程环境下，处理是一样的），迭代梯度更新公式为：

可以以sigmoid函数为例，

其导数形式为

我们可以实现梯度下降算法，那我们怎么知道g(z)梯度的准确性呢？

回忆导数的数学定义：

由此我们可得梯度校验的数值校验公式：

这便是梯度检验的原理。在实际应用中，我们常将ϵ设置为一个很小的常数，比如10^-4数量级，不会将它设的太小，比如10^-20，因为那将导致数值舍入误差。事实上，上式两端值的接近程度取决于 J 的具体形式，但在假定 ϵ=10⁻⁴ 的情况下，通常会发现左右两端至少有四位有效数字是一致的（或者说精度至少在0.0001一级）。

2. 编程实现

import numpy as np

def sigmoid(z):

    return 1./(1+np.exp(-z))

def sigmoid_prime(z):

    return sigmoid(z)*(1-sigmoid(z))

def check_gradient(f, x0, epsilon):

    return (f(x0+epsilon) - f(x0-epsilon))/2/epsilon

if __name__ == '__main__':

    x0 = np.array([1, 2, 3])

    epsilon = 1e-4

    print(sigmoid_prime(x0))

            # [ 0.19661193  0.10499359  0.04517666]

    print(check_gradient(sigmoid, x0, epsilon))

            # [ 0.19661193  0.10499359  0.04517666]

参考文献：

【1】机器学习算法的调试 —— 梯度检验（Gradient Checking）

机器学习算法的调试---梯度检验（Gradient Checking）的更多相关文章

吴恩达机器学习笔记31-梯度检验（Gradient Checking）
当我们对一个较为复杂的模型(例如神经网络)使用梯度下降算法时,可能会存在一些不容易察觉的错误,意味着,虽然代价看上去在不断减小,但最终的结果可能并不是最优解.为了避免这样的问题,我们采取一种叫做梯度的 ...
机器学习(1)之梯度下降(gradient descent)
机器学习(1)之梯度下降(gradient descent) 题记:最近零碎的时间都在学习Andrew Ng的machine learning,因此就有了这些笔记. 梯度下降是线性回归的一种(Line ...
梯度下降(gradient descent)算法简介
梯度下降法是一个最优化算法,通常也称为最速下降法.最速下降法是求解无约束优化问题最简单和最古老的方法之一,虽然现在已经不具有实用性,但是许多有效算法都是以它为基础进行改进和修正而得到的.最速下降法是用 ...
机器学习算法（优化）之一：梯度下降算法、随机梯度下降（应用于线性回归、Logistic回归等等）
本文介绍了机器学习中基本的优化算法—梯度下降算法和随机梯度下降算法,以及实际应用到线性回归.Logistic回归.矩阵分解推荐算法等ML中. 梯度下降算法基本公式常见的符号说明和损失函数 X :所有 ...
[机器学习] ML重要概念：梯度（Gradient）与梯度下降法（Gradient Descent）
引言机器学习栏目记录我在学习Machine Learning过程的一些心得笔记,涵盖线性回归.逻辑回归.Softmax回归.神经网络和SVM等等,主要学习资料来自网上的免费课程和一些经典书籍,免费课 ...
课程二(Improving Deep Neural Networks: Hyperparameter tuning, Regularization and Optimization)，第一周（Practical aspects of Deep Learning） —— 4.Programming assignments:Gradient Checking
Gradient Checking Welcome to this week's third programming assignment! You will be implementing grad ...
（3）梯度下降法Gradient Descent
梯度下降法不是一个机器学习算法是一种基于搜索的最优化方法作用:最小化一个损失函数梯度上升法:最大化一个效用函数举个栗子直线方程:导数代表斜率曲线方程:导数代表切线斜率导数可以代表方向, ...
机器学习&数据挖掘笔记_16（常见面试之机器学习算法思想简单梳理）
前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考 ...
在opencv3中的机器学习算法
在opencv3.0中,提供了一个ml.cpp的文件,这里面全是机器学习的算法,共提供了这么几种: 1.正态贝叶斯:normal Bayessian classifier 我已在另外一篇博文中介 ...

随机推荐

MyEclipse中的几种查找方法
在编程中常常需要用到查找功能,这里根据日常的使用总结一下常用的集中查找方法 Ctrl+H:在MyEclipse中打开Search弹出框,或者在菜单中打开Search弹出框, 定位到 File Sear ...
Datatables js 复杂表头合并单元格
x →Datatables官网← x 项目中用到的Table都是用Datatables插件来搞得: 以前都是生成一般性的table: 近期要生成一些复杂表头,合并单元格之类的: 研究了一下. x 去官 ...
F#周报2018年第50期
新闻 Bolero: 用于WebAssembly的F#工具 Ionide-fsharp安装数量超过10万 WPF的Xaml.Behaviors类库开源 Visual Studio 2019预览版 .N ...
novnc安装教程
适配于centos7 1.安装vncserver # stop selinux and iptables setenforce systemctl stop firewalld systemctl d ...
[No0000C4]TortoiseSVN配置外部对比工具
TortoiseSVN -> Settings Diff Viewer : 选中External->找到外部工具:如BCompare.路径如果有空格的最好用"双引号"括 ...
spark on yarn详解
1.参考文档: spark-1.3.0:http://spark.apache.org/docs/1.3.0/running-on-yarn.html spark-1.6.0:http://spark ...
口语详解｜为什么“how to say”是错的？
你有没有说过一些印象深刻的中式英语呢?为什么有的英语会被称之为中式英语想必你大概知道,但是如何把中式英语使用正确你知道吗?今天,跟着小编来看看吧.By the way,今天的主角是"how ...
json序列化以及反序列化存在多个对象时候的处理
存在多个对象的时候,只需要将反序列化存在的对象,遍历出来即可. using System;using System.Collections.Generic;using System.Linq;usin ...
Instruments学习之Allocations
Allocations:检测一个进程(选择自己的app)内存分配和使用情况等我们启动Allocations后得到一个初始界面初始界面.png 简单说一下上图的3个地方 1:这里有两个部分了,因为官 ...
LeetCode 590 N-ary Tree Postorder Traversal 解题报告
题目要求 Given an n-ary tree, return the postorder traversal of its nodes' values. 题目分析及思路题目给出一棵N叉树,要求返 ...

机器学习算法的调试---梯度检验（Gradient Checking）

1. 数学原理

2. 编程实现

机器学习算法的调试---梯度检验（Gradient Checking）的更多相关文章

随机推荐

热门专题