cv2 数学基础---矩阵微分

矩阵微分基础知识

定义

(1) 向量对标量求导矩阵对标量求导

我们可以看到上述求导过程实际上就是不同函数对变量求导，然后按照向量或者矩阵的形式排列，注意这里结果的结构应该与函数的结构保持一致

(2)标量对向量求导标量对矩阵求导

这里的理解使同一个函数对不同的变量求导，然后注意结果要和变量的形式保持一致，比如对向量求导，向量如果是$n \times 1$的列向量，结果也是$n \times 1$的列向量，如果是行向量结果也是行向量，如果是$m \times n$的矩阵，结果也是同样大小的矩阵

(3)向量对向量求导

我们可以将上述过程看作函数向量中的每个元素对变量向量求导，这样就是标量对向量求导，然后再把所有结果搭成一个矩阵

当x是行向量时，标量对向量求导得到一个$1 \times n$的行向量，因为有m个函数，所以有m个行向量，最后矩阵就是$m \times n$

当x是列向量时，标量对向量求导得到一个$n \times 1$的列向量，因为有m个函数，所以有m个列向量，最后矩阵就是$n \times m$

重要结论

应用上面的定义，我们可以得到一些十分有用的结论：

应用

下面推导一下在单应变换中使用拉格朗日乘子法得到的函数的驻点的推导：

这个式子：

$\frac{\partial \left [ \left | Ax \right | ^{2 }{2} + \lambda \left ( 1 - \left | x\right | ^{2 } \right ) \right ] }{\partial x} = 0$

我们把它展开可以得到：

$\frac{\partial\left ( Ax\right ) ^{T}Ax }{\partial x} - \lambda \frac{\partial x^{T}x }{\partial x} = 0 $

即$\frac{\partial x^{T} A^{T}Ax }{\partial x} - \lambda \frac{\partial x^{T}x }{\partial x} = 0 $

对于第一项我们应用重要结论中的第六条可以得到：

$\frac{\partial x^{T} A^{T}Ax }{\partial x} = 2 A^{T}A x$

第二项应用第二条得到：

$\lambda \frac{\partial x^{T}x }{\partial x} = 2\lambda x$

代回原式即得：

$A^{T}A x = \lambda x$

cv2 数学基础---矩阵微分的更多相关文章

矩阵微分（matrix derivatives）
关于矩阵求导,得到的导数则是矩阵形式:关于矢量求导,得到的导数则是矢量形式:关于标量求导,得到的仍是标量形式.也即关于谁求导,得到的导数形式便和谁的维度信息一致. fx = f(x) grad = n ...
矩阵微分与向量函数Taylor展开
参考博客:https://blog.csdn.net/a_big_pig/article/details/78994033
《神经网络的梯度推导与代码验证》之FNN（DNN）的前向传播和反向推导
在<神经网络的梯度推导与代码验证>之数学基础篇:矩阵微分与求导中,我们总结了一些用于推导神经网络反向梯度求导的重要的数学技巧.此外,通过一个简单的demo,我们初步了解了使用矩阵求导来批量 ...
《神经网络的梯度推导与代码验证》之CNN的前向传播和反向梯度推导
在FNN(DNN)的前向传播,反向梯度推导以及代码验证中,我们不仅总结了FNN(DNN)这种神经网络结构的前向传播和反向梯度求导公式,还通过tensorflow的自动求微分工具验证了其准确性.在本篇章 ...
《神经网络的梯度推导与代码验证》之vanilla RNN的前向传播和反向梯度推导
在本篇章,我们将专门针对vanilla RNN,也就是所谓的原始RNN这种网络结构进行前向传播介绍和反向梯度推导.更多相关内容请见<神经网络的梯度推导与代码验证>系列介绍. 注意: 本系列 ...
《神经网络的梯度推导与代码验证》之LSTM的前向传播和反向梯度推导
前言在本篇章,我们将专门针对LSTM这种网络结构进行前向传播介绍和反向梯度推导. 关于LSTM的梯度推导,这一块确实挺不好掌握,原因有: 一些经典的deep learning 教程,例如花书缺乏相关 ...
coursera机器学习笔记-多元线性回归，normal equation
#对coursera上Andrew Ng老师开的机器学习课程的笔记和心得: #注:此笔记是我自己认为本节课里比较重要.难理解或容易忘记的内容并做了些补充,并非是课堂详细笔记和要点: #标记为<补 ...
机器学习 —— 基础整理（七）前馈神经网络的BP反向传播算法步骤整理
这里把按 [1] 推导的BP算法(Backpropagation)步骤整理一下.突然想整理这个的原因是知乎上看到了一个帅呆了的求矩阵微分的方法(也就是 [2]),不得不感叹作者的功力.[1] 中直接使 ...
从线性模型（linear model）衍生出的机器学习分类器（classifier）
1. 线性模型简介 0x1:线性模型的现实意义在一个理想的连续世界中,任何非线性的东西都可以被线性的东西来拟合(参考Taylor Expansion公式),所以理论上线性模型可以模拟物理世界中的绝大 ...
吴恩达机器学习CS229课程笔记学习
监督学习(supervised learning) 假设我们有一个数据集(dataset),给出居住面积和房价的关系如下: 我们以居住面积为横坐标,房价为纵坐标,组成数据点,如(2104, 400), ...

随机推荐

为控制器生成OpenAPI注释
非常喜欢. NET 的 /// 注释,写代码的时候就顺道完成写文档的过程,简直不要太爽了. ASP. NET CORE 也是一样的,通过 Swagger 工具,可以自动生成 API 的接口文档(Ope ...
西门子S7系列PLC以太网通讯处理器编程调试方法
捷米特(北京)科技有限公司研发的捷米特以太网通讯模块,转以太网通讯模块型号有ETH-S7200-JM01和ETH-S7300-JM01,适用于西门子S7-200/S7-300/S7-400.SMART ...
.Net Core 如何数据导出 Excel？（EPPlus->OfficeOpenXml 实现固定列和动态列导出）
〇.前言对于将数据以 Excel 表格文件输出,还是比较常用的,也存在诸多情况,比如列固定或不固定.数据类型为 List<T>或 Json 对象等. 本文通过包 OfficeOpenXm ...
【技术积累】Mysql中的SQL语言【技术篇】【一】
数据库管理操作创建一个新的数据库要在MySQL中创建一个新的数据库,可以使用CREATE DATABASE语句.以下是创建新数据库的SQL语句及其解释: SQL语句: CREATE DATABAS ...
【调制解调】PM 调相
说明学习数字信号处理算法时整理的学习笔记.同系列文章目录可见 <DSP 学习之路>目录,代码已上传到 Github - ModulationAndDemodulation.本篇介绍 PM ...
CocosCreator基础
跳转到底部目录 CocosCreator项目结构: 资源文件夹(assets) 资源库(library) 本地设置(local) 项目设置(settings) project.json 构建目标(b ...
SAP ABAP 使用GENIOS求解线性规划问题的简单例子
主要内容来自Operations Research & ABAP ,结合我遇到的需求,做了一些修改. 需求:有BOX1和BOX2两种箱子,分别能包装不同数量的A物料和B物料,给出若干数量的A, ...
Linux实现双击自动安装deb文件
在Linux中,有几个常用的软件可以实现双击自动安装.deb文件的功能.以下是一些推荐的软件: 1. GDebi:GDebi是一个轻量级的图形化工具,专门用于安装.deb文件.它可以解决依赖关系,并提 ...
IRF技术介绍及配置介绍
IRF技术介绍及配置介绍 IRF(Intelligent Resilient Framework,智能弹性架构)是 H3C 自主研发的软件虚拟化技术. 它的核心思想是将多台设备通过 IRF 物理端口连 ...
pandas 字典创建Dataframe
所有的ndarrays必须具有相同的长度.如果传递了索引(index),则索引的长度应等于数组的长度.如果没有传递索引,则默认情况下,索引为range(n),其中n为数组长度. import pand ...

cv2 数学基础---矩阵微分

定义

重要结论

应用

cv2 数学基础---矩阵微分的更多相关文章

随机推荐

热门专题