线性代数之——正交矩阵和 Gram-Schmidt 正交化
这部分我们有两个目标。一是了解正交性是怎么让 \(\hat x\) 、\(p\) 、\(P\) 的计算变得简单的,这种情况下,\(A^TA\) 将会是一个对角矩阵。二是学会怎么从原始向量中构建出正交向量。
1. 标准正交基
向量 \(q_1, \cdots, q_n\) 是标准正交的,如果它们满足如下条件:
\[q_i^Tq_j = \begin{cases}
0,&\text{if } i \not = j \quad(正交向量)\\
1, &\text{if } i = j \quad(单位向量)
\end{cases}\]
如果一个矩阵的列是标准正交的,我们称之为 \(Q\)。很容易,我们可以得到 \(Q^TQ=I\)。
当 \(Q\) 是方阵的时候,我们可以得到 \(Q^T=Q^{-1}\),也即转置等于逆。
- 旋转(Rotation)
旋转矩阵 \(Q\) 就是将任意向量逆时针旋转 \(\theta\),其逆矩阵 \(Q^{-1}\) 就是将任意向量顺时针旋转 \(\theta\)。
- 置换(Permutation)
置换矩阵的作用就是交换矩阵的行,在消元的时候有很大的作用。
- 镜像(Reflection)
如果 \(u\) 是任意单位向量,那么 \(Q = I-2uu^T\) 是一个正交矩阵。
\[Q^2=Q^TQ=I\]
绕对称轴镜像两次还是它本身。
取 \(u_1=(1, 0)\),\(u_2=(1/\sqrt2, -1/\sqrt2)\),然后,我们可以得到两个正交矩阵。
\(Q_1\) 将任意向量 \((x, y)\) 变为 \((-x, y)\),\(y\) 轴是镜像轴。\(Q_2\) 将任意向量 \((x, y)\) 变为 \((y, x)\),\(45°\) 轴是镜像轴。
可以看到,旋转、置换和镜像都不会改变一个向量的长度。实际上,乘以任意正交矩阵都不会改变向量的长度。
\[||Qx||=||x||\]
\[||Qx||^2 = (Qx)^T(Qx) = x^TQ^TQx = x^TIx=||x||^2\]
而且,正交矩阵也会保留两个向量的点积。
\[(Qx)^T(Qy) = x^TQ^TQy = x^Ty\]
2. 正交矩阵的投影
当矩阵 \(A\) 变成了正交矩阵 \(Q\),那么投影就会变得非常简单,我们不需要求任何逆矩阵。
\[A^TA\hat x=A^Tb \to \hat x=Q^Tb\]
\[p=A\hat x \to p=Q\hat x = QQ^Tb\]
\[P = A(A^TA)^{-1}A^T \to P = QQ^T\]
当 \(Q\) 为方阵的时候,子空间为整个空间,有 \(Q^T=Q^{-1}\)。\(\hat x = Q^Tb\) 就等同于 \(x=Q^{-1}b\),也就是有唯一解,\(b\) 的投影即为它本身。
这就是傅里叶变化和所有应用数学中各种变化的基础,它们将向量或者函数分解成正交的小片,将这些小片加起来之后就回到了原函数。
3. Gram-Schmidt 正交化和 \(A\) 的 \(QR\) 分解
从上面我们可以看到正交对我们是非常有利的,现在我们就要找到一个方法来创造出标准正交的向量。假设我们有三个不相关的向量 \(a, b, c\),如果我们能构造出正交的三个向量 \(A,B,C\),那么再除以它们的长度就得到了标准正交向量。
首先,我们选取 \(A=a\),那么 \(B\) 必须垂直于 \(A\) 。我们用 \(b\) 减去其在 \(A\) 的投影,就得到了垂直于 \(A\) 的部分,这也就是我们要找的 \(B\)。
\[B = b - \frac{A^Tb}{A^TA}A\]
接着,我们再用 \(c\) 减去其在 \(A\) 和 \(B\) 的投影,就得到我们要找的 \(C\)。
\[C = c - \frac{A^Tc}{A^TA}A-\frac{B^Tc}{B^TB}B\]
如果我们有更多的向量,那我们就用新的向量减去它在已经设定好的所有向量上的投影即可,最后,我们再除以它们各自的长度就得到了标准正交向量。
可以看到,\(q_1=a/||a||\),没有涉及到其它向量,\(a\)、\(q_1\)、\(A\) 都位于一条线上。第二步中 \(b\) 也只是 \(A\) 和 \(B\) 的线性组合,不涉及到后面的向量,\(a,b\)、\(q_1,q_2\)、\(A,B\) 都位于一个平面内。在每一个步骤中,\(a_1, a_2, \cdots, a_k\) 只是 \(q_1, q_2, \cdots, q_k\) 的线性组合,后面的 \(q\) 没有涉及到。
联系 \(A\) 和 \(Q\) 的矩阵 \(R\) 是上三角形矩阵,有 \(A=QR\)。
任意 \(m×n\) 的矩阵 \(A\),如果其列是不相关的,那么就可以分解成 \(QR\),\(Q\) 的列是标准正交的,而 \(R\) 是上三角矩阵并且对角线元素为正,为向量 \(\cdots B,C\cdots\) 的长度。
然后,最小二乘就变成了
\[A^TA\hat x=A^Tb \to R^TQ^TQR\hat x=R^TQ^Tb \to R^TR\hat x=R^TQ^Tb \to R\hat x=Q^Tb \to \hat x = R^{-1}Q^Tb\]
获取更多精彩,请关注「seniusen」!
线性代数之——正交矩阵和 Gram-Schmidt 正交化的更多相关文章
- 施密特正交化 GramSchmidt
施密特正交化 GramSchmidt 施密特正交化的原名是 Gram–Schmidt process,是由Gram和schmidt两个人一起发明的,但是后来因为施密特名气更大,所以该方法被简记为施密特 ...
- 浅谈压缩感知(十九):MP、OMP与施密特正交化
关于MP.OMP的相关算法与收敛证明,可以参考:http://www.cnblogs.com/AndyJee/p/5047174.html,这里仅简单陈述算法流程及二者的不同之处. 主要内容: MP的 ...
- 矩阵分解---QR正交分解,LU分解
相关概念: 正交矩阵:若一个方阵其行与列皆为正交的单位向量,则该矩阵为正交矩阵,且该矩阵的转置和其逆相等.两个向量正交的意思是两个向量的内积为 0 正定矩阵:如果对于所有的非零实系数向量x ,都有 x ...
- <<Numerical Analysis>>笔记
2ed, by Timothy Sauer DEFINITION 1.3A solution is correct within p decimal places if the error is l ...
- <Numerical Analysis>(by Timothy Sauer) Notes
2ed, by Timothy Sauer DEFINITION 1.3A solution is correct within p decimal places if the error is l ...
- Python爬取CSDN博客文章
0 url :http://blog.csdn.net/youyou1543724847/article/details/52818339Redis一点基础的东西目录 1.基础底层数据结构 2.win ...
- QR分解迭代求特征值——原生python实现(不使用numpy)
QR分解: 有很多方法可以进行QR迭代,本文使用的是Schmidt正交化方法 具体证明请参考链接 https://wenku.baidu.com/view/c2e34678168884868762d6 ...
- 【线性代数】标准正交矩阵与Gram-Schmidt正交化
1.标准正交矩阵 假设矩阵Q有列向量q1,q2,...,qn表示,且其列向量满足下式: 则 若Q为方阵,由上面的式子则有 我们举例说明上述概念: 2.标准正交矩阵的好处 上面我们介绍了标准正交 ...
- MIT线性代数:17.正交矩阵和Cram-Schmidt正交化
随机推荐
- tomcat端口被占用如何解决
有时候我们在eclipse中启动项目时,Tomcat服务器会报错,显示8080.8009.8005这几个端口被占用,此时你用debug启动项目时会发现不管用,console控制台什么信息也没有,此时产 ...
- MyBatis-Plus工具快速入门使用
MyBatis-plus有什么特色 1.代码生成 2.条件构造器 对我而言,主要的目的是使用它强大的条件构建器. 快速使用步骤: 1.添加pom文件依赖 <dependency> < ...
- Appointment Helper
using System; using Microsoft.Xrm.Sdk; using Microsoft.Crm.Sdk.Messages; using Microsoft.Xrm.Sdk.Que ...
- python中函数参数的引用方式
值传递和引用传递时C++中的概念,在python中函数参数的传递是变量指向的对象的物理内存地址!!! python不允许程序员选择采用传值还是传引用.Python参数传递采用的肯定是“传对象引用”的方 ...
- hiveserver2不能启动
我的hiveserver2一直不能启动,命令行一直卡住不动,然后我就想是不是配置文件没有配置相关的参数,然后就来修改hive-site.xml 最终修改完后的hive-site.xml: <?x ...
- python--模块之sys与python解释器交互模块
作用:sys模块是与python解释器交互的一个接口.它提供了一系列有关python运行环境的变量和函数. 常用函数:import sys sys.argv #命令行参数list,第一个元素是程序本身 ...
- 【8086汇编-Day5】第三次实验
练习一 结果展示: 这个程序执行下来貌似打印了数字36,但其实是两个数字3.6: 这段就是用来打印3:首先ah里放2,跟后面的int 21h结合起来就是调用21号中断例程的2号子程序,用来打印到标准输 ...
- java入门---对象和类&概念详解&实例
Java作为一种面向对象语言.支持以下基本概念: 多态 继承 封装 抽象 类 对象 实例 方法 重载 这篇文章,我们主要来看下: 对象:对象是类的一个实例(对象不是找个女朋友),有状态 ...
- [原创]python写的sniffer
import socket s=socket.socket(socket.PF_PACKET,socket.SOCK_RAW,8) while 1: data=s.recv(65535) print ...
- MySQL入门第三天(下)——存储过程与存储引擎
一.存储过程 1.简介 原始的SQL执行的流程: 通过存储过程,便可以简化以上流程,那么存储过程是什么,如何进行性能提高呢? 是什么? 存储过程是可编程的函数,在数据库中创建并保存,可以由SQL语句和 ...