(邹博ML)矩阵和线性代数

主要内容

矩阵
特征值和特征向量
矩阵求导

矩阵

SVD的提法

奇异值分解(Singular Value Decomposition)是一种重要的矩阵分解方法，可以看做对称方阵在任意矩阵上的推广。
假设A是一个$m\times n$阶实矩阵，则存在一个分解使得：
- 通常将奇异值从大到小排列，这样$\sum$就能由A唯一确定了。
与特征值、特征向量的概念相对应
- $\sum$在对角线上的元素称为矩阵A的奇异值；
- U的第i列称为A的关于的左奇异向量；
- V的第i列称为A的关于的右奇异向量。

例子：

线性代数

方阵的行列式

一阶方阵的行列式为该元素本身
n阶方阵的行列式等于它的任意行（或列）的各元素与其对应的代数余子式乘积之和
$2\times 2$的方阵

代数余子式

在n阶行列式D中划去任意选定的k行、k列后，余下的元素按原来顺序组成的n-k阶行列式M，称为行列式D的k阶子式A的余子式。如果k阶子式A在行列式D中的行和列的标号分别为i1，i2，…，ik和j1，j2，…，jk。则在A的余子式M前面添加符号：

后,所得到的n-k阶行列式，称为行列式D的k阶子式A的代数余子式。

伴随矩阵

对于$n\times n$方阵的任意元素$a_{ij}$都有各自的代数余子式$A_{ij}=(-1)^{i+j}M_{ij}$，构造$n \times n$的方阵$A^*$;

$A^*$是A的伴随矩阵。

方阵的逆

范德蒙行列式Vandermonde

范德蒙行列式：

第n行是$x_1,x_2,...,x_n$的n-1次幂。

如果我们能使得$x_1,x_2,...,x_n$互不相等，那么矩阵$D$不为0，则存在$D^{-1}$

矩阵的乘法

A为$m \times s$阶矩阵，B为$s\times n$阶的矩阵，那么，$C=A \times B$是$m\times n$阶的矩阵，其中：

矩阵模型

考虑随机过程$\pi$，它的状态有n个，用1~n表示。记在当前时刻t时刻时位于i状态，它在t+1时刻处于j状态的概率为P(i,j)=P(j|i)。

即状态转移的概率只依赖于前一个状态

(思考马尔可夫过程？)

举例：

假定按照经济状况将人群分为上中下三个阶层，用123表示。假定当前处于某阶层只和上一代有关，即，考察父代为第i阶层，则子代为第j阶层的概率。假定为如下转移概率矩阵：

图解为：

概率转移矩阵

第n+1代处于第j个阶层的概率为：

矩阵P即为（条件）概率转移矩阵。

第i行元素表示，在上一状态为i时的分布概率，每一行元素的和为1.

那么思考：初始概率分布对最终分布的影响？

Think!

初始概率$\pi =[0.21,0.68,0.1]$迭代

初始概率$\pi =[0.75,0.15,0.1]$迭代

平稳分布

初始概率不同，但经过若干次迭代，$\pi$最终稳定收敛在某个分布上。这是转移概率矩阵P的性质，而非初始分布的性质。

上例中，矩阵P的n次幂，每行都是，这实际上就是特征向量。

如果一个非周期马尔可夫随机过程具有转移概率矩阵P，且它的任意两个状态都是连通的，则存在，记作。

In Fect，下面两种写法等价：

同时，若某概率分布$\pi P=\pi$，说明

该多项分布是状态转移矩阵P的平稳分布；

矩阵和向量的乘法

矩阵和向量的乘法应用

矩阵的秩

在$m\times n$矩阵A中，任取k行k列，不改变这$k^2$个元素在A中的次序，得到k阶方阵，称为矩阵A的k阶子式。

设在矩阵A中有一个不等于0的r阶子式D，且所有r+1阶子式（如果存在）全等于0，那么，D称为A的最高阶非零子式，r称为A的秩，记作R(A)=r

秩与线性方程组解的关系

推论

Ax=0有非零解的充要条件是R(A)<n
Ax=b有解的充要条件是R(A)=R(A,b)

向量组等价

系数矩阵

将向量组A,B所构成的矩阵依次记作$A(a_1,a_2,...,a_m)$和$B(b_1,b_2,...,b_m)$,B组能由A组线性表示，即对于每个向量$b_i$，存在$k_{1j},k_{2j},...,k_{mj}$

使得：

从而得到系数矩阵K

对C=AB的重新认识

由上，若$C= A\times B$，则矩阵C的列向量由A的列向量线性表示，B即为这一表示的系数矩阵；C同样由B的行向量线性表示，A为这一表示的系数矩阵。

向量组$B:b_1,b_2,...,b_n$能由向量组$A:a_1,a_2,...,a_n$线性表示的充要条件是矩阵$A=(a_1,a_2,...,a_n)$的秩等于矩阵$(A,B)=(a_1,a_2,...,a_n,b_1,b_2,...,b_n)$的秩。

正交阵

若n阶矩阵A满足$A^TA=I$，称A为正交矩阵，简称正交阵。

I为对角线为1，其他为0的矩阵

A是正交阵，x为向量，则Ax称作正交变换。

正交变换不改变向量长度。

特征值和特征向量

A是n阶矩阵，若数$\lambda$和n纬非0列向量x满足$Ax=\lambda x$，那么数$\lambda$称为A的特征值，x称为对应于特征值的特征向量。

特征值的性质

设n阶矩阵$A(a_{ij})$的特征值为$\lambda_1,\lambda_2,...,\lambda_n$，则：

$\lambda_1+\lambda_2+...+\lambda_n=a_{11}+a_{22}+...+a_{nn}$

$\lambda_1\lambda_2...\lambda_n=|A|$

矩阵A主对角线行列式的元素和，称作矩阵A的迹

不同特征值对应的特征向量

不同特征值对应的特征向量，线性无关。
若方阵A是对称阵，结论是否加强？

引理

实对称阵的特征值是实数

应用：

将实数$\lambda$带入方程组$(A-\lambda I)x=0$，该方程组为实系数方程组，因此，实对称阵的特征向量可以取实向量。

实对称阵的不同特征值的特征向量正交

令实对称阵为A,其两个不同的特征值$\lambda_1 \lambda_2$对应的特征向量分别是$\mu_1\mu_2$；

最终结论

正定阵

对于n阶方阵A，若任意n阶向量x，都有$x^TAx>0$则称A是正定阵。

若条件变为$x^TAx\ge0$，则A称作半正定阵。

类似的还有负定阵，半负定阵。

给定任意$m\times n$的矩阵A，证明$A^TA$一定是半正定阵。

正定阵的判定

对称阵A为正定阵；
A的特征值都为正；
A的顺序主子式大于0；
以上三个命题等价。

例题：

定义证明：

向量的导数

A为$m\times n$的矩阵，x为$n \times1$的列向量，则Ax为$m\times1$的列向量，记为:

推导

令：

从而：

结论与直接推广

注意

关于列向量求导，资料中有如下方案：

以上公式将会导致向量间求导得到“超越矩阵”-矩阵的每个元素仍然是一个矩阵，不利于应用。

标量对向量的导数

推导公式：

标量对方阵的导数