1 Laplacian 算子

给定无向图$G=(V, E)$，我们在上一篇博客《谱图论：Laplacian二次型和Markov转移算子》中介绍了其对应的Laplacian二次型：

\[\mathcal{E}[f]=\frac{1}{2} \cdot \mathbb{E}_{u \sim v}\left[(f(u)-f(v))^2\right]
\]

这里$f: V\rightarrow \mathbb{R}$为图的顶点标签，$u\sim v$表示服从均匀分布的随机无向边$(u, v)\in E$。直观地理解，Laplacian二次型刻画了图的“能量”（energy）。$\mathcal{E}[f]$的值越小，也就意味着$f$更加“光滑”（smooth），即其值不会沿着边变化得太剧烈。

事实上，我们可以做进一步地等价变换：

\[\begin{aligned}
\mathcal{E}[f] &=\frac{1}{2} \cdot \mathbb{E}_{u \sim v}\left[(f(u)-f(v))^2\right]\\
&= \langle f, f \rangle - \mathbb{E}_{u\sim v}\left[f(u)f(v)\right]\\
&= \langle f, f \rangle - \langle f, Kf \rangle\\
&= \langle f, If - Kf \rangle \\
&= \langle f, (I - K) f \rangle
\end{aligned}
\]

这$K$为我们在上一篇博客中提到的MarKov转移算子，它满足：$(K f)(u)=\mathbb{E}_{v \sim u}[f(v)]$。

对于最后一个等式而言，我们称算子

\[L = I - K
\]

为图$G$的 （归一化）Laplacian算子。

注对于$d$-正则图$G$而言，我们有

\[L = I - \frac{1}{d} A = \frac{1}{d}(dI - A)
\]

这里$A$为$G$的邻接矩阵，$dI - A$被称为非归一化Laplacian算子，或直接被简称为Laplacian算子。

和$K$一样，$L$也是定义在函数空间$\mathcal{F}=\{f: V \rightarrow \mathbb{R}\}$上的线性算子，按照以下规则将$f\in \mathcal{F}$映射到$Lf\in \mathcal{F}$，满足

\[Lf(u) = f(u) - \mathbb{E}_{v\sim u}[f(v)]，
\]

通过研究$L$，我们就能把握Laplacian二次型$\mathcal{E}[f] = \langle f, Lf \rangle$的特性，从而把握图$G$的特性，这是谱图理论中至关重要的一点。

接下来再来看我们熟悉的那个示性函数例子。

例设图顶点的子集$S\subseteq V$, 0-1示性函数$f=\mathbb{I}_S$用于指示顶点是否在集合$S$中，即：

\[f(u)=\left\{\begin{array}{lll}
1 & \text { if } & u \in S \\
0 & \text { if } & u \notin S
\end{array}\right.
\]

则我们有：

\[\begin{aligned}
& \langle f, Lf \rangle = \mathbb{E}[f] = \text{Pr}_{u\sim v}[u\in S, v\notin S]\\
& \langle f, f\rangle = \mathbb{E}_{u\sim \pi}[f(u)^2] = \text{Pr}_{u\sim \pi}[u\in S] = \text{vol}(S)
\end{aligned}
\]

直观地理解，这里$\text{Pr}_{u\sim v}[u\in S, v\notin S]$表示“伸出”$S$的边占总边数的比例；$\text{vol}(S)$表示$S$的“体积”。则上述两式的比值

\[\begin{aligned}
\frac{\langle f, Lf\rangle}{\langle f, f \rangle} &= \text{Pr}_{u\sim v}\left[v\notin S\mid u \in S \right]\\
&= \text{Pr}\left[ \underbrace{\text{pick a random } u\in S}_{\text{proportional to the degree}}\text{, do }\ 1 \text{ step, that you get out of } S \right] \\
& \in \left[0, 1\right]
\end{aligned}
\]

表示从集合$S$中的“逃出”概率。我们将这个比值称为$S$的电导（conductance）（我们在博客《图数据挖掘：重叠和非重叠社区检测算法》中介绍过，当时是用来衡量社区划分的质量，这个值越小说明划分得越好），用$\Phi[S]$表示。

2 再论Laplacian二次型的极值

有了$L$，那么最小化/最大化$\mathcal{E}[f]$的问题就可以进行进一步的研究了。考虑下列优化问题：

\[\begin{aligned}
& \max \quad \mathcal{E}[f] = \langle f, Lf\rangle = \underbrace{\frac{1}{2}\mathbb{E}_{u\sim v}\left[\left(f(u) - f(v)\right)^2\right]}_{\text{continous func. } f: \space\mathbb{R}^n\rightarrow \mathbb{R}}\\
& \text{s.t.} \underbrace{\quad \lVert f \rVert^2_2 = \langle f, f\rangle = \mathbb{E}_{u\sim\pi}[f(u)^2] = 1}_{\text{compat set}, \text{ ellipsoid in } \mathbb{R}^n} \quad (\Leftrightarrow\text{Var}[f] = 1)
\end{aligned}
\]

存在一个极大值点$\varphi: V\rightarrow \mathbb{R}$，它满足：

\[L \varphi=\lambda \varphi \quad \text { for some } \lambda \in \mathbb{R}，
\]

也即$L\varphi \parallel \varphi$。此外，该极大点也可以被有效地找到。

推论

\[\mathcal{E}[\varphi] = \langle \varphi, L\varphi\rangle = \langle \varphi, \lambda \varphi \rangle = \lambda \langle \varphi, \varphi \rangle = \lambda \in \left[0, 2\right]
\]

事实

\[\begin{aligned}
& \mathbb{E}[\varphi] = \mathbb{E}_{u\sim \pi}\left[\varphi(u)\right] = \mathbb{E}_{u\sim \pi}\left[\varphi(u) \cdot 1\right] = 0 \Leftrightarrow \langle \varphi, \mathbb{1} \rangle = 0 \Leftrightarrow \varphi \perp \mathbf{1}\\
& \text{Var}[\varphi] = 1
\end{aligned}
\]

下面我们来证明为什么$\mathcal{E}[f]$的极大值点$\varphi$满足$L\varphi \parallel \varphi$。

证明我们采用反证法，即假设极大值点$\varphi$满足$L\varphi \nparallel \varphi$，如下图所示：

由于$L\varphi \nparallel \varphi$，那么我们可以现在$L\varphi$与$\varphi$之间的垂线方向上取$f = \varphi + \varepsilon \psi$（$\varepsilon\neq 0$是一个很小的数，$\psi$为单位向量），根据勾股定理有$\lVert f \rVert^2_2 = 1 + \epsilon^2$。则：

\[\begin{aligned}
\mathcal{E}[f] = \langle f, Lf \rangle &\overset{(1)}{=} \langle \varphi + \varepsilon \psi, L\varphi + L\varepsilon \psi \rangle \\
& \overset{(2)}{=} \langle \varphi, L \varphi \rangle + \underbrace{\varepsilon \langle \phi, L \psi \rangle + \varepsilon \langle \psi, L \varphi \rangle}_{L \text{ is self-adjoint}} + \varepsilon^2 \langle \psi, L \psi \rangle\\
& \overset{(3)}{=} \langle \varphi, L \varphi \rangle + \underbrace{2\varepsilon \langle \psi, L \varphi \rangle}_{>0} + \mathcal{O}(\epsilon^2) \\
& > \langle \varphi, L \varphi \rangle
\end{aligned}
\]

（其中等式$(3)$用到了自伴算子的定义）而这与$\varphi$为极大值点相矛盾。因此，$\mathcal{E}[f]$的极大值点$\varphi$满足$L\varphi \parallel \varphi$。

3 Laplacian算子的谱性质

在上一小节，我们已经证明了$\varphi$是一个极大值点。现在我们不采用$\varphi$及所有与$\varphi$平行的解，而将解限制在与$\varphi$相正交的子空间中。这样，优化问题就变为了：

\[\text{Max } \underbrace{\langle f, Lf \rangle}_{\text{continous func. }} \quad \text{s.t.} \underbrace{\lVert f \rVert^2_2 = \langle f, f \rangle = 1}_{\text{compat set}},\quad f\perp \varphi
\]

求解该优化问题可以采用与之前相同的思路，也即存在极大值点$\varphi^{\prime}$满足：

\[L \varphi^{\prime}=\lambda^{\prime} \varphi^{\prime} \quad \text { for some } \lambda^{\prime} \leqslant \lambda，\text{and } \mathbb{E}[\varphi^{\prime}] = 0 (\Leftrightarrow \langle \varphi^{\prime}, \mathbf{1} \rangle = 0)
\]

这里$\lambda^{\prime} < \lambda$的原因是$\lambda$已经对应了极大值点，而我们添加了新的约束使$f\nparallel \varphi$，故这里$\lambda^{\prime}$对应的是第二大的极值点。

重复这个步骤，不断寻找第3大，第$4$大……的极大值点，并使其与之前找到的所有极大值点正交，直到找到最后一个（第$n$大的）极大值点。在这个过程中得到的极大值点都会$\perp$于$\mathbf{1}$（$\mathbf{1}$为全1向量），而最后一个极大值点即为所剩的$\mathbf{1}$向量本身，此时有

\[L\mathbf{1}=0
\]

由此可见最后一个特征值（最小的特征值）为0。

通过上面所述的步骤，我们可以找到Laplacian算子的$n$个相互正交的规范化特征向量（范数为1）及其对应的特征值。而这事实上和我们在线性代数课程中所学过的谱定理密切相关。

谱定理 若$T$为一个实向量空间$V$上的自伴算子，则$V$有一个由$T$的特征向量组成的规范正交基（orthonormal basis）$\varphi_1, \varphi_2, \cdots, \varphi_{n}$，每个特征向量分别对应于实特征值$\lambda_1, \lambda_2, \cdots, \lambda_{n}$。

我们前面证明过Markov转移算子$K$是自伴的，则$L = I - K$也是自伴的（事实上，又由于$\langle f, Lf \rangle \geqslant 0$，$L$还是半正定的）。于是，关于图$G$的Laplacian算子就有以下定理：

定理给定$G$及其Laplacian算子$L$，则存在规范正交基（函数）$\mathbf{1} \equiv \varphi_1, \varphi_2, \cdots, \varphi_{n}$及实数$0=\lambda_1 \leqslant \lambda_2\leqslant \cdots \leqslant \lambda_{n} \leqslant 2 $满足：

\[L\varphi_i = \lambda_i \varphi_i
\]

我们将$\lambda_2$和更广泛的$\lambda_k$（$k$为一个较小的值）称为低频（low-frequency） 特征值，而将$\lambda_n$称为高频（high-frequency） 特征值。

事实上，除了讨论Laplacian算子$L$之外，我们也可以讨论Markov转移算子$K$的特征向量及特征值。由$L = I - K$，我们有

\[K \varphi_i = (I - L) \varphi_i = I \varphi_i - L\varphi_i = \varphi_i - \lambda_i \varphi_i = (1 - \lambda_i) \varphi_i,
\]

则$K$拥有特征向量$\varphi_i$及其相伴的特征值 $\kappa_i = 1 - \lambda_i$，且$-1\leqslant \kappa_{n}\leqslant\cdots\leqslant \kappa_2 \leqslant \kappa_1 = 1$。

定义给定$f: V\rightarrow \mathbb{R}$和正交基$\varphi_1, \varphi_2, \cdots \varphi_{n}$，那么$f$能够唯一地表示为$\varphi_i$的一个线性组合：

\[f = \hat{f}(1) \varphi_1 + \hat{f}(2) \varphi_2 + \cdots \hat{f}(n) \varphi_{n},\quad \hat{f}(i)\in \mathbb{R}
\]

这个性质会为我们带来许多新的结论。

命题将$L$应用于$f$，就得到了：

\[Lf = \underbrace{\lambda_1 \hat{f}(1) \varphi_1}_{0} + \lambda_2 \hat{f}(2) \varphi_2 + \cdots + \lambda_{n} \hat{f}(n) \varphi_{n}，
\]

可以看到，$L$应用于$f$可以转换为分别去应用于正交基。为了方便，我们常常会使用如下所示的记号：

\[\widehat{Lf}(i) = \lambda_i \hat{f}(i)
\]

此外，我们也可以使用规范正交基来简化我们内积和范数的表示。

命题给定另一个函数

\[g = \hat{g}(1)\varphi_1 + \cdots + \hat{g}(n)\varphi_{n}，
\]

则$f$和$g$的内积

\[\langle f, g\rangle = \sum_{i, j}\hat{f}(i)\hat{g}(j)\langle \varphi_i, \varphi_j \rangle = \sum_{1\leqslant i \leqslant n}\hat{f}(i)\cdot \hat{g}(i)
\]

推论

根据内积我们可以诱导出范数

\[\lVert f \rVert^2_2 = \langle f, f\rangle = \sum_{1\leqslant i \leqslant n}\hat{f}(i)^2，
\]

$f$的均值可表示为：

\[\mathbb{E[f]}=\mathbb{E}_{u\sim \pi}[f(u)] = \langle f, \mathbf{1}\rangle=\langle f, \varphi_1 \rangle = \widehat{f}(1)
\]

可以看到，$f$沿规范正交基的展开式中的第一项就是均值乘单位向量：

\[f = \underbrace{\hat{f}(1)}_{\mathbb{E}[f]} \underbrace{\varphi_1}_{\mathbf{1}} + \hat{f}(2) \varphi_2 + \cdots \hat{f}(n) \varphi_{n}, \quad \hat{f}(i) \in \mathbb{R}，
\]

$f$的方差可表示为：

\[\begin{aligned}
\text{Var}[f] & = \mathbb{E}[f^2] - \mathbb{E}[f]^2 \\
& = \sum_{1\leqslant i \leqslant n} \left[\hat{f}(i)^2\right] - \hat{f}(1)^2 \\
&= \sum_{1< i \leqslant n} \hat{f}(i)^2
\end{aligned}
\]

（注意第$1$项$\hat{f}(1)^2 - \hat{f}(1)^2$抵消掉了）

Laplacian二次型$\mathcal{E}[f]$可表示为：

\[\begin{aligned}
\mathcal{E}[f] &= \langle f, Lf \rangle \\
&= \sum_{i, j}\lambda_i \hat{f}(i)\hat{f}(j)\langle \varphi_i, \varphi_j \rangle\\
&= \sum_{1 < i\leqslant n}\lambda_i \hat{f}(i)^2
\end{aligned}
\]

（注意第$1$项由于$\lambda_1=0$就消失了）

参考

[1] CMU 15-751: TCS Toolkit

[2] Bilibili: CMU计算机科学理论(完结)—你值得拥有的数学和计算机课)

[3] Spielman D. Spectral graph theory[J]. Combinatorial scientific computing, 2012, 18: 18.

[4] Axler S. Linear algebra done right[M]. springer publication, 2015.

谱图论：Laplacian算子及其谱性质的更多相关文章

Laplacian算子
多元函数的二阶导数又称为Laplacian算子: \[ \triangledown f(x, y) = \frac {\partial^2 f}{\partial x^2} + \frac {\par ...
机器学习进阶-图像梯度计算-scharr算子与laplacian算子(拉普拉斯) 1.cv2.Scharr(使用scharr算子进行计算) 2.cv2.laplician(使用拉普拉斯算子进行计算)
1. cv2.Scharr(src,ddepth, dx, dy), 使用Scharr算子进行计算参数说明:src表示输入的图片,ddepth表示图片的深度,通常使用-1, 这里使用cv2.CV_6 ...
Python 图像处理 OpenCV （12）： Roberts 算子、 Prewitt 算子、 Sobel 算子和 Laplacian 算子边缘检测技术
前文传送门: 「Python 图像处理 OpenCV (1):入门」「Python 图像处理 OpenCV (2):像素处理与 Numpy 操作以及 Matplotlib 显示图像」「Python ...
Sobel算子 Scharr算子 Laplacian算子
图像梯度处理 Sobel算子水平方向: 对于线条A和线条B,右侧像素值与左侧像素值的差值不为零,因此是边界上下像素值差值为0,左右素值的差值不为零,分布为正负, 离的近的为2,离的远的为1 P5= ...
OpenCV——边缘检测（sobel算子、Laplacian算子、scharr滤波器）
#include <opencv2/opencv.hpp> #include <iostream> using namespace cv; using namespace st ...
opencv —— Laplacian 拉普拉斯算子、二阶导数用于边缘检测
Laplacian 算子简介求多元函数的二阶导数的映射又称为 Laplacian 算子: 计算拉普拉斯变换:Laplacian 函数 void Laplacian(InputArray src, ...
谱聚类(Spectral Clustering)详解
谱聚类(Spectral Clustering)详解谱聚类(Spectral Clustering, SC)是一种基于图论的聚类方法——将带权无向图划分为两个或两个以上的最优子图,使子图内部尽量相似 ...
paper 82：边缘检测的各种微分算子比较(Sobel,Robert,Prewitt,Laplacian,Canny)
不同图像灰度不同,边界处一般会有明显的边缘,利用此特征可以分割图像.需要说明的是:边缘和物体间的边界并不等同,边缘指的是图像中像素的值有突变的地方,而物体间的边界指的是现实场景中的存在于物体之间的边界 ...
【OpenCV新手教程之十二】OpenCV边缘检測：Canny算子,Sobel算子,Laplace算子,Scharr滤波器合辑
本系列文章由@浅墨_毛星云出品,转载请注明出处. 文章链接:http://blog.csdn.net/poem_qianmo/article/details/25560901 作者:毛星云(浅墨) ...
基于MATLAB边缘检测算子的实现
基于MATLAB边缘检测算子的实现作者:lee神 1. 概述边缘检测是图像处理和计算机视觉中的基本问题,边缘检测的目的是标识数字图像中亮度变化明显的点.图像属性中的显著变化通常反映了属性的重要 ...

随机推荐

自研ORM （匠心之作）
Fast Framework 作者 Mr-zhong 代码改变世界.... 一.前言 Fast Framework 基于NET6.0 封装的轻量级 ORM 框架支持多种数据库 SqlServer O ...
浅析switch和if（开发中这两者的优缺点；分析出优缺点在使用就能更确定自己需要使用哪个函数了）
分析 Switch 相较于 if 的优点 1.switch 执行效率高于 if 的执行效率分析: switch是在编译阶段将子函数的地址和判断条件绑定了,只要直接将a的直接映射到子函数地址去执 ...
Lamada List 去重及其它操作示例
import java.util.concurrent.ConcurrentHashMap; import java.util.function.Function; import java.util. ...
XTTS系列之五：警惕大文件表空间
在上篇<XTTS系列之四:迷迷糊糊的并行度>验证之后,就让测试组在RMAN配置中设置好正确的并行.然后重新将备份任务执行,平均速度直接由之前的150MB/s提升为1200MB/s.优化效果 ...
Github入门教程（新版）
GitHub 的介绍与使用 GitHub 注册一个账号直接在首页注册即可啦要注意的是第一项 username 别人是可见的后面修改也会比较麻烦,所以起个好名字很重要个人主页介绍刚注册好的页 ...
AcWing 第87场周赛题解
T1 移动棋子算出数值为 $1$ 的点离 $(3, 3)$ 的距离即可. #include <iostream> #include <cstring> #includ ...
Day12_Java_作业
1:需求:请设计一个方法,可以实现获取任意范围内的随机数. package student; import java.util.Random; import java.util.Scanner; /* ...
shell: xscp
#!/bin/bash ips=( 1.1.1.1 1.1.1.2 ) user= passwd= for i in ${ips[@]} do echo "== $i ==" ss ...
2021-7-29 MySql的简单使用
创建表格先判断users表是否存在,然后设置user_id为无符号(UNSIGNED)自动增长(AUTO_INCREMENT)的整型并通过PRIMARY KEY设置user_id为主键 ENG ...
《Pro Git》Git分支笔记
Git分支简介在Git中,有个校验和的概念,主要用于验证数据完整性,它是一个40位16进制字符串,使用SHA-1哈希算法生成.校验和也标识了Git中每一个对象. 我们由前一章阅读了解到Git保存的是 ...

谱图论：Laplacian算子及其谱性质

1 Laplacian 算子

2 再论Laplacian二次型的极值

3 Laplacian算子的谱性质

参考

谱图论：Laplacian算子及其谱性质的更多相关文章

随机推荐

热门专题