简介

本文将会以图表的形式为大家讲解怎么在NumPy中进行多维数据的线性代数运算。

多维数据的线性代数通常被用在图像处理的图形变换中，本文将会使用一个图像的例子进行说明。

图形加载和说明

熟悉颜色的朋友应该都知道，一个颜色可以用R，G，B来表示，如果更高级一点，那么还有一个A表示透明度。通常我们用一个四个属性的数组来表示。

对于一个二维的图像来说，其分辨率可以看做是一个X*Y的矩阵，矩阵中的每个点的颜色都可以用（R，G，B）来表示。

有了上面的知识，我们就可以对图像的颜色进行分解了。

首先需要加载一个图像，我们使用imageio.imread方法来加载一个本地图像，如下所示：

import imageio

img=imageio.imread('img.png')

print(type(img))

上面的代码从本地读取图片到img对象中，使用type可以查看img的类型，从运行结果，我们可以看到img的类型是一个数组。

class 'imageio.core.util.Array'

通过img.shape可以得到img是一个(80, 170, 4)的三维数组，也就是说这个图像的分辨率是80*170，每个像素是一个（R，B，G，A）的数组。

最后将图像画出来如下所示：

import matplotlib.pyplot as plt

plt.imshow(img)

图形的灰度

对于三维数组来说，我们可以分别得到三种颜色的数组如下所示：

red_array = img_array[:, :, 0]

green_array = img_array[:, :, 1]

blue_array = img_array[:, :, 2]

有了三个颜色之后我们可以使用下面的公式对其进行灰度变换：

Y=0.2126R + 0.7152G + 0.0722B

上图中Y表示的是灰度。

怎么使用矩阵的乘法呢？使用 @ 就可以了：

 img_gray = img_array @ [0.2126, 0.7152, 0.0722]

现在img是一个80 * 170的矩阵。

现在使用cmap="gray"作图：

plt.imshow(img_gray, cmap="gray")

可以得到下面的灰度图像：

灰度图像的压缩

灰度图像是对图像的颜色进行变换，如果要对图像进行压缩该怎么处理呢？

矩阵运算中有一个概念叫做奇异值和特征值。

设A为n阶矩阵，若存在常数λ及n维非零向量x，使得Ax=λx，则称λ是矩阵A的特征值，x是A属于特征值λ的特征向量。

一个矩阵的一组特征向量是一组正交向量。

即特征向量被施以线性变换 A 只会使向量伸长或缩短而其方向不被改变。

特征分解（Eigendecomposition），又称谱分解（Spectral decomposition）是将矩阵分解为由其特征值和特征向量表示的矩阵之积的方法。

假如A是m * n阶矩阵，q=min(m,n)，A*A的q个非负特征值的算术平方根叫作A的奇异值。

特征值分解可以方便的提取矩阵的特征，但是前提是这个矩阵是一个方阵。如果是非方阵的情况下，就需要用到奇异值分解了。先看下奇异值分解的定义：

$A=UΣV^T$

其中A是目标要分解的m * n的矩阵，U是一个 m * m的方阵，Σ 是一个m * n 的矩阵，其非对角线上的元素都是0。$V^T$是V的转置，也是一个n * n的矩阵。

奇异值跟特征值类似，在矩阵Σ中也是从大到小排列，而且奇异值的减少特别的快，在很多情况下，前10%甚至1%的奇异值的和就占了全部的奇异值之和的99%以上了。也就是说，我们也可以用前r大的奇异值来近似描述矩阵。r是一个远小于m、n的数，这样就可以进行压缩矩阵。

通过奇异值分解，我们可以通过更加少量的数据来近似替代原矩阵。

要想使用奇异值分解svd可以直接调用linalg.svd 如下所示：

U, s, Vt = linalg.svd(img_gray)

其中U是一个m * m矩阵，Vt是一个n * n矩阵。

在上述的图像中，U是一个(80, 80)的矩阵，而Vt是一个(170, 170) 的矩阵。而s是一个80的数组，s包含了img中的奇异值。

如果将s用图像来表示，我们可以看到大部分的奇异值都集中在前的部分：

这也就意味着，我们可以取s中前面的部分值来进行图像的重构。

使用s对图像进行重构，需要将s还原成80 * 170 的矩阵：

# 重建

import numpy as np

Sigma = np.zeros((80, 170))

for i in range(80):

    Sigma[i, i] = s[i]

使用 U @ Sigma @ Vt 即可重建原来的矩阵，可以通过计算linalg.norm来比较一下原矩阵和重建的矩阵之间的差异。

linalg.norm(img_gray - U @ Sigma @ Vt)

或者使用np.allclose来比较两个矩阵的不同：

np.allclose(img_gray, U @ Sigma @ Vt)

或者只取s数组的前10个元素，进行重新绘图，比较一下和原图的区别：

k = 10

approx = U @ Sigma[:, :k] @ Vt[:k, :]

plt.imshow(approx, cmap="gray")

可以看到，差异并不是很大：

原始图像的压缩

上一节我们讲到了如何进行灰度图像的压缩，那么如何对原始图像进行压缩呢？

同样可以使用linalg.svd对矩阵进行分解。

但是在使用前需要进行一些处理，因为原始图像的img_array 是一个(80, 170, 3)的矩阵--这里我们将透明度去掉了，只保留了R，B，G三个属性。

在进行转换之前，我们需要把不需要变换的轴放到最前面，也就是说将index=2，换到index=0的位置，然后进行svd操作：

img_array_transposed = np.transpose(img_array, (2, 0, 1))

print(img_array_transposed.shape)

U, s, Vt = linalg.svd(img_array_transposed)

print(U.shape, s.shape, Vt.shape)

同样的，现在s是一个(3, 80)的矩阵，还是少了一维，如果重建图像，需要将其进行填充和处理，最后将重建的图像输出：

Sigma = np.zeros((3, 80, 170))

for j in range(3):

    np.fill_diagonal(Sigma[j, :, :], s[j, :])

reconstructed = U @ Sigma @ Vt

print(reconstructed.shape)

plt.imshow(np.transpose(reconstructed, (1, 2, 0)))

当然，也可以选择前面的K个特征值对图像进行压缩：

approx_img = U @ Sigma[..., :k] @ Vt[..., :k, :]

print(approx_img.shape)

plt.imshow(np.transpose(approx_img, (1, 2, 0)))

重新构建的图像如下：

对比可以发现，虽然损失了部分精度，但是图像还是可以分辨的。

总结

图像的变化会涉及到很多线性运算，大家可以以此文为例，仔细研究。

本文已收录于 http://www.flydean.com/08-python-numpy-linear-algebra/

最通俗的解读，最深刻的干货，最简洁的教程，众多你不知道的小技巧等你来发现！

欢迎关注我的公众号:「程序那些事」,懂技术，更懂你！

NumPy之:多维数组中的线性代数的更多相关文章

Numpy 笔记: 多维数组的切片(slicing)和索引(indexing)【转】
目录切片(slicing)操作索引(indexing) 操作最简单的情况获取多个元素切片和索引的同异切片(slicing)操作 Numpy 中多维数组的切片操作与 Python 中 lis ...
初识numpy的多维数组对象ndarray
PS:内容来源于<利用Python进行数据分析> 一.创建ndarray 1.array :将一个序列(嵌套序列)转换为一个数组(多维数组) In[2]: import numpy as ...
Python数据分析 | Numpy与1维数组操作
作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/33 本文地址:http://www.showmeai.tech/article-det ...
剑指Offer-【面试题03：二维数组中的查找】
package com.cxz.question3; /* * 在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序. * 请完成一个函数,输入这样的一个二维数组和 ...
剑指Offer面试题：2.二维数组中的查找
一.题目:二维数组中的查找题目:在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序.请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数. ...
php如何去掉二维数组中重复的元素？
$arr=array("=>array("a","b")); 我想得到的结果是:只输出第一项(第一项和第三项相同,去第一项)和第二项这个怎么解决 ...
剑指Offer 二维数组中的查找
题目描述在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序.请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数. 思路法一: * 矩阵是 ...
剑指offer系列——二维数组中，每行从左到右递增，每列从上到下递增，设计算法找其中的一个数
题目:二维数组中,每行从左到右递增,每列从上到下递增,设计一个算法,找其中的一个数分析: 二维数组这里把它看作一个矩形结构,如图所示: 1 2 8 2 4 9 12 4 7 10 13 6 8 11 ...
剑指offer一：二维数组中的查找
题目: 在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序.请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数. 思路: 这是一个顺序二维 ...

随机推荐

jsp页面抽取
步骤: 1.先将jsp中要抽取的公共部分剪切出来,黏贴到新的jsp文件中,取名叫xxx.jsp 2.在需要引入此公共部分的jsp页面中使用<%@include file="xxx.js ...
AgileConfig轻量级配置中心1.3.0发布，支持多用户权限控制
AgileConfig 当初是设计给我自己用的一个工具,所以只设置了一道管理员密码,没有用户的概念.但是很多同学在使用过后都提出了需要多用户支持的建议.整个团队或者整个公司都使用同一个密码来管理非常的 ...
【逆向实战】恶意勒索软件分析_披着羊皮的狼_被注入恶意代码的apk
/文章作者:Kali_MG1937 QQ:3496925334 CNBLOG博客号:ALDYS4/ 今天逛某论坛的时候发现了一篇求助贴有意思,好久没分析过恶意软件了今天就拿它来练练手反编译工具 ...
teprunner重磅更新Git打通PyCharm与测试平台
经过Python测试交流群的小伙伴群策群力,teprunner添加了一个重要功能,把PyCharm中的代码,通过Git同步到测试平台中,生成测试用例.这样,teprunner就成了一个名副其实的pyt ...
【NX二次开发】Block UI 多行字符串
属性说明常规类型描述 BlockID String 控件ID Enable Logical 是否可操作 Group Logical ...
【Azure 机器人】微软Azure Bot 编辑器系列(4) : 使用语言生成功能[LG: Language Generation] (The Bot Framework Composer tutorials)
欢迎来到微软机器人编辑器使用教程,从这里开始,创建一个简单的机器人. 在该系列文章中,每一篇都将通过添加更多的功能来构建机器人.当完成教程中的全部内容后,你将成功的创建一个天气机器人(Weather ...
基于webpack5封装的cli工具packx
安装用 npm / yarn 安装: $ npm install -D packx $ yarn add -D packx 特性基于 webpack5 支持 less,sass 支持 spa/mp ...
JVM 内存溢出实战（史上最全）
文章很长,建议收藏起来,慢慢读! 疯狂创客圈为小伙伴奉上以下珍贵的学习资源: 疯狂创客圈经典图书 : <Netty Zookeeper Redis 高并发实战> 面试必备 + 大厂必备 ...
iNeuOS工业互联网平台，在高校教学实训领域的应用
目录 1. 概述... 2 2. 实训柜... 2 3. 培训内容... 4 4. 二次开发培训... 5 1. 概述中国工业互联网从 0 ...
深入了解Debug和Release的区别
原文地址:https://blog.csdn.net/sky___ice/article/details/8993885 一: Bin 目录用来存放编译的结果,bin是二进制binrary的英文缩写, ...

NumPy之:多维数组中的线性代数

简介