一种压缩图片的方法---Machine learning 之 K-Means

暴力的轮胎 2024-08-12 07:43:32 原文

背景描述：

　　RGB编码：对于一个直接用24bit表示每一个而像素的图像来说，每一个pixel使用8-bit无符号整数(0-255)来表示红or绿or蓝。

压缩目的：

　　将128x128大小的图片由原来的24bit表示-压缩成->16bit表示每一个像素的图像。

压缩方法：

　　对于每一个pixel, 使用 K-Means选择16bits来表示原来的24bits。当然，具体是通过计算每一个像素空间的16bits大小的聚类来表示原来的24bits。

实现步骤：

　　1.将原来的128x128大小的图片读入到一个3维矩阵A中。举个例子 A(50， 33， 3)表示原图片中rowNum = 50 columnNum = 33 RGB中的B维所对应的

颜色值（0-255）。这样我们就得到了一个 X = （m x 3）matrix of piexl colors( where m = 128 * 128 = 16384)。

　　2.运行K-Means算法，取K= 16, 这样将每一个pixel聚类到一个Cluster k上(关于K-means初始K个点的选择其实就是随机在X中选出K个点作为 centroid的)。用k这个centroid point的location来代表原来的像素值。这里K=16，我们可以用四位来表示16种分类的可能。那么也就需要4bits就可以记录当前piexl的压缩后的分类。（当然，最后还需要有一个对照表 k(16个颜色（？为啥不用4bits来映射，2进制转换太繁琐！这里直接映射就好了）) -> RGB(24bits)）。

压缩效果：

　　压缩前大小：128*128*24 = 393216 bits;

　　压缩后大小：128*128*4 + 16*24 = 65920 bits;

　　压缩因子接近 6！

　　代码在gitlab Machine learning ex7中。

核心思路：

　　K-means进行图片压缩，压缩的并不是颜色。原来用24位表示颜色，现在也用24位表示颜色。只不过编码方式发生了改变，将原来的24bits种颜色变成了16bits种颜色。而这个过程正是采用的k-means聚类。那么颜色之间的区分度就变得不是那么明显，导致分辨率下降。

Have fun , good luck!

And this is my picture kebe compressed:

K-Means结果可视化

　　如图每一个颜色代表一个cluster（共计16种）。

一种压缩图片的方法---Machine learning 之 K-Means的更多相关文章

另一种压缩图片的方法---Machine learning 之 PCA（Principle Component Analysis）
PCA最主要的用途是用来减少特征向量的数目,N个特征向量减小到 K个特征向量.如果为了可视化,k可以使3 或者 2.这样可以加速算法的学习速度. PCA用来压缩图像同一有效. 具体方式以及原理在gi ...
OpenCV Machine Learning 之 K近期邻分类器的应用 K-Nearest Neighbors
OpenCV Machine Learning 之 K近期邻分类器的应用以下的程序实现了对高斯分布的点集合进行分类的K近期令分类器 #include "ml.h" #includ ...
[实现]Javascript代码的另一种压缩与加密方法——代码图片转换
代码=图片图片=代码 JS代码对于喜欢F12的同志来说,连个遮羞布都没有... 虽然把代码变成图片也仅仅只是增加一层纱布而已...但这方法还是挺好玩的,而且代码也被压缩了一点. 第一次看到[图片=代 ...
10 行 Python 代码，批量压缩图片 500 张，简直太强大了
本文原创并首发于公众号[Python猫],未经授权,请勿转载. 原文地址:https://mp.weixin.qq.com/s/5hpFDgjCpfb0O1Jg-ycACw 熟悉 "Pyth ...
Android 下压缩图片—微弱失真
Android下压缩图片的方法: 大概能将3M左右的图片压缩到100K左右, 几乎不失真. 代码如下: import java.io.FileNotFoundException; import jav ...
Canvas DrawImage截取和压缩图片的陷阱
html5的canvas十分之强大,可以做到快速的截取压缩出新的图片! 不过最近开发过程中遇到一个问题,图片压缩后使用toDataURL取得图片显示为一片漆黑,什么都没有! 折腾了很久,起初以为是上传 ...
JAVA中pdf转图片的方法
JAVA中实现pdf转图片可以通过第三方提供的架包,这里介绍几种常用的,可以根据自身需求选择使用. 一.icepdf.有收费版和开源版,几种方法里最推荐的.转换的效果比较好,能识别我手头文件中的中文, ...
Python解压ZIP、RAR等常用压缩格式的方法
解压大杀器首先祭出可以应对多种压缩包格式的python库:patool.如果平时只用基本的解压.打包等操作,也不想详细了解各种压缩格式对应的python库,patool应该是个不错的选择. pato ...
使用Python轻松批量压缩图片
在互联网,图片的大小对一个网站的响应速度有着明显的影响,因此在提供用户预览的时候,图片往往是使用压缩后的.如果一个网站图片较多,一张张压缩显然很浪费时间.那么接下来,我就跟大家分享一个批量压缩图片的方 ...

随机推荐

ie9以下提示用户升级浏览器
<!--[if lt IE 9]> <div style='border: 4px solid #FFF500; background: #FDFDC8; text-align: c ...
计蒜客成绩统计 (Hash表)
链接 : Here! 思路 : 如果用 $STL$ 的 $map$ 或者是使用 $unordered\underline{}map$ 的话是会 $T$ 的, 所以得手写一个 $hash表$. 其实这个 ...
Miller Rabbin素数测试
步骤 ①先写快速幂取模函数 ②MR算法开始 (1)传入两个参数一个是底数一个是n也就是幂数,如果n是一个合数那么可以判定,这个数一定不是素数 (2)然后开始寻找一个奇数的n去计算,如果最后满足a^d% ...
vim学习1-入门指令
使用vim命令进入vim界面 vim后面加上你要打开的已存在的文件名或者不存在(则作为新建文件)的文件名. 打开Xfce终端,输入以下命令 $ vim practice_1.txt 直接使用vim也可 ...
洛谷——P1034 矩形覆盖
https://www.luogu.org/problem/show?pid=1034 题目描述在平面上有 n 个点(n <= 50),每个点用一对整数坐标表示.例如:当 n＝4 时,4个点的 ...
MVC.Net：MVC.Net与WebAPI的IOC实现
我们通过Ninject(http://www.ninject.org/)项目来帮助我们实现MVC.Net与WebAPI项目的IOC实现. 首先我们来看MVC.Net的IOC实现. 1. 通过NuGet ...
[React] Refactor a connected Redux component to use Unstated
In this lesson, I refactor a simple Counter component connected to Redux to use Unstated instead. I ...
VC问题 IntelliSense:“没有可用的附加信息”，[请參见“C++项目 IntelliSense 疑难解答”，获得进一步的帮助]
在XP上安装VS2010 后发现 IntelliSense不能使用,但在Windows7上是能够正常使用这功能的.关于IntelliSense不能使用的问题已有网友提出了是由于KB2876217这个补 ...
AndroidUI组件之ActionBar
有一段时间没有写博文了,发现自己的博文的完整度不是非常好.就拿AndroidUI组件这一块.一直没有更新完.我会尽快更新.好了.不多说了,今天来看一下ActionBar. 依照以往的作风.知识点都以代 ...
CAS 4.0 配置开发手冊
1 下载地址http://downloads.jasig.org/ cas-server-4.0.0-release.tar.gz cas-client-3.3.3-release.tar.g ...