基于聚类的“图像分割”

参考网站： https://zhuanlan.zhihu.com/p/27365576

昨天萌新使用的是PIL这个库，今天发现机器学习也可以这样玩。

视频地址Python机器学习应用

图像分割：利用图像的灰度、颜色、纹理、形状等特征，把图像分成若干个互不重叠的区域，并使这些特征在同一区域内呈现相似性，在不同的区域之间存在明显的差异性。然后就可以将分割的图像中具有独特性质的区域提取出来用于不同的研究。

实现步骤：

1.建立工程并导入sklearn包

2.加载图片并进行预处理

3.加载Kmeans聚类算法

4.对像素点进行聚类并输出

实验代码

import numpy as np

import PIL.Image as image

from sklearn.cluster import KMeans

def load_data(file_path):

    f = open(file_path,'rb') #二进制打开

    data = []

    img = image.open(f) #以列表形式返回图片像素值

    m,n = img.size #活的图片大小

    for i in range(m):

        for j in range(n):  #将每个像素点RGB颜色处理到0-1范围内并存放data

            x,y,z = img.getpixel((i,j))

            data.append([x/256.0,y/256.0,z/256.0])

    f.close()

    return np.mat(data),m,n #以矩阵型式返回data，图片大小

img_data,row,col = load_data('1.jpg')

label = KMeans(n_clusters=3).fit_predict(img_data)  #聚类中心的个数为3

label = label.reshape([row,col])    #聚类获得每个像素所属的类别

pic_new = image.new("L",(row,col))  #创建一张新的灰度图保存聚类后的结果

for i in range(row):    #根据所属类别向图片中添加灰度值

    for j in range(col):

        pic_new.putpixel((i,j),int(256/(label[i][j]+1)))

pic_new.save('111.jpg')

实验结果

修改n_clusters的值会有不同结果

实验分析

通过设置不同的k值，能够得到不同的聚类结果。同时，k值的不确定也是Kmeans算法的一个缺点。往往为了达到好的实验结果，需要进行多次尝试才能够选取最优的k值。而像层次聚类的算法，就无需指定k值，只要给定限制条件，就能自动地得到类别数k。

话说把女朋友P成这样会不会被骂

然而自己想太多

基于聚类的“图像分割”(python)的更多相关文章

基于图的图像分割（Graph-Based Image Segmentation）
一.介绍基于图的图像分割(Graph-Based Image Segmentation),论文<Efficient Graph-Based Image Segmentation>,P. ...
数学建模及机器学习算法（一）：聚类-kmeans（Python及MATLAB实现，包括k值选取与聚类效果评估）
一.聚类的概念聚类分析是在数据中发现数据对象之间的关系,将数据进行分组,组内的相似性越大,组间的差别越大,则聚类效果越好.我们事先并不知道数据的正确结果(类标),通过聚类算法来发现和挖掘数据本身的结 ...
Python黑帽编程1.2 基于VS Code构建Python开发环境
Python黑帽编程1.2 基于VS Code构建Python开发环境 0.1 本系列教程说明本系列教程,采用的大纲母本为<Understanding Network Hacks Atta ...
kaggle信用卡欺诈看异常检测算法——无监督的方法包括：基于统计的技术，如BACON *离群检测多变量异常值检测基于聚类的技术；监督方法：神经网络 SVM 逻辑回归
使用google翻译自:https://software.seek.intel.com/dealing-with-outliers 数据分析中的一项具有挑战性但非常重要的任务是处理异常值.我们通常将异 ...
基于Scrapy框架的Python新闻爬虫
概述该项目是基于Scrapy框架的Python新闻爬虫,能够爬取网易,搜狐,凤凰和澎湃网站上的新闻,将标题,内容,评论,时间等内容整理并保存到本地详细代码下载:http://www.demoda ...
windows下使用pycharm开发基于ansible api的python程序
Window下python安装ansible,基于ansible api开发python程序在windows下使用pycharm开发基于ansible api的python程序时,发现ansible ...
基于聚类K-Means方法实现图像分割
”“”K-Means to realize Image segmentation “”“ import numpy as np import PIL.Image as image from sklea ...
K-means聚类算法及python代码实现
K-means聚类算法(事先数据并没有类别之分!所有的数据都是一样的) 1.概述 K-means算法是集简单和经典于一身的基于距离的聚类算法采用距离作为相似性的评价指标,即认为两个对象的距离越近,其 ...
数据结构：二叉树基于list实现（python版）
基于python的list实现二叉树 #!/usr/bin/env python # -*- coding:utf-8 -*- class BinTreeValueError(ValueError): ...

随机推荐

C#多线程数据分布加载
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.T ...
Scheduling the Delivery of Local Notifications
[Scheduling the Delivery of Local Notifications] Apps can use local notifications to display alerts, ...
Android 通过adb shell命令查看内存，CPU，启动时间，电量等信息
1. 查看内存信息 1)查看所有内存信息命令: dumpsys meminfo 例: C:\Users\laiyu>adb shell shell@android:/ $ dumpsys m ...
Gym 101201G Maximum Islands (最大独立集)
题意:给定一个图,L代表陆地,W代表水,C表示不确定,问你最多有多少岛. 析:首先给定的L周围必须是是W,只有这样才是最优的,因为如果是L,那么还得有另外的W来包围,不是最优的,那么剩下的就剩下C了, ...
js Object
对象 var ob = {}; 键值对可以做为key的有 :数字,boolean(某些浏览器不支持,比如IE),字符串(不包含标识符) 可以作为value的有 :一切可以解析为具体值的代码 var ...
Java8接口中的默认方法
Java8新增特性,可以为接口中添加默认方法,实现这个接口的所有类都会继承这个方法,这样看起来,接口和类的界限就有点不明显了,同时也会带来多继承,菱形问题.这样设计的初衷是什么? 重所周知,java8 ...
Flask测试和部署
一蓝图Blueprint 为什么学习蓝图? 我们学习Flask框架,是从写单个文件,执行hello world开始的.我们在这单个文件中可以定义路由.视图函数.定义模型等等.但这显然存在一个问题:随 ...
How to extract msu/msp/msi/exe files from the command line
http://www.windowswiki.info/2009/02/19/how-to-extract-msumspmsiexe-files-from-the-command-line/ Micr ...
TSQL--如何突破PRINT的8000大限
相信很多DBA都喜欢干的一件事就是拼SQL语句,我也不例外,但是PRINT只能打印4000的Unicode string或8000的Non-unicode string, 这个蛋疼的限制会导致过长的s ...
[UWP开发]在windows10中设置壁纸~UserProfilePersonalizationSettings
在之前的wp8.1和wp8中,微软没有公开设置壁纸的API,只有一个设置锁屏的API,但在Windows10中,微软为我们提供了设置壁纸的API:TrySetWallpaperImageAsync,他 ...

基于聚类的“图像分割”(python)