opencv笔记--Kmeans
在图像分割中,使用 kmeans 算法可以实现图像区域基本分割。如果一幅图像被分为两类,kmeans 分割效果与 ostu 算法基本一致,具体如下图:
kmeans 将图像灰度聚类为 k 类,ostu 将图像灰度分割为 2 类,当 k = 2 时,两种算法最终目的基本趋于一致。
kmeans 算法基本思路如下:
1)随机选取第一个聚类中心点,之后的聚类中心点选取有两种方法;
a. 随机选取其他 k - 1 个聚类中心点;
b. 根据已经选取的聚类中心点,计算所有点到已经选取的聚类中心点的距离,选择到所有已经选取的聚类中心点的最远点作为下一个聚类中心点;
2)根据点到已经选取的聚类中心点的距离对其进行分类;
3)重新求各个分类的聚类中心点,然后回到 2);
4)当不再满足迭代条件时给出最终聚类结果,迭代条件包括:
a. 聚类中心点在迭代过程中的偏移量;
b. 迭代次数;
对于聚类中心点的选择,一般情况下,方法 b 会得到更好的聚类,且迭代速度较快。
opencv 提供的 kmean 函数为:
double kmeans( InputArray data, int K, InputOutputArray bestLabels, TermCriteria criteria, int attempts,
int flags, OutputArray centers=noArray() );
参数如下:
data: 待分类点矩阵,其类型必须为 CV_32F;
K,bestLabels: 聚类数与待分类点所属分类;
criteria:停止条件;
attempts:使用不同的随机聚类中心点尝试聚类次数;
flags:聚类中心点选择方案,包括完全随机选择,kmeans++选择方案(b),用户输入;
centers:最终聚类中心点;
以下给出 kmeans 算法使用代码:
1 void UseKmeans(cv::Mat& src, cv::Mat& rst)
2 {
3 int width = src.cols;
4 int height = src.rows;
5 int dims = src.channels();
6 int sampleCount = width * height;
7
8 int clusterCount = 2;
9 Mat points(sampleCount, dims, CV_32F, Scalar(10));
10 cv::Mat pos(sampleCount, 2, CV_16S, Scalar(0, 0));
11 Mat labels;
12 Mat centers(clusterCount, 1, points.type());
13
14 // invert to data points
15 int index = 0;
16 for (int row = 0; row < height; row++) {
17 for (int col = 0; col < width; col++) {
18 points.at<float>(index, 0) = static_cast<int>(src.ptr<uchar>(row)[col]);
19 pos.at<short>(index, 0) = static_cast<short>(row);
20 pos.at<short>(index, 1) = static_cast<int>(col);
21 ++index;
22 }
23 }
24
25 // k-mean algorithm
26 TermCriteria criteria = TermCriteria(CV_TERMCRIT_EPS + CV_TERMCRIT_ITER, 100, 1.0);
27 kmeans(points, clusterCount, labels, criteria, 3, KMEANS_PP_CENTERS, centers);
28
29 int bright_val = -1;
30 for (int i = 0; i < centers.rows; ++i)
31 {
32 int val = centers.at<float>(i, 0);
33 if (val > bright_val)
34 bright_val = val;
35 }
36
37 int bright_label = -1;
38 for (int idx = 0; idx < sampleCount; ++idx)
39 {
40 float *datapoint = points.ptr<float>(idx);
41 int *datalabel = labels.ptr<int>(idx);
42 if (datapoint[0] >= bright_val)
43 {
44 bright_label = datalabel[0];
45 break;
46 }
47 }
48
49 // save result
50 rst.create(src.size(), CV_8UC1);
51 rst.rowRange(0, rst.rows) = 0;
52 for (int idx = 0; idx < sampleCount; ++idx)
53 {
54 int *datalabel = labels.ptr<int>(idx);
55 if (datalabel[0] == bright_label)
56 {
57 int row = pos.at<short>(idx, 0);
58 int col = pos.at<short>(idx, 1);
59 rst.ptr<uchar>(row)[col] = 255;
60 }
61 }
62 }
opencv笔记--Kmeans的更多相关文章
- OpenCV笔记大集锦(转载)
整理了我所了解的有关OpenCV的学习笔记.原理分析.使用例程等相关的博文.排序不分先后,随机整理的.如果有好的资源,也欢迎介绍和分享. 1:OpenCV学习笔记 作者:CSDN数量:55篇博文网址: ...
- opencv笔记6:角点检测
time:2015年10月09日 星期五 23时11分58秒 # opencv笔记6:角点检测 update:从角点检测,学习图像的特征,这是后续图像跟踪.图像匹配的基础. 角点检测是什么鬼?前面一篇 ...
- opencv笔记5:频域和空域的一点理解
time:2015年10月06日 星期二 12时14分51秒 # opencv笔记5:频域和空域的一点理解 空间域和频率域 傅立叶变换是f(t)乘以正弦项的展开,正弦项的频率由u(其实是miu)的值决 ...
- opencv笔记4:模板运算和常见滤波操作
time:2015年10月04日 星期日 00时00分27秒 # opencv笔记4:模板运算和常见滤波操作 这一篇主要是学习模板运算,了解各种模板运算的运算过程和分类,理论方面主要参考<图像工 ...
- opencv笔记3:trackbar简单使用
time:2015年 10月 03日 星期六 13:54:17 CST # opencv笔记3:trackbar简单使用 当需要测试某变量的一系列取值取值会产生什么结果时,适合用trackbar.看起 ...
- opencv笔记2:图像ROI
time:2015年 10月 03日 星期六 12:03:45 CST # opencv笔记2:图像ROI ROI ROI意思是Region Of Interests,感兴趣区域,是一个图中的一个子区 ...
- opencv笔记1:opencv的基本模块,以及环境搭建
opencv笔记1:opencv的基本模块,以及环境搭建 安装系统 使用fedora22-workstation-x86_64 安装opencv sudo dnf install opencv-dev ...
- OpenCV: Kmeans的使用一维和二维点集
OpenCVKmeans算法默认使用了Kmeans++选取种子点 参考:OpenCv中Kmeans算法实现和使用 //效果:根据半径聚类,并不一定能得到好的结果. float CBlotGlint:: ...
- OpenCV基本架构[OpenCV 笔记0]
最近正在系统学习OpenCV,将不定期发布笔记,主要按照毛星云的<OpenCV3编程入门>的顺序学习,会参考官方教程和文档.学习工具是Xcode+CMake,会对书中一部分内容更正,并加入 ...
随机推荐
- 【漏洞复现】CVE-2022–21661 WordPress核心框架WP_Query SQL注入漏洞原理分析与复现
影响版本 wordpress < 5.8.3 分析 参考:https://blog.csdn.net/qq_46717339/article/details/122431779 在 5.8.3 ...
- 《剑指offer》面试题53 - I. 在排序数组中查找数字 I
问题描述 统计一个数字在排序数组中出现的次数. 示例 1: 输入: nums = [5,7,7,8,8,10], target = 8 输出: 2 示例 2: 输入: nums = [5,7,7,8, ...
- 【小记录】利用cuvid库做视频解码,运行出现"dlopen "libnvcuvid.so" failed!"
1.查看源码:/Video_Codec_SDK_8.0.14/Samples/common/src/dynlink_nvcuvid.cpp 其中的LOAD_LIBRARY函数的源码如下: 1 #eli ...
- manjaro20安装teamviewer出现sudo teamviewer –daemon start无响应
问题 https://www.randomhacks.co.uk/the-teamviewer-daemon-is-not-running-please-start-the-daemon-ubuntu ...
- spring事务隔离级别、传播机制以及简单配置
转自 https://blog.csdn.net/zht741322694/article/details/78676964 一.spring支持的事务声明方式1. 编程式事务 当系统需要明确的, ...
- Redis的几点积累
1.Redis比memcache快 Redis具有事务,持久化等机制,但是它还能做到高性能,原因包括如下: Libevent.和Memcached不同,Redis并没有选择libevent.Libev ...
- 无缓冲文件IO和目录操作
引言 在后台开发中,对于文件I/O我们通常不使用C语言封装的fopen.fread.fwrite标准I/O,而是直接使用Linux提供的系统调用函数.因为这些系统调用没有使用用户缓冲区,我们直接与内核 ...
- listen()和accept()
1.listen()队列剖析 作用:监听端口,TCP连接中的服务器端角色 调用格式:int listen(int sockfd, int backlog); 第一个参数:创建的sockfd, 好好理解 ...
- Elasticsearch使用系列-ES增删查改基本操作+ik分词
Elasticsearch使用系列-ES简介和环境搭建 Elasticsearch使用系列-ES增删查改基本操作+ik分词 一.安装可视化工具Kibana ES是一个NoSql数据库应用.和其他数据库 ...
- Java 将PDF转为HTML时保存到流
本文介绍如何通过Java后端程序代码将PDF文件转为HTML,并将转换后的HTML文件保存到流.在实现转换时,可设置相关转换属性,如:是否嵌入SVG.是否嵌入图片等.下面是实现转换的方法和步骤: 1. ...