模糊c-means算法的c++实现

首先输入点的个数，维度，分类数目

我的代码FCM中主要过程如下：

1：(init_c函数)随机初始化聚类中心

2：(comp_dis函数)计算每个点到每个聚类距离 dis[i][j] 表示i点到j聚类中心的距离

3：(while(1))进入循环

4：(comp_u函数)计算隶属度矩阵u[i][j]表示i点对应j聚类中心的隶属度

5：(update_c函数)根据隶属度和每个点的位置更新聚类中心

6：(compdis函数)因为聚类中心更新了嘛，再重新计算下每个点到每个聚类中心的距离

7：(comp_obj_func函数)计算函数值差值如果小于设定值eps则进行第8步，否则进行第9步

8：(break)退出循环

9：根据每个点的隶属度情况，给每个点分类（距离哪个聚类中心近，就给谁）

注意事项：

1.如果点很少的话，可能在我的初始化聚类中心函数中会有相同的点，造成分类错误，但实际应用中，点数足够多的情况则这个概率可以忽略

2.在计算隶属度的函数中，如果一个点距离一个聚类中心足够的近，那么直接将它的隶属度设置成1，其他的为0

其他：

如果有错误和疑问欢迎探讨，望多多指教！

代码：

 #include<iostream>

 #include<cstdio>

 #include<vector>

 #include<fstream>

 #include<cmath>

 #include<ctime>

 #include<cstdlib>

 using namespace std;

 struct Mode

 {

     int x,y;

     int di;

     vector<double> datas;

 };

 typedef vector<vector<Mode> > ModeVec;

 const int N=;

 const double eps=1e-;

 const double eps_dis=1e-;

 double getDistance(Mode &m1,Mode &m2);

 void FCM(Mode *p,int n,int di,int clusternum,vector<vector<Mode> > &ans);

 void init_c(Mode *p,int n,int clusternum,Mode *c);

 void comp_dis(Mode *p,Mode *c,int n,int clusternum,double dis[][]);

 void comp_u(double dis[][],int n,int clusternum,double u[][]);

 void update_c(Mode *p,double u[][],int n,int clusternum,Mode *c);

 double comp_obj_func(double u[][],double dis[][],int n,int clusternum,int di);

 int main()

 {

     int n,dimension,clusternum;

     Mode p[N];

 //    freopen("in.txt","r",stdin);

 //    freopen("out.txt","w",stdout);

     ifstream fin("in.txt");

     ofstream fout("out.txt");

     fin>>n>>dimension>>clusternum;  //输入点的个数，维度，聚类数目

     for(int i=; i<n; i++)

     {

         p[i].di=dimension;

         for(int j=; j<dimension; j++)

             {

                 double temp;

                 fin>>temp;

                 p[i].datas.push_back(temp);

             }

     }

     vector<vector<Mode> > ans;

     FCM(p,n,dimension,clusternum,ans);  //传入数组p，有n个点，维度为dimension，结果保存在ans

     for(int i=;i<clusternum;i++)

     {

         printf("第%d类：\n",i+);

         for(int j=;j<ans[i].size();j++)

         {

             printf("(");

             for(int k=;k<dimension;k++)

             {

                 if(k==) printf("%f",ans[i][j].datas[k]);

                 else printf(",%f",ans[i][j].datas[k]);

             }

             printf(") ");

         }

         printf("\n");

     }

     return ;

 }

 double getDistance(Mode &m1,Mode &m2)

 {

     int di=m1.di;

     double ans=;

     for(int i=; i<di; i++)

         ans+=(m1.datas[i]-m2.datas[i])*(m1.datas[i]-m2.datas[i]);

     return ans;

 }

 void init_c(Mode *p,int n,int clusternum,Mode *c) //初始化聚类中心

 {

     int di=p[].di;

     srand(time(NULL));

     for(int i=;i<clusternum;i++)

         {

             c[i].di=di;

             c[i].datas.clear();

             for(int j=;j<di;j++)

                 c[i].datas.push_back();

         }

     for(int i=;i<n;i++)

         for(int j=;j<di;j++)

             for(int k=;k<clusternum;k++)

                 c[k].datas[j]+=p[i].datas[j];

     for(int i=;i<clusternum;i++)

     {

         for(int j=;j<di;j++)

         {

             int tp=rand()%n+;

             c[i].datas[j]/=tp;

         }

     }

 }

 void comp_dis(Mode *p,Mode *c,int n,int clusternum,double dis[][]) //初始化每个点和每个簇的距离

 {

     for(int i=; i<n; i++)

         for(int j=; j<clusternum; j++)

             dis[i][j]=getDistance(p[i],c[j]);

 }

 void comp_u(double dis[][],int n,int clusternum,double u[][])  //计算隶属度矩阵

 {

     for(int i=; i<n; i++)

     {

         double tp=;

         for(int j=;j<clusternum;j++)

             {

                 if(dis[i][j]<eps_dis)  //如果这个点很接近一个簇类中心，那么这个隶属度设为1，其他为0

                 {

                     for(int k=;k<clusternum;k++)

                         u[i][k]=;

                     u[i][j]=;

                     return;

                 }

                 tp+=/dis[i][j];

             }

         tp=/tp;

         for(int j=; j<clusternum; j++)

             u[i][j]=tp*(/dis[i][j]);

     }

 }

 void update_c(Mode *p,double u[][],int n,int clusternum,Mode *c)

 {

     int di=p[].di;

     for(int j=;j<clusternum;j++)

     {

         c[j].di=di;

         c[j].datas.clear();

         for(int i=;i<di;i++)

             c[j].datas.push_back();

         double tp=;

         for(int i=;i<n;i++)

         {

             for(int k=;k<di;k++)

                 c[j].datas[k]+=u[i][j]*u[i][j]*p[i].datas[k];

             tp+=u[i][j]*u[i][j];

         }

         for(int k=;k<di;k++)

             c[j].datas[k]/=tp;

     }

 }

 double comp_obj_func(double u[][],double dis[][],int n,int clusternum,int di)

 {

     double sum=;

     for(int i=;i<n;i++)

         for(int j=;j<clusternum;j++)

             sum+=u[i][j]*u[i][j]*dis[i][j];

     return sum;

 }

 void FCM(Mode *p,int n,int di,int clusternum,vector<vector<Mode> > &ans)        //in: n,d,c       time:O(c*n*d) 时间复杂度=聚类数*点数*维数

 {

     int index=;

     double sum=,psum;

     Mode c[]; //聚类中心

     double dis[N][]; //距离

     double u[N][];  //隶属度矩阵

     init_c(p,n,clusternum,c); // 初始化聚类中心  time: O(c)

     comp_dis(p,c,n,clusternum,dis); //更新距离矩阵dis

     while()

     {

         index++;

         printf("第%d次循环----------------------------------------\n",index);

         comp_u(dis,n,clusternum,u);  //计算隶属度矩阵u  time:O(n*c);

         for(int i=;i<n;i++)

         {

             printf("第%d个点的隶属值\n",i+);

             for(int j=;j<clusternum;j++)

             {

                 printf("%f ",u[i][j]);

             }

             printf("\n");

         }

         update_c(p,u,n,clusternum,c);   //更新聚类中心 time:O(c*(2*d+(n*d))) = O(c*n*d)

         comp_dis(p,c,n,clusternum,dis); //重新计算距离矩阵

         psum=sum;

         sum=comp_obj_func(u,dis,n,clusternum,di);

         printf("函数值=%f\n",sum);

         if(fabs(psum-sum)<eps)

             break;

     }

     for(int i=;i<clusternum;i++)

     {

         vector<Mode> m;

         ans.push_back(m);

     }

     for(int i=;i<n;i++)

     {

         double tp=-;

         int index=;

         for(int j=;j<clusternum;j++)

         {

             if(u[i][j]>tp)

             {

                 tp=u[i][j];

                 index=j;

             }

         }

         ans[index].push_back(p[i]);

     }

 }

模糊c-means算法的c++实现的更多相关文章

Fuzzy C Means 算法及其 Python 实现——写得很清楚，见原文
Fuzzy C Means 算法及其 Python 实现转自:http://note4code.com/2015/04/14/fuzzy-c-means-%E7%AE%97%E6%B3%95%E5% ...
K－means算法
K-means算法很简单,它属于无监督学习算法中的聚类算法中的一种方法吧,利用欧式距离进行聚合啦. 解决的问题如图所示哈:有一堆没有标签的训练样本,并且它们可以潜在地分为K类,我们怎么把它们划分呢? ...
paper 104: 彩色图像高速模糊的懒惰算法
工程及源代码:快速模糊.rar 图像模糊算法有很多种,我们最常见的就是均值模糊,即取一定半径内的像素值之平均值作为当前点的新的像素值,在一般的工业 ...
模糊C均值算法
Fuzzy C-Means读书笔记一.算法简介很显然,图中的数据集可分为两个簇.借鉴K-Means算法的思想,利用单个特殊的点(质心)表示一个簇.因此,我们用\(C_1\)和\(C_2\)分别表示 ...
KNN 与 K - Means 算法比较
KNN K-Means 1.分类算法聚类算法 2.监督学习非监督学习 3.数据类型:喂给它的数据集是带label的数据,已经是完全正确的数据喂给它的数据集是无label的数据,是杂乱无章的,经过 ...
FCM聚类算法介绍
FCM算法是一种基于划分的聚类算法,它的思想就是使得被划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最小.模糊C均值算法是普通C均值算法的改进,普通C均值算法对于数据的划分是硬性的,而FCM则 ...
《Single Image Haze Removal Using Dark Channel Prior》一文中图像去雾算法的原理、实现、效果（速度可实时）
最新的效果见 :http://video.sina.com.cn/v/b/124538950-1254492273.html 可处理视频的示例:视频去雾效果在图像去雾这个领域,几乎没有人不知道< ...
FCM算法
FCM算法是一种基于划分的聚类算法,它的思想就是使得被划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最小.模糊C均值算法是普通C均值算法的改进,普通C均值算法对于数据的划分是硬性的,而FCM则 ...
paper 105：《Single Image Haze Removal Using Dark Channel Prior》一文中图像去雾算法的原理、实现、效果及其他
在图像去雾这个领域,几乎没有人不知道<Single Image Haze Removal Using Dark Channel Prior>这篇文章,该文是2009年CVPR最佳论文.作者 ...
Matalab之模糊KMeans实现
这节继续上节的KMeans进行介绍,上节主要是对模糊KMeans方法的原理做了介绍,没有实践印象总是不深刻,前段时间有个师姐让我帮着写了个模糊KMeans的算法,今天就拿她给出的例子来对这个方法做个实 ...

随机推荐

linux中的文本处理命令
一.wc :统计文本的行数.字符数. -l:只显示行数 -d:只显示单词数 -c:只显示字符数二.tr:转换字符或者删除字符 -d:删除字符三.cut -d:指定分隔符 -f:指定要显示的字段例 ...
go语言学习基础-编译文件
1.创建工程在go的src目录下,比如我的go目录为/Users/yinxin/go,我创建文件夹 test路径为/Users/yinxin/go/src/test; 2.创建文件 main.go , ...
Unity 游戏框架搭建 2019 (二十一、二十二) 第三章简介&整理前的准备
整理前的准备到目前为止,我们积攒了很多示例了,并且每个示例也都贯彻了最的约定和规则. 在上一篇的小结也说了一个比较新的东西:编程体验优化. 在之前我们还积攒了一个问题:代码重复问题. 我们可是忍住整 ...
python--Django（三）视图
Django的视图不同于其他语言的MVC模式,Django采用的是MVT模式,即Model.View.Template,这里的View其实质就是其他语言中的Controller(emmm.....) ...
BadMethodCallException : Call to undefined method App\Models\Article::setContainer()
如果你执行 php artisan db:seed 发生如下错误说是模型中不存在静态方法 setContainer()方法,那么你应该检查下你的DatabaseSeeder.php 文件中的 r ...
Java第二十九天，文件及目录的管理，File类
一.基础知识点 1.路径分隔符 (1)什么是路径分隔符? 这个多被应用在环境变量设置当中,例如当我设置Path环境变量时,多个环境变量的路径要用 ':'(Windows系统用封号分隔)或 ':'(Li ...
多角度让你彻底明白yield语法糖的用法和原理及在C#函数式编程中的作用
如果大家读过dapper源码,你会发现这内部有很多方法都用到了yield关键词,那yield到底是用来干嘛的,能不能拿掉,拿掉与不拿掉有多大的差别,首先上一段dapper中精简后的Query方法,先让 ...
Python 1基础语法三(变量和标识符的区别)
一.字面量: 就是一个一个的值,如1.2.3.‘world’,就是它自己本身表达的字面值.字面意思,在程序中可以直接使用. 二.变量(variable): 可以用来保存字面量,变量本身没有任何意思:如 ...
35 编码 ASCII Unicode UTF-8 ,字符串的编码、io流的编码
* 编码表: * 信息在计算机上是用二进制表示的,这种表示法让人理解就很困难.为保证人类和设备,设备和计算机之间能进行正确的信息交换,人们编制的统一的信息交换代码,这就是ASCII码表 *ASCII ...
Linux CentOS7 开通端口外网端口访问权限
一.查看系统防火墙状态(如果返回 running 代表防火墙启动正常)firewall-cmd --state二.开启端口外网访问1.添加端口返回 success 代表成功(--permanent永 ...

模糊c-means算法的c++实现

模糊c-means算法的c++实现的更多相关文章

随机推荐

热门专题