K-means (PRML) in C++

原始数据

#include <iostream>
#include <fstream>
#include <sstream>
#include <vector>
#include <string>
#include <algorithm>
#include <numeric>
#include <cmath>
#include <limits>

template <class T>
void ReadDataFromFile(const std::string &filename, std::vector<std::vector<T> > &vv_data) {
std::ifstream vm_info(filename.c_str());
T x, y;
std::vector<T> v_data;

while(!vm_info.eof()) {
v_data.clear();
vm_info >> x >> y;
v_data.push_back(x);
v_data.push_back(y);
vv_data.push_back(v_data);
}
vm_info.close();
}

template <class T>
void Display2DVector(std::vector<std::vector<T> > &vv) {
for(size_t i=0;i<vv.size();++i) {
for(typename::std::vector<T>::const_iterator it=vv.at(i).begin();it!=vv.at(i).end();++it) {
std::cout<<*it<<" ";
}
std::cout<<"\n";
}
std::cout<<"--------the total of the 2DVector is "<<vv.size()<<std::endl;
}

template <class T>
void AddIndicator(std::vector<std::vector<T> > &vv, const int &k) {
for(size_t i=0; i<vv.size(); ++i) {
for(size_t j=0; j<k; ++j) {
vv.at(i).push_back(0);
}
}
}

template <class T1, class T2>
void UpdateIndicator(std::vector<std::vector<T1> > &vv, const std::vector<T2> &u, const int &k) {
for(size_t i=0; i<vv.size(); ++i) {
double dis=std::numeric_limits<double>::max(), dis_min, cluster;
for(size_t j=0; j<k; ++j) {
dis_min=pow(vv.at(i).at(0)-u.at(j*2), 2.0)+pow(vv.at(i).at(1)-u.at(j*2+1), 2.0);
if(dis_min < dis) {
dis=dis_min;
cluster=j;
}
}
vv.at(i).at(cluster+2)=1;
}
}

template <class T1, class T2>
void UpdateMeans(const std::vector<std::vector<T1> > &vv, std::vector<T2> &u, const int &k) {
std::vector<T2> sum_set(u.size(), 0);

for(size_t i=0; i<k; ++i) {
double sum_indi=0.0;
for(size_t j=0; j<vv.size(); ++j) {
sum_indi+=vv.at(j).at(i+2);
sum_set.at(i*2)+=vv.at(j).at(i+2)*vv.at(j).at(0);
sum_set.at(i*2+1)+=vv.at(j).at(i+2)*vv.at(j).at(1);
}
sum_set.at(i*2)/=sum_indi;
sum_set.at(i*2+1)/=sum_indi;
}
u=sum_set;
}

template <class T1, class T2>
double DistortionMeasure(const std::vector<std::vector<T1> > &vv, const std::vector<T2> &u, const int &k) {
double cost=0.0;
for(size_t i=0; i<vv.size(); ++i) {
for(size_t j=0; j<k; ++j) {
cost+=vv.at(i).at(j+2)*(pow(vv.at(i).at(0)-u.at(j*2), 2.0)+pow(vv.at(i).at(1)-u.at(j*2+1), 2.0));
}
}

return cost;
}

int main() {
int k=4;
double mean[]={39, 42, 70, 2, 230, 10, 190, 85};
std::vector<double> u(mean, mean+sizeof(mean)/sizeof(mean[0]));

std::string oridata="kmeans.dat";
std::vector<std::vector<double> > vv_data;

ReadDataFromFile(oridata, vv_data);

AddIndicator(vv_data, k);

std::cout<<"the original mean: \n";
for(std::vector<double>::const_iterator it=u.begin(); it!=u.end(); ++it) {
std::cout<<*it<<" ";
}
std::cout<<std::endl;

double cost_old=std::numeric_limits<double>::max();
while(true) {
double cost_new=DistortionMeasure(vv_data, u, k);

if(std::abs(cost_new-cost_old)<0.0000001)
break;

UpdateIndicator(vv_data, u, k);

UpdateMeans(vv_data, u, k);
cost_old=cost_new;
}

std::cout<<"the new mean: \n";
for(std::vector<double>::const_iterator it=u.begin(); it!=u.end(); ++it) {
std::cout<<*it<<" ";
}
std::cout<<std::endl;

return 0;
}

The two phases of re-assigning data points to clusters and re-computing the cluster means are repeated in turn until there is no further change in the assignments(or until some maximum number of iterations is exceeded).

K-means (PRML) in C++的更多相关文章

KNN 与 K - Means 算法比较
KNN K-Means 1.分类算法聚类算法 2.监督学习非监督学习 3.数据类型:喂给它的数据集是带label的数据,已经是完全正确的数据喂给它的数据集是无label的数据,是杂乱无章的,经过 ...
软件——机器学习与Python，聚类，K——means
K-means是一种聚类算法: 这里运用k-means进行31个城市的分类城市的数据保存在city.txt文件中,内容如下: BJ,2959.19,730.79,749.41,513.34,467. ...
快速查找无序数组中的第K大数？
1.题目分析: 查找无序数组中的第K大数,直观感觉便是先排好序再找到下标为K-1的元素,时间复杂度O(NlgN).在此,我们想探索是否存在时间复杂度 < O(NlgN),而且近似等于O(N)的高 ...
网络费用流-最小k路径覆盖
多校联赛第一场(hdu4862) Jump Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Ot ...
numpy.ones_like(a, dtype=None, order='K', subok=True)返回和原矩阵一样形状的1矩阵
Return an array of ones with the same shape and type as a given array. Parameters: a : array_like Th ...
当我们在谈论kmeans（2）
本稿为初稿,后续可能还会修改:如果转载,请务必保留源地址,非常感谢! 博客园:http://www.cnblogs.com/data-miner/ 其他:建设中- 当我们在谈论kmeans(2 ...
scikit-learn包的学习资料
http://scikit-learn.org/stable/modules/clustering.html#k-means http://my.oschina.net/u/175377/blog/8 ...
HDU 3584 Cube （三维树状数组）
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=3584 Cube Problem Description Given an N*N*N cube A, ...
Torch7学习笔记（二）nn Package
神经网络Package [目前还属于草稿版,等我整个学习玩以后会重新整理] 模块Module module定义了训练神经网络需要的所有基础方法,并且是可以序列化的抽象类. module有两种状态变量: ...
2016中国大学生程序设计竞赛 - 网络选拔赛 J. Alice and Bob
Alice and Bob Time Limit: 10000/5000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/Others) ...

随机推荐

ABP生成错误：必须添加对程序集“netstandard”的引用
当前使用ABP版本为:4.6.0 升级vs2017到15.4版本,升级framework到4.7版本如果Core版本请升级到net core 2
url取值乱码问题，url加中文导致页面不能加载问题 js unicode转码，以及解码
很多时候写H5或其他适配时,打不开url.很多原因是因为浏览器不支持中文url,从url拿出来的中文值也会乱码,这时候就必须把中文转化成Unicode值,去进行页面传值中文转Unicode fun ...
Math.floor() 与 parseInt()
parseInt()与Math.floor()都能实现数字的向下取整,但是两者存在根本上的差异,1.Math.floor()用于一个数的向下取整,不能解析字符串 <script type=&qu ...
8.2.3 覆写 Equals
经过对四种不同类型判等方法的讨论,我们不难发现不管是 Equals 静态方法.Equals 虚方法抑或==操作符的执行结果,都可能受到覆写 Equals 方法的影响.因此研究对象判等就必须将注意力 ...
Eclipse中使用struts标签时出错
原因是Action和ActionForm对应文件中没有继承相应的类,具体来说: ActionForm的编写: 必须继承org.apache.struts.action.ActionForm Actio ...
Sessions共享技术设计
概述分布式session是实现分布式部署的前提, 当前项目由于历史原因未实现分布式session, 但是由于在kubernets中部署多个pod时, 负载均衡的调用链太长, 导致会话不能保持, 所以 ...
Problem 29
Problem 29 Consider all integer combinations of ab for 2 ≤ a ≤ 5 and 2 ≤ b ≤ 5: 仔细看看以下a与b的组合 22=4, 2 ...
C#学习笔记_11_方法的隐藏和重写
11_方法的隐藏和重写方法的隐藏需要使用到关键字:new 方法的重写虚函数: 使用关键字virtual修饰的函数虚函数可以被子类隐藏,也可以被子类重写非虚函数只能被子类隐藏关键字:over ...
00110_Class类
1.Class 对象是在加载类时由 Java虚拟机以及通过调用类加载器中的 defineClass 方法自动构造的: 2.获取Class对象的三种方式 (1)方式一:通过Object类中的getObj ...
（43）. Spring Boot动态数据源（多数据源自动切换）【从零开始学Spring Boot】
在上一篇我们介绍了多数据源,但是我们会发现在实际中我们很少直接获取数据源对象进行操作,我们常用的是jdbcTemplate或者是jpa进行操作数据库.那么这一节我们将要介绍怎么进行多数据源动态切换.添 ...

K-means (PRML) in C++

K-means (PRML) in C++的更多相关文章

随机推荐

热门专题