K-means算法Java实现

public class KMeansCluster {

private int k;//簇的个数

private int num = 100000;//迭代次数

private List<double> datas;//原始样本集

private String address;//样本集路径

private List<point> data = new ArrayList<point>();

private AbstractDistance distance = new AbstractDistance() {

@Override

public double getDis(Point p1, Point p2) {

//欧几里德距离

return Math.sqrt(Math.pow(p1.getX() - p2.getX(), 2) + Math.pow(p1.getY() - p2.getY(), 2));

}

};

public KMeansCluster(int k, int num, String address) {

this.k = k;

this.num = num;

this.address = address;

}

public KMeansCluster(int k, String address) {

this.k = k;

this.address = address;

}

public KMeansCluster(int k, List<double> datas) {

this.k = k;

this.datas = datas;

}

public KMeansCluster(int k, int num, List<double> datas) {

this.k = k;

this.num = num;

this.datas = datas;

}

private void check() {

if (k == 0)

throw new IllegalArgumentException("k must be the number > 0");

if (address == null && datas == null)

throw new IllegalArgumentException("program can't get real data");

}

/**

* 初始化数据

*

* @throws java.io.FileNotFoundException

*/

public void init() throws FileNotFoundException {

check();

//读取文件，init data

//处理原始数据

for (int i = 0, j = datas.size(); i < j; i++)

data.add(new Point(i, datas.get(i), 0));

}

/**

* 第一次随机选取中心点

*

* @return

*/

public Set<point> chooseCenter() {

Set<point> center = new HashSet<point>();

Random ran = new Random();

int roll = 0;

while (center.size() < k) {

roll = ran.nextInt(data.size());

center.add(data.get(roll));

}

return center;

}

/**

* @param center

* @return

*/

public List<cluster> prepare(Set<point> center) {

List<cluster> cluster = new ArrayList<cluster>();

Iterator<point> it = center.iterator();

int id = 0;

while (it.hasNext()) {

Point p = it.next();

if (p.isBeyond()) {

Cluster c = new Cluster(id++, p);

c.addPoint(p);

cluster.add(c);

} else

cluster.add(new Cluster(id++, p));

}

return cluster;

}

/**

* 第一次运算，中心点为样本值

*

* @param center

* @param cluster

* @return

*/

public List<cluster> clustering(Set<point> center, List<cluster> cluster) {

Point[] p = center.toArray(new Point[0]);

TreeSet<distence> distence = new TreeSet<distence>();//存放距离信息

Point source;

Point dest;

boolean flag = false;

for (int i = 0, n = data.size(); i < n; i++) {

distence.clear();

for (int j = 0; j < center.size(); j++) {

if (center.contains(data.get(i)))

break;

flag = true;

// 计算距离

source = data.get(i);

dest = p[j];

distence.add(new Distence(source, dest, distance));

}

if (flag == true) {

Distence min = distence.first();

for (int m = 0, k = cluster.size(); m < k; m++) {

if (cluster.get(m).getCenter().equals(min.getDest()))

cluster.get(m).addPoint(min.getSource());

}

flag = false;

}

return cluster;

}

/**

* 迭代运算，中心点为簇内样本均值

*

* @param cluster

* @return

*/

public List<cluster> cluster(List<cluster> cluster) {

// double error;

Set<point> lastCenter = new HashSet<point>();

for (int m = 0; m < num; m++) {

// error = 0;

Set<point> center = new HashSet<point>();

// 重新计算聚类中心

for (int j = 0; j < k; j++) {

List<point> ps = cluster.get(j).getMembers();

int size = ps.size();

if (size < 3) {

center.add(cluster.get(j).getCenter());

continue;

}

// 计算距离

double x = 0.0, y = 0.0;

for (int k1 = 0; k1 < size; k1++) {

x += ps.get(k1).getX();

y += ps.get(k1).getY();

}

//得到新的中心点

Point nc = new Point(-1, x / size, y / size, false);

center.add(nc);

}

if (lastCenter.containsAll(center))//中心点不在变化，退出迭代

break;

lastCenter = center;

// 迭代运算

cluster = clustering(center, prepare(center));

// for (int nz = 0; nz < k; nz++) {

// error += cluster.get(nz).getError();//计算误差

// }

}

return cluster;

}

/**

* 输出聚类信息到控制台

*

* @param cs

*/

public void out2console(List<cluster> cs) {

for (int i = 0; i < cs.size(); i++) {

System.out.println("No." + (i + 1) + " cluster:");

Cluster c = cs.get(i);

List<point> p = c.getMembers();

for (int j = 0; j < p.size(); j++) {

System.out.println("\t" + p.get(j).getX() + " ");

}

System.out.println();

}

K-means算法Java实现的更多相关文章

k近邻算法-java实现
最近在看<机器学习实战>这本书,因为自己本身很想深入的了解机器学习算法,加之想学python,就在朋友的推荐之下选择了这本书进行学习. 一 . K-近邻算法(KNN)概述最简单最初级的分 ...
KNN 与 K - Means 算法比较
KNN K-Means 1.分类算法聚类算法 2.监督学习非监督学习 3.数据类型:喂给它的数据集是带label的数据,已经是完全正确的数据喂给它的数据集是无label的数据,是杂乱无章的,经过 ...
K－means算法
K-means算法很简单,它属于无监督学习算法中的聚类算法中的一种方法吧,利用欧式距离进行聚合啦. 解决的问题如图所示哈:有一堆没有标签的训练样本,并且它们可以潜在地分为K类,我们怎么把它们划分呢? ...
k近邻算法的Java实现
k近邻算法是机器学习算法中最简单的算法之一,工作原理是:存在一个样本数据集合,即训练样本集,并且样本集中的每个数据都存在标签,即我们知道样本集中每一数据和所属分类的对应关系.输入没有标签的新数据之后, ...
KNN算法java实现代码注释
K近邻算法思想非常简单,总结起来就是根据某种距离度量检测未知数据与已知数据的距离,统计其中距离最近的k个已知数据的类别,以多数投票的形式确定未知数据的类别. 一直想自己实现knn的java实现,但限于 ...
Floyd算法java实现demo
Floyd算法java实现,如下: https://www.cnblogs.com/Halburt/p/10756572.html package a; /** * ┏┓ ┏┓+ + * ┏┛┻━━━ ...
k-means算法Java一维实现
这里的程序稍微有点变形.k_means方法返回K-means聚类的若干中心点.代码: import java.util.ArrayList; import java.util.Collections; ...
感知机学习算法Java实现
感知机学习算法Java实现. Perceptron类用于实现感知机, 其中的perceptronOriginal()方法用于实现感知机学习算法的原始形式: perceptronAnother()方法用 ...
一致哈希算法Java实现
一致哈希算法(Consistent Hashing Algorithms)是一个分布式系统中经常使用的算法. 传统的Hash算法当槽位(Slot)增减时,面临全部数据又一次部署的问题.而一致哈希算法确 ...
机器学习实战笔记--k近邻算法
#encoding:utf-8 from numpy import * import operator import matplotlib import matplotlib.pyplot as pl ...

随机推荐

[Selenium] 使用自定义的FirefoxProfile
FirefoxProfile 用于定制待测试的Firefox 浏览器的特定属性,其中包括所存储的密码.书签.历史信息.Cookies等.某些测试用例需要用到特定的用户信息,因此可通过定制当前Firef ...
(转)Excel自定义格式详解
”G/通用格式”:以常规的数字显示,相当于”分类”列表中的”常规”选项.例:代码:”G/通用格式”.10显示为10:10.1显示为10.1. 2. “#”:数字占位符.只显有意义的零而不显示无意义的零 ...
bzoj2878 [Noi2012]迷失游乐园——概率期望DP
题目:https://www.lydsy.com/JudgeOnline/problem.php?id=2878 这个博客写得很好:https://www.cnblogs.com/qt666/p/72 ...
Laravel 在 Nginx 中的参考配置两份
此份参考自网络: server { listen 80; server_name laravel.app; root /项目目录/public; index index.php index.html ...
修改CentOS系统的默认启动级别
======修改CentOS系统的默认启动级别====== 现在的Linux系统安装完后就运行在第5个级别,即系统启动后直接进入图形界面,而不用在字符模式下登录后用startx或者xinit来起动图形 ...
android 四大组件详解
这个文章主要是讲Android开发的四大组件,本文主要分为一.Activity详解二.Service详解三.Broadcast Receiver详解四.Content Provider详解外加一个重 ...
PhpStorm之设置字体大小
1.点击左上角的File,再点击setting:(Ctrl+Alt+S) 2.进入 Editor / General,选择 Change font size (Zoom) with Ctrl+Mo ...
51nod 1050【DP】
思路: 就是先正常的dp一下求一个最大连续子串,然后特殊情况就是sum-最小连续子串.. 比一比谁大谁小就好了 #include <stdio.h> #include <string ...
poj1724【最短路】
题意: 给出n个城市,然后给出m条单向路,给出了每条路的距离和花费,问一个人有k coins,在不超过money的情况下从1到n最短路径路径. 思路: 我相信很多人在上面那道题的影响下,肯定会想想,在 ...
Spring AOP SpringBoot集成
上一篇文章<Spring AOP 面向切面编程入门>对AOP作了简要的介绍,包含一些专业术语的解释. 本文基于SpringBoot编写了一个简单的Spring AOPDemo. maven ...

K-means算法Java实现

K-means算法Java实现的更多相关文章

随机推荐

热门专题