k-means算法Java一维实现
这里的程序稍微有点变形。
k_means方法返回K-means聚类的若干中心点。
代码:
import java.util.ArrayList;
import java.util.Collections; public class Prophet_kmeans {
private static final int MAXK = 100; private static int n = 0;
private static int K = 0; private static ArrayList<Double> k_means(ArrayList<Double> list) {
n = list.size();
K = MAXK;
if(K > n/4) K = n/2;
if(K == 0) K = n;
Collections.sort(list);
double[] point = new double[n];
int id = 0;
double minn = list.get(0), maxx = list.get(0);
for(double number : list) {
if(number < minn) minn = number;
if(number > maxx) maxx = number;
point[id++] = number;
}
double[] center = new double[K];
double delta = (maxx-minn) / K;
double p =minn + delta / 2;
for(int i=0;i<K;i++) {
center[i] = p;
p += delta;
}
int[] belong = new int[n];
for(int i=0;i<n;i++) belong[i] = 0;
double[] x_total = new double[K];
int[] x_cnt = new int[K];
for(int T=0;T<10;T++) { // T代表k means聚类迭代的次数
for(int i=0;i<n;i++) {
double min_dist = Math.abs(point[i] - center[belong[i]]);
for(int k=0;k<K;k++) {
double tmp_dist = Math.abs(point[i] - center[k]);
if(tmp_dist < min_dist) {
min_dist = tmp_dist;
belong[i] = k;
}
}
}
for(int i=0;i<K;i++) {
x_total[i] = 0;
x_cnt[i] = 0;
}
for(int i=0;i<n;i++) {
int k = belong[i];
x_total[k] += point[i];
x_cnt[k] ++;
}
for(int k=0;k<K;k++) {
if(x_cnt[k] == 0) continue;
center[k] = x_total[k] / (double)x_cnt[k];
}
}
ArrayList<Double> k_list = new ArrayList<Double>();
for(int k=0;k<K;k++) if(x_cnt[k] != 0) k_list.add(center[k]);
K = k_list.size();
return k_list;
} public static void main(String[] args) {
ArrayList<Double> list = new ArrayList<Double>();
list.add(1.0);
list.add(2.0);
list.add(3.0);
list.add(2.2);
list.add(2.1);
list.add(1.5);
list.add(9.9);
list.add(7.5);
list.add(8.8);
list.add(6.9);
list.add(8.7);
ArrayList<Double> ansList = k_means(list);
System.out.println("K == " + K);
for(double number : ansList) {
System.out.println(number);
}
} }
输出结果如下:
K == 4
1.25
2.325
7.2
9.133333333333333
k-means算法Java一维实现的更多相关文章
- k近邻算法-java实现
最近在看<机器学习实战>这本书,因为自己本身很想深入的了解机器学习算法,加之想学python,就在朋友的推荐之下选择了这本书进行学习. 一 . K-近邻算法(KNN)概述 最简单最初级的分 ...
- KNN 与 K - Means 算法比较
KNN K-Means 1.分类算法 聚类算法 2.监督学习 非监督学习 3.数据类型:喂给它的数据集是带label的数据,已经是完全正确的数据 喂给它的数据集是无label的数据,是杂乱无章的,经过 ...
- K-means算法
K-means算法很简单,它属于无监督学习算法中的聚类算法中的一种方法吧,利用欧式距离进行聚合啦. 解决的问题如图所示哈:有一堆没有标签的训练样本,并且它们可以潜在地分为K类,我们怎么把它们划分呢? ...
- k近邻算法的Java实现
k近邻算法是机器学习算法中最简单的算法之一,工作原理是:存在一个样本数据集合,即训练样本集,并且样本集中的每个数据都存在标签,即我们知道样本集中每一数据和所属分类的对应关系.输入没有标签的新数据之后, ...
- KNN算法java实现代码注释
K近邻算法思想非常简单,总结起来就是根据某种距离度量检测未知数据与已知数据的距离,统计其中距离最近的k个已知数据的类别,以多数投票的形式确定未知数据的类别. 一直想自己实现knn的java实现,但限于 ...
- Floyd算法java实现demo
Floyd算法java实现,如下: https://www.cnblogs.com/Halburt/p/10756572.html package a; /** * ┏┓ ┏┓+ + * ┏┛┻━━━ ...
- <转>从K近邻算法、距离度量谈到KD树、SIFT+BBF算法
转自 http://blog.csdn.net/likika2012/article/details/39619687 前两日,在微博上说:“到今天为止,我至少亏欠了3篇文章待写:1.KD树:2.神经 ...
- KMeans (K均值)算法讲解及实现
算法原理 KMeans算法是典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大.该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标 ...
- 机器学习 Python实践-K近邻算法
机器学习K近邻算法的实现主要是参考<机器学习实战>这本书. 一.K近邻(KNN)算法 K最近邻(k-Nearest Neighbour,KNN)分类算法,理解的思路是:如果一个样本在特征空 ...
随机推荐
- opencv图像处理
#coding=utf-8 import cv2 import numpy as np img1 = cv2.imread("3.jpg") img2 = cv2.imread(& ...
- yii控制布局方式
1:在控制器内成员变量设置 public $layout = false; //不使用布局 public $layout = “main”; //设置使用的布局文件 2:在控制器成员方法内设置 $th ...
- linux杀毒软件clamav安装与使用
#clamav安装与使用 ###第一步:Clamav下载http://www.clamav.net/downloads wget http://www.clamav.net/downloads/pro ...
- Linux(CentOS7)下发送邮件(使用Gmail作为发件服务器)
参考下述文章的思路,补充了在Gmail上的相关设置 https://gist.github.com/ilkereroglu/aa6c868153d1c5d57cd8 1.安装mailx yum ins ...
- PentesterLab-From SQL Injection to Shell
一.打开靶机ip出现如下界面: 随便点一下,点到test链接,访问了如下url:http://192.168.109.131/cat.php?id=1,这里出现了一个id,常规思路这个位置可能有sql ...
- MySQL笔记之多表
貌似很久不写博客了,趁着项目刚完结,记录一下这段时间了解到的一些认识,或许有些地方理解的还不够到位,看到的希望能不吝赐教. 外键 概念 与索引的关系 写法 查询 一对多多对一查询 多对多查询 插入 多 ...
- kd树 求k近邻 python 代码
之前两篇随笔介绍了kd树的原理,并用python实现了kd树的构建和搜索,具体可以参考 kd树的原理 python kd树 搜索 代码 kd树常与knn算法联系在一起,knn算法通常要搜索k近邻, ...
- 为Java程序员金三银四精心挑选的五十道面试题与答案
1.面向对象的特征有哪些方面? [基础] 答:面向对象的特征主要有以下几个方面: 1)抽象:抽象就是忽略一个主题中与当前目标无关的那些方面,以便更充分地注意与当前目标有关的方面.抽象并不打算了解全部问 ...
- 【剑指offer】 和为s的连续正数序列,C++实现
原创博文,转载请注明出处! # 题目 # 思路 设置两个辅助变量small和big,small表示序列的最小值,big表示序列的最大值.如果sum(small ~ big) > s,则增大sma ...
- JVM原理二----JAVA虚拟机体系结构
组成: 指令集,寄存器,栈,无用单元收集(GC),方法区域.JAVA核心 1,指令集:这个不太清楚 2,寄存器:和处理器中的寄存器类似 pc:Java程序计数器. optop:指向*作数栈顶端的指针. ...