k近邻算法的Java实现

k近邻算法是机器学习算法中最简单的算法之一，工作原理是：存在一个样本数据集合，即训练样本集，并且样本集中的每个数据都存在标签，即我们知道样本集中每一数据和所属分类的对应关系。输入没有标签的新数据之后，将新数据的每个特征和样本集中数据对应的特征进行比较，然后算法提取样本集中特征最相似数据的分类标签作为新数据的标签。一般来说，我们只选取样本数据中前k个最相似的数据。

Java实现:

KNNData.java

package KNN;

public class KNNData implements Comparable<KNNData>{

    double c1;

    double c2;

    double c3;

    double distance;

    String type;

    public KNNData(double c1, double c2, double c3, String type) {

        this.c1 = c1;

        this.c2 = c2;

        this.c3 = c3;

        this.type = type;

    }

    @Override

    public int compareTo(KNNData arg0) {

        return Double.valueOf(this.distance).compareTo(Double.valueOf(arg0.distance));

    }

}

KNN.java

package KNN;

import java.util.Collections;

import java.util.HashMap;

import java.util.Iterator;

import java.util.List;

import java.util.Map;

import java.util.Set;

public class KNN {

    //训练集

    private List<KNNData> KNNDS = null;

    public KNN(List<KNNData> KNNDS) {

        this.KNNDS = KNNDS;

    }

    //欧式距离

    private static double disCal(KNNData i, KNNData td) {

        return Math.sqrt((i.c1 - td.c1)*(i.c1 - td.c1)+(i.c2 - td.c2)*(i.c2 - td.c2)+

                (i.c3 - td.c3)*(i.c3 - td.c3));

    }

    private static String getMaxValueKey(int k, List<KNNData> ts){

        //只保留前k个元素

        while(ts.size() != k) {

            ts.remove(k);

        }

        String sKey;

        //保存key以及出现次数

        HashMap<String,Integer> keySet = new HashMap<String,Integer>();

        keySet.put(ts.get(0).type,1);

        for (int x = 1; x < ts.size(); x++) {

            sKey = ts.get(x).type;

            if (keySet.containsKey(sKey)) {

                keySet.put(sKey, keySet.get(sKey)+1);

            } else {

                keySet.put(sKey, 1);

            }

        }

        Set<Map.Entry<String,Integer>> set = keySet.entrySet();

        Iterator<Map.Entry<String,Integer>> iter = set.iterator(); 

        int mValue = 0;

        String mType = "";

        while (iter.hasNext()){

            Map.Entry<String,Integer> map = iter.next();

            if (mValue < map.getValue()) {

                mType = map.getKey();

                mValue = map.getValue();

            }

        }

        return mType;

    }

    public static String knnCal(int k, KNNData i, List<KNNData> ts) {

        //保存距离

        for (KNNData td : ts) {

            td.distance = disCal(i, td);

        }

        Collections.sort(ts);

        return getMaxValueKey(k, ts);

    }

}

KNNTest.java

package KNN;

import java.util.ArrayList;

import java.util.List;

public class KNNTest {

    public static void main(String[] args) {

        List<KNNData> kd = new ArrayList<KNNData>();

        //训练集

        kd.add(new KNNData(1.2,1.1,0.1,"A"));

        kd.add(new KNNData(1.2,1.1,0.1,"A"));

        kd.add(new KNNData(7,1.5,0.1,"B"));

        kd.add(new KNNData(6,1.2,0.1,"B"));

        kd.add(new KNNData(2,2.6,0.1,"C"));

        kd.add(new KNNData(2,2.6,0.1,"C"));

        kd.add(new KNNData(2,2.6,0.1,"C"));

        kd.add(new KNNData(100,1.1,0.1,"D"));

        System.out.println(KNN.knnCal(3, new KNNData(1.1,1.1,0.1,"N/A"), kd));

    }

}

k近邻算法的Java实现的更多相关文章

机器学习实战笔记--k近邻算法
#encoding:utf-8 from numpy import * import operator import matplotlib import matplotlib.pyplot as pl ...
基本分类方法——KNN(K近邻)算法
在这篇文章 http://www.cnblogs.com/charlesblc/p/6193867.html 讲SVM的过程中,提到了KNN算法.有点熟悉,上网一查,居然就是K近邻算法,机器学习的入门 ...
从K近邻算法谈到KD树、SIFT+BBF算法
转自 http://blog.csdn.net/v_july_v/article/details/8203674 ,感谢july的辛勤劳动前言前两日,在微博上说:“到今天为止,我至少亏欠了3篇文章 ...
机器学习之K近邻算法（KNN）
机器学习之K近邻算法(KNN) 标签: python 算法 KNN 机械学习苛求真理的欲望让我想要了解算法的本质,于是我开始了机械学习的算法之旅 from numpy import * import ...
k近邻算法
k 近邻算法是一种基本分类与回归方法.我现在只是想讨论分类问题中的k近邻法.k近邻算法的输入为实例的特征向量,对应于特征空间的点,输出的为实例的类别.k邻近法假设给定一个训练数据集,其中实例类别已定. ...
KNN K~近邻算法笔记
K~近邻算法是最简单的机器学习算法.工作原理就是:将新数据的每一个特征与样本集中数据相应的特征进行比較.然后算法提取样本集中特征最相似的数据的分类标签.一般来说.仅仅提取样本数据集中前K个最相似的数据 ...
机器学习03：K近邻算法
本文来自同步博客. P.S. 不知道怎么显示数学公式以及排版文章.所以如果觉得文章下面格式乱的话请自行跳转到上述链接.后续我将不再对数学公式进行截图,毕竟行内公式截图的话排版会很乱.看原博客地址会有更 ...
机器学习——KNN算法（k近邻算法）
一 KNN算法 1. KNN算法简介 KNN(K-Nearest Neighbor)工作原理:存在一个样本数据集合,也称为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分 ...
[机器学习] k近邻算法
算是机器学习中最简单的算法了,顾名思义是看k个近邻的类别,测试点的类别判断为k近邻里某一类点最多的,少数服从多数,要点摘录: 1. 关键参数:k值 && 距离计算方式 &&am ...

随机推荐

被解放的GPU CSS3动画加速
概念图形处理器( Graphics Processing Unit ) 专门用来处理在个人电脑.工作站或游戏机上图像运算工作显卡的“心脏” 90%以上的新型台式电脑和笔记本型电脑拥有集成图形处理器 ...
ACM 背包问题
背包问题时间限制:3000 ms | 内存限制:65535 KB 难度:3 描述现在有很多物品(它们是可以分割的),我们知道它们每个物品的单位重量的价值v和重量w(1<=v,w< ...
ACM：POJ 2739 Sum of Consecutive Prime Numbers-素数打表-尺取法
POJ 2739 Sum of Consecutive Prime Numbers Time Limit:1000MS Memory Limit:65536KB 64bit IO Fo ...
display: block; -webkit-margin-before: 1em; -webkit-margin-after: 1em; -webkit-margin-start: 0px; -webkit-margin-end: 0px;
总的来说:这是CSS3.0的对于文章段P容器的定义方法语句! display:block这个样式,只定义了P容器为一个块; 后面四句是CSS3中的样式定义方法: -webkit-margin-befo ...
NOIP欢乐模拟赛 T1 解题报告
小澳的方阵 (matrix.cpp/c/pas) [题目描述] 小澳最近迷上了考古,他发现秦始皇的兵马俑布局十分有特点,热爱钻研的小澳打算在电脑上还原这个伟大的布局. 他努力钻研,发现秦始皇布置兵马俑 ...
【noiOJ】p1481
1481:Maximum sum 查看提交统计提问总时间限制: 1000ms 内存限制: 65536kB 描述 Given a set of n integers: A={a1, a2,. ...
UVA 558 判定负环，spfa模板题
1.UVA 558 Wormholes 2.总结:第一个spfa,好气的是用next[]数组判定Compilation error,改成nexte[]就过了..难道next还是特殊词吗题意:科学家, ...
Java_关于App class loader的总结
Java本身是一种设计的非常简单,非常精巧的语言,所以Java背后的原理也很简单,归结起来就是两点: 1.JVM的内存管理理解了这一点,所有和对象相关的问题统统都能解决 2.JVM Class Lo ...
java使用poi读取ppt文件和poi读取excel、word示例
java使用poi读取ppt文件和poi读取excel.word示例 http://www.jb51.net/article/48092.htm
Node.js 手册查询-1-核心模块方法
Node.js 学习手册标签(空格分隔): node.js 模块核心模块核心模块是被编译成二进制代码,引用的时候只需require表示符即可 os 系统基本信息 os模块可提供操作系统的一些基本 ...

k近邻算法的Java实现

k近邻算法的Java实现的更多相关文章

随机推荐

热门专题