KNN算法基本实例

　　KNN算法是机器学习领域中一个最基本的经典算法。它属于无监督学习领域的算法并且在模式识别，数据挖掘和特征提取领域有着广泛的应用。

给定一些预处理数据，通过一个属性把这些分类坐标分成不同的组。这就是KNN的思路。

　　下面，举个例子来说明一下。图中的数据点包含两个特征：

　　现在，给出数据点的另外一个节点，通过分析训练节点来把这些节点分类。没有分来的及诶但我们标记为白色，如下所示：

　　直观来讲，如果我们把那些节点花道一个图片上，我们可能就能确定一些特征，或组。现在，给一个没有分类的点，我们可以通过观察它距离那个组位置最近来确定它属于哪个组。意思就是，假如一个点距离红色的组最近，我们就可以把这个点归为红色的组。简而言之，我们可以把第一个点（2.5,7）归类为绿色，把第二个点（5.5,4.5）归类为红色。

　　算法流程：

　　假设m是训练样本的数量，p是一个未知的节点。

　　1 把所有训练的样本放到也数组arr[]中。这个意思就是这个数组中每个元素就可以使用元组（x,y）表示。

　　2 伪码

for i= to m:

  Calculate Euclidean distance d(arr[i], p).

　　3 标记设置S为K的最小距离。这里每个距离都和一个已经分类的数据点相关。

　　4 返回在S之间的大多数标签。

　　实际程序C代码：

// C++ program to find groups of unknown

// Points using K nearest neighbour algorithm.

#include <bits/stdc++.h>

using namespace std;

struct Point

{

    int val;     // Group of point

    double x, y;     // Co-ordinate of point

    double distance; // Distance from test point

};

// Used to sort an array of points by increasing

// order of distance

bool comparison(Point a, Point b)

{

    return (a.distance < b.distance);

}

// This function finds classification of point p using

// k nearest neighbour algorithm. It assumes only two

// groups and returns 0 if p belongs to group 0, else

// 1 (belongs to group 1).

int classifyAPoint(Point arr[], int n, int k, Point p)

{

    // Fill distances of all points from p

    for (int i = ; i < n; i++)

        arr[i].distance =

            sqrt((arr[i].x - p.x) * (arr[i].x - p.x) +

                 (arr[i].y - p.y) * (arr[i].y - p.y));

    // Sort the Points by distance from p

    sort(arr, arr+n, comparison);

    // Now consider the first k elements and only

    // two groups

    int freq1 = ;     // Frequency of group 0

    int freq2 = ;     // Frequency of group 1

    for (int i = ; i < k; i++)

    {

        if (arr[i].val == )

            freq1++;

        else if (arr[i].val == )

            freq2++;

    }

    return (freq1 > freq2 ?  : );

}

// Driver code

int main()

{

    int n = ; // Number of data points

    Point arr[n];

    arr[].x = ;

    arr[].y = ;

    arr[].val = ;

    arr[].x = ;

    arr[].y = ;

    arr[].val = ;

    arr[].x = ;

    arr[].y = ;

    arr[].val = ;

    arr[].x = ;

    arr[].y = ;

    arr[].val = ;

    arr[].x = ;

    arr[].y = ;

    arr[].val = ;

    arr[].x = 1.5;

    arr[].y = ;

    arr[].val = ;

    arr[].x = ;

    arr[].y = ;

    arr[].val = ;

    arr[].x = ;

    arr[].y = ;

    arr[].val = ;

    arr[].x = 3.8;

    arr[].y = ;

    arr[].val = ;

    arr[].x = ;

    arr[].y = ;

    arr[].val = ;

    arr[].x = 5.6;

    arr[].y = ;

    arr[].val = ;

    arr[].x = ;

    arr[].y = ;

    arr[].val = ;

    arr[].x = 3.5;

    arr[].y = ;

    arr[].val = ;

    arr[].x = ;

    arr[].y = ;

    arr[].val = ;

    arr[].x = ;

    arr[].y = ;

    arr[].val = ;

    arr[].x = ;

    arr[].y = ;

    arr[].val = ;

    arr[].x = ;

    arr[].y = ;

    arr[].val = ;

    /*Testing Point*/

    Point p;

    p.x = 2.5;

    p.y = ;

    // Parameter to decide groupr of the testing point

    int k = ;

    printf ("The value classified to unknown point"

            " is %d.\n", classifyAPoint(arr, n, k, p));

    return ;

}

　　实际程序python代码：

 # Python3 program to find groups of unknown

 # Points using K nearest neighbour algorithm.

 import math

 def classifyAPoint(points,p,k=):

     '''

      This function finds classification of p using

      k nearest neighbour algorithm. It assumes only two

      groups and returns  if p belongs to group , else

        (belongs to group ).

       Parameters -

           points : Dictionary of training points having two keys -  and

                    Each key have a list of training data points belong to that 

           p : A touple ,test data point of form (x,y)

           k : number of nearest neighbour to consider, default is

     '''

     distance=[]

     for group in points:

         for feature in points[group]:

             #calculate the euclidean distance of p from training points

             euclidean_distance = math.sqrt((feature[]-p[])** +(feature[]-p[])**)

             # Add a touple of form (distance,group) in the distance list

             distance.append((euclidean_distance,group))

     # sort the distance list in ascending order

     # and select first k distances

     distance = sorted(distance)[:k]

     freq1 =  #frequency of group

     freq2 =  #frequency og group 

     for d in distance:

         if d[] == :

             freq1 +=

         elif d[] == :

             freq2 += 

     return  if freq1>freq2 else 

 # driver function

 def main():

     # Dictionary of training points having two keys -  and

     # key  have points belong to class

     # key  have points belong to class 

     points = {:[(,),(,),(,),(,),(3.5,),(,),(,),(,)],

               :[(,),(,),(1.5,),(,),(,),(3.8,),(5.6,),(,),(,)]}

     # testing point p(x,y)

     p = (2.5,)

     # Number of neighbours

     k = 

     print("The value classified to unknown point is: {}".\

           format(classifyAPoint(points,p,k)))

 if __name__ == '__main__':

     main()

 # This code is contributed by Atul Kumar (www.fb.com/atul.kr.)

KNN算法基本实例的更多相关文章

《机学五》KNN算法及实例
一.概述 [定义]如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别. 二.距离计算公式两个样本的距离可以通过如下公式计算,又叫[欧式距 ...
KNN算法 - 数据挖掘算法（3）
(2017-04-10 银河统计) KNN算法即K Nearest Neighbor算法.这个算法是机器学习里面一个比较经典的.相对比较容易理解的算法.其中的K表示最接近自己的K个数据样本.KNN算法 ...
机器学习经典算法具体解释及Python实现--K近邻(KNN)算法
(一)KNN依旧是一种监督学习算法 KNN(K Nearest Neighbors,K近邻 )算法是机器学习全部算法中理论最简单.最好理解的.KNN是一种基于实例的学习,通过计算新数据与训练数据特征值 ...
【十大算法实现之KNN】KNN算法实例(含测试数据和源码)
KNN算法基本的思路是比较好理解的,今天根据它的特点写了一个实例,我会把所有的数据和代码都写在下面供大家参考,不足之处,请指正.谢谢! update:工程代码全部在本页面中,测试数据已丢失,建议去UC ...
【Machine Learning】KNN算法虹膜图片识别
K-近邻算法虹膜图片识别实战作者:白宁超 2017年1月3日18:26:33 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结 ...
KNN算法
1.算法讲解 KNN算法是一个最基本.最简单的有监督算法,基本思路就是给定一个样本,先通过距离计算,得到这个样本最近的topK个样本,然后根据这topK个样本的标签,投票决定给定样本的标签: 训练过程 ...
kNN算法python实现和简单数字识别
kNN算法算法优缺点: 优点:精度高.对异常值不敏感.无输入数据假定缺点:时间复杂度和空间复杂度都很高适用数据范围:数值型和标称型算法的思路: KNN算法(全称K最近邻算法),算法的思想很简单 ...
机器学习笔记--KNN算法1
前言 Hello ,everyone. 我是小花.大四毕业,留在学校有点事情,就在这里和大家吹吹我们的狐朋狗友算法---KNN算法,为什么叫狐朋狗友算法呢,在这里我先卖个关子,且听我慢慢道来. 一 K ...
KNN算法与Kd树
最近邻法和k-近邻法下面图片中只有三种豆,有三个豆是未知的种类,如何判定他们的种类? 提供一种思路,即:未知的豆离哪种豆最近就认为未知豆和该豆是同一种类.由此,我们引出最近邻算法的定义:为了判定未知 ...

随机推荐

Python基础与进阶
1 Python基础与进阶欢迎来到Python世界搭建编程环境变量 | 字符串 | 注释 | 错误消除他只用一张图,就把Python中的列表拿下了! 使用 If 语句进行条件测试使用字典更准 ...
linux学习第十三天 (Linux就该这么学)找到一本不错的Linux电子书
今天主要讲了vftp 服务的配置,不家三种访问方式一,匿名访问模式二,本地访问模式三,虚拟用户模式和,tftp简单文件传输协议也讲了要孝试的服务,sabma服务的配置,及wind ...
Django中发件邮箱的设定
Django中发件邮箱的设定: EMAIL_BACKEND = 'django.core.mail.backends.smtp.EmailBackend'#邮件发送到邮件服务器 #EMAIL_BACK ...
AX_CreateAndPostInventJournal
static void CreateAndPostInventJournal(Args _args) { InventJournalTable inventJournalTableLocal; Inv ...
Python爬虫学习--用Python结合Selenium实现明日之子节目直播时为自己喜欢的选手自动点赞拉票！！！
声明:本脚本纯属娱乐,请勿用来非法点赞拉票,任何使用不当造成的后果自行承担. 闲话: 明日之子第二季开始好久了,作者一直再追,特别喜欢里面那个酷酷的小哥-蔡泽明.前两天晋选9大厂牌,采取的是直播的形式 ...
CentOS7安装特定版本的Docker
查询可用版本 [root@bogon ~]# yum list docker-ce --showduplicates | sort -r 查询结果 * updates: centos.ustc.edu ...
Goldwave-5.7[逆向流程+算法分析]
目标程序:Goldwave 5.7 分析工具: 1.OllyDbg 2.IDAPro 目的:用C语言写Goldwave-5.7的注册机. 0x0思路: 1.注册机准备: 功能:输入用户名后经过计算输出 ...
(24)How generational stereotypes hold us back at work
https://www.ted.com/talks/leah_georges_how_generational_stereotypes_hold_us_back_at_work/transcript ...
通过TensorFlow训练神经网络模型
神经网络模型的训练过程其实质上就是神经网络参数的设置过程在神经网络优化算法中最常用的方法是反向传播算法,下图是反向传播算法流程图: 从上图可知,反向传播算法实现了一个迭代的过程,在每次迭代的开始,先 ...
Linux 使用记1 fastx toolkit安装问题
1 安装fastx toolkit的时候,步骤按https://blog.csdn.net/LotusWang0723/article/details/78723409 其中可能会出现如下报错 tex ...

KNN算法基本实例

KNN算法基本实例的更多相关文章

随机推荐

热门专题