k-nearest neighbors algorithm - Wikipedia

  • https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm
  • Not to be confused with k-means clustering.
  • In pattern recognition, the k-nearest neighbors algorithm (k-NN) is a non-parametric method used for classification and regression.[1] In both cases, the input consists of the k closest training examples in the feature space. The output depends on whether k-NN is used for classification or regression.
  • k-NN is a type of instance-based learning, or lazy learning, where the function is only approximated locally and all computation is deferred until classification. The k-NN algorithm is among the simplest of all machine learning algorithms.

学习笔记之scikit-learn - 浩然119 - 博客园

  • https://www.cnblogs.com/pegasus923/p/9997485.html
  • 1.6. Nearest Neighbors — scikit-learn 0.20.2 documentation
    • https://scikit-learn.org/stable/modules/neighbors.html#nearest-neighbors-classification

Machine Learning with Python: k-Nearest Neighbor Classifier in Python

  • https://www.python-course.eu/k_nearest_neighbor_classifier.php

Refining a k-Nearest-Neighbor classification

  • https://www3.nd.edu/~steve/computing_with_data/17_Refining_kNN/refining_knn.html

1.13. Feature selection — scikit-learn 0.20.2 documentation

  • https://scikit-learn.org/stable/modules/feature_selection.html

K近邻法(KNN)原理小结 - 刘建平Pinard - 博客园

  • http://www.cnblogs.com/pinard/p/6061661.html
  • 1. KNN算法三要素
  • 2. KNN算法蛮力实现
  • 3. KNN算法之KD树实现原理
  • 4. KNN算法之球树实现原理
  • 5. KNN算法的扩展
  • 6. KNN算法小结

scikit-learn K近邻法类库使用小结 - 刘建平Pinard - 博客园

  • https://www.cnblogs.com/pinard/p/6065607.html
  • 1. scikit-learn 中KNN相关的类库概述
  • 2. K近邻法和限定半径最近邻法类库参数小结
  • 3. 使用KNeighborsClassifier做分类的实例

特征工程之特征选择 - 刘建平Pinard - 博客园

  • https://www.cnblogs.com/pinard/p/9032759.html

特征工程之特征表达 - 刘建平Pinard - 博客园

  • https://www.cnblogs.com/pinard/p/9061549.html

特征工程之特征预处理 - 刘建平Pinard - 博客园

  • https://www.cnblogs.com/pinard/p/9093890.html

精确率与召回率,RoC曲线与PR曲线 - 刘建平Pinard - 博客园

  • https://www.cnblogs.com/pinard/p/5993450.html

k selection

  • 设定区间范围,e.g. [1, 25],测试所有k再比较结果

Feature selection

  • ablation study : removing some “feature” of the model or algorithm, and seeing how that affects performance.

    • 注意如果去掉一个feature之后结果并没有变化,不能说明这个feature没用,原因可能是:

      • conditionally independant of the given feature : 其他feature对结果的影响跟它一样
      • 不相关feature
  • test with specified features only
    • 注意一个feature有可能跟其他feature一起配合才对结果有positive impact
  • test with all combination of features
    • 最全面的方法是覆盖所有组合,但是费时
    • 折中的方法是从上面两种测试结果中选择出一个小范围有用的feature list,然后测试feature list,跟all features比较性能

学习笔记之k-nearest neighbors algorithm (k-NN)的更多相关文章

  1. [机器学习系列] k-近邻算法(K–nearest neighbors)

    C++ with Machine Learning -K–nearest neighbors 我本想写C++与人工智能,但是转念一想,人工智能范围太大了,我根本介绍不完也没能力介绍完,所以还是取了他的 ...

  2. 机器学习算法-K-NN的学习 /ML 算法 (K-NEAREST NEIGHBORS ALGORITHM TUTORIAL)

    1为什么我们需要KNN 现在为止,我们都知道机器学习模型可以做出预测通过学习以往可以获得的数据. 因为KNN基于特征相似性,所以我们可以使用KNN分类器做分类. 2KNN是什么? KNN K-近邻,是 ...

  3. 2 kNN-K-Nearest Neighbors algorithm k邻近算法(一)

    给定训练数据样本和标签,对于某测试的一个样本数据,选择距离其最近的k个训练样本,这k个训练样本中所属类别最多的类即为该测试样本的预测标签.简称kNN.通常k是不大于20的整数,这里的距离一般是欧式距离 ...

  4. 2 kNN-K-Nearest Neighbors algorithm k邻近算法(二)

    2.3 示例:手写识别系统 2.3 .1 准备数据:将图像转换为测试向量 训练样本:trainingDigits 2000个例子,每个数字大约200个样本 测试数据:testDigits 大约900个 ...

  5. [PyTorch 学习笔记] 3.1 模型创建步骤与 nn.Module

    本章代码:https://github.com/zhangxiann/PyTorch_Practice/blob/master/lesson3/module_containers.py 这篇文章来看下 ...

  6. 机器学习实战(Machine Learning in Action)学习笔记————02.k-邻近算法(KNN)

    机器学习实战(Machine Learning in Action)学习笔记————02.k-邻近算法(KNN) 关键字:邻近算法(kNN: k Nearest Neighbors).python.源 ...

  7. 学习笔记之scikit-learn

    scikit-learn: machine learning in Python — scikit-learn 0.20.0 documentation https://scikit-learn.or ...

  8. Machine Learning In Action 第二章学习笔记: kNN算法

    本文主要记录<Machine Learning In Action>中第二章的内容.书中以两个具体实例来介绍kNN(k nearest neighbors),分别是: 约会对象预测 手写数 ...

  9. 学习笔记——k近邻法

    对新的输入实例,在训练数据集中找到与该实例最邻近的\(k\)个实例,这\(k\)个实例的多数属于某个类,就把该输入实例分给这个类. \(k\) 近邻法(\(k\)-nearest neighbor, ...

随机推荐

  1. Redis 当成数据库在使用和可靠的分布式锁,Redlock 真的可行么?

    怎样做可靠的分布式锁,Redlock 真的可行么? https://martin.kleppmann.com/2016/02/08/how-to-do-distributed-locking.html ...

  2. 2017.4.7 Sprng MVC工作流程描述图

    图一: 图二: Spring工作流程描述         1. 用户向服务器发送请求,请求被Spring 前端控制Servelt DispatcherServlet捕获:       2. Dispa ...

  3. web四则混合运算2

    一.设计思路: 先出题(String型)(上周已经实现),再写方法计算结果,加入控制有无乘除法,范围,参与计算数,出题数,页码显示等简单功能,有无括号和分数的计算目前还没能实现. 二.代码: 界面 & ...

  4. 20165313 《Java程序设计》第五周学习总结

    教材学习总结 下面是我认为的重点,不足之处还请谅解: 1内部类:在一个类中定义另一个类:外嵌类:包含内部类的类. 2内部类的类体中不能声明类变量和类方法:外嵌类的类体中可以用内部类声明对象. 3非内部 ...

  5. 《DSP using MATLAB》Problem 6.13

    代码: %% ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ %% Output In ...

  6. 《DSP using MATLAB》Problem 5.28

    昨晚手机在看X信的时候突然黑屏,开机重启都没反应,今天维修师傅说使用时间太长了,还是买个新的吧,心疼银子啊! 这里只放前两个小题的图. 代码: 1. %% ++++++++++++++++++++++ ...

  7. day39机器学习

    2 Numpy快速上手 2.1. 什么是Numpy Numpy是Python的一个科学计算的库 主要提供矩阵运算的功能,而矩阵运算在机器学习领域应用非常广泛 Numpy一般与Scipy.matplot ...

  8. day18-19 Storm

    课程介绍 课程名称:Storm是什么 课程目标: 通过该课程的学习能够了解离线计算与流式计算的区别.掌握Storm框架的基础知识.了解流式计算的一般架构图. 课程大纲: 1. 离线计算是什么? 2.  ...

  9. xencenter如何安装系统

    首先点击增加服务器 输入xenserver的ip和用户名以及密码 添加资源池,注意下面那个add new server也要指定一个server,例如刚刚创建的那个 还要搞一个存储的,注意iso要选择s ...

  10. MBR, EFI, 硬盘分区表

    文章目录 硬盘MBR详细介绍 结束柱面号(End cylinder)超过1023时怎么处理 grub stage 1 是如何引导grub stage 2 的 MBR和2TB的限制 (MBR/GPT/E ...