基于python 实现KNN 算法

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# @Time    : 2018/11/7 14:50

# @Author  : gylhaut

# @Site    : "http://www.cnblogs.com/gylhaut/"

# @File    : KNNAlgorithm.py

# @Software: PyCharm

# coding:utf-8

from numpy import *

import operator

##给出训练数据以及对应的类别

def createDataSet():

    group = array([[1.0, 2.0], [1.2, 0.1], [0.1, 1.4], [0.3, 3.5]])

    labels = ['A', 'A', 'B', 'B']

    return group, labels

###通过KNN进行分类

def classify(input, dataSet, label, k):

    '''

    :param input: test集

    :param dataSet: 训练集

    :param label: 训练output

    :param k: k值选择

    :return:

    '''

    dataSize = dataSet.shape[0] # 4

    ####计算欧式距离

    # print(tile(input, (dataSize, 1)))

    diff = tile(input, (dataSize, 1)) - dataSet

    sqdiff = diff ** 2

    squareDist = sum(sqdiff, axis=1)  ###行向量分别相加，从而得到新的一个行向量

    dist = squareDist ** 0.5

    #print(dist)

    ##对距离进行排序

    sortedDistIndex = argsort(dist)  ##argsort()根据元素的值从小到大对元素进行排序，返回下标

    #print(sortedDistIndex)

    classCount = {}

    for i in range(k):

        voteLabel = label[sortedDistIndex[i]]

        #print(voteLabel)

        ###对选取的K个样本所属的类别个数进行统计

        classCount[voteLabel] = classCount.get(voteLabel, 0) + 1

    ###选取出现的类别次数最多的类别

    #print(classCount)

    maxCount = 0

    for key, value in classCount.items():

        if value > maxCount:

            maxCount = value

            classes = key

    return classes

from numpy import *

dataSet,labels = createDataSet()

input = array([1.1,0.3])

K = 3

output = classify(input,dataSet,labels,K)

print("测试数据为:",input,"分类结果为：",output)

基于python 实现KNN 算法的更多相关文章

Python实现KNN算法及手写程序识别
1.Python实现KNN算法输入:inX:与现有数据集(1xN)进行比较的向量 dataSet:已知向量的大小m数据集(NxM) 个标签:数据集标签(1xM矢量) k:用于比较的邻居数 ...
Python实现KNN算法
Python实现Knn算法关键词:KNN.K-近邻(KNN)算法.欧氏距离.曼哈顿距离 KNN是通过测量不同特征值之间的距离进行分类.它的的思路是:如果一个样本在特征空间中的k个最相似(即特征空间 ...
基于OpenCV的KNN算法实现手写数字识别
基于OpenCV的KNN算法实现手写数字识别一.数据预处理 # 导入所需模块 import cv2 import numpy as np import matplotlib.pyplot as pl ...
[Python]基于K-Nearest Neighbors[K-NN]算法的鸢尾花分类问题解决方案
看了原理,总觉得需要用具体问题实现一下机器学习算法的模型,才算学习深刻.而写此博文的目的是,网上关于K-NN解决此问题的博文很多,但大都是调用Python高级库实现,尤其不利于初级学习者本人对模型的理 ...
[Python] 应用kNN算法预测豆瓣电影用户的性别
应用kNN算法预测豆瓣电影用户的性别摘要本文认为不同性别的人偏好的电影类型会有所不同,因此进行了此实验.利用较为活跃的274位豆瓣用户最近观看的100部电影,对其类型进行统计,以得到的37种电影类 ...
ML一：python的KNN算法
(1):list的排序算法: 参考链接:http://blog.csdn.net/horin153/article/details/7076321 示例: DisListSorted = sorted ...
利用Python实现kNN算法
邻近算法(k-NearestNeighbor) 是机器学习中的一种分类(classification)算法,也是机器学习中最简单的算法之一了.虽然很简单,但在解决特定问题时却能发挥很好的效果.因此,学 ...
基于Python协同过滤算法的认识
Contents 1. 协同过滤的简介 2. 协同过滤的核心 3. 协同过滤的实现 4. 协同过滤的应用 1. 协同过滤的简介关于协同过滤的一个最经典的例子就是看电影,有时候 ...
基于python 实现冒泡排序算法
#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/11/17 14:42 # @Author : gylhaut # @Site ...

随机推荐

MySQL数据类型的最优选择
MySQL数据类型的最优选择慎重选择数据类型很重要.为啥哩?可以提高性能.原理如下: ● 存储(内存.磁盘).从而节省I/O(检索相同数据情况下) ● 计算.进而 ...
CABasicAnimation动画
使用CABasicAnimation动画: CALayer *znzLayer; = [[CALayer alloc]init]; //创建不断该表CALayer的transform属性动画 CABa ...
Spark算子 - aggregate
释义将每个partition内元素进行聚合,然后将每个partition的聚合结果进行combine,得到最终聚合结果.最终结果允许跟原始RDD类型不同方法签名如下: def aggregate[ ...
2021美团安洵暗泉re部分复现
typora-copy-images-to: ./ 安洵杯 sign_in 贪吃蛇虽然没啥用 smc解密拿一下flag相关的部分倒着看看sub_40105F 和sub_401055函数写出解密算 ...
3、前端--伪元素选择器、选择器优先级、字体、背景、边框、display、盒子模型
伪元素选择器 # 首字调整>>>:也是一种文档布局的方式 p:first-letter { font-size: 48px; /*字体大小*/ color: red; } # 在文本 ...
Solution -「多校联训」种蘑菇
\(\mathcal{Description}\) Link. 给定一棵含有 \(n\) 个结点的树,设 \(S\) 为其中的非空联通子集,求 \[\sum_{S}(\gcd_{u\in S} ...
Note -「线性规划」学习笔记
\(\mathcal{Definition}\) 线性规划(Linear Programming, LP)形式上是对如下问题的描述: \[\operatorname{maximize}~~~~z= ...
leetcode算法1.两数之和
哈喽!大家好,我是[学无止境小奇],一位热爱分享各种技术的博主! [学无止境小奇]的创作宗旨:每一条命令都亲自执行过,每一行代码都实际运行过,每一种方法都真实实践过,每一篇文章都良心制作过. [学无止 ...
dart系列之:集合使用最佳实践
目录简介使用字面量创建集合不要使用.length来判断集合是否为空可遍历对象的遍历 List.from和iterable.toList where和whereType 避免使用cast 总结 ...
IDEA tomcat启动报错----Artifact is being deployed, please wait...解决
今天学习遇到了这个错误,记录下自己遇到的错误和解决方法! 这个报错的意思是: Artifact 正在部署中,请稍候- 实际上有可能就是jar包没有导进去.检查项目打包情况:file-->Proj ...

基于python 实现KNN 算法

基于python 实现KNN 算法的更多相关文章

随机推荐

热门专题