【机器学*】k*邻算法-01

k临*算法（解决分类问题）：

　　已知数据集，以及该数据对应类型

　　给出一个数据x，在已知数据集中选择最接*x的k条数据，根据这k条数据的类型判断x的类型

具体实现：

from numpy import *

import operator

def createDataSet():

    group = array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])  #已知数据集

    labels = ['A','A','B','B']  #已知数据集对应的类型

    return group,labels

def classify0(inX,dataSet,lables,k):

    dataSetSize=dataSet.shape[0]    #dataset是4*2的二维数组，shape[0]=4,shape[1]=2

    diffMat=tile(inX,(dataSetSize,1))-dataSet   #tile(inX,(dataSetSize,1))=[inX,inX,inX,inX],1代表每行inX重复一次

    sqDiffMat=diffMat**2    #数组中每个值都**2

    sqDistances=sqDiffMat.sum(axis=1)   #sum(axis=？)第？个维度的相加，可理解为第？层[]里的元素相加

    distances=sqDistances**0.5  #数组中每个值都**0.5

    sortedDistIndicies=distances.argsort()  #argsort()从小到大返回索引

    classCount={}   #花括号{}：代表dict字典数据类型

    for i in range(k):

        voteIlabel=labels[sortedDistIndicies[i]]    #前i小的类型

        classCount[voteIlabel]=classCount.get(voteIlabel,0)+1   #dict.get(key, default=None) key找不到返回default

    sortedClassCount=sorted(classCount.items(),key=operator.itemgetter(1),reverse=True) #按字典第2个值排序，True表示从大到小排序

    return sortedClassCount[0][0]   #{(B,2),(A,1)} [0][0]代表B

group,labels=createDataSet()

print(classify0([0,0],group,labels,3))

【机器学】k邻算法-01的更多相关文章

机器学*——K*邻算法（KNN）
1 前言 Kjin邻法(k-nearest neighbors,KNN)是一种基本的机器学*方法,采用类似"物以类聚,人以群分"的思想.比如,判断一个人的人品,只需观察他来往最密切 ...
【机器学*】k*邻算法-02
k邻*算法具体应用:2-2约会网站配对心得体会: 1.对所有特征值进行归一化处理:将特征值单位带来的距离影响消除,使所有特征同权重--然后对不同的特征进行加权2.对于相互独立的特征,可以通过建立(特 ...
【机器学*】k-*邻算法（kNN）学*笔记
[机器学*]k-*邻算法(kNN) 学*笔记标签(空格分隔): 机器学* kNN简介 kNN算法是做分类问题的.思想如下: KNN算法的思想总结一下:就是在训练集中数据和标签已知的情况下,输入测试数 ...
【机器学*】k*邻算法-03
心得体会: 需要思考如何将现实对象转化为特征向量,设置特征向量时记住鸭子定律1 鸭子定律1 如果走路像鸭子.说话像鸭子.长得像鸭子.啄食也像鸭子,那它肯定就是一只鸭子事物的外在特征就是事物本质的表现 ...
【机器学*与R语言】2-懒惰学*K*邻（kNN）
目录 1.理解使用KNN进行分类 KNN特点 KNN步骤 1)计算距离 2)选择合适的K 3)数据准备 2.用KNN诊断乳腺癌 1)收集数据 2)探索和准备数据 3)训练模型 4)评估模型的性能 5) ...
K近邻算法：机器学习萌新必学算法
摘要:K近邻(k-NearestNeighbor,K-NN)算法是一个有监督的机器学习算法,也被称为K-NN算法,由Cover和Hart于1968年提出,可以用于解决分类问题和回归问题. 1. 为什么 ...
[机器学习系列] k-近邻算法（K–nearest neighbors）
C++ with Machine Learning -K–nearest neighbors 我本想写C++与人工智能,但是转念一想,人工智能范围太大了,我根本介绍不完也没能力介绍完,所以还是取了他的 ...
机器学习随笔01 - k近邻算法
算法名称: k近邻算法 (kNN: k-Nearest Neighbor) 问题提出: 根据已有对象的归类数据,给新对象(事物)归类. 核心思想: 将对象分解为特征,因为对象的特征决定了事对象的分类. ...
一步步教你轻松学KNN模型算法
一步步教你轻松学KNN模型算法( 白宁超 2018年7月24日08:52:16 ) 导读:机器学习算法中KNN属于比较简单的典型算法,既可以做聚类又可以做分类使用.本文通过一个模拟的实际案例进行讲解. ...

随机推荐

Hadoop入门常见错误及解决方案
常见错误及解决方案目录常见错误及解决方案 ResourceManager连接失败 root用户和ranan用户两个用户启动集群不统一不识别主机名 DataNode和NameNode进程同时只能工 ...
【MarkDown】--使用教程
MarkDown使用教程目录 MarkDown使用教程一. 常用设置 1.1 目录 1.2 标题 1.3 文本样式 (1)引用 (2)高亮 (3)强调 (4)水平线 (5)上下标 (6)插入代码 ...
Sharding-JDBC 实现水平分表
1.搭建环 (1) 技术: SpringBoot2.2.1+ MyBatisPlus + Sharding-JDBC + Druid 连接池(2)创建 SpringBoot 工程
JavaIO——File类
1.File文件类 File类(描述具体文件或文件夹的类):是唯一一个与文件本身操作有关的程序类,可完成文件的创建.删除.取得文件信息等操作.但不能对文件的内容进行修改. (1)File类的基本使用 ...
spring-dm 一个简单的实例
spring-dm2.0 运行环境,支持JSP页面运行spring web 项目需要引用包
@Order注解使用
注解@Order或者接口Ordered的作用是定义Spring IOC容器中Bean的执行顺序的优先级,而不是定义Bean的加载顺序,Bean的加载顺序不受@Order或Ordered接口的影响: @ ...
js实现点击不同按钮切换内容
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
注册页面的servlet
package cn.itcast.travel.web.servlet;import cn.itcast.travel.domain.ResultInfo;import cn.itcast.trav ...
C/C++语言结构体指针的使用
C/C++语言结构体指针的使用主要内容结构体的使用 - 定义,赋值,结构体指针结构体作为函数参数的使用指针的使用代码内容重点结构体的使用 - 定义,赋值,结构体指针结构体作为函数参数的使 ...
【JavaWeb】【MySQL】【edu01】jdbc.properties配置文件的编写
前提准备导入 mysql-connector-java-版本号的jar包下面为大家提供几个jar包下载地址点击进入下载界面 >>推荐 MySQL官方多版本选择点击进入下载界面 ...

【机器学*】k*邻算法-01

【机器学*】k*邻算法-01的更多相关文章

随机推荐

热门专题

【机器学】k邻算法-01

【机器学】k邻算法-01的更多相关文章