机器学习（6）K近邻算法

k-近邻，通过离你最近的来判断你的类别

例子：

定义：如果一个样本在特征空间中的k个最相似（即特征空间中最邻近的样本中大多数属于某一类别），则该样本属于这个类别

K近邻需要做标准化处理

例如：

import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier

def knn():
    '''
    k近邻预测消费花费
    :return:
    '''
    #读取数据
    data=pd.read_csv('data.csv')
    # print(data.info())
    data=data[['age','ageg','num','cost']]
    # print(data)
    #对数据的处理
    y=data[['cost']]
    x=data.drop('cost',axis=1)
    #划分训练集合测试集

    x_train,x_text,y_train,y_text=train_test_split(x,y,test_size=0.25)
    #标准化
    ss=StandardScaler()
    x_train=ss.fit_transform(x_train)
    x_text=ss.transform(x_text)
    #训练和预测
    y_train=y_train.astype(int)
    kn=KNeighborsClassifier(n_neighbors=5)
    kn.fit(x_train,y_train)

    y_predict=kn.predict(x_text)
    print('预测值',y_predict)
    print("++" * 100)
    x_text=np.array(x_text)
    print('原本的测试值',x_text)
    print('得分：',kn.score(x_text,y_text.astype(int)))
#训练，预测

    kn=KNeighborsClassifier()

    # data=data['id','']
    #数据处理

    #特征工程
if __name__ == '__main__':
    knn()

机器学习（6）K近邻算法的更多相关文章

机器学习之K近邻算法（KNN）
机器学习之K近邻算法(KNN) 标签: python 算法 KNN 机械学习苛求真理的欲望让我想要了解算法的本质,于是我开始了机械学习的算法之旅 from numpy import * import ...
【机器学习】k近邻算法（kNN）
一.写在前面本系列是对之前机器学习笔记的一个总结,这里只针对最基础的经典机器学习算法,对其本身的要点进行笔记总结,具体到算法的详细过程可以参见其他参考资料和书籍,这里顺便推荐一下Machine Le ...
第四十六篇入门机器学习——kNN - k近邻算法（k-Nearest Neighbors）
No.1. k-近邻算法的特点 No.2. 准备工作,导入类库,准备测试数据 No.3. 构建训练集 No.4. 简单查看一下训练数据集大概是什么样子,借助散点图 No.5. kNN算法的目的是,假如 ...
机器学习之K近邻算法
K 近邻 (K-nearest neighbor, KNN) 算法直接作用于带标记的样本,属于有监督的算法.它的核心思想基本上就是近朱者赤,近墨者黑. 它与其他分类算法最大的不同是,它是一种&quo ...
机器学习实战-k近邻算法
写在开头,打算耐心啃完机器学习实战这本书,所用版本为2013年6月第1版在P19页的实施kNN算法时,有很多地方不懂,遂仔细研究,记录如下: 字典按值进行排序首先仔细读完kNN算法之后,了解其是用 ...
【机器学习】K近邻算法——多分类问题
给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例的多数属于某个类,就把该类输入实例分为这个类. KNN是通过测量不同特征值之间的距离进行分类.它的的思路是:如 ...
机器学习2—K近邻算法学习笔记
Python3.6.3下修改代码中def classify0(inX,dataSet,labels,k)函数的classCount.iteritems()为classCount.items(),另外p ...
机器学习03：K近邻算法
本文来自同步博客. P.S. 不知道怎么显示数学公式以及排版文章.所以如果觉得文章下面格式乱的话请自行跳转到上述链接.后续我将不再对数学公式进行截图,毕竟行内公式截图的话排版会很乱.看原博客地址会有更 ...
[机器学习] k近邻算法
算是机器学习中最简单的算法了,顾名思义是看k个近邻的类别,测试点的类别判断为k近邻里某一类点最多的,少数服从多数,要点摘录: 1. 关键参数:k值 && 距离计算方式 &&am ...
机器学习：k-NN算法（也叫k近邻算法）
一.kNN算法基础 # kNN:k-Nearest Neighboors # 多用于解决分裂问题 1)特点: 是机器学习中唯一一个不需要训练过程的算法,可以别认为是没有模型的算法,也可以认为训练数据集 ...

随机推荐

THM武器化
Weaponization thm:https://tryhackme.com/room/weaponization 武器化了解和探索常见的红队武器化技术.您将学习使用业内常见的方法构建自定义有效载 ...
python selenium自动化火狐浏览器开代理IP服务器
前言 Selenium是一款用于自动化测试Web应用程序的工具,它可以模拟用户在浏览器中的各种行为.而代理IP服务器则是一种可以帮助用户隐藏自己真实IP地址的服务器,使得用户可以在互联网上更加匿名地进 ...
MQ系列13：消息大量堆积如何为解决
MQ系列1:消息中间件执行原理 MQ系列2:消息中间件的技术选型 MQ系列3:RocketMQ 架构分析 MQ系列4:NameServer 原理解析 MQ系列5:RocketMQ消息的发送模式 MQ系 ...
【python基础】复杂数据类型-字典（增删改查）
1.初识字典字典,是另外一种复杂的数据类型,相较于列表,字典可以将相关信息关联起来.比如说一个人的信息有名字.年龄.性别等,如果用列表存储的话,不能表示他们之间是相关联的,而字典可以,字典是一个或多 ...
驱动开发：内核LoadLibrary实现DLL注入
远程线程注入是最常用的一种注入技术,在应用层注入是通过CreateRemoteThread这个函数实现的,该函数通过创建线程并调用 LoadLibrary 动态载入指定的DLL来实现注入,而在内核层同 ...
助力长城汽车数据管道平台连接“数据孤岛”，加强数据一元化，Apache DolphinScheduler 的角色定位
讲师简介长城汽车-IDC-数据中台部-刘永飞高级工程师我是长城汽车 IDC-数据中台部的刘永飞,给大家分享一下我们自研的一个数据同步工具平台,以及在使用这个工具过程中遇到的问题.今天的分享主要有 ...
.NET Core(C#)使用Titanium.Web.Proxy实现Http(s)代理服务器监控HTTP请求
关于Titanium.Web.Proxy详细信息可以去这里仔细看看,这里只记录简单用法安装引用Titanium.Web.Proxy NuGet直接获取Titanium.Web.Proxy 使用配置 ...
用R语言实现并行计算：基于R的数据处理和分析工具
目录引言随着数据量的爆炸式增长,数据处理和分析的需求也越来越大.传统的批处理计算已经无法满足高效的数据处理和分析需求,因此,并行计算成为了一个重要的技术方向.然而,R语言作为一种开源.可视化能力强 ...
docker 安装redis 6.0.8哨兵集群（一主两从三哨兵）
准备三台主机并且安装了docker 192.168.31.132 192.168.31.134 192.168.31.144 linux 版redis6.0.8 下载下载地址:https://dow ...
5.2 基于ROP漏洞挖掘与利用
通常情况下栈溢出可能造成的后果有两种,一类是本地提权另一类则是远程执行任意命令,通常C/C++并没有提供智能化检查用户输入是否合法的功能,同时程序编写人员在编写代码时也很难始终检查栈是否会发生溢出,这 ...

机器学习（6）K近邻算法

机器学习（6）K近邻算法的更多相关文章

随机推荐

热门专题