K邻近回归算法

代码：

 # -*- coding: utf-8 -*-

 """

 Created on Fri Jul 13 10:40:22 2018

 @author: zhen

 """

 import mglearn

 from sklearn.neighbors import KNeighborsRegressor

 from sklearn.model_selection import train_test_split

 import matplotlib.pyplot as plt

 import numpy as np

 x, y = mglearn.datasets.make_wave(n_samples=40)

 # 将wave数据集分为训练集和测试集

 x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=0)

 fig, axes = plt.subplots(1, 3, figsize=(15, 4))

 # 创建1000个数据点，在-3到3之间均匀分布

 line = np.linspace(-3, 3, 1000).reshape(-1, 1)

 for n_neighbors, ax in zip([1, 3, 9],axes):

     # 利用1个，3个和9个邻居分别进行预测

     reg = KNeighborsRegressor(n_neighbors=n_neighbors)

     reg.fit(x_train, y_train)

     ax.plot(line, reg.predict(line))

     ax.plot(x_train, y_train, '^', c=mglearn.cm2(0), markersize=8)

     ax.plot(x_test, y_test, 'v', c=mglearn.cm2(1), markersize=8)

     ax.set_title(

             "{} neighbor(s)\n train score:{:.2f} test score:{:.2f}".format(

                     n_neighbors, reg.score(x_train, y_train),

                     reg.score(x_test, y_test)))

     ax.set_xlabel("Feature")

     ax.set_ylabel("Target")

 axes[0].legend(["Model prediction", "Training data/target", "Test data/target"], loc="best")

结果：

总结：

　　K-NN的优点之一就是模型很容易理解，通常不需要过多调节就可以得到不错的性能。
在考虑使用更高级的技术之前，尝试此算法是一种很好的基准方法。
构建模型的速度通常很快，但如果训练集很大（特征数很多或样本基数很大），预测速度可能会比较慢。
因此，使用此算法之前进行数据预处理是很重要的！
此算法对特征数很多（几百或更多）的数据集效果往往不好，特别是稀疏数据集！

K邻近回归算法的更多相关文章

K邻近分类算法
# -*- coding: utf-8 -*- """ Created on Thu Jun 28 17:16:19 2018 @author: zhen "& ...
k邻近算法(KNN)实例
一 k近邻算法原理 k近邻算法是一种基本分类和回归方法. 原理:K近邻算法,即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例的多数属于某个类,就把该输入实 ...
kaggle赛题Digit Recognizer：利用TensorFlow搭建神经网络（附上K邻近算法模型预测）
一.前言 kaggle上有传统的手写数字识别mnist的赛题,通过分类算法,将图片数据进行识别.mnist数据集里面,包含了42000张手写数字0到9的图片,每张图片为28*28=784的像素,所以整 ...
《机器学习实战》学习笔记一K邻近算法
一. K邻近算法思想:存在一个样本数据集合,称为训练样本集,并且每个数据都存在标签,即我们知道样本集中每一数据(这里的数据是一组数据,可以是n维向量)与所属分类的对应关系.输入没有标签的新数据后,将 ...
Python实现kNN（k邻近算法）
Python实现kNN(k邻近算法) 运行环境 Pyhton3 numpy科学计算模块计算过程 st=>start: 开始 op1=>operation: 读入数据 op2=>op ...
监督学习——K邻近算法及数字识别实践
1. KNN 算法 K-近邻(k-Nearest Neighbor,KNN)是分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一.该方法的思路是:如果一个样本在特征空间中的k个最相似( ...
<机器学习实战>读书笔记--k邻近算法KNN
k邻近算法的伪代码: 对未知类别属性的数据集中的每个点一次执行以下操作: (1)计算已知类别数据集中的点与当前点之间的距离: (2)按照距离递增次序排列 (3)选取与当前点距离最小的k个点 (4)确定 ...
[机器学习实战] k邻近算法
1. k邻近算法原理: 存在一个样本数据集,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系.输入没有标签的新数据后,将新数据的每个特征与样本集中数据对 ...
机器学习基础——简单易懂的K邻近算法，根据邻居“找自己”
本文始发于个人公众号:TechFlow,原创不易,求个关注今天的文章给大家分享机器学习领域非常简单的模型--KNN,也就是K Nearest Neighbours算法,翻译过来很简单,就是K最近邻居 ...

随机推荐

设计模式之适配者模式——Java语言描述 | Amos H's blog
适配器模式是作为两个不兼容的接口之间的桥梁.这种类型的设计模糊属于结构性模式,它结合了两个独立接口的功能概念阐述使用适配器模式可以解决在软件系统中,将一些旧的类放入新环境中,但是新环境要求的接口旧 ...
2025战略，中秋送福利！免费开源ERP Odoo Windows 一键傻瓜式安装版发布
概述为了帮助更多的小白,能够快速的体验Odoo的强大功能,针对国内大多数小白用户无法快速直接体验Odoo的尴尬,开源智造呕心沥血,历经数百次的测试和整合终于赶在中秋节这天将Odoo所需要的复杂运行环 ...
安卓开发笔记（二十一）：Android Studio如何创建assets目录
方法如下: 因为在用WebView控件查看安卓内置网页的时候,必须创建这个资源文件夹,将网页放置在这个目录之下,默认是没有assets这个目录的,这样才可以实现网页代码html.css.javascr ...
Android利用RecyclerView实现列表倒计时效果
最近面试时,面试官问了一个列表倒计时效果如何实现,然后脑袋突然懵的了O(∩_∩)O,现在记录一下. 运行效果图实现思路实现方法主要有两个: 1.为每个开始倒计时的item启动一个定时器,再做更新i ...
Expand命令行详解
使用Expand命令行可以在计算机没有安装Windows操作系统的情况下应用批处理文件和脚本: 虽然有多个基于Windows的工具可以压缩和解压缩文件(包括WinZip和WinRAR),但是必须有一个 ...
Mysql中concat()、concat_ws()和 group_concat()的用法
一.CONCAT()函数CONCAT()函数用于将多个字符串连接成一个字符串.使用数据表Info作为示例,其中SELECT id,name FROM info LIMIT 1;的返回结果为+----+ ...
使用BeanUtils类实现DTO之间的同名属性复制
开发中经常碰到这样的场景,从数据库查询出来全部的字段,但是有些字段是不想给客户端看到,这时就需要将属性从DAO复制到传给客户端的DTO对象,如果采用get/set, 那显得很麻烦.可使用反射实现. ...
git命令设置
初始化为git项目: cd .../project //切换到项目目录下 git init //把project初始化为git项目 git remote add origin https://gi ...
git 建议使用
1 登录github官网首页创建一个项目 2 本地克隆下载git项目 git clone https://github.com/wangguoxingduanxuejing/branch-pract ...
Python爬虫入门教程 48-100 使用mitmdump抓取手机惠农APP-手机APP爬虫部分
1. 爬取前的分析 mitmdump是mitmproxy的命令行接口,比Fiddler.Charles等工具方便的地方是它可以对接Python脚本. 有了它我们可以不用手动截获和分析HTTP请求和响应 ...

K邻近回归算法

K邻近回归算法的更多相关文章

随机推荐

热门专题