scikit_learn (sklearn)库中NearestNeighbors（最近邻）函数的各参数说明

NearestNeighbors(n_neighbors=5, radius=1.0, algorithm='auto', leaf_size=30, metric='minkowski', p=2, metric_params=None, n_jobs=None）

Parameters(参数):

n_neighbors（n邻域）:所要选用的最近邻的数目，相当于knn算法（k近邻算法）中的 k,(default = 5)，在设置此参数时输入的需为整形（int）。

radius（半径）:要使用的参数空间范围，在设置此参数时输入的需为浮点数（float）。

algorithm{‘auto’, ‘ball_tree’, ‘kd_tree’, ‘brute’}：即用于选取计算最近邻的算法：这里主要包括

　　　 ‘auto’ ：根据样本数据自动刷选合适的算法。

‘ball_tree’：构建“球树”算法模型。

‘kd_tree’ ：‘’kd树‘’算法。

‘brute’ ：使用蛮力搜索，即或相当于Knn算法，需遍历所有样本数据与目标数据的距离，进而按升序排序从而选取最近的K个值，采用投票得出结果。

（注意：拟合稀疏输入将覆盖此参数的设置，使用蛮力。）

leaf_size：叶的大小，针对算法为球树或KD树而言。这个设置会影响构造和查询的速度，以及存储树所需的内存。最优值取决于问题的性质。

metric：用于树的距离度量。默认度量是Minkowski，p=2等价于标准的欧几里德度量。有关可用度量的列表，可以查阅距离度量类的文档。如果度量是“预先计算的”，则假定X是距离矩阵，在拟合期间必须是平方。

p：Minkowski度量参数的参数来自sklearn.emeics.pairwise.pairwise_距离。当p=1时，这等价于使用曼哈顿距离(L1)，欧几里得距离(L2)等价于p=2时，对于任意的p，则使用Minkowski_距离(L_P)。

metric_params：度量函数的附加关键字参数，设置应为dict（字典）形式。

n_jobs：要为邻居搜索的并行作业的数量。None指1，除非在 joblib.parallel_backend背景。-1意味着使用所有处理器，若要了解相关的知识应该具体查找一下。

scikit_learn (sklearn)库中NearestNeighbors（最近邻）函数的各参数说明的更多相关文章

Python初探——sklearn库中数据预处理函数fit_transform()和transform()的区别
敲<Python机器学习及实践>上的code的时候,对于数据预处理中涉及到的fit_transform()函数和transform()函数之间的区别很模糊,查阅了很多资料,这里整理一下: ...
2.sklearn库中的标准数据集与基本功能
sklearn库中的标准数据集与基本功能下面我们详细介绍几个有代表性的数据集: 当然同学们也可以用sklearn机器学习函数来挖掘这些数据,看看可不可以捕捉到一些有趣的想象或者是发现: 波士顿房价数 ...
numpy函数库中一些常用函数的记录
##numpy函数库中一些常用函数的记录最近才开始接触Python,python中为我们提供了大量的库,不太熟悉,因此在<机器学习实战>的学习中,对遇到的一些函数的用法进行记录. (1) ...
查找库中的某个函数，grep命令的用法。
程序中调用了某个库中的函数,我想知道这个函数具体的作用,就必须去看这个库的源代码. 那么问题来了:如何从库中众多的.h文件中,得知我想要的函数在哪个文件里? 最后用grep命令成功解决. 具体用法:先 ...
支持向量机SVM知识梳理和在sklearn库中的应用
SVM发展史线性SVM=线性分类器+最大间隔间隔(margin):边界的活动范围.The margin of a linear classifier is defined as the width ...
STL库中的正态分布函数
在设计抽奖一类程序中,有时会需要一种概率“有较大可能获得一个普通结果,有较小可能获得一个糟糕或极好的结果”,这就可以用正态分布函数来获得这样一个结果. STL中已经提供了一系列随机分布的函数,包括正态 ...
jquery.rotate.js库中的rotate函数怎么用。
rotate是jQuery旋转rotate插件,支持Internet Explorer 6.0+ .Firefox 2.0 .Safari 3 .Opera 9 .Google Chrome,高级浏览 ...
Sklearn库例子1：Sklearn库中AdaBoost和Decision Tree运行结果的比较
DisCrete Versus Real AdaBoost 关于Discrete 和Real AdaBoost 可以参考博客:http://www.cnblogs.com/jcchen1987/p/4 ...
机器学习之numpy库中常用的函数介绍（一）
1. mat() mat()与array的区别: mat是矩阵,数据必须是2维的,是array的子集,包含array的所有特性,所做的运算都是针对矩阵来进行的. array是数组,数据可以是多维的,所 ...

随机推荐

微信小程序开发调试阶段不校验请求域名
在微信小程序开发官网上有说明: 在开发者工具的右上角有详情选项,可以勾选不校验合法域名,之后就可以与本地ip进行通信了!
洛谷P1192台阶问题（DP）
题目描述有NNN级的台阶,你一开始在底部,每次可以向上迈最多KKK级台阶(最少111级),问到达第NNN级台阶有多少种不同方式. 输入格式两个正整数N,K. 输出格式一个正整数,为不同方式数,由 ...
JAVA 常用包
JAVA是以包的形式进行语言结构组织的. 引入这些包的关键词就是 import 下面说说 JAVA常用包有下面的几个 1. java.lang 这个是默认引入的,也是一个最基础的包.其中lang不是中 ...
2.1.1Remove Duplicates from Sorted Arr
/* 题目:2.1.1 Remove Duplicates from Sorted Array Given a sorted array, remove the duplicates in place ...
剑指offer第二版速查表
3.数组中重复数字:每个位置放置数字与下标对应相等 O(n) 4.二维数组中的查找:右下角开始比较 O(m+n) 5.替换空格:python直接替换 6.从尾到头打印链表: 借助栈或直接利用系统调用栈 ...
CentOS7虚拟机优化
CentOS7: 将网卡配置重点关注的地方为: [root@master ~]# cat /etc/sysconfig/network-scripts/ifcfg-ens33 BOOTPROTO=st ...
centos上正式环境邮件发送失败问题
用celery异步发送邮件的时候遇到一个问题: 能接收到任务,但是就是执行不了, 也不报错发现可能是settIngs.py里设置的端口有问题, 现在设置的端口是25, 改成465, 并且把ssl打开 ...
Django--redis 保存session
pipenv install django-redis settings.py: # 作为 cache backend 使用配置使用redis保存session CACHES = { "d ...
win10系统黑屏无法显示桌面解决
适用情况:win10系统黑屏无法显示出桌面但是程序能正常运行时解决方法:win+r 调出运行窗口运行:Explorer.exe
吴裕雄 Bootstrap 前端框架开发——Bootstrap 排版：列表
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title> ...

scikit_learn (sklearn)库中NearestNeighbors（最近邻）函数的各参数说明

scikit_learn (sklearn)库中NearestNeighbors（最近邻）函数的各参数说明的更多相关文章

随机推荐

热门专题