Machine Learning in Action-chapter2-k近邻算法

一.numpy()函数

1.shape[]读取矩阵的长度

例：

import numpy as np

x = np.array([[1,2],[2,3],[3,4]])

print x.shape         //输出行列数 （3,2）

print x.shape[0]    //输出行数 3

print x.shape[1]    //输出列数 2

2.tile()函数

形式为tile(A,reps)

reps的数字从后往前分别对应A的第N个维度的重复次数。如tile（A,2）表示A的第一个维度重复2遍，tile（A,(2,3)）表示A的第一个维度重复3遍，然后第二个维度重复2遍，tile（A,(2,2,3)）表示A的第一个维度重复3遍，第二个维度重复2遍，第三个维度重复2遍。

例:

A=[1,2]

print '-----------tile(A,2)--------------'

print tile(A,2)

print '-----------tile(A,(2,2))----------'

print tile(A,(2,2))

print '-----------tile(2,2,3)------------'

print tile(A,(2,2,3))

　　输出结果为：

3.sum()函数

没有axis参数表示全部相加，axis＝0表示按列相加，axis＝1表示按照行的方向相加

例：

import numpy as np

x = np.array([[1,2,3],[4,5,6]])

k = x.sum()

k0 = x.sum(axis=0)

k1 = x.sum(axis=1)

print k

print k0

print k1

　　输出结果为：

4.argsort()函数

返回的是数组值从小到大的索引值

例：>>> x = np.array([3, 1, 2])
>>> np.argsort(x)
array([1, 2, 0])

-------------------------------k近邻算法源代码---------------------------------

def classify0(inX, dataSet, labels, k):

    dataSetSize = dataSet.shape[0]

    diffMat = tile(inX, (dataSetSize, 1)) - dataSet

    sqDiffMat = diffMat ** 2

    sqDistances = sqDiffMat.sum(axis=1)

    distances = sqDistances ** 0.5

    sortedDistIndicies = distances.argsort()

    classCount = {}

    for i in range(k):

        voteIlabel = labels[sortedDistIndicies[i]]

        classCount[voteIlabel] = classCount.get(voteIlabel, 0) + 1

    sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True)
    #sortedClassCount = sorted(classCount.iteritems(), key=lambda classCount:classCount[1], reverse=True)

    return sortedClassCount[0][0]

inX:输入向量

dataSet：训练样本

labels:标签向量

Machine Learning in Action-chapter2-k近邻算法的更多相关文章

K近邻 Python实现机器学习实战(Machine Learning in Action)
算法原理 K近邻是机器学习中常见的分类方法之间,也是相对最简单的一种分类方法,属于监督学习范畴.其实K近邻并没有显式的学习过程,它的学习过程就是测试过程.K近邻思想很简单:先给你一个训练数据集D,包括 ...
机器学习实战（Machine Learning in Action）学习笔记————08.使用FPgrowth算法来高效发现频繁项集
机器学习实战(Machine Learning in Action)学习笔记————08.使用FPgrowth算法来高效发现频繁项集关键字:FPgrowth.频繁项集.条件FP树.非监督学习作者:米 ...
机器学习实战（Machine Learning in Action）学习笔记————07.使用Apriori算法进行关联分析
机器学习实战(Machine Learning in Action)学习笔记————07.使用Apriori算法进行关联分析关键字:Apriori.关联规则挖掘.频繁项集作者:米仓山下时间:2018 ...
机器学习实战（Machine Learning in Action）学习笔记————06.k-均值聚类算法（kMeans）学习笔记
机器学习实战(Machine Learning in Action)学习笔记————06.k-均值聚类算法(kMeans)学习笔记关键字:k-均值.kMeans.聚类.非监督学习作者:米仓山下时间: ...
机器学习实战（Machine Learning in Action）学习笔记————02.k-邻近算法（KNN）
机器学习实战(Machine Learning in Action)学习笔记————02.k-邻近算法(KNN) 关键字:邻近算法(kNN: k Nearest Neighbors).python.源 ...
Machine Learning in Action(5) SVM算法
做机器学习的一定对支持向量机(support vector machine-SVM)颇为熟悉,因为在深度学习出现之前,SVM一直霸占着机器学习老大哥的位子.他的理论很优美,各种变种改进版本也很多,比如 ...
Machine Learning In Action 第二章学习笔记: kNN算法
本文主要记录<Machine Learning In Action>中第二章的内容.书中以两个具体实例来介绍kNN(k nearest neighbors),分别是: 约会对象预测手写数 ...
学习笔记之机器学习实战 (Machine Learning in Action)
机器学习实战 (豆瓣) https://book.douban.com/subject/24703171/ 机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中 ...
【机器学习】k近邻算法（kNN）
一.写在前面本系列是对之前机器学习笔记的一个总结,这里只针对最基础的经典机器学习算法,对其本身的要点进行笔记总结,具体到算法的详细过程可以参见其他参考资料和书籍,这里顺便推荐一下Machine Le ...
[机器学习] k近邻算法
算是机器学习中最简单的算法了,顾名思义是看k个近邻的类别,测试点的类别判断为k近邻里某一类点最多的,少数服从多数,要点摘录: 1. 关键参数:k值 && 距离计算方式 &&am ...

随机推荐

运输层（TCP/UDP）详解
TCP和UDP的区别: tcp是面向连接的可靠的传输协议 udp是非连接的不可靠的传输协议 TCP组成可以看到虽然tcp是面向字节流的,但是其传输的基本单位还是报文(tcp首部和数据,ip报文和ud ...
Spring学习（1）：侵入式与非侵入式，轻量级与重量级
一. 引言在阅读spring相关资料,都会提到Spring是非侵入式编程模型,轻量级框架,那么就有必要了解下这些概念. 二. 侵入式与非侵入式非侵入式:使用一个新的技术不会或者基本不改变原有代码结 ...
openstack-r版(rocky)搭建基于centos7.4 的openstack swift对象存储服务三
openstack-r版(rocky)搭建基于centos7.4 的openstack swift对象存储服务一 openstack-r版(rocky)搭建基于centos7.4 的openstac ...
基于C#的机器学习--面部和动态检测-图像过滤器
在本章中,我们将展示两个独立的例子,一个用于人脸检测,另一个用于动态检测,以及如何快速地将这些功能添加到应用程序中. 在这一章中,我们将讨论: 面部检测动态检测将检测添加到应用程序中面部检测人 ...
LeetCode 845——数组中的最长山脉
1. 题目 2. 解答 2.1 方法一 left 数组表示当前元素左边比当前元素小的元素个数,right 数组数组表示当前元素右边比当前元素小的元素个数.在山脉的中间 B[i] 处,其左边和右边肯定都 ...
使用qemu启动dd制作的img镜像
1. 准备工作应用场景在需要单机取证时,需要在不影响对象业务的情况下进行取证或分析,可以使用dd 对目标服务器进行镜像,生成img文件,镜像可以通过winhex进行静态分析.但是想要动态分析服务器 ...
LeetCode 289. Game of Life (C++)
题目: According to the Wikipedia's article: "The Game of Life, also known simply as Life, is a ce ...
Scrum立会报告+燃尽图（十月二十七日总第十八次）
此作业要求参见:https://edu.cnblogs.com/campus/nenu/2018fall/homework/2246 项目地址:https://git.coding.net/zhang ...
《C》VS控制台应用
源(c)文件:主要是源码,包括程序入口,函数的实现头(h)文件:主要是定义的函数声明资源(rc)文件:程序中用到的辅助资源,比如位图,图标资源解决VS2015安装后stdio.h ucrtd.l ...
《我是IT小小鸟》阅读心得
虽然读这本书是老师布置的作业,但是读了几页后就被书中的内容所吸引住了.或许是因为我也是学这个专业的,所以书中的一些内容让我觉得非常的有兴趣.作为一个学习软件工程的大一学生还没真正的认识到这个专业的深奥 ...

Machine Learning in Action-chapter2-k近邻算法

Machine Learning in Action-chapter2-k近邻算法的更多相关文章

随机推荐

热门专题