【python】kNN基础算法--分类和推荐系统

（1）k-近邻算法是分类数据最简单最有效的方法。
  （2）在将数据输入到分类器之前，必须将待处理数据的格式改变为分类器可以接受的格式。
  （3）所有的推荐模型都可以使用这个算法，只要将结果量化就行了，主要是要考虑权重的设计。
# -*- coding:utf-8 -*-
#数字型聚类分析

from numpy import *
import operator

def createDataSet():
  group = array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])
  labels = ['A','A','B','B']
  return group,labels

group,labels = createDataSet()  #这里的group不能直接用，需要这样子返回参数

def classify0(inX,dataSet,labels,k):              
    dataSetSize = dataSet.shape[0]   #shape[0]就是读取矩阵第一维度的长度
    diffMat = tile(inX,(dataSetSize,1)) - dataSet   
    #>>> tile(1,2)  >>>array([1, 1])
    #>>> tile((1,2,3),3)  >>>array([1, 2, 3, 1, 2, 3, 1, 2, 3])

    sqDiffMat = diffMat**2
    sqDistances = sqDiffMat.sum(axis=1)    #我们平时用的sum应该是默认的axis=0 就是普通的相加，而当加入axis=1以后就是将一个矩阵的每一行向量相加

    distances = sqDistances**0.5
    sortedDistIndicies = distances.argsort()   #排序


    classCount={}   #classCount={} 这是一个dict，用于存储不同标签出现的次数；

    for i in range(k):
        voteIlabel = labels[sortedDistIndicies[i]]
        classCount[voteIlabel] = classCount.get(voteIlabel,0)+1
    sortedClassCount = sorted(classCount.iteritems(),
     key=operator.itemgetter(1),reverse=True)
    return sortedClassCount[0][0]

classify0([0,0],group,labels,3)

【python】kNN基础算法--分类和推荐系统的更多相关文章

【python】kNN基础算法--推荐系统
虽然把text转成全部量化是可以的,但是还是需要把text转成numpy的形式(这个是必须掌握的) 在将数据输入到分类器之前,必须将待处理数据的格式改变为分类器可以接受的格式. 数据规范化.数据归一化 ...
【python】kNN基础算法--推荐系统（辅助研究）
# -*- coding:utf-8 -*- # import numpy as np #import numpy 和from numpy import *是不一样的 # # # import num ...
poj和hdu部分基础算法分类及难度排序
最近想从头开始刷点基础些的题,正好有个网站有关于各大oj的题目分类(http://www.pythontip.com/acm/problemCategory),所以写了点脚本把hdu和poj的一些题目 ...
Python之基础算法介绍
一.算法介绍 1. 算法是什么算法是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制.也就是说,能够对一定规范的输入,在有限时间内获得所要求的输 ...
python函数基础算法简介
一.多层语法糖本质 """ 语法糖会将紧挨着的被装饰对象名字当参数自动传入装饰器函数中""" def outter(func_name): ...
Python机器学习基础教程-第1章-鸢尾花的例子KNN
前言本系列教程基本就是摘抄<Python机器学习基础教程>中的例子内容. 为了便于跟踪和学习,本系列教程在Github上提供了jupyter notebook 版本: Github仓库: ...
kNN算法：K最近邻(kNN，k-NearestNeighbor)分类算法
一.KNN算法概述邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一.所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它 ...
数学建模：2.监督学习--分类分析- KNN最邻近分类算法
1.分类分析分类(Classification)指的是从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类的分析方法. 分类问题的应用场景:分 ...
Opencv学习之路—Opencv下基于HOG特征的KNN算法分类训练
在计算机视觉研究当中,HOG算法和LBP算法算是基础算法,但是却十分重要.后期很多图像特征提取的算法都是基于HOG和LBP,所以了解和掌握HOG,是学习计算机视觉的前提和基础. HOG算法的原理很多资 ...

随机推荐

解决 413 Request Entity Too Large
修改配置文件 vim /etc/nginx/sites-available/default,增加 client_max_body_size 1000m;//最大上传大小 proxy_connect_ ...
C 数组排序后输出至文件
如题 C实现 #include<stdio.h> #define COUNT 9 //数组长度+1 #define FILE_NAME "data.txt" //文件名 ...
入门 - k8s伸缩应用程序（六）
目标使用 kubectl 伸缩应用程序. Scaling(伸缩)应用程序在之前的文章中,我们创建了一个 Deployment,然后通过服务提供访问 Pod 的方式.我们发布的 Deployme ...
Android中常用布局
1.线性布局 LinearLayout orientation:方向:vertical,垂直:horizontal,水平 gravity:对齐方式,子控件相对于当前 ...
linux 批量替换文件内容及查找某目录下所有包含某字符串的文件
转载请注明来源:https://www.cnblogs.com/hookjc/ 1. sed C代码 grep -rl matchstring somedir/ | xargs sed -i 's ...
LaunchScreen原理
会自动加载LaunchScreen是因为在Target当中,指定了Launch Screen file 它的底层实现其实把LaunchScreen上的东西,生成了一张图片,然后把这张图片设为程序的启动 ...
python的namespace的理解
Python命名空间的本质 python中的名称空间是名称(标识符)到对象的映射. 具体来说,python为模块.函数.类.对象保存一个字典(__dict__),里面就是重名称到对象的映射. -- ...
netty系列之:不用怀疑,netty中的ByteBuf就是比JAVA中的好用
目录简介 ByteBuf和ByteBuffer的可扩展性不同的使用方法性能上的不同总结简介 netty作为一个优秀的的NIO框架,被广泛应用于各种服务器和框架中.同样是NIO,netty所依 ...
38、python并发编程之IO模型
目录: 一 IO模型介绍二阻塞IO(blocking IO) 三非阻塞IO(non-blocking IO) 四多路复用IO(IO multiplexing) 五异步IO(Asynchron ...
Solution Set -「ARC 107」
「ARC 107A」Simple Math Link. 答案为: \[\frac{a(a+1)\cdot b(b+1)\cdot c(c+1)}{8} \] 「ARC 107B」Quadrup ...

【python】kNN基础算法--分类和推荐系统

【python】kNN基础算法--分类和推荐系统的更多相关文章

随机推荐

热门专题