现在进行第五步,对数据进行预测

那么要做的的是从数据集里面拿出一部分作为要预测的,剩下的去比较,书上使用的是10%

# 对之前做好的kNN算法进行预测
# 首先获取之前构造好的kNN分类器、数据、规则化之后的数据
import kNN
import norm
# 倒完包之后先别急,目的是从规则化的数据集里面选100个出来,用分类器进行预测,计算错误率
# 这里图简单,直接用的前100个进行预测,后面会打乱数据集进行真正的随机 labelSet = norm.labelSet
norm_data = norm.norm_data
random_ratio = 0.10
norm_num = len(norm_data) # 1000
predict_num = int(random_ratio * norm_num) # 100
errorNum = 0.0

然后进行预测,预测的思路是:

  • 100行预测,剩下900行作为比对
  • 每次取1行,然后经过分类器得出结果,再与标记的结果进行比较,看正误
  • 输出结果并计算错误率
# 开始预测
for i in range(predict_num):
predict_result = kNN.classifier(norm_data[i, :], norm_data[predict_num:norm_num, :], labelSet[predict_num:norm_num], 3)
# print(predict_result)
print("the classifier came back with:%d,the real answer is:%d " % (predict_result, labelSet[i]))
if predict_result != labelSet[i]:
errorNum += 1.0
print("the total error rate is:%f"%(errorNum/float(predict_num)))

然鹅,报错了

TypeError: unhashable type: 'numpy.ndarray'

这里的报错,网上找了很多,都没有解决,尝试自己一步一步解决

  • 首先,在kNN文件中使用classifier是没有问题的
  • 这里的错误指向的是kNN.classifier,但是检查了网上说的几种情况如变量名冲突、np.array类型都没有问题
  • 那么只有可能是kNN中classifier的数据类型出了问题
  • 通过报错提示的行数,将字典中的label类型从str修改为int,即可成功

修改代码如下

# kNN.py
label = int(label)

再次运行predict.py

# 对之前做好的kNN算法进行预测
# 首先获取之前构造好的kNN分类器、数据、规则化之后的数据
import kNN
import norm # 倒完包之后先别急,目的是从规则化的数据集里面选100个出来,用分类器进行预测,计算错误率
# 这里图简单,直接用的前100个进行预测,后面会打乱数据集进行真正的随机 labelSet = norm.labelSet
norm_data = norm.norm_data
random_ratio = 0.10
norm_num = len(norm_data) # 1000
predict_num = int(random_ratio * norm_num) # 100
errorNum = 0.0 # 开始预测
for i in range(predict_num):
predict_result = kNN.classifier(norm_data[i, :], norm_data[predict_num:norm_num, :], labelSet[predict_num:norm_num], 3)
# print(predict_result)
print("the classifier came back with:%d,the real answer is:%d " % (predict_result, labelSet[i]))
if predict_result != labelSet[i]:
errorNum += 1.0
print("the total error rate is:%f"%(errorNum/float(predict_num)))

结果如下

the classifier came back with:3,the real answer is:3
the classifier came back with:2,the real answer is:2
the classifier came back with:1,the real answer is:1
...
the classifier came back with:3,the real answer is:1
the total error rate is:0.050000

但是,这也会带来一个问题,那就是原来kNN中的预测会报错,因为原来标签是对应的str类型

kNN-预测的更多相关文章

  1. tensorflow knn 预测房价 注意有 Min-Max Scaling

    示例数据: 0.00632 18.00 2.310 0 0.5380 6.5750 65.20 4.0900 1 296.0 15.30 396.90 4.98 24.00 0.02731 0.00 ...

  2. 【Machine Learning】KNN算法虹膜图片识别

    K-近邻算法虹膜图片识别实战 作者:白宁超 2017年1月3日18:26:33 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结 ...

  3. 海伦去约会——kNN算法

    下午于屋中闲居,于是翻开<机器学习实战>一书看了看“k-邻近算法”的内容,并学习了一位很厉害的博主Jack Cui的代码,自己照着码了一遍.在此感谢博主Jack Cui的知识分享. 一.k ...

  4. KNN算法 - 数据挖掘算法(3)

    (2017-04-10 银河统计) KNN算法即K Nearest Neighbor算法.这个算法是机器学习里面一个比较经典的.相对比较容易理解的算法.其中的K表示最接近自己的K个数据样本.KNN算法 ...

  5. python机器学习---线性回归案例和KNN机器学习案例

    散点图和KNN预测 一丶案例引入 # 城市气候与海洋的关系研究 # 导包 import numpy as np import pandas as pd from pandas import Serie ...

  6. ES:AI 注释

    为AI做注解: AI已经出第三版,大的框架没有改变,DNN也没有引入AI这本书.第四版网络版应流出,不知道最终定版如何! 强化学习的方法有大幅度更新,但从策略系统更新范畴看来,没有什么实质的改变,只是 ...

  7. Python机器学习笔记 Grid SearchCV(网格搜索)

    在机器学习模型中,需要人工选择的参数称为超参数.比如随机森林中决策树的个数,人工神经网络模型中隐藏层层数和每层的节点个数,正则项中常数大小等等,他们都需要事先指定.超参数选择不恰当,就会出现欠拟合或者 ...

  8. 小数据玩转Pyspark(2)

    一.客户画像 客户画像应用:精准营销(精准预测.个性化推荐.联合营销):风险管控(高风险用户识别.异常用户识别.高可疑交易识别):运营优化(快速决策.产品组合优化.舆情分析.服务升级):业务创新(批量 ...

  9. 股票价格涨跌预测—基于KNN分类器

    code{white-space: pre;} pre:not([class]) { background-color: white; }if (window.hljs && docu ...

  10. [Python] 应用kNN算法预测豆瓣电影用户的性别

    应用kNN算法预测豆瓣电影用户的性别 摘要 本文认为不同性别的人偏好的电影类型会有所不同,因此进行了此实验.利用较为活跃的274位豆瓣用户最近观看的100部电影,对其类型进行统计,以得到的37种电影类 ...

随机推荐

  1. 时间工具类之"获取相差天数"

    一.时间工具类DateUtils之"获取相差天数" 1 /** 2 * 相差天数 3 * 4 * <p>TODO 方法功能描述 5 * 6 * @param start ...

  2. 寄存器、特殊功能寄存器和ram之间的区别联系

    存储器在CPU外,一般指硬盘,U盘等可以在切断电源后保存资料的设备,容量一般比较大,缺点是读写速度都很慢,普通的机械硬盘读写速度一般是50MB/S左右. 内存和寄存器就是为了解决存储器读写速度慢而产生 ...

  3. 9_根轨迹_Part3_分离点/汇合点和根的性质

  4. video元素和audio元素相关事件

    前言 在利用video元素或audio元素读取或播放媒体数据时,会触发一系列事件,如果用js脚本来捕抓这些事件,就可以对着这些事件进行处理了. 捕抓的方式有两种: 第一种是监听的方式.使用vedio或 ...

  5. css设置图片根据最大边自适应

    给新手的福利,还是记一下吧.......很简单 <div> <img src="1.jpg" alt=""> </div> ...

  6. Vulnhub 之 Earth

    靶机地址:https://www.vulnhub.com/entry/the-planets-earth,755/ Kali IP:192.168.56.104 下载OVA文件后,直接通过Virtua ...

  7. 一. 为什么要用SpringMVC框架

    以前是怎么做项目的.CoreServlet,起到一个中心处理器作用.所有的请求到服务器,服务器给CoreServlet,在里面处理所有表的增删改查,跳转也在里面做.以前做部门就是 DepServlet ...

  8. 今天记录一下h5跳转小程序,可以通过短信推广小程序

    今天记录一下h5跳转小程序最简单的方法,首先准备条件,是一个已经上线的小程序 根据URL Schame进行跳转,在微信公众平台登录自己的小程序,然后生成RL Schame,如下图 其次按照步骤进行小程 ...

  9. ADO访问Excel

    需要安装驱动:Microsoft Access Database Engine,可搜索下载,有64位和32位之分. 随便新建一个后缀名为udl的文件,双击打开.注意,现如今一般都是64位系统,双击打开 ...

  10. Java学习day14

    可变参数用作方法的形参,方法参数的个数就可变 格式:修饰符 返回值类型 方法名(数据类型...变量名){ } 方法内的形参只能有一个,这里的变量是一个数组 public static <T> ...