【机器学*】k*邻算法-03

心得体会：

　　需要思考如何将现实对象转化为特征向量，设置特征向量时记住鸭子定律1

　　鸭子定律1 如果走路像鸭子、说话像鸭子、长得像鸭子、啄食也像鸭子，那它肯定就是一只鸭子

　　事物的外在特征就是事物本质的表现

# 2-3手写识别系统

#32*32转1*1024数组

def img2vector(filename):

    returnVect=zeros((1,1024))

    fr=open(filename)

    for i in range(32):

        lineStr=fr.readline()

        for j in range(32):

            returnVect[0,32*i+j]=int(lineStr[j])

    return returnVect

# testVector=img2vector("E:/Python/《机器学*实战》代码/Ch02/trainingDigits/0_0.txt")

# print(testVector[0,0:31])

#从os模块读取测试代码

import os

def handwritingClassTest():

    hwLabels=[]#数据结果

    trainingFileList=os.listdir("E:/Python/《机器学*实战》代码/Ch02/trainingDigits")

    m=len(trainingFileList)

    trainingMat=zeros((m,1024))#数据集

    for i in range(m):

        fileNameStr=trainingFileList[i]

        fileStr=fileNameStr.split('.')[0]

        classNumStr=int(fileStr.split('_')[0])

        hwLabels.append(classNumStr)

        trainingMat[i,:]=img2vector("E:/Python/《机器学*实战》代码/Ch02/trainingDigits/%s"%fileNameStr)

    errorCount=0.0

    testFileList=os.listdir("E:/Python/《机器学*实战》代码/Ch02/testDigits")

    mTest=len(testFileList)

    for i in range(mTest):

        fileNameStr = testFileList[i]

        fileStr = fileNameStr.split('.')[0]

        classNumStr = int(fileStr.split('_')[0])

        vectorUnderTest = img2vector("E:/Python/《机器学*实战》代码/Ch02/testDigits/%s" % fileNameStr)

        classifierResult=classify0(vectorUnderTest,trainingMat,hwLabels,3)

        if(classifierResult!=classNumStr):

            errorCount+=1

    print("error rate:%s"%(errorCount/float(mTest)))

handwritingClassTest()

【机器学】k邻算法-03的更多相关文章

机器学*——K*邻算法（KNN）
1 前言 Kjin邻法(k-nearest neighbors,KNN)是一种基本的机器学*方法,采用类似"物以类聚,人以群分"的思想.比如,判断一个人的人品,只需观察他来往最密切 ...
【机器学*】k*邻算法-02
k邻*算法具体应用:2-2约会网站配对心得体会: 1.对所有特征值进行归一化处理:将特征值单位带来的距离影响消除,使所有特征同权重--然后对不同的特征进行加权2.对于相互独立的特征,可以通过建立(特 ...
【机器学*】k-*邻算法（kNN）学*笔记
[机器学*]k-*邻算法(kNN) 学*笔记标签(空格分隔): 机器学* kNN简介 kNN算法是做分类问题的.思想如下: KNN算法的思想总结一下:就是在训练集中数据和标签已知的情况下,输入测试数 ...
【机器学*】k*邻算法-01
k临*算法(解决分类问题): 已知数据集,以及该数据对应类型给出一个数据x,在已知数据集中选择最接*x的k条数据,根据这k条数据的类型判断x的类型具体实现: from numpy import * ...
【机器学*与R语言】2-懒惰学*K*邻（kNN）
目录 1.理解使用KNN进行分类 KNN特点 KNN步骤 1)计算距离 2)选择合适的K 3)数据准备 2.用KNN诊断乳腺癌 1)收集数据 2)探索和准备数据 3)训练模型 4)评估模型的性能 5) ...
K近邻算法：机器学习萌新必学算法
摘要:K近邻(k-NearestNeighbor,K-NN)算法是一个有监督的机器学习算法,也被称为K-NN算法,由Cover和Hart于1968年提出,可以用于解决分类问题和回归问题. 1. 为什么 ...
[机器学习系列] k-近邻算法（K–nearest neighbors）
C++ with Machine Learning -K–nearest neighbors 我本想写C++与人工智能,但是转念一想,人工智能范围太大了,我根本介绍不完也没能力介绍完,所以还是取了他的 ...
机器学习03：K近邻算法
本文来自同步博客. P.S. 不知道怎么显示数学公式以及排版文章.所以如果觉得文章下面格式乱的话请自行跳转到上述链接.后续我将不再对数学公式进行截图,毕竟行内公式截图的话排版会很乱.看原博客地址会有更 ...
一步步教你轻松学KNN模型算法
一步步教你轻松学KNN模型算法( 白宁超 2018年7月24日08:52:16 ) 导读:机器学习算法中KNN属于比较简单的典型算法,既可以做聚类又可以做分类使用.本文通过一个模拟的实际案例进行讲解. ...

随机推荐

GISer如何突破二次开发瓶颈
年初时写的<一个GISer的使命>那篇文章中,提出了GISer的技术提升路径可以分为四个大的阶段: 阶段一,能使用商业GIS软件去解决问题. 阶段二,能使用开源GIS软件去解决问题. 阶段 ...
Android系统编程入门系列之硬件交互——多媒体麦克风
在多媒体摄像头及相关硬件文章中,对摄像头的使用方式需要区分应用程序的目标版本以使用不同的代码流程,而与之相比,麦克风硬件的使用就简单多了. 麦克风及相关硬件麦克风硬件在移动设备上作为音频的采集设备, ...
JavaScript 链表
------------恢复内容开始------------ 背景数组并不总是组织数据的最佳数据结构,原因如下.在很多编程语言中,数组的长度是固定的,所以当数组已被数据填满时,再要加入新的元素就会非 ...
Template Metaprogramming in C++
说实话,学习C++以来,第一次听说"Metaprogramming"这个名词. Predict the output of following C++ program. 1 #in ...
android获取路径目录方法
Environment常用方法: getExternalStrongeDirectory() 返回File,获取外部存储目录即SDCard getDownloadCacheDirectory() 返回 ...
Spring boot 数据源配置。
配置文件 : spring boot 配置文件有两种形式 ,一种是properties文件.一种是yml文件.案列使用properties文件. 数据源的默认配置 : spring boot 约定 ...
springMVC WebApplicationInitializer 替代web.xml 配置Servlet 之原理
Servlet 3.0之前 ,xml 配置在过去搭建spring + springMCV ,首先第一步要做的是什么 ,就是要配置web.xml 文件 ,把springMVC 中的Servlet 加 ...
HashMap、ConcurrentHashMap对比
1.hashmap的put的原理,hashmap的扩容及计算槽的算法,线程安全的hashtable.ConcurrentHashMap的区别是什么 1.1 hashMap的put原理什么时候变成红黑 ...
【C/C++】函数的分文件编写
创建同名的头文件(.h)和cpp文件. 在头文件里写函数声明,在cpp文件中写函数定义. 在cpp文件中写#include "xx.h" //自定义头文件名框架(include ...
ANTLR 相关术语
下面介绍很多重要的与语言识别相关的术语. 语言(Language) A language is a set of valid sentences 一门语言是一个有效语句的集合. Sentences a ...

【机器学*】k*邻算法-03

【机器学*】k*邻算法-03的更多相关文章

随机推荐

热门专题

【机器学】k邻算法-03

【机器学】k邻算法-03的更多相关文章