kNN(从文本文件中解析数据)
# 准备数据:从文本文件中解析数据
# 在kNN.py中创建名为file2matrix的函数,处理输入格式问题
# 该函数的输入为文件名字符串,输出为训练样本矩阵和类标签向量
# 将文本记录到转换Numpy的解析程序
def file2matrix(filename):
fr = open(filename)
arrayOLines = fr.readlines()
numberOfLines = len(arrayOLines) #得到文件行数
returnMat = zeros((numberOfLines,3)) #创建返回的Numpy矩阵
classLabelVector = []
index = 0
for line in arrayOLines: #解析文件数据列表
line = line.strip() #使用line.strip()截取掉所有的回车字符
listFromLine = line.split('\t') #使用tab字符\t将上一步得到的整行数据分割成一个元素列表
returnMat[index,:] = listFromLine[0:3] #选取前三个元素,存储到特征矩阵中
classLabelVector.append(int(listFromLine[-1])) #-1表示列表中的最后一列元素,存储到向量classLabelVector中
index += 1
return returnMat,classLabelVector
出现的错误
>>>reload(kNN)
Traceback (most recent call last):
File "<input>", line 1, in <module>
NameError: name 'reload' is not defined
如果你的python版本是Python 2.X:
import sys
reload(sys)
sys.setdefaultencoding("utf-8") 如果你的python版本是python 3.3:
import imp
imp.reload(sys) 注意:
1.Python 3与Python 2有很大的区别,其中Python 3系统默认使用的就是utf-8编码。
2. 所以,对于使用的是Python 3的情况,就不需要sys.setdefaultencoding("utf-8")这段代码。
3.最重要的是,Python 3的sys库里面已经没有setdefaultencoding()函数了。 如果你的python版本是python 3.4以及3.4以上:
import importlib
import sys
importlib.reload(sys))

kNN(从文本文件中解析数据)的更多相关文章
- Matlab中导入文本文件中的数据 矩阵合并 以及C++中删除文件操作
		今天用到了Matlab读取文本文件中按照一定格式存储好的数据,然后进行后续的分析计算等,因此涉及到Matlab的文件读取,记录在这里,供以后查阅: fid = fopen('train.set', ' ... 
- C#实现读写文本文件中的数据
		[1]首先我们定义一段假数据,这里以一个string为例字 static void Main(string[] args) { string data = &quo ... 
- 如何在FineReport中解析数据库内XML文件
		在数据库表中,其中字段XML所存的为xml格式数据在表xmltest中.那么在使用该表进行报表制作时,需要将存于xml字段中的值读取出来作为报表数据源. XML每条记录数据格式如下: <Fiel ... 
- Java基础知识强化之IO流笔记46:IO流练习之 把文本文件中数据存储到集合中的案例
		1. 把文本文件中数据存储到集合中 需求:从文本文件中读取数据(每一行为一个字符串数据)到集合中,并遍历集合. 分析: 通过题目的意思我们可以知道如下的一些内容, 数据 ... 
- Java基础知识强化之IO流笔记47:IO流练习之 随机获取文本文件中的姓名案例
		1. 随机获取文本文件中的姓名案例 需求:我有一个文本文件中存储了几个名称,请大家写一个程序实现随机获取一个人的名字. 分析: A: 把文本文件中的数据存储到集 ... 
- load data导txt文件进mysql中的数据
		1.实验内容: 利用SQL语句“load data ”将“.txt”文本文件中的数据导入到mysql中 2.实验过程: 首先我创了一个txt(也可以是其他的),设置其编码为utf-8,在windows ... 
- java往文本文件中写入信息并修改
		题目要求: 1.可以往一个文本文档中写入员工信息:name,id和详情 2.可以更改name package FanCQ.Xue.practice; import java.io.*;import j ... 
- CSS控制XML与通过js解析xml然后通过html显示xml中的数据
		使用CSS控制XML的显示 book.css bookname{ display:block;color:Red} author{ display:block;font-style:italic} p ... 
- Java基础知识强化之IO流笔记45:IO流练习之 把集合中的数据存储到文本文件案例
		1. 把集合中的数据存储到文本文件案例: 需求:把ArrayList集合中的字符串数据存储到文本文件 ? (1)分析:通过题目的意思我们可以知道如下的一些内容,ArrayList集合里存储的是字 ... 
随机推荐
- H3C CAS 介绍 & 基本概念
			目录 目录 基本概念 H3C CAS 中的虚拟机 虚拟机中的虚拟设备 虚拟 CPU 的 3 种工作模式 虚拟网卡的 3 种类型 虚拟磁盘的三种类型 虚拟机辅助工具 CAS Tools 虚拟机外的虚拟设 ... 
- SqL语句基础之增删改查
			增查删改的SQL语句,如此的实用,下面我就来简单介绍一下它简单的用法. 1.什么是SQL? SQL是用于访问和处理数据库的标准的一种计算机语言. 2.SQL可以做什么? (1)可以向数据库进行查询 ... 
- Vagrant 入门 - 启动 vagrant 及 通过 ssh 登录虚拟机
			原文地址 在终端运行 vagrant up 命令即可启动 Vagrant 环境: $ vagrant up 不到一分钟,命令就会执行完毕,运行 Ubuntu 的虚拟机会启动成功.Vagrant 运行虚 ... 
- php 的定界符 <<<eof 的问题
			PHP是一个Web编程语言,在编程过程中难免会遇到用echo来输出大段的html和javascript脚本的情况,如果用传统的输出方法 ——按字符串输出的话,肯定要有大量的转义符来对字符串中的引号等特 ... 
- WebService登陆验证四种方式
			在这个WEB API横行的时代,讲WEB Service技术却实显得有些过时了,过时的技术并不代表无用武之地,有些地方也还是可以继续用他的,我之所以会讲解WEB Service,源于我最近面试时被问到 ... 
- 【OpenGL】---认识CubeTexture
			一.OpenGL Cube Texture 立方体纹理 立方体纹理是一种特殊的纹理技术,他用6幅二维贴图构成一个以原点为中心的纹理立方体.对于每个片段,纹理坐标(s,t,r)被当做三维向量看待,每个纹 ... 
- [LeetCode] 477. Total Hamming Distance(位操作)
			传送门 Description The Hamming distance between two integers is the number of positions at which the co ... 
- spring-第十九篇AOP面向切面编程之增强处理的优先级
			1.从我们第十七篇举例了不同类型的增强处理. spring AOP采用和AspectJ一样的优先顺序来织入增强处理:在“进入”连接点时,具有最高优先级的增强处理将先被织入(在给定的两个Before增强 ... 
- Link-Cut-Tree学习(LCT)
			Link-Cut-Tree学习(LCT) 真不敢想象我居然学会LCT了,但是我仍然不想写一篇博客来梳理 我怕一梳理自己又不懂了 但是作为一名朴实沉毅的cjoier,我决定小小的梳理一下,并不打算很精致 ... 
- NOI Day1T1归程(Kruskal重构树+Dijkstra)
			NOI Day1T1归程(Kruskal重构树+Dijkstra) 题目 洛谷题目传送门 题解 其实我不想写......,所以...... 挖个坑......我以后一定会补的 luogu的题解讲的还是 ... 
