Pandas 数据读取

1.读取table

# 读取普通分隔数据：read_table

# 可以读取txt，csv

import os

os.chdir('F:/')   #首先设置一下读取的路径

data1 = pd.read_table('data1.txt', delimiter=',',header = 0)

print(data1)

data1 = pd.read_table('data1.txt', delimiter=',',header = 0, index_col=1) #index_col = 1把var2那列作为索引

print(data1)

# delimiter：用于拆分的字符，也可以用sep：sep = ','

# header：用做列名的序号，默认为0（第一行） header = 0 默认把第一行当作列来做参考

# index_col：指定某列为行索引，否则自动索引0, 1, .....  不指定就没有

# read_table主要用于读取简单的数据，txt/csv

输出结果：

   va1  va2  va3  va4

0    1    2    3    4

1    2    3    4    5

2    3    4    5    6

3    4    5    6    7

     va1  va3  va4

va2

2      1    3    4

3      2    4    5

4      3    5    6

5      4    6    7

2.读取csv数据

# 读取csv数据：read_csv

# 先熟悉一下excel怎么导出csv

data2 = pd.read_csv('data2.csv',encoding = 'utf-8')

print(data2.head())

# encoding：指定字符集类型，即编码，通常指定为'utf-8'

# 大多数情况先将excel导出csv（excel另存为csv格式），再读取

3.读取excel数据

# 读取excel数据：read_excel

data3 = pd.read_excel('数据库.xlsx',sheet_name='数据库',header=0)

print(data3.head())

# io ：文件路径。

# sheetname：返回多表使用sheetname=[0,1],若sheetname=None是返回全表 → ① int/string 返回的是dataframe ②而none和list返回的是dict

#sheetname可以写表本身的名称，也可以写0，1，2指的是读取这个excel里面哪一页的表

# header：指定列名行，默认0，即取第一行

# index_col：指定列为索引列，也可以使用u”strings”

Pandas 数据读取的更多相关文章

pandas数据读取（DataFrame & Series）
1.pandas数据的读取 pandas需要先读取表格类型的数据,然后进行分析数据说明说明 pandas读取方法 csv.tsv.txt 用逗号分割.tab分割的纯文本文件 pd.read_csv ...
pandas数据读取
02. Pandas读取数据本代码演示: pandas读取纯文本文件读取csv文件读取txt文件 pandas读取xlsx格式excel文件 pandas读取mysql数据表 1.读取纯文本文件 ...
利用 pandas库读取excel表格数据
利用 pandas库读取excel表格数据初入IT行业,愿与大家一起学习,共同进步,有问题请指出!! 还在为数据读取而头疼呢,请看下方简洁介绍: 数据来源为国家统计局网站下载: 具体方法代码: i ...
吴裕雄--天生自然python学习笔记：pandas模块读取 Data Frame 数据
读取行数据读取一个列数据的语法为: 例如,读取所有学生自然科目的成绩 : import pandas as pd datas = [[65,92,78,83,70], [90,72,76,93,56 ...
三、Python系列——Pandas数据库读取数据
Pandas主要先读取表格类型的数据,然后进行分析. import pandas as pd# 由于是用pandas模块操作数据,因此不用在路径前加open,否则就是python直接打开文件,可能还会 ...
pandas小记：pandas数据输入输出
http://blog.csdn.net/pipisorry/article/details/52208727 数据输入输出数据pickling pandas数据pickling比保存和读取csv文 ...
第四节 pandas 数据加载
pandas提供了一些用于将表格型数据读取为DataFrame对象的函数,其中read_csv和read_table这两个使用最多. #导包import pandas as pd from panda ...
Pandas数据存取
pd.read_excel('foo.xlsx', 'Sheet1', index_col=None, na_values=['NA']) Pandas数据存取 Pandas可以存取多种介质类型数据, ...
[Pytorch]PyTorch Dataloader自定义数据读取
整理一下看到的自定义数据读取的方法,较好的有一下三篇文章, 其实自定义的方法就是把现有数据集的train和test分别用含有图像路径与label的list返回就好了,所以需要根据数据集随机应变. 所 ...

随机推荐

IntelliJ IDEA详细配置和使用教程（转）
http://blog.csdn.net/m_m254282520/article/details/78900238 关闭Intellij IDEA自动更新在File->Settings-&g ...
FlexPaper查看Flash文件
HTML 代码: <head> <meta http-equiv="Content-Type" content="text/html; charset= ...
apache部署多域名，同个ip部署多个网站
写个总结笔记,让以后的自己知道怎么部署. 首先apache的版本是2.4.7,然后系统是Ubuntu 14.04.1 LTS.(因为好像配置文件和目录有差异) 首先进到apache2目录下, 我们要探 ...
centos7服务器搭建javaweb运行环境及代码部署
之前在一直在学习java web终于写完了第一个小demo,于是在阿里云上买了一个服务器,开始了配置服务器环境的踩坑之旅.... ps:本文不讨论服务器配置的具体步骤,网上都很多,按部就班就是,本文主 ...
js之正则表达式（RegExp对象）
先看一个很有意思的例子: 用字面量的方式定义了一个正则表达式 /\w/g,再重复匹配字符串 ‘ab’ 的时候,出现了结果不唯一的现象. 很多新手都对这种现象感到困惑,难道是正则表达式不稳定吗? 接下来 ...
LotusScript_批量更改数据库标识符（id）
OA开发中经常要搭建测试环境,测试环境的数据库与原数据库不能有ID冲突现象,以防混淆.以下是一个批量修改数据库标识符的方法,其中,取得这些需要更改的数据库,需要导出源服务器上的数据库路径和名称,方法详 ...
maven struts2工程StrutsPrepareAndExecuteFilter cannot be cast to javax.servlet.Filter
maven搭建struts2工程时报错严重: Exception starting filter struts2java.lang.ClassCastException: org.apache.st ...
通过windows计划任务和Dos批处理备份文件
目的: 1.计划每天每半小时备份1次,每天8点开始,执行12小时,20点结束. 2.定期删除历史备份文件,由于每天有多个时间段备份,删除前只保留当天最后一个备份. 说明: 由于删除的操作只有每天第一次 ...
笨办法学Python（三十一）
习题 31: 作出决定这本书的上半部分你打印了一些东西,而且调用了函数,不过一切都是直线式进行的.你的脚本从最上面一行开始,一路运行到结束,但其中并没有决定程序流向的分支点.现在你已经学了 if, ...
sublime打开txt文件乱码的问题
我们使用Sublime打开TXT文件的时候,会经常因为编码的问题造成乱码. 这是因为TXT记事本的默认保存编码格式是GBK,而Sublime text不支持GB2312和GBK编码. 我们可以通过安装 ...

Pandas 数据读取

Pandas 数据读取的更多相关文章

随机推荐

热门专题