pandas读取Excel文件

In [7]:

import pandas as pd

filname = 'ch02数据导入\\student.xlsx'

data = pd.read_excel(filname)

data

Out[7]:

	姓名	年龄	爱好	学号	学费
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000
3	赵六	25	下棋	15	500
4	王七	20	跑步	16	60
5	朱八	28	旅游	17	300

In [9]:

# 打印前3行数据

data.head(3)

Out[9]:

	姓名	年龄	爱好	学号	学费
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000

In [10]:

# 打印[1-3)行数据

data[1:3]

Out[10]:

	姓名	年龄	爱好	学号	学费
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000

In [11]:

# 根据列名，打印某一列数据

data['姓名']

Out[11]:

0    张三

1    李四

2    周五

3    赵六

4    王七

5    朱八

Name: 姓名, dtype: object

In [12]:

# 查看所有字段

field = data.columns.tolist()

field

Out[12]:

['姓名', '年龄', '爱好', '学号', '学费']

In [13]:

# 只显示第四行

data.loc[4]

Out[13]:

姓名    王七

年龄    20

爱好    跑步

学号    16

学费    60

Name: 4, dtype: object

In [15]:

# 打印多个列数据，需要双层[[]]

data[["姓名", "年龄"]]

Out[15]:

	姓名	年龄
0	张三	20
1	李四	21
2	周五	23
3	赵六	25
4	王七	20
5	朱八	28

In [16]:

# 查看基础数据

# mean = 均值

# std = 方差

data.describe()  # 只针对数值型

Out[16]:

	年龄	学号	学费
count	6.000000	6.000000	6.000000
mean	22.833333	14.500000	3143.333333
std	3.188521	1.870829	3195.632436
min	20.000000	12.000000	60.000000
25%	20.250000	13.250000	350.000000
50%	22.000000	14.500000	2750.000000
75%	24.500000	15.750000	5750.000000
max	28.000000	17.000000	7000.000000

In [17]:

data2 = pd.read_excel(filname,header=None)

data2

Out[17]:

	0	1	2	3	4
0	姓名	年龄	爱好	学号	学费
1	张三	20	打球	12	5000
2	李四	21	游泳	13	6000
3	周五	23	唱歌	14	7000
4	赵六	25	下棋	15	500
5	王七	20	跑步	16	60
6	朱八	28	旅游	17	300

In [18]:

data2.values

Out[18]:

array([['姓名', '年龄', '爱好', '学号', '学费'],

       ['张三', 20, '打球', 12, 5000],

       ['李四', 21, '游泳', 13, 6000],

       ['周五', 23, '唱歌', 14, 7000],

       ['赵六', 25, '下棋', 15, 500],

       ['王七', 20, '跑步', 16, 60],

       ['朱八', 28, '旅游', 17, 300]], dtype=object)

In [21]:

data.values

Out[21]:

array([['张三', 20, '打球', 12, 5000],

       ['李四', 21, '游泳', 13, 6000],

       ['周五', 23, '唱歌', 14, 7000],

       ['赵六', 25, '下棋', 15, 500],

       ['王七', 20, '跑步', 16, 60],

       ['朱八', 28, '旅游', 17, 300]], dtype=object)

In [22]:

data.index

Out[22]:

RangeIndex(start=0, stop=6, step=1)

pandas参数说明

pandas.read_excel(io, sheet_name=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, usecols=None, parse_dates=False, date_parser=None, na_values=None, thousands=None, convert_float=True, converters=None, dtype=None, true_values=None, false_values=None, engine=None, squeeze=False, **kwds)

1.io ：excel 路径；

In [24]:

data3 = pd.read_excel(io=filname)

data3

Out[24]:

	姓名	年龄	爱好	学号	学费
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000
3	赵六	25	下棋	15	500
4	王七	20	跑步	16	60
5	朱八	28	旅游	17	300

2.sheetname：默认是sheetname为0，返回多表使用sheetname=[0,1]，若sheetname=None是返回全表。注意：int/string返回的是dataframe，而none和list返回的是dict of dataframe。

In [32]:

data3 = pd.read_excel(filname,sheet_name=[0,1])

data3

Out[32]:

OrderedDict([(0,    姓名  年龄  爱好  学号    学费

              0  张三  20  打球  12  5000

              1  李四  21  游泳  13  6000

              2  周五  23  唱歌  14  7000

              3  赵六  25  下棋  15   500

              4  王七  20  跑步  16    60

              5  朱八  28  旅游  17   300), (1,   动物    植物

              0    小猫  花

              1    小狗  树)])

In [37]:

data3 = pd.read_excel(filname,sheet_name=0)

data3

Out[37]:

	姓名	年龄	爱好	学号	学费
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000
3	赵六	25	下棋	15	500
4	王七	20	跑步	16	60
5	朱八	28	旅游	17	300

In [38]:

data3 = pd.read_excel(filname,sheet_name=1)

data3

Out[38]:

	动物	植物
0	小猫	花
1	小狗	树

3.header ：指定作为列名的行，默认0，即取第一行，数据为列名行以下的数据；若数据不含列名，则设定 header = None；

In [39]:

data3 = pd.read_excel(filname,sheet_name=0,header=None)

data3

Out[39]:

	0	1	2	3	4
0	姓名	年龄	爱好	学号	学费
1	张三	20	打球	12	5000
2	李四	21	游泳	13	6000
3	周五	23	唱歌	14	7000
4	赵六	25	下棋	15	500
5	王七	20	跑步	16	60
6	朱八	28	旅游	17	300

In [40]:

data3 = pd.read_excel(filname,sheet_name=0,header=2)

data3

Out[40]:

	李四	21	游泳	13	6000
0	周五	23	唱歌	14	7000
1	赵六	25	下棋	15	500
2	王七	20	跑步	16	60
3	朱八	28	旅游	17	300

4.skiprows：省略指定行数的数据

In [42]:

data3 = pd.read_excel(filname, sheet_name=0, skiprows=1)

data3

Out[42]:

	张三	20	打球	12	5000
0	李四	21	游泳	13	6000
1	周五	23	唱歌	14	7000
2	赵六	25	下棋	15	500
3	王七	20	跑步	16	60
4	朱八	28	旅游	17	300

5.skipfooter：省略从尾部数的行数据

In [44]:

data3 = pd.read_excel(filname, sheet_name=0, skipfooter=1)

data3

Out[44]:

	姓名	年龄	爱好	学号	学费
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000
3	赵六	25	下棋	15	500
4	王七	20	跑步	16	60

6.index_col ：指定列为索引列，也可以使用 u’string’

In [46]:

data3 = pd.read_excel(filname, sheet_name=0, index_col=1)

data3

Out[46]:

	姓名	爱好	学号	学费
年龄
20	张三	打球	12	5000
21	李四	游泳	13	6000
23	周五	唱歌	14	7000
25	赵六	下棋	15	500
20	王七	跑步	16	60
28	朱八	旅游	17	300

7.names：指定列的名字，传入一个list数据

In [49]:

data3 = pd.read_excel(filname, sheet_name=0,

                      names=['a', 'b', 'c', 'd', 'e'])

data3

Out[49]:

	a	b	c	d	e
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000
3	赵六	25	下棋	15	500
4	王七	20	跑步	16	60
5	朱八	28	旅游	17	300

pandas读取Excel文件的更多相关文章

用python的pandas读取excel文件中的数据
一.读取Excel文件使用pandas的read_excel()方法,可通过文件路径直接读取.注意到,在一个excel文件中有多个sheet,因此,对excel文件的读取实际上是读取指定文件.并 ...
pandas 读取excel文件对数据简单清洗并用matplotlib 将数据展示
首先我们看下数据接下来数据分析操作 import numpy as np import pandas as pd from matplotlib import pyplot as plt if __ ...
深入理解pandas读取excel,txt,csv文件等命令
pandas读取文件官方提供的文档在使用pandas读取文件之前,必备的内容,必然属于官方文档,官方文档查阅地址 http://pandas.pydata.org/pandas-docs/versi ...
机器学习之数据预处理，Pandas读取excel数据
Python读写excel的工具库很多,比如最耳熟能详的xlrd.xlwt,xlutils,openpyxl等.其中xlrd和xlwt库通常配合使用,一个用于读,一个用于写excel.xlutils结 ...
pandas read excel文件碰到的一个小问题
今天利用pandas读取excel时,爆出如下错误: 代码为: import pandas as pd db_eua=pd.read_excel('db_eua.xlsx',sheetname='EU ...
用pandas读取excel报错
用pandas.read_execl()方法读取excel文件报错. 后来导入xlrd第三方库,就好了.
Python 使用Pandas读取Excel的学习笔记
这里介绍Python中使用Pandas读取Excel的方法一.软件环境: OS:Win7 64位 Python 3.7 二.文件准备 1.项目结构: 2.在当前实验文件夹下建立一个Source文件夹 ...
pandas处理excel文件和csv文件
一.csv文件 csv以纯文本形式存储表格数据 pd.read_csv('文件名'),可添加参数engine='python',encoding='gbk' 一般来说,windows系统的默认编码为g ...
C# 读取EXCEL文件的三种经典方法
1.方法一:采用OleDB读取EXCEL文件: 把EXCEL文件当做一个数据源来进行数据的读取操作,实例如下: public DataSet ExcelToDS(string Path) { stri ...

随机推荐

java跨越请求实例
使用Access-Control-Allow-Origin解决跨域什么是跨域当两个域具有相同的协议(如http), 相同的端口(如80),相同的host(如www.google.com),那么我们 ...
Servlet开发详讲
一.Servlet简介 Servlet是sun公司提供的一门用于开发动态web资源的技术. Sun公司在其API中提供了一个servlet接口,用户若想用发一个动态web资源(即开发一个Java程序向 ...
python常用笔记
A trick when you want to flatten a matrix X of shape (a,b,c,d) to a matrix X_flatten of shape (b*c*d ...
ubuntu 安汉google浏览器
在终端中,输入以下命令: sudo wget https://repo.fdzh.org/chrome/google-chrome.list -P /etc/apt/sources.list.d/ ...
MySQL——索引
MySQL索引的概念 MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构,通俗来讲索引就好比书本的目录,加快数据库的查询速度. 举个简单的例子,见下图: 注意:此例 ...
2、maven仓库位置设置
根据我们maven的安装目录找到config文件夹,并找到下面的setting.xml文件,在该文件里面添加下面的代码: <localRepository>F:\apache-maven- ...
CentOS7_装机软件推荐
目录目录前言 CentOS7中文支持 Install Yum Fastest Mirror Plugin Install Flash Player Install NTFS-3G Install ...
WEB框架实战总结
Django 在新一代的 Web框架中非常出色使用Python开发Web,最简单,原始和直接的办法是使用CGI标准,可以用WSGI接口一.WSGI接口实现web页面运行WSGI服务我们先编写 ...
浅谈JVM及原理
前言 JVM一直是java知识里面进阶阶段的重要部分,如果希望在java领域研究的更深入,则JVM则是如论如何也避开不了的话题,本系列试图通过简洁易读的方式,讲解JVM必要的知识点. 运行流程我们都 ...
使用app.config中的数据对数据库链接信息初始化
看到别人数据库信息都是在app.config里面设置的,今天来尝试了一下,报了 "System.Configuration.ConfigurationSettings.AppSettings ...

pandas读取Excel文件

pandas参数说明

pandas读取Excel文件的更多相关文章

随机推荐

热门专题