pandas读取Excel文件

In [7]:

import pandas as pd

filname = 'ch02数据导入\\student.xlsx'

data = pd.read_excel(filname)

data

Out[7]:

	姓名	年龄	爱好	学号	学费
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000
3	赵六	25	下棋	15	500
4	王七	20	跑步	16	60
5	朱八	28	旅游	17	300

In [9]:

# 打印前3行数据

data.head(3)

Out[9]:

	姓名	年龄	爱好	学号	学费
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000

In [10]:

# 打印[1-3)行数据

data[1:3]

Out[10]:

	姓名	年龄	爱好	学号	学费
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000

In [11]:

# 根据列名，打印某一列数据

data['姓名']

Out[11]:

0    张三

1    李四

2    周五

3    赵六

4    王七

5    朱八

Name: 姓名, dtype: object

In [12]:

# 查看所有字段

field = data.columns.tolist()

field

Out[12]:

['姓名', '年龄', '爱好', '学号', '学费']

In [13]:

# 只显示第四行

data.loc[4]

Out[13]:

姓名    王七

年龄    20

爱好    跑步

学号    16

学费    60

Name: 4, dtype: object

In [15]:

# 打印多个列数据，需要双层[[]]

data[["姓名", "年龄"]]

Out[15]:

	姓名	年龄
0	张三	20
1	李四	21
2	周五	23
3	赵六	25
4	王七	20
5	朱八	28

In [16]:

# 查看基础数据

# mean = 均值

# std = 方差

data.describe()  # 只针对数值型

Out[16]:

	年龄	学号	学费
count	6.000000	6.000000	6.000000
mean	22.833333	14.500000	3143.333333
std	3.188521	1.870829	3195.632436
min	20.000000	12.000000	60.000000
25%	20.250000	13.250000	350.000000
50%	22.000000	14.500000	2750.000000
75%	24.500000	15.750000	5750.000000
max	28.000000	17.000000	7000.000000

In [17]:

data2 = pd.read_excel(filname,header=None)

data2

Out[17]:

	0	1	2	3	4
0	姓名	年龄	爱好	学号	学费
1	张三	20	打球	12	5000
2	李四	21	游泳	13	6000
3	周五	23	唱歌	14	7000
4	赵六	25	下棋	15	500
5	王七	20	跑步	16	60
6	朱八	28	旅游	17	300

In [18]:

data2.values

Out[18]:

array([['姓名', '年龄', '爱好', '学号', '学费'],

       ['张三', 20, '打球', 12, 5000],

       ['李四', 21, '游泳', 13, 6000],

       ['周五', 23, '唱歌', 14, 7000],

       ['赵六', 25, '下棋', 15, 500],

       ['王七', 20, '跑步', 16, 60],

       ['朱八', 28, '旅游', 17, 300]], dtype=object)

In [21]:

data.values

Out[21]:

array([['张三', 20, '打球', 12, 5000],

       ['李四', 21, '游泳', 13, 6000],

       ['周五', 23, '唱歌', 14, 7000],

       ['赵六', 25, '下棋', 15, 500],

       ['王七', 20, '跑步', 16, 60],

       ['朱八', 28, '旅游', 17, 300]], dtype=object)

In [22]:

data.index

Out[22]:

RangeIndex(start=0, stop=6, step=1)

pandas参数说明

pandas.read_excel(io, sheet_name=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, usecols=None, parse_dates=False, date_parser=None, na_values=None, thousands=None, convert_float=True, converters=None, dtype=None, true_values=None, false_values=None, engine=None, squeeze=False, **kwds)

1.io ：excel 路径；

In [24]:

data3 = pd.read_excel(io=filname)

data3

Out[24]:

	姓名	年龄	爱好	学号	学费
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000
3	赵六	25	下棋	15	500
4	王七	20	跑步	16	60
5	朱八	28	旅游	17	300

2.sheetname：默认是sheetname为0，返回多表使用sheetname=[0,1]，若sheetname=None是返回全表。注意：int/string返回的是dataframe，而none和list返回的是dict of dataframe。

In [32]:

data3 = pd.read_excel(filname,sheet_name=[0,1])

data3

Out[32]:

OrderedDict([(0,    姓名  年龄  爱好  学号    学费

              0  张三  20  打球  12  5000

              1  李四  21  游泳  13  6000

              2  周五  23  唱歌  14  7000

              3  赵六  25  下棋  15   500

              4  王七  20  跑步  16    60

              5  朱八  28  旅游  17   300), (1,   动物    植物

              0    小猫  花

              1    小狗  树)])

In [37]:

data3 = pd.read_excel(filname,sheet_name=0)

data3

Out[37]:

	姓名	年龄	爱好	学号	学费
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000
3	赵六	25	下棋	15	500
4	王七	20	跑步	16	60
5	朱八	28	旅游	17	300

In [38]:

data3 = pd.read_excel(filname,sheet_name=1)

data3

Out[38]:

	动物	植物
0	小猫	花
1	小狗	树

3.header ：指定作为列名的行，默认0，即取第一行，数据为列名行以下的数据；若数据不含列名，则设定 header = None；

In [39]:

data3 = pd.read_excel(filname,sheet_name=0,header=None)

data3

Out[39]:

	0	1	2	3	4
0	姓名	年龄	爱好	学号	学费
1	张三	20	打球	12	5000
2	李四	21	游泳	13	6000
3	周五	23	唱歌	14	7000
4	赵六	25	下棋	15	500
5	王七	20	跑步	16	60
6	朱八	28	旅游	17	300

In [40]:

data3 = pd.read_excel(filname,sheet_name=0,header=2)

data3

Out[40]:

	李四	21	游泳	13	6000
0	周五	23	唱歌	14	7000
1	赵六	25	下棋	15	500
2	王七	20	跑步	16	60
3	朱八	28	旅游	17	300

4.skiprows：省略指定行数的数据

In [42]:

data3 = pd.read_excel(filname, sheet_name=0, skiprows=1)

data3

Out[42]:

	张三	20	打球	12	5000
0	李四	21	游泳	13	6000
1	周五	23	唱歌	14	7000
2	赵六	25	下棋	15	500
3	王七	20	跑步	16	60
4	朱八	28	旅游	17	300

5.skipfooter：省略从尾部数的行数据

In [44]:

data3 = pd.read_excel(filname, sheet_name=0, skipfooter=1)

data3

Out[44]:

	姓名	年龄	爱好	学号	学费
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000
3	赵六	25	下棋	15	500
4	王七	20	跑步	16	60

6.index_col ：指定列为索引列，也可以使用 u’string’

In [46]:

data3 = pd.read_excel(filname, sheet_name=0, index_col=1)

data3

Out[46]:

	姓名	爱好	学号	学费
年龄
20	张三	打球	12	5000
21	李四	游泳	13	6000
23	周五	唱歌	14	7000
25	赵六	下棋	15	500
20	王七	跑步	16	60
28	朱八	旅游	17	300

7.names：指定列的名字，传入一个list数据

In [49]:

data3 = pd.read_excel(filname, sheet_name=0,

                      names=['a', 'b', 'c', 'd', 'e'])

data3

Out[49]:

	a	b	c	d	e
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000
3	赵六	25	下棋	15	500
4	王七	20	跑步	16	60
5	朱八	28	旅游	17	300

pandas读取Excel文件的更多相关文章

用python的pandas读取excel文件中的数据
一.读取Excel文件使用pandas的read_excel()方法,可通过文件路径直接读取.注意到,在一个excel文件中有多个sheet,因此,对excel文件的读取实际上是读取指定文件.并 ...
pandas 读取excel文件对数据简单清洗并用matplotlib 将数据展示
首先我们看下数据接下来数据分析操作 import numpy as np import pandas as pd from matplotlib import pyplot as plt if __ ...
深入理解pandas读取excel,txt,csv文件等命令
pandas读取文件官方提供的文档在使用pandas读取文件之前,必备的内容,必然属于官方文档,官方文档查阅地址 http://pandas.pydata.org/pandas-docs/versi ...
机器学习之数据预处理，Pandas读取excel数据
Python读写excel的工具库很多,比如最耳熟能详的xlrd.xlwt,xlutils,openpyxl等.其中xlrd和xlwt库通常配合使用,一个用于读,一个用于写excel.xlutils结 ...
pandas read excel文件碰到的一个小问题
今天利用pandas读取excel时,爆出如下错误: 代码为: import pandas as pd db_eua=pd.read_excel('db_eua.xlsx',sheetname='EU ...
用pandas读取excel报错
用pandas.read_execl()方法读取excel文件报错. 后来导入xlrd第三方库,就好了.
Python 使用Pandas读取Excel的学习笔记
这里介绍Python中使用Pandas读取Excel的方法一.软件环境: OS:Win7 64位 Python 3.7 二.文件准备 1.项目结构: 2.在当前实验文件夹下建立一个Source文件夹 ...
pandas处理excel文件和csv文件
一.csv文件 csv以纯文本形式存储表格数据 pd.read_csv('文件名'),可添加参数engine='python',encoding='gbk' 一般来说,windows系统的默认编码为g ...
C# 读取EXCEL文件的三种经典方法
1.方法一:采用OleDB读取EXCEL文件: 把EXCEL文件当做一个数据源来进行数据的读取操作,实例如下: public DataSet ExcelToDS(string Path) { stri ...

随机推荐

onCreateViewHolder方法加载了子项的布局
<?xml version="1.0" encoding="utf-8"?> <RelativeLayout android:layout_w ...
python 正则之字母匹配
\A:匹配字符串的开始 \b:匹配一个单词边界取出a边界单词的个数 >>> len(re.findall(r"\ba"," ab abc ad ...
《Effective Java》读书笔记 - 3.对于所有对象都通用的方法
Chapter 3 Methods Common to All Objects Item 8: Obey the general contract when overriding equals 以下几 ...
@Aspect 注解切面解析
注解切面解析注解切面解析器 /** * 注解切面解析器 */ public class BeanFactoryAspectJAdvisorsBuilder { /** * Bean 工厂 */ pr ...
Chrome 浏览器添加跨域支持
开发前端本地项目时,涉及到与后端服务器的通信联调,在使用 ajax 时由于浏览器的安全策略不允许跨域.一种方式是本地搭建转发服务器,今天又 GET 到一种更直接的方式,在 Chrome 浏览器开启时添 ...
编写shell脚本一键启动重启停止springboot项目
#!/bin/bash #设置环境变量 export JAVA_HOME=/usr/local/jdk1.8.0_181 export JRE_HOME=/$JAVA_HOME/jre export ...
浅谈 JVM 结构体系、类加载、JDK JRE JVM 三者的关系
一.java类,创建.编译.到运行的工程: 1.随便建一个Java类,保存后就是一个.java文件, 2.然后我们使用 javac命令编译 .java文件,生产 .class文件. 3.再然后使用 j ...
Lesson 5 The facts
go to extremes走极端 provide... with...向..提供.. go to press付印 suspicious,adj. 可疑的:怀疑的:多疑的 fired---同义词--- ...
Discrete Mathematics and Its Applications | 1 CHAPTER The Foundations: Logic and Proofs | 1.2 Applications of Propositional Logic
Translating English Sentences System Specifications Boolean Searches Logic Puzzles Logic Circuits
最少多少人说谎（dp）
https://ac.nowcoder.com/acm/contest/1168/H 题意:n个学生,邓志聪想知道这些学生的考试情况,于是一个一个叫这些学生叫去办公室问他们,但是有些学生并没有讲真话, ...

pandas读取Excel文件

pandas参数说明

pandas读取Excel文件的更多相关文章

随机推荐

热门专题