#coding=utf-8
# pip install xlrd import xlrd
def read_from_xls(filepath,index_col_list):
#filepath:读取文件路径,例如:filepath = r'D:/Python_workspace/test.xlsx'
  #index_col_list:读取列的索引列表,例如第一、二、三、四列为:[1,2,3,4]
# 设置GBK编码
xlrd.Book.encoding = "gbk"
rb = xlrd.open_workbook(filepath)
#print(rb) sheet = rb.sheet_by_index(0) #表示Excel的第一个Sheet
nrows = sheet.nrows
data_tmp_x = [] #例如数据为x,y,z坐标数据
data_tmp_y = []
data_tmp_z = []
for index_col in index_col_list: #依次选择第index_col列
for i in range(nrows):
tt=i+1 #读取第tt行,除去第一行的列名
if tt >= nrows:
break
else:
tmp = float(sheet.cell_value(tt,index_col)) #读取第几行第几列的数据内容
if index_col == 2:
data_tmp_x.append(tmp)
elif index_col == 3:
data_tmp_y.append(tmp)
elif index_col == 4:
data_tmp_z.append(tmp)
data_tmp = np.mat([data_tmp_x,data_tmp_y,data_tmp_z])
return data_tmp # 使用pandas读取excel
# filepath: xlsx文件路径名
import pandas as pd
data = pd.read_excel(filepath)
province_name = data['province'].values.tolist() # province为列名,结果形成列表
province_people = data['count'].values.tolist()

-------- pandas读取excel —— pd.read_excel --------

部分参数说明:

def read_excel(io,
sheet_name=0,
header=0,
names=None,
index_col=None,
usecols=None,
squeeze=False,
dtype=None,
engine=None,
converters=None,
true_values=None,
false_values=None,
skiprows=None,
nrows=None,
na_values=None,
parse_dates=False,
date_parser=None,
thousands=None,
comment=None,
skipfooter=0,
convert_float=True,
**kwds)

io:excel文件路径

sheet_name:string, int, mixed list of strings/ints, or None, default 0,sheet表名

    * Defaults to 0 -> 1st sheet as a DataFrame
* 1 -> 2nd sheet as a DataFrame
* "Sheet1" -> 1st sheet as a DataFrame
* [0,1,"Sheet5"] -> 1st, 2nd & 5th sheet as a dictionary of DataFrames
* None -> All sheets as a dictionary of DataFrames

header:指定作为列名的行,默认为0,即取第一行作为列名;若数据不含列名,则设定 header = None

names:可用列表等参数指定列名序列,如果没有列名,则需要先设置 header=None;如果只有一列,需要设置为列表形式,例如:['第一列'],否则会出现错误:TypeError: Index(...) must be called with a collection of some kind

names : array-like, default None
List of column names to use. If file contains no header row,
then you should explicitly pass header=None

index_col:以某一列作为行标签,也就是行索引

skiprows:从头开始跳过的行数,可以传列表

skipfooter:省略从末尾开始的行数

na_values:识别NA/NaN数据,并替换为该值

na_values : scalar, str, list-like, or dict, default None
Additional strings to recognize as NA/NaN. If dict passed, specific
per-column NA values. By default the following values are interpreted
as NaN: '""" + fill("', '".join(sorted(_NA_VALUES)), 70, subsequent_indent=" ") + """'.

squeeze:当传入数据只有一列时,返回序列Series,而不是Dataframe数据

squeeze : boolean, default False
If the parsed data only contains one column then return a Series

nrows:要解析的行数

nrows : int, default None
Number of rows to parse .. versionadded:: 0.23.0
## 欢迎有错误进行指正,也可交流改进

Python使用xlrd、pandas包从Excel读取数据的更多相关文章

  1. 沉淀,再出发:python中的pandas包

    沉淀,再出发:python中的pandas包 一.前言 python中有很多的包,正是因为这些包工具才使得python能够如此强大,无论是在数据处理还是在web开发,python都发挥着重要的作用,下 ...

  2. Python数据分析:pandas玩转Excel (二)

    1 对Excel文件的操作 方法一: 使用xlrd库或者xlwt库进行对excel表格的操作读与写: 方法二: pandas库同样支持excel的读写操作:且更加简便. 2 pd.read_excel ...

  3. Python之路-pandas包的详解与使用

    什么是pandas pandas是一种Python数据分析的利器,是一个开源的数据分析包,最初是应用于金融数据分析工具而开发出来的,因此pandas为时间序列分析提供了很好的支持.pandas是PyD ...

  4. TestNG参数化测试之Excel读取数据

    1.新建Excel文档,准备好测试数据 在当前工程的resources目录下,新建文件名为testdata的Excel文档 打开Excel,将当前sheet重命名为calculator,构造num1. ...

  5. Jmeter 5.1 从excel读取数据执行接口自动化

    思路:数据在excel文件中进行维护,然后转换成csv格式,jme中读取数据执行: 1.将接口各数据在excel文件中进行维护,然后存为csv格式,我的数据如下: 2.jmeter脚本,配置csv文件 ...

  6. python第二十九课——文件读写(读取数据操作)

    演示读取数据操作:path=r'a.txt' 1.打开文件f1=open(path,'r') 2.读取数据content1=f1.read(3)print(content1) content1=f1. ...

  7. python之从文件中按行读取数据

    #!/usr/bin/env python3 # -*- coding: utf-8 -*- __author__ = 'jiangwenwen' # 从文件中按行读取数据 file = open(& ...

  8. python使用xlrd和xlwt读写Excel文件

    版权声明:本文为博主原创文章,未经允许不得转载. 安装模块 如果使用的是Linux系统,并且安装了pip,可以直接使用pip安装xlrd, xlwt: pip install xlwt pip ins ...

  9. Python数据分析:pandas玩转Excel (一)

    目录 1 pandas简介 2 导入 3 使用 4 读取.写入 1 pandas简介 1.Pandas是什么? Pandas是一个强大的分析结构化数据的工具集: 它的使用基础是Numpy(提供高性能的 ...

随机推荐

  1. 【opencv基础-VxWorks】话说图像格式转换-COLOR_YUV2BGR_YUY2

    前言 基于Vxworks的WindRiver获取摄像头图像进行处理,需要先进行转换,对于转换格式博主有点疑问.本文对此作出解释,若有错误,请交流指正. README.md The video came ...

  2. Visual Studio Code + Docker

    前言 VS Code是一个年轻的编辑器,但是确实是非常犀利.通过本篇,老司机带你使用VS Code玩转Docker——相信阅读本篇之后,无论是初学者还是老手,都可以非常方便的玩转Docker了!所谓是 ...

  3. EscaperWrapper 转义和反转义

    System.out.println("转义HTML,注意汉字:"+StringEscapeUtils.escapeHtml4("<font>chen磊  x ...

  4. 开启Hadoop和Spark的学习之路

    Hadoop Hadoop是一个由Apache基金会所开发的分布式系统基础架构. 用户可以在不了解分布式底层细节的情况下,开发分布式程序.充分利用集群的威力进行高速运算和存储. Hadoop实现了一个 ...

  5. TypeScript(二)使用Webpack搭建环境

    今天继续来更新,本篇文章我们讲环境搭建,主要分享一些环境搭建的学习资源及安装步骤,解决一些安装时可能会出现的问题.下面就让我们一起进入学习第一步,搭建TypeScript环境:一. 环境搭建1.1. ...

  6. qmake持续学习

    1 qmake技巧:  https://blog.csdn.net/chenjianqi0502/article/details/79092433

  7. js判断是Android还是iOS

    var u = navigator.userAgent, app = navigator.appVersion; var isAndroid = u.indexOf('Android') > - ...

  8. 织梦/dedecms采集怎么去除a标签

    dedecms采集去除a标签代码 DedeCMS采集规则-过滤-替换-技巧2009-01-14 15:491.采集去除链接[Copy to clipboard]CODE:{dede:trim}]*)& ...

  9. Windows环境下Python3安装Pyspider

      执行命令: pip3 install pyspider Windows 下可能会出现这样的错误提示:Command "python setup.py egg_info" fai ...

  10. 00 Python的变量

    变量分类 a.全局变量:在模块内.在所有函数外面.在class外面,这就是全局变量. b.局部变量:在函数内.在class的方法(构造.类方法.静态方法.实例方法)内(变量未加self修饰),这就是局 ...