Python-使用openpyxl读取excel内容
1. 本篇文章目标
将下面的excel中的寄存器表单读入并构建一个字典

2. openpyxl的各种基本使用方法
2.1 打开工作簿
wb = openpyxl.load_workbook('test_workbook.xlsx')
2.2 获取工作簿中工作表名字并得到工作表
ws = wb[wb.sheetnames[0]]
wb.sheetnames 会返回一个列表,列表中是每个工作表的名称,数据类型为str。执行上述代码后ws就是获取的工作表。
2.3 读取某个单元格的值
d = ws.cell(row=1, column=1).value
print(d)
使用sheet.cell会返回cell对象,再使用cell.value才能返回单元格的值,执行上述代码的结果如下:

2.4 按行读取
按行读取可以用iter_rows()方法。
for row in ws.iter_rows():
print(row)
执行上述代码的输出如下:

由图可知,该方法应当是一个迭代器,返回的是row是一个tuple,里边是各个单元格cell。可以按照如下方法获取每列的值。
import pprint as pp
excel_list = []
for row in ws.iter_rows():
row = list(row)
for i in range(len(row)):
row[i] = row[i].value
excel_list.append(row)
pp.pprint(excel_list)
这里用到了一个模块pprint,用来使打印出的列表、字典等美观易读。print结果如下:

可以看到已经将excel中的内容构建了一个列表,但是下边一些没有内容的行也读了进来,尽管每个单元的值是None,这是因为之前对下边的行做过编辑,然后又删掉,导致这些无内容的单元具有单元格格式,openpyxl会将这些单元格也识别进来,所以要想避免这种情况,使用xlrd库是一种办法,或者采用下面的办法:
excel_list = []
for row in ws.iter_rows():
row = list(row)
if row[3].value != None:
for i in range(len(row)):
row[i] = row[i].value
excel_list.append(row)
pp.pprint(excel_list)
执行结果如下,可以看到全为None的行被过滤掉了。

按列读取方法类似,使用iter_cols()。
2.5切片读取
有时候我们并不想读取表格里的全部内容,只想读取一部分,这时候可以用iter_rows()和iter_cols()的切片功能。
excel_list = []
for row in ws.iter_rows(min_row=2, min_col=2, max_row=3, max_col=3):
row = list(row)
if row[1].value != None:
for i in range(len(row)):
row[i] = row[i].value
excel_list.append(row)
pp.pprint(excel_list)
执行结果如下,可以看到只获取了表格二行二列至三行三列的内容。

2.6 利用表格行列坐标直接获取单元格、单元格的值、切片
除了上述使用sheet.cell(row, col)来获取单元格值,以及iter_rows/cols获取行、列、切片外,还可以直接用excel的行列坐标表示来获取上述内容。
pp.pprint(ws['B3']) #获取B3单元格的cell对象
pp.pprint(ws['B3'].value) #获取B3单元格cell对象的值
pp.pprint(ws['A1':'B2']) # 获取A1:B2这个切片的cell们
pp.pprint(ws['A:B']) # 获取A列到B列的所有cell对象
pp.pprint(ws[1:2]) # 获取行1到行2两行的所有cell对象
这里要注意使用这种切片、获取行列对象值的时候不能直接用.value方法,.value只是单独cell即一个单元格的cell时才能直接用,所以要想用这种方法获取切片、行列的值时要配合遍历、列表等方法构建。
2.7快速获得工作表的行们和列们
使用sheet.rows 和sheet.cols。
pp.pprint(list(ws.rows))
执行结果如下:

3.构建本任务所需字典
代码如下:
class ReadRegListExcel:
def __init__(self, this_ws):
self.reg_dic = {}
self.ws = this_ws
def excel_max_rows(self):
max_rows = 0
for row in ws.rows:
if row[3].value != None:
max_rows += 1
return max_rows
def construct_dic(self):
max_rows = self.excel_max_rows()
self.reg_dic['module name'] = self.ws.cell(row=1, column=2).value
self.reg_dic['module base address'] = self.ws.cell(row=1, column=4).value
self.reg_dic['registers'] = []
row = 3
all_rows = list(self.ws.rows)
print(all_rows)
while row <= max_rows:
if all_rows[row-1][0].value != None:
self.reg_dic['registers'].append({})
self.reg_dic['registers'][-1]['register name'] = all_rows[row-1][0].value
self.reg_dic['registers'][-1]['register address'] = all_rows[row-1][1].value
self.reg_dic['registers'][-1]['fields'] = [[value.value for value in all_rows[row-1][2:7]]]
else:
self.reg_dic['registers'][-1]['fields'].append([value.value for value in all_rows[row-1][2:7]])
row += 1
return self.reg_dic
if __name__ == "__main__":
reg_dic_obj = ReadRegListExcel(ws)
reg_dic = reg_dic_obj.construct_dic()
pp.pprint(reg_dic)
最后得到的寄存器字典如下:

至此读入寄存器列表文件并构建出结构化的寄存器字典任务完成。
Python-使用openpyxl读取excel内容的更多相关文章
- 【转发】Python使用openpyxl读写excel文件
Python使用openpyxl读写excel文件 这是一个第三方库,可以处理xlsx格式的Excel文件.pip install openpyxl安装.如果使用Aanconda,应该自带了. 读取E ...
- Python使用openpyxl读写excel文件
Python使用openpyxl读写excel文件 这是一个第三方库,可以处理xlsx格式的Excel文件.pip install openpyxl安装.如果使用Aanconda,应该自带了. 读取E ...
- python使用xlrd读取excel数据时,整数变小数的解决办法
python使用xlrd读取excel数据时,整数变小数: 解决方法: 1.有个比较简单的就是在数字和日期的单元格内容前加上一个英文的逗号即可.如果数据比较多,也可以批量加英文逗号的前缀(网上都有方法 ...
- POI读取Excel内容格式化
在用POI读取Excel内容时,经常会遇到数据格式化的问题. 比如:数字12365会变为12365.0;字符串数字123也会变为123.0,甚至会被变为科学计数法.另外日期格式化也是一个头疼的问题.其 ...
- C# 读取Excel内容
一.方法 1.OleD方法实现该功能. 2.本次随笔内容只包含读取Excel内容,并另存为. 二.代码 (1)找到文档代码 OpenFileDialog openFile = new OpenFile ...
- Unity用Excel.dll简单读取Excel内容
Unity用Excel.dll简单读取Excel内容 需要Excel.dll 需要如下三个命名空间 using System.IO; using Excel; using System.Data; 1 ...
- 【python-excel】Selenium+python自动化之读取Excel数据(xlrd)
Selenium2+python自动化之读取Excel数据(xlrd) 转载地址:http://www.cnblogs.com/lingzeng86/p/6793398.html ·········· ...
- Python+selenium之读取配置文件内容
Python+selenium之读取配置文件内容 Python支持很多配置文件的读写,此例子中介绍一种配置文件的读取数据,叫ini文件,python中有一个类ConfigParser支持读ini文件. ...
- EasyExcel 轻松灵活读取Excel内容
写在前面 Java 后端程序员应该会遇到读取 Excel 信息到 DB 等相关需求,脑海中可能突然间想起 Apache POI 这个技术解决方案,但是当 Excel 的数据量非常大的时候,你也许发现, ...
- java poi 读取excel内容
import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.ss.usermodel.Row; import or ...
随机推荐
- JavaScript快速入门(一)
JavaScript快速入门(二) 语句 只需简单地把各条语句放在不同的行上就可以分隔它们 var a = 1 var b = 2 如果想把多条语句放在同一行上,就需要用分号隔开 var a = 1; ...
- 12个例子夯实promise基础
工作中常常用到promise,async + await,遇到一些问题需要用到基础知识总会有一部分不记得,就重新温习权威指南和es6标准入门,花了几天肝下了这篇文章.喜欢的同学请动动发财手点个赞,文章 ...
- 让 JuiceFS 帮你做好「异地备份」
家住北京西二旗的小张是一家互联网金融公司的运维工程师,金融行业的数据可是很值钱的,任何的损坏和丢失都不能容忍. 为此,小张选了北京品质最高的机房,买了品质最好的硬件,做了全面的数据备份容灾策略: 每 ...
- 一文详解应用安全防护ESAPI
本文分享自华为云社区<应用安全防护ESAPI>,作者: Uncle_Tom. 1. ESAPI 简介 OWASP Enterprise Security API (ESAPI)是一个免费. ...
- Intellij IDEA 中 .properties文件中文乱码
在别的地方显示正常的 application.properties 文件,放到 idea 中就会有乱码,如下图所示 idea 右下角编码那里还是灰色的,不能更改 解决方法 点开 idea 的 sett ...
- Python Split 函数用法
一.split函数简介Python中split()函数,具体作用如下: 拆分字符串.通过指定分隔符对字符串进行切片,并返回分割后的字符串列表(list):二.语法split() 方法语法: str.s ...
- 详解最新版RabbitMQ 基于RPM 方式的安装
如何选择安装版本 已经不支持的发布系列 版本 最后补丁版本 首次发布时间 停止更新时间 3.7 3.7.28 2017年11月28日 2020年09月30日 3.6 3.6.16 2015年12月22 ...
- 【Unity3D】UGUI之Image和RawImage
1 纹理(Texture) Image 控件和 RawImage 控件都是承载渲染图片的控件,都需要指定一个纹理(Texture)图片.在 Assets 窗口选中一张图片,在 Inspector ...
- 解决:Not found the kernel library or the kernel library is invalid
问题说明: 今天运行一个E语言写的程序报错, 看样子是缺少核心依赖库. 解决方法 去下载个易语言安装包安装一下即可.比如我安装的是: 易语言5.6完美破解版(精简版).exe 下载地址:https:/ ...
- 分享一个Github相关彩蛋
楼上很多回答 都是基于手把手实操Github.Git源代码管理相关, 这些操作"无他,唯手熟尔". 今天提供一个github上阅读源码的小技巧,逆天级别的彩蛋. 要想成为大神,Gi ...