常用模块 - openpyxl模块
一、简介
xlrd/xlwt
主要是针对Office 2003或更早版本的XLS文件格式
缺点:不支持XLSX文件格式
OpenPyXL
能读能写能修改
缺点:不支持XLS
Microsoft Excel API
强大无极限
缺点:速度慢
二、基本用法
首先介绍下Excel的一些基本概念,Workbook相当于是一个文件,WorkSheet就是文件里面的每个具体的表,比如新建Excel文件里面的“Sheet1”,一个Workbook里面有一个或多个WorkSheet。
2.1操作Workbook对象
获取Workbook对象的方法有两种,一种是创建一个新的,一种是导入一个已经存在的。
2.1.1获取Workbook对象
方法1:创建Workbook
# 导入模块
from openpyxl import Workbook
# 创建一个Workbook
wb = Workbook() // 默认生成一个名为'Sheet'的WorkSheet
方法2:导入Workbook
# 导入模块
from openpyxl import load_workbook
# 导入一个Workbook
wb = load_workbook(filename='test.xlsx')
2.1.2Workbook属性
sheetnames: 返回所有WorkSheet的名字列表,类型为list
worksheets: 返回所有WorkSheet的列表,类型为list
active: 返回当前默认选中的WorkSheet
2.1.3Workbook方法
get_sheet_names(): 同sheetnames
get_active_sheet(): 同active属性
get_sheet_by_name(name): 根据名称获取WorkSheet
remove(worksheet): 删除一个WorkSheet,注意是WorkSheet对象,不是名字
save(filename): 保存到文件,记住有写入操作记得保存。
2.2操作WorkSheet
2.2.1获取WorkSheet对象
# 获取默认打开的(active)的WorkSheet
ws1 = wb.active
# 创建一个WorkSheet
ws2 = wb.create_sheet() # 可传title和index两个参数,不传生成的WorkSheet名在'Sheet'后面递增加数字
# 通过名称获取WorkSheet
ws3=wb['Sheet1']
2.2.2WorkSheet属性
rows: 返回所有有效数据行,有数据时类型为generator,无数据时为tuple
columns: 返回所有有效数据列,类型同rows
max_column: 有效数据最大列
max_row: 有效数据最大行
min_column: 有效数据最小列,起始为1
min_row: 有效数据最大行,起始为1
values: 返回所有单元格的值的列表,类型为tuple
title: WorkSheet的名称
2.2.3WorkSheet方法
cell(coordinate=None, row=None, column=None, value=None): 获取指定单元格或设置单元格的值,具体使用在cell下面介绍
2.3操作Cell
2.3.1获取Cell对象
# 使用WorkSheet的Cell方法
c1 = ws.cell('A1')
c2 = ws.cell(row=1, column=1) # 获取A1单元格
# 通过坐标获取Cell
c3 = ws['A1']
# 获取多个
c3 = ws['A1:E5'] # 返回多行数据,类型为tuple
2.3.2设置Cell的值
# 直接使用WorkSheet的cell方法设置
ws.cell(row=1, column=1, value=10)
# 设置Cell对象value属性
c1 = ws.cell('A1')
c1.value = 100
2.3.3Cell属性
column: 所在列,起始为1
row: 所在行,起始为1
coordinate: 所在坐标,如'A1'
parent: 所属的WorkSheet
value: 单元格的值
2.3.4Cell方法
offset(row=0, column=0): 偏移
三、使用实例
#! /usr/bin/env python3
# -*- coding:utf-8 -*- # Author : mayi
# Blog : http://www.cnblogs.com/mayi0312/
# Date : 2019/04/25
# Name : my_excel_model
# Software : PyCharm
# Note : 功能:使用openpyxl模块处理Excel文件 import os
from openpyxl import load_workbook
from openpyxl import Workbook def getExcelConOpenpyxl(file_name, book_name=None, data_type="list", index=1):
"""
利用openpyxl模块获取Excel表中的内容
:param file_name: Excel表文件名
:param book_name: Sheet表名
:param data_type: 列表中存储每行内容的方式(list或dict),默认为列表
:param index: sheet的序号或者名字,默认处理第一个sheet
:return: Excel表中的内容
"""
# 打开一个xlsx文件
wb = load_workbook(file_name)
# 打开指定的sheet
# sheet = wb.get_sheet_by_name("名单")
# sheet = wb["名单"]
if not book_name:
sheet = wb.active
else:
sheet = wb.get_sheet_by_name(book_name)
# 用于存储Excel表内容的列表
excel_con_list = []
# 获取所有内容
line_list = sheet.rows
# 第一行为表头
field_list = next(line_list)
for line in line_list:
if data_type == "dict":
# 字典
temp_line_dict = {}
for i, cell in enumerate(line):
cell_key = field_list[i].value
cell_value = cell.value
temp_line_dict[cell_key] = cell_value
excel_con_list.append(temp_line_dict)
else:
# 列表
temp_line_list = []
for i, cell in enumerate(line):
cell_key = field_list[i].value
cell_value = cell.value
temp_line_list.append([cell_key, cell_value])
excel_con_list.append(temp_line_list) # 关闭文档
wb.close() return excel_con_list def setExcelConOpenpyxl(file_name, con_list, field_list=None, book_name=None, model=None):
"""
利用openpyxl模块将列表中的内容存储至Excel表中
:param file_name: Excel表文件名
:param con_list: 需要保存的列表信息
:param field_list: 表头内容
:param book_name: Sheet表名称
:param model: 模板文件名(默认没有模板)
:return: None
"""
if model:
# 如果有模板文件,则打开模板工作簿
wb = load_workbook(model)
else:
# 否则,新建一个Excel工作簿
wb = Workbook()
# 激活工作表
sheet = wb.active
if not book_name:
sheet.title = book_name
if field_list:
# 如果有设置表头的话
# 列数
n_col = len(field_list)
for i_col in range(n_col):
sheet.cell(row=1, column=i_col + 1, value=field_list[i_col])
# 行数
n_row = len(con_list)
for i in range(n_row):
# 列数
n_col = len(con_list[i])
for j in range(n_col):
sheet.cell(row=2 + i, column=j + 1, value=con_list[i][j]) if not os.path.exists(os.path.dirname(file_name)):
# 如果文件所在目录不存在,则创建
os.makedirs(os.path.dirname(file_name)) # 文档另存为
wb.save(file_name)
# 关闭文档
wb.close() # 入口函数
if __name__ == '__main__':
filename = "test.xlsx"
con_list = getExcelConOpenpyxl(filename)
print(con_list)
filename = os.path.abspath("test_w.xlsx")
field_list = ["序号", "姓名", "性别", "年龄"]
con_list = [
[1, "张三", "男", ""],
[2, "李四", "女", ""],
[3, "王五", "男", ""],
[4, "麻六", "女", ""],
[5, "田七", "男", ""],
]
setExcelConOpenpyxl(filename, con_list, field_list, book_name="名单")
注意:
·Cell的row和column都是从1开始的
·文件操作完记得调用Workbook的save()方法
·最好记得调用Workbook的close()方法
常用模块 - openpyxl模块的更多相关文章
- Python基础之模块:5、 第三方模块 requests模块 openpyxl模块
目录 一.第三方模块的下载与使用 1.什么是第三方模块 2.如何安装第三方模块 方式一:pip工具 方式二:pycharm中下载 3.注意事项 1.报错并有警告信息 2.报错,提示关键字 3.报错,无 ...
- json模块 pickle 模块 collections 模块 openpyxl 模块
json模块 json 模块是一个系列化模块 一个第三方的特殊数据格式 可以将python数据类型----> json 数据格式 ----> 字符串 ----> 文件 其他语言想要使 ...
- 日志、第三方模块(openpyxl模块)
目录 1.日志模块 2.第三方模块 内容 日志模块 1.日志模块的主要组成部分 1.logger对象:产生日志 无包装的产品 import logging logger = logging.getLo ...
- 7.19 包 logging模块 hashlib模块 openpyxl模块 深浅拷贝
包 包是什么 他是一系列文件的结合体,表现形式就是文件夹 包的本质还是模块 他通常会有__init__.py文件 我们首先回顾一下模块导入的过程 import module首次导入模块(.py文件) ...
- Python笔记(十四):操作excel openpyxl模块
(一) 常遇到的情况 就我自己来说,常遇到的情况可能就下面几种: 读取excel整个sheet页的数据. 读取指定行.列的数据 往一个空白的excel文档写数据 往一个已经有数据的excel文档追加 ...
- openpyxl模块介绍
openpyxl模块是一个读写Excel 2010文档的Python库,如果要处理更早格式的Excel文档,需要用到额外的库,openpyxl是一个比较综合的工具,能够同时读取和修改Excel文档.其 ...
- python之openpyxl模块
一 . Python操作EXCEL库的简介 1.1 Python官方库操作excel Python官方库一般使用xlrd库来读取Excel文件,使用xlwt库来生成Excel文件,使用xlutils库 ...
- openpyxl模块(excel操作)
openpyxl模块介绍 openpyxl模块是一个读写Excel 2010文档的Python库,如果要处理更早格式的Excel文档,需要用到额外的库,openpyxl是一个比较综合的工具,能够同时读 ...
- [Python]-openpyxl模块Excel数据处理-读取公式的结果
日常需要Python来处理各种数据,处理Excel数据常用的库一般有openpyxl.xlrd(读取).xlwt(写入). 经过对比发现openpyxl模块比较好用. openpyxl模块 这篇笔记比 ...
随机推荐
- Android MVP模式就是这么回事儿
MVP模式 概念就不说了,大家都懂.View层通过Persenter层相互通信,避免了View中大量的业务代码,而将其提取到Model中.其实简单的来说,就是通过接口回调,把业务分离出去.提高代码的可 ...
- CSS3 选择器用法小结
表单选择器: /*:enabled 可用的 :disabled 被禁用的 :focus 获取了焦点的 多用在表单元素上*/ input:enabled {...} input:disabled {.. ...
- doPost方法不支持 a 标签和地址栏直接输入地址访问
demo <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF- ...
- 实现自定义Session
1. 回话状态接口 /// <summary> /// 会话状态策略接口 /// </summary> public partial interface ISessionStr ...
- requirejs中Shims使用说明
RequireJS中如果使用AMD规范,在使用的过程中没有太多的问题,如果加载非AMD规范的JS文件,就需要使用Require中的shim. require.config({ paths:{ jque ...
- ShowDoc
ShowDoc 摘自ShowDoc 每当接手一个他人开发好的模块或者项目,看着那些没有写注释的代码,我们都无比抓狂.文档呢?!文档呢?!Show me the doc !! 程序员都很希望别人能写技术 ...
- hdfs操作手册
hdfscli 命令行 # hdfscli --help HdfsCLI: a command line interface for HDFS. Usage: hdfscli [interactive ...
- Visual Studio 下nuget命令的使用
从Visual Studio 2012版本开始默认集成了Nuget扩展,在Visual Studio 2010或以下的版本需要单独安装,安装方法如下: 1. “工具”→“扩展和更新...”,弹出扩展管 ...
- django项目设计
我们以前是只建立一个项目只建立一个app,如果我们要建立多个app的时候 并且这个app要写很多额视图的函数views内函数,要是建立很多种的时候就会造成很冗杂,不美观 我们未来增强解耦性,就把那个 ...
- oracle中存储过程把表导出txt文件
create or replace directory MY_DIR as 'D:\MY_DIR\'; grant read,write on directory MY_DIR to adm; sel ...