(一)  常遇到的情况

就我自己来说,常遇到的情况可能就下面几种:

  1. 读取excel整个sheet页的数据。
  2. 读取指定行、列的数据
  3. 往一个空白的excel文档写数据
  4. 往一个已经有数据的excel文档追加数据

下面就以这几种情况为例进行说明。

(二)  涉及的模块及函数说明

就我知道的,有3个模块可以操作excel文档,3个模块通过pip都可以直接安装。

xlrd:读数据

xlwt:写数据

openpyxl:可以读数据,也可以写数据

这里就就只说明openpyxl了,因为这个模块能满足上面的需要了。

openpyxl函数

函数

说明

load_workbook(filename)

打开excel,并返回所有sheet页

访问指定sheet页的方法:

#打开excel文档
wb =
openpyxl.load_workbook(file_name)
#访问sheet页
sheet = wb[‘sheet页的名称’]

#关闭excel文档

wb.close()

Workbook()

创建excel文档

wb = openpyxl.Workbook()

#保存excel文档

wb.save('文件名.xlsx')

下面的函数是针对sheet页的

sheet = wb[‘sheet页的名称’]

访问指定单元格的方式sheet['A1']、sheet['B1']...

min_row

返回包含数据的最小行索引,索引从1开始

例如:sheet.min_row

max_row

返回包含数据的最大行索引,索引从1开始

min_column

返回包含数据的最小列索引,索引从1开始

max_column

返回包含数据的最大列索引,索引从1开始

values

获取excel文档所有的数据,返回的是一个generator对象

iter_rows(min_row=None, max_row=None, min_col=None, max_col=None)

min_row:最小行索引

max_row:最大行索引

min_col:最小列索引

max_col:最大列索引

获取指定行、列的单元格,没指定就是获取所有的

现在我有这么一个excel,下面以这个excel进行说明。

关于min_row、max_row这些,看下面的输出就很直观了

 import openpyxl

 def get_data_openpyxl(file_name,sheet):
#打开excel文档
wb = openpyxl.load_workbook(file_name)
#访问sheet页
sheet = wb[sheet]
# 包含数据的最小行索引,从1开始
minRow = sheet.min_row
print("最小行索引是:", minRow)
#包含数据的最大行索引,从1开始
maxRow = sheet.max_row
print("最大行索引是:",maxRow)
#包含数据的最小列索引
minColumn = sheet.min_column
print("最小列索引是:",minColumn)
#包含数据的最大列索引
maxColumn = sheet.max_column
print("最大列索引是:", maxColumn)
wb.close()
get_data_openpyxl('测试.xlsx','Sheet')

(三)  读取excel整个sheet页的数据

下面的代码都是没加异常处理的,要加的话自己看情况加上异常处理就行了。

 import openpyxl

 def get_data_openpyxl(file_name,sheet):
#打开excel文档
wb = openpyxl.load_workbook(file_name)
#访问sheet页
sheet = wb[sheet]
# 获取excel文档所有的数据,返回的是一个generator对象
data = sheet.values
print(data)
#迭代输出所有数据
for i in data:
print(i)
wb.close()
get_data_openpyxl('测试.xlsx','Sheet')

(四)  读取指定行、列的数据

这里有个问题就是,openpyxl模块貌似没有读取指定行、列数据的函数,不过没关系,自己封装一个函数去实现就行了,这个是通用的(前提是已经安装openpyxl),可以创建一个类(可以根据函数的作用创建多个不同的类,这个看自己了),放一些自己写的常用函数。

 import openpyxl

 def get_data_iter(file_name,sheet, max_row=None,min_row=None,max_col=None,min_col=None):
''' :param file_name: excel文件名称
:param sheet: sheet页名称
:param max_row:最大行索引,未指定则获取所有行的数据
:param min_row: 最小行索引,未指定则从第一行开始
:param min_col:最小列索引,未指定则从第一列开始
:param max_col:最大列索引,未指定则获取所有列的数据
:return:返回指定行、列的数据
'''
# 打开excel文档
wb = openpyxl.load_workbook(file_name)
# 访问sheet页
sheet = wb[sheet]
# 获得指定行列的单元格
cell = sheet.iter_rows(max_row=max_row, min_row=min_row, max_col=max_col, min_col=min_col)
all_rows = []
# 获取单元格的值
for row in cell:
rows = []
for c in row:
rows.append(c.value)
all_rows.append(tuple(rows))
wb.close()
return all_rows rows = get_data_iter('测试.xlsx','Sheet',max_row=10,min_row=5,max_col=3,min_col=1)
print(rows)
for i in rows:
print(i)

(五)  往空白的excel文档写数据

 import openpyxl

 #创建excel文档
wb =openpyxl.Workbook()
sheet = wb['Sheet']
sheet['A1'] = '颜色'
sheet['B1'] = '版本'
x = 2
for i in range(10):
sheet['A'+str(x)] = i+1
sheet['B'+str(x)] = i+1
x += 1 wb.save('测试写数据.xlsx')

执行后,可以在当前工作目录下看到这个excel文档

(六)  往一个已经有数据的excel文档追加数据

要追加数据的话,获取已经有数据的最大索引就行了,从下一行开始添加数据,这里X的初始值忘记加1了,代码就不修改了,能看明白就行了

 import openpyxl

 # 打开excel文档
wb = openpyxl.load_workbook('测试写数据.xlsx')
# 访问sheet页
sheet = wb['Sheet']
#获取最大行索引
maxRow = sheet.max_row
x = maxRow
for i in range(10):
sheet['A'+str(x)] = '追加数据'
sheet['B'+str(x)] = '追加数据'
x += 1 wb.save('测试写数据.xlsx')

执行完后:

Python笔记(十四):操作excel openpyxl模块的更多相关文章

  1. Python第十四天 序列化 pickle模块 cPickle模块 JSON模块 API的两种格式

    Python第十四天 序列化  pickle模块  cPickle模块  JSON模块  API的两种格式 目录 Pycharm使用技巧(转载) Python第一天  安装  shell  文件 Py ...

  2. python3操作Excel openpyxl模块的使用

    python 与excel 安装模块 本例子中使用的模块为: openpyxl 版本为2.4.8 安装方法请参看以前发表的文章(Python 的pip模块安装方法) Python处理Excel表格 使 ...

  3. Python笔记(十四)_永久存储pickle

    pickle模块:将所有的Python对象转换成二进制文件存放 应用场景:编程时最好将大对象(列表.字典.集合等)用pickle写成永久数据包供程序调用,而不是直接写入程序 写入过程:将list转换为 ...

  4. python笔记十四(高阶函数——map/reduce、filter、sorted)

    一.map/reduce 1.map() map(f,iterable),将一个iterable对象一次作用于函数f,并返回一个迭代器. >>> def f(x): #定义一个函数 ...

  5. python制作简单excel统计报表2之操作excel的模块openpyxl简单用法

    python制作简单excel统计报表2之操作excel的模块openpyxl简单用法 # coding=utf-8 from openpyxl import Workbook, load_workb ...

  6. VSTO学习笔记(十四)Excel数据透视表与PowerPivot

    原文:VSTO学习笔记(十四)Excel数据透视表与PowerPivot 近期公司内部在做一种通用查询报表,方便人力资源分析.统计数据.由于之前公司系统中有一个类似的查询使用Excel数据透视表完成的 ...

  7. Python第二十四天 binascii模块

    Python第二十四天 binascii模块 binascii用来进行进制和字符串之间的转换 import binascii s = 'abcde' h = binascii.b2a_hex(s) # ...

  8. Python 3标准库 第十四章 应用构建模块

    Python 3标准库 The Python3 Standard Library by  Example -----------------------------------------第十四章   ...

  9. 孤荷凌寒自学python第二十四天python类中隐藏的私有方法探秘

    孤荷凌寒自学python第二十四天python类中隐藏的私有方法探秘 (完整学习过程屏幕记录视频地址在文末,手写笔记在文末) 今天发现了python的类中隐藏着一些特殊的私有方法. 这些私有方法不管我 ...

随机推荐

  1. WIN10下Prolific USB-to-Serial Comm Port驱动

    最近在安装Prlific的时候,通过电脑自动安装启动后,发现系统无法识别,如下图所示: 还以为是驱动比较老,没有及时更新导致的,去官网下载最新的驱动,发现了这个列表: 这个驱动不支持win10. 后来 ...

  2. [原创]MOF提权下载者代码

    0x001 网上的mof提权 调用的是js执行添加用户 而且有个缺陷 还不能一步到位...目标3389也连不上...也不知道上面安装了什么软件...毛然添加用户也不好比如有个类似狗之类的拦截添加用户 ...

  3. DDD实战进阶第一波(四):开发一般业务的大健康行业直销系统(搭建支持DDD的轻量级框架三)

    上一篇文章我们讲了经典DDD架构对比传统三层架构的优势,以及经典DDD架构每一层的职责后,本篇文章将介绍基础结构层中支持DDD的轻量级框架的主要代码. 这里需要说明的是,DDD轻量级框架能够体现DDD ...

  4. SignalR 中使用 MessagePack 序列化提高 WebSocket 通信性能

    It's like JSON.but fast and small. MessagePack is an efficient binary serialization format. It lets ...

  5. Linux编程 4 (创建文件touch,复制文件cp,tab补全,链接文件ln)

    一.创建文件 使用touch 可以创建空文件,例如opt目录下创建test2.txt文件.这种一般是有些程序必须要先创建文件,才能使用. 二. 复制文件 2.1 使用cp命令来复制文件,需要两个参数- ...

  6. salesforce零基础学习(八十八)项目中的零碎知识点小总结(二)

    通过做项目以及群里面的一些大神的聊天,总结一下关于项目中的两个知识点,以后当做参考. 一. 在custom setting中配置集成接口信息后刷sandbox的问题 我们做项目时,经常会遇见和其他平台 ...

  7. Debatching(Splitting) XML Message in Orchestration using DefaultPipeline - BizTalk 2010

    Debatching(Splitting) XML Message in Orchestration using DefaultPipeline - BizTalk 2010   In this po ...

  8. JWT的相关讲解

    原文链接: http://www.cnblogs.com/chenwolong/p/Token.html

  9. SQL语句简单笔记

    Create database database name://创建数据库 Show databases dbName: //显示所有数据库 Create table tableName: //创建表 ...

  10. 性能监控(1)--linux下的top命令

    Linux下的监控工具 top命令 top命令能够实时显示系统中各个进程的资源占用情况,其输出信息分为两部分,前半部分为系统统计信息,后半部分是进程信息. 第一行是任务队列信息,它的结果等同于upti ...