from IPython.core.interactiveshell import InteractiveShell

InteractiveShell.ast_node_interactivity = "all" #全部行都能输出

import warnings

warnings.filterwarnings('ignore')

Excel基本概念

工作簿：一个Excel电子表格文档，扩展名.xlsx
工作表：一个工作簿最多可以包含255张工作表
活动表：用户当前查看或关闭Excel前最后退出的表
列：默认从A开始，行：默认从1开始
单元格：行列交叉的方格为单元格

安装openpyxl模块

# pip install openpyxl

import openpyxl

pip show openpyxl #查看包的版本

读取Excel文档

用openpyxl模块打开Excel文档

wb = openpyxl.load_workbook(r"C:\\Users\\Administrator\\example.xlsx") # wb means workbook

type(wb)

import os

os.getcwd() #获取当前工作路径

# os.chdir() #更改当前工作路径

从工作簿中取得工作表

wb.get_sheet_names()

sheet3 = wb.get_sheet_by_name('Sheet3') #get sheet by name

type(sheet3) #the type of sheet3 is a worksheet

sheet3.title #view the title of sheet

anotherSheet = wb.get_active_sheet() #get active sheet

anotherSheet.title #活动单元格的title

从表中取得单元格

import openpyxl

wb = openpyxl.load_workbook('example.xlsx')

sheet1 = wb.get_sheet_by_name("Sheet1")

sheet1['A1'] # Cell 提取单元格

sheet1['A1'].value #单元格的数据类型和内容

sheet1['A1'].row #单元格所在的行

sheet1['A1'].column #单元格所在的列

sheet1['A1'].coordinate #单元格所在的列

sheet1.cell(row=1,column=2) #提取第1行、第2列的单元格

sheet1.cell(row=1,column=2).value #提取第1行、第2列的单元格的值

for i in range(1,8,2):

    print(i,sheet1.cell(row=i,column=2).value)

import openpyxl

wb = openpyxl.load_workbook(r"C:\\Users\\Administrator\\example.xlsx")

sheet1 = wb.get_sheet_by_name('Sheet1')

sheet1.max_row

sheet1.max_column

列字母和数字之间的转化

import openpyxl

from openpyxl.utils import get_column_letter,column_index_from_string

get_column_letter(1)

get_column_letter(100)

column_index_from_string('A')

column_index_from_string('AA')

从表中取得行和列

import openpyxl

wb = openpyxl.load_workbook(r"C:\\Users\\Administrator\\example.xlsx")

sheet1 = wb.get_sheet_by_name('Sheet1')

tuple(sheet1['A1':'C3']) #每一行单独成tuple的一个元素

list(sheet1['A1':'C3']) #每一行单独成list的一个元素

for rowOfCellObjects in sheet1['A1':'C3']:  #打印区域

    for cellObj in rowOfCellObjects:

        print(cellObj.coordinate,cellObj.value)

    print('---End of Row---')

import openpyxl

wb = openpyxl.load_workbook(r"C:\\Users\\Administrator\\example.xlsx")

sheet1 = wb.get_active_sheet()

for cellObj in list(sheet1.columns)[1]: #打印单列

    print(cellObj.value)

小结

导入openpyxl模块
调用openpyxl.load_workbook()函数
取得Workbook对象
调用get_active_sheet()或get_sheet_by_name()工作簿方法
使用索引或工作表的cell()方法，Cell()方法带上row和column参数
取得Cell对象
读取Cell对象的value/row/column/coordinate属性

项目：从Excel中读取数据

读取电子表格数据

import openpyxl,pprint

print("Opening workbook ...")

wb = openpyxl.load_workbook(r"C:\\Users\\Administrator\\censuspopdata.xlsx") #Workbook对象

sheet = wb.get_sheet_by_name('Population by Census Tract') #Worksheet对象

countyData = {}

#ToDo: Fill in countyData with each county's population and tracts.

print("Reading row...")

填充数据结构

for row in range(2,sheet.max_row+1):

    #Each row in the spreadsheet has data for one census tract.

    State = sheet['B'+str(row)].value

    County = sheet['C'+str(row)].value

    Pop = sheet['D'+str(row)].value

    # Make sure the key for this State exists.

    countyData.setdefault(State,{})

    #Make sure the key for this County in this state exists.

    countyData[State].setdefault(County,{'tracts':0,'pop':0})

    # Each row represents one census tractso increment by one.

    countyData[State][County]['tracts'] += 1

    #Increase the county pop by the pop in this census tract.

    countyData[State][County]['pop'] += int(Pop)

将程序结果写入文件

# Open a new text file and write the contents of countyData to it.

print("Writing results")

resultFile = open('census2010.py','w')

resultFile.write('allData = '+pprint.pformat(countyData))

resultFile.close()

print("Done")

# 调用已经存储好的census2010.py文件查看结果

import census2010

anchoragePop = census2010.allData['AK']['Anchorage']['pop']

print("The 2010 population of Anchorage was " + str(anchoragePop))

类似程序的思想(略)

写入Excel文档

创建并保存Excel文档

import openpyxl

wb = openpyxl.Workbook() #创建空对象

wb.get_sheet_names() #查看空对象的sheet

sheet = wb.get_active_sheet() #获取当前活动工作表

sheet.title

sheet.title = 'Spam Bacon Eggs Sheet' #修改当前工作表的title

wb.get_sheet_names() #查看已修改的活动工作表title

import openpyxl

wb = openpyxl.load_workbook('example.xlsx')

sheet = wb.get_active_sheet()

sheet.title = 'Spam Spam Spam'

wb.save('example_copy.xlsx') #保存修改工作表名的拷贝

创建和删除工作表

import openpyxl

wb = openpyxl.Workbook()

wb.get_sheet_names()

wb.create_sheet()

wb.get_sheet_names()

wb.create_sheet(index=0,title='First Sheet')

wb.get_sheet_names()

wb.create_sheet(index=2,title = 'Middle Sheet')

wb.get_sheet_names

wb.remove_sheet(wb.get_sheet_by_name('Middle Sheet'))

wb.remove_sheet(wb.get_sheet_by_name('Sheet1'))

wb.get_sheet_names()

['First Sheet', 'Sheet']

将值写入单元格

import openpyxl

wb = openpyxl.Workbook()

sheet = wb.get_sheet_by_name('Sheet')

sheet['A1'] = 'Hello World'

sheet['A1'].value

项目：更新一个电子表格

利用更新信息建立数据结构

import openpyxl

wb  = openpyxl.load_workbook('produceSales.xlsx')

sheet = wb.get_sheet_by_name('Sheet')

# the produce types and their updated prices

price_updates = {'Garlic':3.07,'Celery':1.19,'Lemon':1.27}

#ToDo:Loop through the rows and update the prices.

检查所有行，更新不正确的价格

for rowNum in range(2,sheet.max_row+1): #the first row is heading, skip it

    produceName = sheet.cell(row=rowNum,column=1).value

    if produceName in price_updates:

        sheet.cell(row=rowNum,column=2).value = price_updates[produceName]

wb.save('updatedProduceSales.xlsx')

类似程序的思想(从略)

设置单元格的字体风格

from openpyxl.styles import Font

wb = openpyxl.Workbook()

sheet = wb.get_sheet_by_name('Sheet')

italic24Font = Font(size = 24, italic = True)

sheet['A1'].font = italic24Font

sheet['A1'] = 'Hello world!'

wb.save('styled.xlsx')

Font对象

import openpyxl

from openpyxl.styles import Font

wb = openpyxl.Workbook()

sheet = wb.get_sheet_by_name('Sheet')

fontobj1 = Font(name='Times New Roman',italic=True) #name 字体 size 字号 bold 是否加粗 italic 是否斜体

sheet['A1'].font = fontobj1

sheet['A1'] = 'Bold Times New Roman'

fontobj2 = Font(size=24,italic=True)

sheet['B3'].font = fontobj2

sheet['B3']= '23 pt Italic'

wb.save('styles.xlsx') #默认size 11 name Calibri

公式

import openpyxl

wb = openpyxl.Workbook()

sheet = wb.get_active_sheet()

sheet['A1'] = 200

sheet['A2'] = 300

sheet['A3'] = '=SUM(A1:A2)'

wb.save('writeFormula.xlsx')

import openpyxl

wb = openpyxl.load_workbook('writeFormula.xlsx')

sheet = wb.get_active_sheet()

sheet['A3'].value

import openpyxl

wbDataonly = openpyxl.load_workbook('writeFormula.xlsx',data_only=True)

sheet1 = wbDataonly.get_active_sheet()

sheet1['A3'].value #此处需要手动打开一次.xlsx文件

调整行和列

调整行高和列宽

import openpyxl

wb = openpyxl.Workbook()

sheet = wb.active

sheet['A1'] = 'Tall row'

sheet['B2'] = 'Wide column'

sheet.row_dimensions[1].height = 70

sheet.column_dimensions['B'].width = 20

wb.save('dimensions.xlsx')

合并和拆分单元格

import openpyxl

wb = openpyxl.Workbook()

sheet = wb.active

sheet.merge_cells('A1:D3') #合并单元格

sheet['A1'] = 'Twelve cells merged together'

sheet.merge_cells('C5:D5')

sheet['C5'] = 'Two merged cells.'

wb.save('merged.xlsx')

import openpyxl

wb = openpyxl.load_workbook('merged.xlsx') #拆分单元格

sheet = wb.active

sheet.unmerge_cells('A1:D3')

sheet.unmerge_cells('C5:D5')

wb.save('merged.xlsx')

冻结窗格

import openpyxl

wb = openpyxl.load_workbook('produceSales.xlsx')

sheet = wb.active

sheet.freeze_panes = 'C2'

# "A2" means freeze row1 'B1' means freeze columnA 'C2' means freeze row1 and columnA/columnB 'A1' or None means no freezed

wb.save('freezeExample.xlsx')

图表

import openpyxl

wb = openpyxl.Workbook()

sheet = wb.active

for i in range(1,11): #create some data in column A

    sheet['A'+str(i)] = i

refObj = openpyxl.chart.Reference(sheet,min_row = 1,min_col = 1,max_row = 10,max_col = 1) #创建数据区域

seriesObj = openpyxl.chart.Series(refObj,title='First series')

chartObj = openpyxl.chart.BarChart()

chartObj.title = 'My chart'

chartObj.append(seriesObj)

sheet.add_chart(chartObj,'C5') #'C5'表示图表开始的位置

wb.save('sampleChart.xlsx')

习题与小结

openpyxl.load_workbook()函数返回什么？
- 返回Workbook对象
get_sheet_names()工作簿返回什么？
- 返回所有工作表名称构成的列表
如何取得名为“Sheet1”的工作表的Worksheet对象
- openpyxl.get_sheet_by_name("Sheet1")
如何取得工作不得活动工作表的Worksheet对象
- wb.get_active_sheet() / wb.active
如何取得单元格"C5"中的值
- sheet['C5'].value / sheet.cell(row=5,column=3).value
如何将单元格C5中的值设置成‘Hello’
- sheet['C5'] = 'Hello'
如何取得表示单元格的行和列的整数？
- get_column_letter(int) int --> char
- column_index_from_string char --> int
max_row/max_column返回什么，返回值的类型是什么？
- sheet1.max_row 以整数方式返回单元格区域的行号
- sheet1.max_column 以整数方式返回单元格区域的列号
如果要取得列‘M’的下标，需要调用什么函数
- column_index_from_string('M')
如果要取得列14的字符串名称，需要调用什么函数
- get_column_letter(14)
如何取得从A1到F1的所有Cell对象的元组
- tuple(sheet['A1':'F1])
如何将工作簿保存到文件名example.xlsx?
- wb.save('example.xlsx')
如何在单元格中设置一个公式？
- sheet['B1'] = '==SUM(A1:B15)'
如果需要取得单元格中公式的结果，而不是公式本身，必须先做什么？
- 读取时使用data_only = True
- mannual打开和保存工作簿
如何将第5行的高度设置为100
- sheet.row_dimensions[5] = 100
如何将列C的宽度设置成70
- sheet.column_dimensions['C'] = 70
列出一些openpyxl2.1.4不会从xlsx中加载的功能
- 图表 #版本已更新，新版本未知
什么是冻结窗格？
- sheet.freeze_panes = 'C2' 冻结首行和A、B列
创建条形图的步骤和方法：
- 加载数据 openpyxl.load_workbook()
- 创建reference对象 #图表的数据源区域
- 创建series对象，并将reference对象加入到series对象中 #数据序列
- 创建chart对象，并将series对象加入到chart对象中(append方法)
- 将chart对象加入到sheet中(add_chart方法)

本文整理自《python编程快速上手让繁琐工作自动化》

数据下载地址：http://nostarch.com/automatestuff/

利用Python openpyxl操作Excel的更多相关文章

python openpyxl 操作 excel
初识与安装 Openpyxl is a Python library for reading and writing Excel 2010 xlsx/xlsm/xltx/xltm files. 安装 ...
Python读写操作Excel模块_xlrd_xlwt_xlutils
Python 读写操作Excel -- 安装第三方库(xlrd.xlwt.xlutils.openpyxl) 如果仅仅是要以表单形式保存数据,可以借助 CSV 格式(一种以逗号分隔的表格数据格式)进行 ...
Python“文件操作”Excel篇（上）
大家好,我们今天来一起探索一下用Python怎么操作Excel文件.与word文件的操作库python-docx类似,Python也有专门的库为Excel文件的操作提供支持,这些库包括xlrd.xlw ...
数据测试001：利用python连接数据库插入excel数据
数据测试001:利用python连接数据库插入excel数据最近在做数据测试,主要是做报表系统,需要往数据库插入数据验证服务逻辑,本次介绍如何利用python脚本插入Oracle和Mysql库中: ...
Python Pandas操作Excel
Python Pandas操作Excel 前情提要 ☟ 本章使用的 Python3.6 Pandas==0.25.3 项目中需要用到excel的文件字段太多考虑到后续字段命名的变动以及中文/英文/日 ...
python用openpyxl操作excel
python操作excel方法 1)自身有Win32 COM操作office但讲不清楚,可能不支持夸平台,linux是否能用不清楚,其他有专业处理模块,如下 2)xlrd:(读excel)表,xlrd ...
python通过openpyxl操作excel
python 对Excel操作常用的主要有xlwt.xlrd.openpyxl ,前者xlwt主要适合于对后缀为xls比较进行写入,而openpyxl主要是针对于Excel 2007 以上版本进行操作 ...
Python 读写操作Excel —— 安装第三方库（xlrd、xlwt、xlutils、openpyxl）
数据处理是 Python 的一大应用场景,而 Excel 则是最流行的数据处理软件.因此用 Python 进行数据相关的工作时,难免要和 Excel 打交道. 如果仅仅是要以表单形式保存数据,可以借助 ...
用python库openpyxl操作excel,从源excel表中提取信息复制到目标excel表中
现代生活中,我们很难不与excel表打交道,excel表有着易学易用的优点,只是当表中数据量很大,我们又需要从其他表册中复制粘贴一些数据(比如身份证号)的时候,我们会越来越倦怠,毕竟我们不是机器,没法 ...

随机推荐

【视频开发】十全大补:CxImage图像处理类库
十全大补:CxImage图像处理类库转载IT168 CxImage是一个可以用于MFC 的C++图像处理类库类,它可以打开,保存,显示,转换各种常见格式的图像文件,比如BMP, JP ...
阿里云移动推送 ios项目添加SDK步骤
添加阿里云Pods仓库和各产品SDK Pod依赖,配置步骤如下: 1. CocoaPods集成添加阿里云Pods仓库,Podfile添加: source 'https://github.com/ali ...
php位运算及其高级应用
我们之前学过逻辑与(&&) 条件1 && 条件2 当两边条件同时成立时候返回1 逻辑或(||) 条件1 || 条件2 当两边条件只要有一 ...
Xcode中提高效率的快捷键
依稀记得大神都是使用超多的快捷键来开发的.虽然要成为大神的路很远,不过把下面这些快捷键用熟练,就相当于把宝剑磨的既快又光,相当于有了一件极品的装备,对于接下来的打(升)怪(职)升(加)级(薪)那肯定是 ...
3.01定义常量之define
[注:本程序验证是使用vs2013版] #include <stdio.h> #include <stdlib.h> #include <string.h> #pr ...
Python字符串格式化方式之format
format方式是在Python3引入了一个新的字符串格式化的方法,并且随后支持了Python2.7.这个新的字符串格式化方法摆脱了%操作符并且使得字符串格式化的语法更规范了.现在时候通过调用字符串对 ...
LOJ6300 博弈论与概率统计组合、莫队
传送门如果在\(0\)以下之后仍然会减分,那么最后的结果一定是\(N-M\). 注意到如果在Alice分数为\(0\)时继续输,那么就相当于减少了一次输的次数.也就是说如果说在总的博弈过程中,Ali ...
Codeforces Round #568 Div. 2
没有找到这场div3被改成div2的理由. A:签到. #include<bits/stdc++.h> using namespace std; #define ll long long ...
NIO(3)--Selector
Selector是NIO中的可选择Channel(SelectableChannel)的multiplexor.有两个拗口的概念,首先是SelectableChannel,在NIO里并非所有的Chan ...
quartz 定时器执行
类存储job信息 public class JobInfo {//省略setter getter String jobName; String jobGroup; Class<? extends ...

利用Python openpyxl操作Excel

Excel基本概念

安装openpyxl模块

读取Excel文档

用openpyxl模块打开Excel文档

从工作簿中取得工作表

从表中取得单元格

列字母和数字之间的转化

从表中取得行和列

小结

项目：从Excel中读取数据

读取电子表格数据

填充数据结构

将程序结果写入文件

类似程序的思想(略)

写入Excel文档

创建并保存Excel文档

创建和删除工作表

将值写入单元格

项目：更新一个电子表格

利用更新信息建立数据结构

检查所有行，更新不正确的价格

类似程序的思想(从略)

设置单元格的字体风格

Font对象

公式

调整行和列

调整行高和列宽

合并和拆分单元格

冻结窗格

图表

习题与小结

利用Python openpyxl操作Excel的更多相关文章

随机推荐

热门专题