使用Python处理Excel文件的一些代码示例

笔记：使用Python处理Excel文件的一些代码示例，以下代码来自于《Python数据分析基础》一书，有删改

#!/usr/bin/env python3

# 导入读取Excel文件的库，xlrd，其中的 open_workbook 为读取工作簿

from xlrd import open_workbook

input_file = 'D:\wangm\Documents\learning\code\python\data_row.xlsx'

# open_workbook(input_file) 打开一个工作簿

workbook = open_workbook(input_file)

# 输出此工作簿中有多少个表 workbook.nsheets

print('Number of worksheets: ', workbook.nsheets)

# 遍历工作簿中的每张表

for worksheet in workbook.sheets():

    # 分别输出每张表的名字、行数、列数

    print('Worksheet name: ', worksheet.name, '\tRows: ', worksheet.nrows, '\tColumns: ', worksheet.ncols)

# 处理单个工作簿

#!/usr/bin/env python3

# 导入读取Excel文件的库，xlrd，其中的 open_workbook 为读取工作簿

from xlrd import open_workbook

# 导入写工作簿的库

from xlwt import Workbook

input_file = 'D:\wangm\Documents\learning\code\python\data_row.xlsx'

output_file = 'D:\wangm\Documents\learning\code\python\data_out.xlsx'

# 创建一个Workbook对象

output_workbook = Workbook()

# 向output_workbook中添加一种名为'out_data_sheet_1'的表

output_wb_sheet = output_workbook.add_sheet('out_data_sheet_1')

with open_workbook(input_file) as workbook:

    # 通过名字选取工作簿中的某个表，也可以使用索引值选定

    worksheet = workbook.sheet_by_name('supplier_data')

    # worksheet = workbook.sheet_by_index(0)

    # 通过行、列索引值遍历工作簿中指定表的每一个值

    for row_index in range(worksheet.nrows):

        for column_index in range(worksheet.ncols):

            # 向工作簿中的一个选取的表(output_wb_sheet)的通过索引指定的单元格(row_index, column_index)中写入一个值

            output_wb_sheet.write(row_index, column_index, worksheet.cell_value(row_index, column_index))

# 将该工作簿保存为 output_file

output_workbook.save(output_file)

#!/usr/bin/env python3

# 导入读取Excel文件的库，xlrd，其中的 open_workbook 为读取工作簿

from xlrd import open_workbook

input_file = 'D:\wangm\Documents\learning\code\python\data_row.xlsx'

# open_workbook(input_file) 打开一个工作簿

workbook = open_workbook(input_file)

# 输出此工作簿中有多少个表 workbook.nsheets

print('Number of worksheets: ', workbook.nsheets)

# 遍历工作簿中的每张表

for worksheet in workbook.sheets():

    # 分别输出每张表的名字、行数、列数

    print('Worksheet name: ', worksheet.name, '\tRows: ', worksheet.nrows, '\tColumns: ', worksheet.ncols)

# 处理单个工作簿

#!/usr/bin/env python3

# 导入读取Excel文件的库，xlrd，其中的 open_workbook 为读取工作簿

from xlrd import open_workbook

# 导入写工作簿的库

from xlwt import Workbook

input_file = 'D:\wangm\Documents\learning\code\python\data_row.xlsx'

output_file = 'D:\wangm\Documents\learning\code\python\data_out.xlsx'

# 创建一个Workbook对象

output_workbook = Workbook()

# 向output_workbook中添加一种名为'out_data_sheet_1'的表

output_wb_sheet = output_workbook.add_sheet('out_data_sheet_1')

with open_workbook(input_file) as workbook:

    # 通过名字选取工作簿中的某个表，也可以使用索引值选定

    worksheet = workbook.sheet_by_name('supplier_data')

    # worksheet = workbook.sheet_by_index(0)

    # 通过行、列索引值遍历工作簿中指定表的每一个值

    for row_index in range(worksheet.nrows):

        for column_index in range(worksheet.ncols):

            # 向工作簿中的一个选取的表(output_wb_sheet)的通过索引指定的单元格(row_index, column_index)中写入一个值

            output_wb_sheet.write(row_index, column_index, worksheet.cell_value(row_index, column_index))

# 将该工作簿保存为 output_file

output_workbook.save(output_file)

#!/usr/bin/env python3

import pandas as pd

input_file = 'D:\wangm\Documents\learning\code\python\data_row.xlsx'

output_file = 'D:\wangm\Documents\learning\code\python\data_out_pd.xlsx'

# pd.read_excel() 读取一个Excel文件，并指定选中其中的某张表，将其变为一个”数据框“对象

data_frame = pd.read_excel(input_file, sheetname='supplier_data')

# 创建一个Excel文件

writer = pd.ExcelWriter(output_file)

# 将data_frame转为Excel文件，并写入输出文件

data_frame.to_excel(writer, sheet_name='supplier_data', index=False)

# 保存输出文件

writer.save()

#

# 筛选特定的行

# 在基本Python中：

# 类似于之前处理CSV文件，无非是改变了读写文件的函数，过程都是去每一行的值，筛选出符合条件的行

# 保存下来，然后写入Excel文件

# 下面给出使用pandas库来筛选

#!/usr/bin/env python3

import pandas as pd

input_file = 'D:\wangm\Documents\learning\code\python\data_row.xlsx'

output_file = 'D:\wangm\Documents\learning\code\python\data_out_pd.xlsx'

data_frame = pd.read_excel(input_file, 'supplier_data', index_col=None)

# 筛选出Cost值大于500的行，将标题行和这些行作为一个新的‘数据框’对象

# 下面这条用于筛选的语句，通过列名作为索引去除Cost的值，并将其转换为float在进行比较，比较结果为真的行留了下来

# 缺陷：将Cost的值的 $ 的符号丢掉了

#data_frame_value_meets_condition = data_frame[data_frame['Cost'].astype(float) > 500.0]

writer = pd.ExcelWriter(output_file)

#data_frame_value_meets_condition.to_excel(writer, sheet_name='supplier_data', index=False)

#writer.save()

# 还可以筛选出某一列中的值属于某个特定集合的行

important_dates = ['1/1/2018', '3/1/2018']

data_frame_value_in_set = data_frame[data_frame['Date'].isin(important_dates)]

data_frame_value_in_set.to_excel(writer, sheet_name='supplier_data', index=False)

writer.save()

# 此处写入后也将Cost的值的 $ 的符号丢掉了，起初我认为是因为被转换为float时的原因，然而此处却发现不是，那到底是为什么？

# 类似于处理CSV文件，pandas在处理Excel文件时，也有类似于使用RE筛选的函数

# 此处就产生一个疑问，pandas读取CSV文件、Excel文件后得到的对象为何如此相似？希望在后面具体了解pandas库时得到答案

选取特定的列
类似于处理CSV文件时的情况
读取多个Excel文件时，类似于前面处理CSV文件时的情况，使用glob

以上代码示例分别使用基本Python和pandas库处理Excel文件，运行在Python3.6 Win10上的Spyder下

使用Python处理Excel文件的一些代码示例的更多相关文章

使用Python处理CSV文件的一些代码示例
笔记:使用Python处理CSV文件的一些代码示例,来自于<Python数据分析基础>一书,有删改 # 读写CSV文件,不使用CSV模块,仅使用基础Python # 20181110 wa ...
[转]用Python读写Excel文件
[转]用Python读写Excel文件转自:http://www.gocalf.com/blog/python-read-write-excel.html#xlrd-xlwt 虽然天天跟数据打交 ...
python读写Excel文件的函数--使用xlrd/xlwt
python中读取Excel的模块或者说工具有很多,如以下几种: Packages 文档下载说明 openpyxl Download | Documentation | Bitbucket The ...
python之路-随笔 python处理excel文件
小罗问我怎么从excel中读取数据,然后我百了一番,做下记录以下代码来源于:http://www.cnblogs.com/lhj588/archive/2012/01/06/2314181.html ...
Python处理Excel文件
因为工作需求,需要审核一部分query内容是否有效,query储存在Excel中,文本内容为页面的Title,而页面的URL以HyperLink的格式关联到每个Cell. 于是本能的想到用Python ...
记录：python读取excel文件
由于最近老是用到python读取excel文件,所以特意记录一下python读取excel文件的大体框架. 库:xlrd(读),直接pip安装即可.想要写excel文件的话,安装xlwd库即可,也是直 ...
Python解析excel文件并存入sqlite数据库
最近由于工作上的需求需要使用Python解析excel文件并存入sqlite 就此做个总结功能:1.数据库设计建立数据库2.Python解析excel文件3.Python读取文件名并解析4.将解 ...
Python读写EXCEL文件常用方法大全
前言 python读写excel的方式有很多,不同的模块在读写的讲法上稍有区别,这里我主要介绍几个常用的方式. 用xlrd和xlwt进行excel读写: 用openpyxl进行excel读写: 用pa ...
php读取excel文件的实例代码
php读取excel文件的实例代码. 代码: <?php /** * php读取excel文件 * by www.jbxue.com */ $this->loadexcel();//半酣p ...

随机推荐

【bzoj1925】[Sdoi2010]地精部落组合数学+dp
题目描述传说很久以前,大地上居住着一种神秘的生物:地精. 地精喜欢住在连绵不绝的山脉中.具体地说,一座长度为 N 的山脉 H可分为从左到右的 N 段,每段有一个独一无二的高度 Hi,其中Hi是1到 ...
HDU-1528/1962 Card Game Cheater
两组牌中两张牌相比能赢的就连,后求最大匹配. #include <cmath> #include <cstdlib> #include <cstdio> #incl ...
严格次小生成树[BJWC2010] (树链剖分,倍增,最小生成树)
题目链接 Solution 有几点关键,首先,可以证明次小生成树一定是由最小生成树改变一条边而转化来. 所以需要枚举所有非最小生成树的边$(u,v)$.并且找到 $u$ 到 $v$ 的边中 ...
bzoj 4295 [PA2015]Hazard 贪心，暴力
[PA2015]Hazard Time Limit: 10 Sec Memory Limit: 512 MBSubmit: 69 Solved: 19[Submit][Status][Discus ...
PHP中的验证码类（完善验证码）
运行结果:  <?php class Vcode { private $width; //宽 private $height; //高 p ...
wireshark中的抓包过滤器和显示过滤器
一抓包过滤器语法说明:BPF语法(Berkeley Packet Filter) 类型Tpye:host,net,port 方向Dir:src,dst 协议Proto:ether,ip,tcp, ...
【CF1028A】Find Square（签到）
题意:给定矩阵里,找到由B构成的矩形的中心 n,m<=115 思路: #include<cstdio> #include<cstring> #include<str ...
net6：创建Membership对象数据源的代码
原文发布时间为:2008-07-30 -- 来源于本人的百度文章 [由搬家工具导入] 添加了一个db的类作为了对象数据源： using System;using System.Data;using S ...
react 生命周期详解
state有时候很不听话,在某些时候,我不想他渲染,偏偏react非常智能的帮我们重复渲染. 比如最常见的就是传递的对象为空,组件依旧渲染了一次或者多次. 更多场景不举例了,对症下药. shouldC ...
AC日记——Dishonest Sellers Codeforces 779c
C. Dishonest Sellers time limit per test 2 seconds memory limit per test 256 megabytes input standar ...

使用Python处理Excel文件的一些代码示例

使用Python处理Excel文件的一些代码示例的更多相关文章

随机推荐

热门专题