python数据处理excel和pdf,并打包成exe
之前零散的用过一点python做数据处理,这次又遇到一个数据处理的小功能,因此,记录一下整个流程,方便以后查阅。
功能要求:读取excel,找指定的PDF文件的页数是否与excel中记录的一致
整个处理过程包括python环境配置,插件安装,excel和PDF处理,exe打包
1、python环境配置
IDE用的是PyCharm社区版,pyhon环境用的是pandas,它内嵌了很多数据处理的插件,就有我们这次需要的excel处理插件。
安装其他插件,PDF处理采用PyPDF2,exe打包采用pyinstaller

2、excel和PDF处理
整个代码就不贴了,太多了也不想看,下面说一下主要代码块
1)excel读写
import pandas as pd # 读取excel文件,configPath为excel文件路径,configSheetName为excel中sheet表单名称
configTable = pd.read_excel(configPath, configSheetName)
# 读取表单中的数据,返回一个数组,数组存储每行的信息,fieldCount为表单数据列总数
configUnit = configTable.iloc[:, range(fieldCount)] configCount = len(configUnit)
for k in range(configCount):
# 读取第k行的具体列数据,loc的第二个参数是列名称
pdfNm = NameUnit.loc[k, pdfNmName]
fileNum = NameUnit.loc[k, fileNmName] # 省略若干代码... # 创建excel对象
writer = pd.ExcelWriter(excelPath + u'_结果.xlsx', engine='xlsxwriter')
NameUnit.to_excel(writer, sheet_name=configSheetName)
workbook = writer.book
worksheet = writer.sheets[configSheetName]
for k in range(configCount):
# 省略若干代码...
if pageCount != pageNum:
# 如果excel中记录值与实际值不相等
format1 = workbook.add_format({'bg_color': 'red'}) # 红色
else:
# 相等
format1 = workbook.add_format({'bg_color': 'transparent'}) # 白色
# 设置excel单元格格式
worksheet.conditional_format(color_range, {'type': 'no_blanks', 'format': format1})
worksheet.conditional_format(color_range, {'type': 'blanks', 'format': format1})
# 保存excel
writer.save()
2)PDF读取
import PyPDF2
import os # 判断文件是否存在
if os.path.exists(pdfFilePath):
# 获取PDF对象
pageObj = PyPDF2.PdfFileReader(pdfFilePath)
# 获取PDF页码总数
pageNum = pageObj.getNumPages()
3、exe打包
1)配置PyInstaller
参数-F表示打包成一个exe文件,不带-F则打包成一个文件夹,里面很多小文件,前一个运行速度慢一点,后一种运行速度快一点

2、遇到的问题
错误1:
RecursionError: maximum recursion depth exceeded
解决:在对应的spec文件前面添加最大的行数限制
import sys
sys.setrecursionlimit(5000)
错误2:
No module named 'pandas._libs.tslibs.timedeltas' in PyInstaller
在pandas安装路径下,Anaconda3\Lib\site-packages\PyInstaller\hooks新建hook-pandas.py文件,并根据报错信息添加缺少的模块,以下是我添加的所有依赖模块
hiddenimports=[
#all your previous hidden imports
'pandas', 'pandas._libs.tslibs.np_datetime', 'pandas._libs.tslibs.nattype',
'pandas._libs.skiplist'
]
点击Tools -> External Tools -> pyinstaller.exe运行spec文件,等个几分钟后就能在工程下的dist文件夹下找到打包的EXE,足足有300M。
python数据处理excel和pdf,并打包成exe的更多相关文章
- pyinstaller将python编写的打卡程序打包成exe
编写了一个简易的定时提醒下班打卡程序,python代码如下: #coding:utf-8 import time import datetime from tkMessageBox import * ...
- python学习===将py文件从打包成exe程序
1.进入要打包的py程序所在文件夹,例如hello.py程序要打包. 2.在同一目录下新建文件setup.py,内容如下: from distutils.core import setup impor ...
- 将 Python 程序打包成 .exe 文件
1.简介 做了一个excel的风控模板,里面含有宏,我用python的第三方xlwings部署到linux后发现,linux环境并不支持xlwings. Python 程序都是脚本的方式,一般是在解析 ...
- Python打包成exe程序
如何把.py文件打包成.exe可执行程序. 这里选择用PyInstaller 3.0来打包,PyInstaller 3.0下载地址:https://pypi.python.org/pypi/PyIns ...
- python的py文件打包成exe
一.首先需要安装Pyinstaller-- 使用pip来安装模块 (我电脑上装的是python的一个编译环境Anaconda,如果电脑上装的是python自带的IDE的话,就直接进入python的安装 ...
- python打包成exe
目前有三种方法可以实现python打包成exe,分别为 py2exe Pyinstaller cx_Freeze 其中没有一个是完美的 1.py2exe的话不支持egg类型的python库 2.Pyi ...
- 将Python 程序打包成 .exe格式入门
PyInstaller PyInstaller 是一个十分有用的第三方库,可以用来打包 python 应用程序,打包完的程序就可以在没有安装 Python 解释器的机器上运行了. 它能够在 Windo ...
- 将Python项目打包成EXE可执行文件(单文件,多文件,包含图片)
解决 将Python项目打包成EXE可执行文件(单文件,多文件,包含图片) 1.当我们写了一个Python的项目时,特别是一个GUI项目,我们特备希望它能成为一个在Windows系统可执行的EXE文件 ...
- 关于python打包成exe的一点经验之谈
我经常用python写些脚本什么的,有时候脚本写完以后,每次运行都得在IDE打开在运行,很麻烦,所以经常将python编译成exe.SO...有了一点经验,在这和大家分享一下. python ...
随机推荐
- [python] PyMouse、PyKeyboard用python操作鼠标和键盘
1.PyUserInput 简介 PyUserInput是一个使用python的跨平台的操作鼠标和键盘的模块,非常方便使用.支持的平台及依赖如下: Linux - Xlib Mac - Quart ...
- 【RL-TCPnet网络教程】第17章 RL-TCPnet之UDP通信
第17章 RL-TCPnet之UDP通信 本章节为大家讲解RL-TCPnet的UDP通信实现,学习本章节前,务必要优先学习第16章UDP用户数据报协议基础知识.有了这些基础知识之后,再搞本章 ...
- Android OpenSL ES 开发:OpenSL ES利用SoundTouch实现PCM音频的变速和变调
缘由 OpenSL ES 学习到现在已经知道 OpenSL ES 不仅能播放和录制PCM音频数据,还能改变声音大小.设置左声道或右声道播放.还能变速播放,可谓是播放音频的王者.但是变速有一点不好的就是 ...
- [Swift]LeetCode179. 最大数 | Largest Number
Given a list of non negative integers, arrange them such that they form the largest number. Example ...
- H5 页面调试小帮手-UC 开发者工具
调试web页面难 接触过app自动化的同学都比较清楚,如果想要对web应用或者Hybrid应用进行调试时(获取页面元素信息等等),必定绕不开的就是chrome浏览器的inspect功能了:在chrom ...
- presto中ldaps配置完整流程
最近开始转战presto,至于前面章节中的Hbase,我也会持续更新,喜欢我的可以关注我.关于这个流程,我看过阿里云的的一篇文章,但看后还是不知所云,就写下了这篇博客,大家感兴趣的可以访问那篇文章—— ...
- ThinkPHP 数据库操作(一) : 连接数据库
ThinkPHP内置了抽象数据库访问层,把不同的数据库操作封装起来,我们只需要使用公共的Db类进行操 作,而无需针对不同的数据库写不同的代码和底层实现,Db类会自动调用相应的数据库驱动来处理.采用 P ...
- 【Spark篇】---SparkStreaming算子操作transform和updateStateByKey
一.前述 今天分享一篇SparkStreaming常用的算子transform和updateStateByKey. 可以通过transform算子,对Dstream做RDD到RDD的任意操作.其实就是 ...
- 8.Django缓存和信号
缓存 由于Django是动态网站,所有每次请求均会去数据进行相应的操作,当程序访问量大时,耗时必然会更加明显,最简单解决方式是使用:缓存,缓存将某个views的返回值保存至内存或者memcache中, ...
- Zabbix4.0.3解决中文乱码
字体下载地址:https://github.com/hejianlai/Zabbix/raw/master/font/msyh.ttf放到以下目录,可能你的路径和我的不一样用find查出来cd /us ...