背景

由于工作原因，经常需要将多个pdf文件合并后打印，有时候上网找免费合并工具比较麻烦（公司内网不能访问公网），于是决定搞个小工具。

具体实现

需要安装 PyPDF2

pip install PyPDF2

代码

# -*- coding=utf-8 -*-

"""

功能: 将当前目录下的所有pdf文件合并为一个文件，新文件命名为 all_merge_年月日_时分秒.pdf

被合并的pdf文件不包含 all_merge 开头的文件

"""

import PyPDF2

import pathlib

import datetime

def do_merge(the_dir):

    prefix = 'all_merge'

    output_file = '%s_%s.pdf' % (prefix, datetime.datetime.now().strftime('%Y%m%d_%H%M%S'))

    pdf_files = []

    path_dir = pathlib.Path(the_dir)

    for filename in path_dir.iterdir():

        if not filename.is_file():

            continue

        if filename.name[0:len(prefix)] == prefix:

            continue

        elif filename.name.endswith('.pdf'):

            pdf_files.append(filename.name)

    pdf_files.sort(key=str.lower)

    pdf_writer = PyPDF2.PdfFileWriter()

    print("find %d pdf file(s)." % len(pdf_files))

    idx = 0

    for f in pdf_files:

        idx += 1

        print("%d: %s" % (idx, f))

        pdf_obj = open(f, 'rb')

        pdf_reader = PyPDF2.PdfFileReader(pdf_obj)

        for page_num in range(0, pdf_reader.numPages):

            page_obj = pdf_reader.getPage(page_num)

            pdf_writer.addPage(page_obj)

    pdf_output = open(output_file, 'wb')

    pdf_writer.write(pdf_output)

    pdf_output.close()

    print("merge file:[ %s ]" % output_file)

    input("Press any key to exit.")

if __name__ == "__main__":

    do_merge(".")

效果

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理

想要获取更多Python学习资料可以加
QQ:2955637827私聊
或加Q群630390733
大家一起来学习讨论吧！

Python实现多个pdf文件合并的更多相关文章

【转】Python编程: 多个PDF文件合并以及网页上自动下载PDF文件
1. 多个PDF文件合并1.1 需求描述有时候,我们下载了多个PDF文件, 但希望能把它们合并成一个PDF文件.例如:你下载的数个PDF文件资料或者电子发票,你可以使用python程序合并成一个PDF ...
利用Python将多个PDF文件合并
from PyPDF2 import PdfFileMerger import os files = os.listdir()#列出目录中的所有文件 merger = PdfFileMerger() ...
深入学习Python解析并解密PDF文件内容的方法
前面学习了解析PDF文档,并写入文档的知识,那篇文章的名字为深入学习Python解析并读取PDF文件内容的方法. 链接如下:https://www.cnblogs.com/wj-1314/p/9429 ...
如何将两个PDF文件合并到一个页面中
在目前职场办公中,很多使用的文件格式是PDF文件格式,由于工作的需要,经常需要将PDF文件合并在一起,但由于PDF文件不能直接编辑修改,不能OFFICE,WPS那样,通过复制粘贴将两者合并,那如何解决 ...
深入学习python解析并读取PDF文件内容的方法
这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应 ...
python转换html到pdf文件
1.安装wkhtmltopdf Windows平台直接在 http://wkhtmltopdf.org/downloads.html 下载稳定版的 wkhtmltopdf 进行安装,安装完成之后把该程 ...
【转】Python 深入浅出 - PyPDF2 处理 PDF 文件
实际应用中,可能会涉及处理 pdf 文件,PyPDF2 就是这样一个库,使用它可以轻松的处理 pdf 文件,它提供了读,割,合并,文件转换等多种操作. 文档地址:http://pythonhosted ...
利用python第三方库提取PDF文件的表格内容
小爬最近接到一个棘手任务:需要提取手机话费电子发票PDF文件中的数据.接到这个任务的第一时间,小爬决定搜集各个地区各个时间段的电子发票文件,看看其中的差异点.粗略统计下来,PDF文件的表格框架是统一的 ...
办公室文员必备python神器，将PDF文件表格转换成excel表格！
[阅读全文] 第三方库说明 # PDF读取第三方库 import pdfplumber # DataFrame 数据结果处理 import pandas as pd 初始化DataFrame数据对象 ...

随机推荐

leetcode187. 重复的DNA序列
所有 DNA 都由一系列缩写为 A,C,G 和 T 的核苷酸组成,例如:"ACGAATTCCG".在研究 DNA 时,识别 DNA 中的重复序列有时会对研究非常有帮助.编写一个函数 ...
java多态2
1 package pet_2; 2 3 public class Pet { 4 private String name; 5 6 public String getName() { 7 retur ...
.Net Core官方的 JWT 授权验证
什么是JWT? JSON Web令牌(JWT)是一个开放标准(RFC 7519),它定义了一种紧凑且自包含的方式,用于在各方之间安全地传输信息作为JSON对象.由于此信息是经过数字签名的,因此可以被验 ...
Beta冲刺随笔——Day_One
这个作业属于哪个课程软件工程 (福州大学至诚学院 - 计算机工程系) 这个作业要求在哪里 Beta 冲刺这个作业的目标团队进行Beta冲刺作业正文正文其他参考文献无今日事今日毕林涛: ...
第8.4节 Python类中不是构造方法却胜似构造方法的__new方法__深入剖析：语法释义
一. 引言在本博前面的内容都对构造方法__init__进行了介绍,也在前面章节引入了__new__方法,但老猿认为__new__方法比构造方法__init__更应该属于构造方法.这是因为在Py ...
第14.14节爬虫实战准备：csdn博文点赞过程http请求和响应信息分析
如果要对csdn博文点赞,首先要登录CSDN,然后打开一篇需要点赞的文章,如<第14.1节通过Python爬取网页的学习步骤>按<第14.3节使用google浏览器获取网站访问的 ...
自动化运维工具之Puppet master/agent模型、站点清单和puppet多环境设定
前文我们了解了puppe中模块的使用,回顾请参考https://www.cnblogs.com/qiuhom-1874/p/14086315.html:今天我来了解下puppet的master/age ...
javascript （JS组成、书写位置、基本概念、作用域、内存问题、变量）
1 JavaScript的组成和书写位置 Javascript:运行在客户端(浏览器)的脚本语言,JavaScript的解释器被称为JavaScript引擎,为浏览器的一部分,与java没有直接的关系 ...
合并EXCEL文件到一个文件的V宏
我建的宏: Sub 合并文件的VBA() Dim MyPath, MyName, AWbName Dim Wb As Workbook, WbN As String Dim G As Long Dim ...
算法—— n个骰子的点数
把n个骰子扔在地上,所有骰子朝上一面的点数之和为s.输入n,打印出s的所有可能的值出现的概率. 你需要用一个浮点数数组返回答案,其中第 i 个元素代表这 n 个骰子所能掷出的点数集合中第 i 小的那个 ...

Python实现多个pdf文件合并

背景

具体实现

效果

Python实现多个pdf文件合并的更多相关文章

随机推荐

热门专题