[python]将多张图片合并为单个pdf文件

前言

最近有个个人需求是要把多个图片文件合并为一个PDF文件，这样方便用PDF阅读器连续看，避免界面点一下，只会图片放大。（比如看漫画）

主要思路是先把单张图片转换成单个PDF文件，然后把PDF文件进行合并。原先是用WPS的转换工具做的，但WPS每次只能批量转换30张，如果有大量图片文件，用WPS就不太方便了。

现成的工具找不到，索性自己整一个。python的pillow库和pypdf2库就可以实现这样的需求。

安装依赖库

本地的python版本为3.11。注意pypdf2升级到3.0版本后，一些类和方法和版本2有些区别。

python -m pip install PyPDF2==3.0.1 pillow==10.2.0

示例代码

目录结构示例

├── images

│   ├── 00001.jpg

│   ├── 00002.jpg

│   ├── 00003.jpg

│   ├── 00004.jpg

│   ├── 00005.jpg

│   ├── 00006.jpg

│   ├── 00007.jpg

│   ├── 00008.jpg

│   ├── 00009.jpg

│   └── 00010.jpg

├── main.py

└── temp

其中main.py内容如下

from PIL import Image

import os

import re

from PyPDF2 import PdfMerger

images_dir = "images"

tmpdir = "temp"

def trans_jpg2pdf(jpg_list: list) -> list:

    """jpg图片转换成pdf

    Args:

        jpg_list (list): 图片文件列表

    Returns:

        list: 图片转换后的pdf文件列表

    """

    pdf_list = []

    for jpg in jpg_list:

        jpg_path = os.path.join(images_dir, jpg)

        pdf_file = jpg.replace('.jpg', '.pdf')

        pdf_path = os.path.join(tmpdir, pdf_file)

        if os.path.exists(pdf_path):

            os.remove(pdf_path)

        pdf_list.append(pdf_path)

        im = Image.open(jpg_path)

        im.save(pdf_path, 'PDF', resolution=100.0)

    return pdf_list

def merge_pdf(pdf_list: list, result_pdf: str = "result.pdf"):

    """ 合并pdf文件

    Args:

        pdf_list (list): pdf文件列表

        result_pdf (str): 合并后的pdf文件名称

    """

    sorted_list = sorted(pdf_list, key=lambda x: int(re.search(r'\d+', x).group()))

    f_merger = PdfMerger()

    for pdf in sorted_list:

        f_merger.append(pdf)

    if os.path.exists(result_pdf):

        os.remove(result_pdf)

    f_merger.write(result_pdf)

if __name__ == '__main__':

    jpg_list = [f for f in os.listdir(images_dir) if f.endswith(".jpg")]

    pdf_list = trans_jpg2pdf(jpg_list)

    merge_pdf(pdf_list, "result.pdf")

补充

webp格式文件转PDF示例

from PIL import Image  

im = Image.open("00033.webp")

rgb_im = im.convert("RGB")

rgb_im.save("00033.pdf", 'PDF', resolution=100.0)

[python]将多张图片合并为单个pdf文件的更多相关文章

C# 合并及拆分PDF文件
C# 合并及拆分PDF文件有时我们可能会遇到下图这样一种情况 — 我们需要的资料或教程被分成了几部分存放在多个PDF文件中,不管是阅读还是保存都不是很方便,这时我们肯定想要把这些PDF文件合并为一个 ...
C# 将多个office文件转换及合并为一个PDF文件
PDF文件介绍 PDF(Portable Document Format )文件源于20世纪90年代初期,如今早已成为了一种最流行的的文件格式之一.因为PDF文件有很多优点: 支持跨平台和跨设备共享 ...
如何用Latex合并多个pdf文件？
如何用Latex合并多个pdf文件? 用TeX合并pdf, 用LaTeX合并pdf 代码: \documentclass[a4paper]{article} \usepackage{pdfpage ...
C# 合并和拆分PDF文件
一.合并和拆分PDF文件的方式 PDF文件使用了工业标准的压缩算法,易于传输与储存.它还是页独立的,一个PDF文件包含一个或多个"页",可以单独处理各页,特别适合多处理器系统的工作 ...
用itext合并多个pdf文件【转】【补】
java代码 package c; import java.io.FileOutputStream; import java.io.IOException; import java.util.Arra ...
Aspose.Pdf合并图片到PDF文件
将图片和PDF文件合成为新的PDF文件,可以先将图片转换为PDF文件, 然后合成PDF即可, 将图片转换成PDF文件有如下方法: Aspose.Pdf.Document Aspose.Pdf.Gene ...
python数据处理（三）之处理pdf文件
代码以及资料 https://github.com/jackiekazil/data-wrangling 1.前言尽可能地寻找可以替代pdf格式的数据 2.解析pdf的编程方法安装slate pi ...
如何将多个网页合并成一个PDF文件
pdfFactory是一款PDF虚拟打印软件,但与其他虚拟打印机软件不同的是,它使用起来更加简单高效.由于无需Acrobat就能生成Adobe PDF文件,它可以帮助用户在系统没有连接打印机的情况下, ...
Python将word文档转换成PDF文件
如题. 代码: ''' #將word文档转换为pdf文件 #用到的库是pywin32 #思路上是调用了windows和office功能 ''' #导入所需库 from win32com.client ...
Merging a WPF application into a single EXE(WPF应用程序合并成单个Exe文件)
I always dislike handing off little applications to people. Not because I can’t, but because of the ...

随机推荐

一键式文本纠错工具，整合了BERT、ERNIE等多种模型，让您立即享受纠错的便利和效果
pycorrector一键式文本纠错工具,整合了BERT.MacBERT.ELECTRA.ERNIE等多种模型,让您立即享受纠错的便利和效果 pycorrector: 中文文本纠错工具.支持中文音似. ...
21.12 Python 实现网站服务器
Web服务器本质上是一个提供Web服务的应用程序,运行在服务器上,用于处理HTTP请求和响应.它接收来自客户端(通常是浏览器)的HTTP请求,根据请求的URL.参数等信息生成HTTP响应,并将响应返回 ...
C#使用Tamir.SharpSsh.jsch上传文件异常Algorithm negotiation fail
环境服务器:centos6.5 客户端:Windows 前言项目中有一个exe,安装在客户端,其中有一个功能是将本地产生的文件上传至服务器,这个功能是以服务的方式安装在客户端上.之前一切好使,文件 ...
LLM面面观之RLHF平替算法DPO
1. 背景最近本qiang~老看到一些关于大语言模型的DPO.RLHF算法,但都有些云里雾里,因此静下心来收集资料.研读论文,并执行了下开源代码,以便加深印象. 此文是本qiang~针对大语言模型的 ...
又学了一招：微软科普Windows 11电脑自动清理释放硬盘
你是不是每次都等到电脑内存被占满,磁盘"红"成一片,才想起来去清理那些没用的程序or文件? 今天微软官方科普了一个小技巧:既然都用上了Windows 11 ,为什么不让电脑帮你自动 ...
C++对象之谜(封装篇)
这篇博客简要记录下C++对象的相关内容,以便回顾时使用. C++类的定义我们使用C++定义一个矩形(Rectangle)类,它的基本属性有:长(width),宽(width), 对矩形的基本操作有: ...
java的char类型，只有两个字节，为什么可以存储汉字？java中 char详解
我自己出了一道面试题,如下: public static void main(String[] args) { char a = '9'; char b = 9; char c = '我'; Syst ...
.NET Core开发实战（第18课：日志框架：聊聊记日志的最佳姿势）--学习笔记（下）
18 | 日志框架:聊聊记日志的最佳姿势除了使用 CreateLogger 指定 logger 的名称,实际上还可以借助容器来构造 logger,通常情况下我们会定义自己的类 namespace L ...
ARM 中SP，LR，PC寄存器的作用
ARM中所有寄存器都是32位的.这里以cortex-a7内核的MX6ULL处理器为例,按照功能可以分为两类:运行需要寄存器(程序正常运行所需要的,比如变量暂存,pc制作等,总共43个),系统管理控制寄 ...
在OAuth 2.0模式下使用Spring Cloud Gateway
Spring Cloud Gateway主要用于以下角色之一: OAuth Client OAuth Resource Server 1 Spring Cloud Gateway as an OAu ...

[python]将多张图片合并为单个pdf文件

前言

安装依赖库

示例代码

补充

[python]将多张图片合并为单个pdf文件的更多相关文章

随机推荐

热门专题