操作PDF文档时,复制其中的指定页面可以帮助我们从PDF文件中提取特定信息,如文本、图表或数据等,以便在其他文档中使用。复制PDF页面也可以实现在不同文件中提取页面,以创建一个新的综合文档。本文将介绍如何使用Python 在同一文档中复制PDF页面,或者复制页面到另一PDF文档中

所需Python库 - Spire.PDF for Python。可以通过下面的pip命令直接安装:

pip install Spire.Pdf

Python 在同一PDF 文档中复制页面

Spire.PDF for Python库支持在文档中添加新页面,然后将指定页面的内容绘制到新页面来实现复制PDF页面。操作如下:

  1. 使用 LoadFromFile() 方法加载PDF文档;
  2. 获取文档中指定页面,然后使用 CreateTemplate() 方法基于页面内容创建模板;
  3. 通过 Insert() 方法在指定索引处插入空白新页面 (也可以使用 Add() 方法直接在文档末尾添加新页面);
  4. 使用 PdfPageBase.Canvas.DrawTemplate() 方法将模板绘制到新页面上;
  5. 使用 SaveToFile() 方法保存PDF文档。
from spire.pdf.common import *
from spire.pdf import * # 加载PDF文档
pdf = PdfDocument()
pdf.LoadFromFile("实验.pdf") # 获取第一页
page = pdf.Pages[0] # 基于该页面创建模板
template = page.CreateTemplate() # 插入一个新页面到第二位置处
page = pdf.Pages.Insert(1, page.Size, PdfMargins(0.0)) # 将模板绘制到新页面上
page.Canvas.DrawTemplate(template, PointF(0.0, 0.0)) # 保存PDF
pdf.SaveToFile("复制PDF页面.pdf");
pdf.Close()

Python在不同PDF 文档之间复制页面

也可以将指定页面从一个PDF文档复制到另一个PDF文档中,具体操作如下:

  1. 使用 LoadFromFile() 方法加载两个PDF文档;
  2. 获取文档1中指定页面,然后使用 CreateTemplate() 方法基于页面内容创建模板;
  3. 通过 Insert() 方法在文档2中指定索引处插入空白新页面;
  4. 使用 PdfPageBase.Canvas.DrawTemplate() 方法将模板绘制到新页面上;
  5. 使用 SaveToFile() 方法保存结果文档
from spire.pdf.common import *
from spire.pdf import * # 加载文档1
pdf1 = PdfDocument()
pdf1.LoadFromFile("实验.pdf") # 加载文档2
pdf2 = PdfDocument()
pdf2.LoadFromFile("南极洲.pdf") # 获取文档1中的第一页
page = pdf1.Pages[0] # 基于该页面内容创建模板
template = page.CreateTemplate() # 在文档2指定位置处插入空白新页面
newPage = pdf2.Pages.Insert(0, page.Size, PdfMargins(0.0)) # 将模板绘制到新页面上
newPage.Canvas.DrawTemplate(template, PointF(0.0, 0.0)) # 保存PDF
pdf2.SaveToFile("复制页面到另一PDF.pdf")
pdf2.Close()


生成文档中的红色水印,可以通过点击以下链接,申请一个月免费授权来去除:

https://www.e-iceblue.cn/misc/temporary-license.html

Python 在同一/或不同PDF之间复制页面的更多相关文章

  1. python网络爬虫高清PDF资料分享

    1.python+网络爬虫开发实战中文PDF高清版 链接:https://pan.baidu.com/s/1bks8J9kgqCArUlEoDg4acA 提取码:h9y2 复制这段内容后打开百度网盘手 ...

  2. 统计学习:《贝叶斯思维统计建模的Python学习法》中文PDF+英文PDF+代码

    用数学工具解决实际问题仅有的要求可能就是懂一点概率知识和程序设计.而贝叶斯方法是一种常见的利用概率学知识去解决不确定性问题的数学方法,对于一个计算机专业的人士,应当熟悉其应用在诸如机器翻译,语音识别, ...

  3. 学习NLP:《精通Python自然语言处理》中文PDF+英文PDF+代码

    自然语言处理是计算语言学和人工智能之中与人机交互相关的领域之一. 推荐学习自然语言处理的一本综合学习指南<精通Python自然语言处理>,介绍了如何用Python实现各种NLP任务,以帮助 ...

  4. 学习推荐《Python神经网络编程》中文版PDF+英文版PDF+源代码

    推荐非常适合入门神经网络编程的一本书<Python神经网络编程>,主要是三部分: 介绍神经网络的基本原理和知识:用Python写一个神经网络训练识别手写数字:对识别手写数字的程序的一些优化 ...

  5. Linux命令(20)linux服务器之间复制文件和目录

    linux的scp命令: scp就是secure copy的简写,用于在linux下进行远程拷贝文件的命令,和它类似的命令有cp,不过cp只是在本机进行拷贝不能跨服务器. 有时我们需要获得远程服务器上 ...

  6. linux 的 scp 命令 可以 在 linux 之间复制 文件 和 目录

    转自:http://blog.csdn.net/snlying/article/details/6184102 Linux系统中scp命令的用法. scp就是secure copy的简写,用于在lin ...

  7. 使用 Oracle GoldenGate 在 Microsoft SQL Server 和 Oracle Database 之间复制事务

    使用 Oracle GoldenGate 在 Microsoft SQL Server 和 Oracle Database 之间复制事务 作者:Nikolay Manchev 分步构建一个跨这些平台的 ...

  8. Python将html转化为pdf

    前言 前面我们对博客园的文章进行了爬取,结果比较令人满意,可以一下子下载某个博主的所有文章了.但是,我们获取的只有文章中的文本内容,并且是没有排版的,看起来也比较费劲... 咋么办的?一个比较好的方法 ...

  9. 安装vmtools之后任然不能在虚拟机和主机之间复制粘贴的问题

    安装vmtools之后任然不能在虚拟机和主机之间复制粘贴的问题 都是因为这个进程没有启动起来,你只需要在启动后在终端输入 "/usr/bin /vmware-user" 就可以手动 ...

  10. 在linux服务器之间复制文件和目录命令scp

    scp是secure copy的简写,用于在Linux下进行远程拷贝文件的命令,和它类似的命令有cp,不过cp只是在本机进行拷贝不能跨服务器,而且scp传输是加密的.可能会稍微影响一下速度.当你服务器 ...

随机推荐

  1. 海光 FTPM 运行报错:Fapi_Provision_Finish() ErrorCode (0x00060025) No EK certificate found.

    使用的是海光 CPU 提供的基于固件的 FTPM,错误原因是海光没有给 TPM 提供相应的 EK 证书.从而导致Fapi_Provision()接口无法通过证书的校验.关于Fapi_Provision ...

  2. Java读取寄存器数据的方法

    在Java中直接读取硬件寄存器(如CPU寄存器.I/O端口等)通常不是一个直接的任务,因为Java设计之初就是为了跨平台的安全性和易用性,它并不直接提供访问底层硬件的API.不过,在嵌入式系统.工业控 ...

  3. Windows右下角时间显示具体星期

    事件起因: 有时候脑子不清楚,过着过着就会忘记今天是星期几,错过一些重要事情,于是乎就想看看Windows右下角能不能显示到具体星期,果然在查了资料之后这个需求可以达成 解决办法: 控制面板 - 日期 ...

  4. 揭秘!尤雨溪成立的VoidZero如何改变前端世界

    前言 Vue和Vite之父尤雨溪宣布成立公司 VoidZero,目前已经融资3200万.这篇文章欧阳将带你了解VoidZero是如何改变javascript的世界! 关注公众号:[前端欧阳],给自己一 ...

  5. kotlin类和对象—>属性与字段

    1.声明属性,Kotlin 类中的属性既可以用关键字 var 声明为可变的,也可以用关键字 val 声明为只读的 class Address { var name: String = "Ho ...

  6. 混合云下的 Kubernetes 多集群管理与应用部署

    本文是上海站 Meetup 中讲师李宇根据其分享内容梳理成的文章 大家好,很高兴来到今天下午的 Meetup.我先简单做个自我介绍,我叫李宇,目前是 KubeSphere 的一名研发,主要负责多集群方 ...

  7. ajax下载二进制文件(导出Excel)

    var url = 'http://127.0.0.1'; var xhr = new XMLHttpRequest(); xhr.open('GET', url, true); // 也可以使用PO ...

  8. 最新Sql语句来啦

    创建数据库 CREATE DATABASE 数据库名称; 删除数据库 DROP DATABASE 数据库名称; 创建新表 create table 表名(列 类型 ,列 类型 ,..); 根据已有的表 ...

  9. GaussDB: db2->gaussdb 函数转换

    一.db2->gaussdb函数转换 问题描述:使用GaussDB替代DB2的方案,使用起来还是有些差别,做一下函数的映射转换.   DB2写法 GaussDB改写语法 日期函数 days(OU ...

  10. 线上debug&gateway自定义路由规则

    如何进行线上debug. 如何在gateway自定义路由规则去进行请求分发,让请求打到集群模式下我们想要的节点. 1.配置remote debug 1.在启动参数配置参数: -Xdebug -Xrun ...