操作PDF文档时,复制其中的指定页面可以帮助我们从PDF文件中提取特定信息,如文本、图表或数据等,以便在其他文档中使用。复制PDF页面也可以实现在不同文件中提取页面,以创建一个新的综合文档。本文将介绍如何使用Python 在同一文档中复制PDF页面,或者复制页面到另一PDF文档中

所需Python库 - Spire.PDF for Python。可以通过下面的pip命令直接安装:

pip install Spire.Pdf

Python 在同一PDF 文档中复制页面

Spire.PDF for Python库支持在文档中添加新页面,然后将指定页面的内容绘制到新页面来实现复制PDF页面。操作如下:

  1. 使用 LoadFromFile() 方法加载PDF文档;
  2. 获取文档中指定页面,然后使用 CreateTemplate() 方法基于页面内容创建模板;
  3. 通过 Insert() 方法在指定索引处插入空白新页面 (也可以使用 Add() 方法直接在文档末尾添加新页面);
  4. 使用 PdfPageBase.Canvas.DrawTemplate() 方法将模板绘制到新页面上;
  5. 使用 SaveToFile() 方法保存PDF文档。
from spire.pdf.common import *
from spire.pdf import * # 加载PDF文档
pdf = PdfDocument()
pdf.LoadFromFile("实验.pdf") # 获取第一页
page = pdf.Pages[0] # 基于该页面创建模板
template = page.CreateTemplate() # 插入一个新页面到第二位置处
page = pdf.Pages.Insert(1, page.Size, PdfMargins(0.0)) # 将模板绘制到新页面上
page.Canvas.DrawTemplate(template, PointF(0.0, 0.0)) # 保存PDF
pdf.SaveToFile("复制PDF页面.pdf");
pdf.Close()

Python在不同PDF 文档之间复制页面

也可以将指定页面从一个PDF文档复制到另一个PDF文档中,具体操作如下:

  1. 使用 LoadFromFile() 方法加载两个PDF文档;
  2. 获取文档1中指定页面,然后使用 CreateTemplate() 方法基于页面内容创建模板;
  3. 通过 Insert() 方法在文档2中指定索引处插入空白新页面;
  4. 使用 PdfPageBase.Canvas.DrawTemplate() 方法将模板绘制到新页面上;
  5. 使用 SaveToFile() 方法保存结果文档
from spire.pdf.common import *
from spire.pdf import * # 加载文档1
pdf1 = PdfDocument()
pdf1.LoadFromFile("实验.pdf") # 加载文档2
pdf2 = PdfDocument()
pdf2.LoadFromFile("南极洲.pdf") # 获取文档1中的第一页
page = pdf1.Pages[0] # 基于该页面内容创建模板
template = page.CreateTemplate() # 在文档2指定位置处插入空白新页面
newPage = pdf2.Pages.Insert(0, page.Size, PdfMargins(0.0)) # 将模板绘制到新页面上
newPage.Canvas.DrawTemplate(template, PointF(0.0, 0.0)) # 保存PDF
pdf2.SaveToFile("复制页面到另一PDF.pdf")
pdf2.Close()


生成文档中的红色水印,可以通过点击以下链接,申请一个月免费授权来去除:

https://www.e-iceblue.cn/misc/temporary-license.html

Python 在同一/或不同PDF之间复制页面的更多相关文章

  1. python网络爬虫高清PDF资料分享

    1.python+网络爬虫开发实战中文PDF高清版 链接:https://pan.baidu.com/s/1bks8J9kgqCArUlEoDg4acA 提取码:h9y2 复制这段内容后打开百度网盘手 ...

  2. 统计学习:《贝叶斯思维统计建模的Python学习法》中文PDF+英文PDF+代码

    用数学工具解决实际问题仅有的要求可能就是懂一点概率知识和程序设计.而贝叶斯方法是一种常见的利用概率学知识去解决不确定性问题的数学方法,对于一个计算机专业的人士,应当熟悉其应用在诸如机器翻译,语音识别, ...

  3. 学习NLP:《精通Python自然语言处理》中文PDF+英文PDF+代码

    自然语言处理是计算语言学和人工智能之中与人机交互相关的领域之一. 推荐学习自然语言处理的一本综合学习指南<精通Python自然语言处理>,介绍了如何用Python实现各种NLP任务,以帮助 ...

  4. 学习推荐《Python神经网络编程》中文版PDF+英文版PDF+源代码

    推荐非常适合入门神经网络编程的一本书<Python神经网络编程>,主要是三部分: 介绍神经网络的基本原理和知识:用Python写一个神经网络训练识别手写数字:对识别手写数字的程序的一些优化 ...

  5. Linux命令(20)linux服务器之间复制文件和目录

    linux的scp命令: scp就是secure copy的简写,用于在linux下进行远程拷贝文件的命令,和它类似的命令有cp,不过cp只是在本机进行拷贝不能跨服务器. 有时我们需要获得远程服务器上 ...

  6. linux 的 scp 命令 可以 在 linux 之间复制 文件 和 目录

    转自:http://blog.csdn.net/snlying/article/details/6184102 Linux系统中scp命令的用法. scp就是secure copy的简写,用于在lin ...

  7. 使用 Oracle GoldenGate 在 Microsoft SQL Server 和 Oracle Database 之间复制事务

    使用 Oracle GoldenGate 在 Microsoft SQL Server 和 Oracle Database 之间复制事务 作者:Nikolay Manchev 分步构建一个跨这些平台的 ...

  8. Python将html转化为pdf

    前言 前面我们对博客园的文章进行了爬取,结果比较令人满意,可以一下子下载某个博主的所有文章了.但是,我们获取的只有文章中的文本内容,并且是没有排版的,看起来也比较费劲... 咋么办的?一个比较好的方法 ...

  9. 安装vmtools之后任然不能在虚拟机和主机之间复制粘贴的问题

    安装vmtools之后任然不能在虚拟机和主机之间复制粘贴的问题 都是因为这个进程没有启动起来,你只需要在启动后在终端输入 "/usr/bin /vmware-user" 就可以手动 ...

  10. 在linux服务器之间复制文件和目录命令scp

    scp是secure copy的简写,用于在Linux下进行远程拷贝文件的命令,和它类似的命令有cp,不过cp只是在本机进行拷贝不能跨服务器,而且scp传输是加密的.可能会稍微影响一下速度.当你服务器 ...

随机推荐

  1. Razor 常用又容易忘记语法

    1. <text> 要写 text 可以用这个特殊 element @:&nbsp   @: 也是一个可以写 text 的方式 2. @Html.Raw($@"<s ...

  2. Asp.net core 学习笔记之 Tag Helper

    refer : https://docs.microsoft.com/en-us/aspnet/core/mvc/views/tag-helpers/authoring?view=aspnetcore ...

  3. IIS Reverse Proxy 反向代理

    前言 反向代理是这样的: 2 台 web server, A server, B server A server 是 public 的, 有 domain, 有 SSL (作为 B server 的代 ...

  4. 【赵渝强老师】如何分析Java的内存溢出问题

    一.什么是内存溢出? 内存溢出(OOM:out of memory)通俗理解就是内存不够,通常在运行大型软件或游戏时,软件或游戏所需要的内存远远超出了你主机内安装的内存所承受大小,就叫内存溢出. 在J ...

  5. LeetCode 564. Find the Closest Palindrome (构造)

    题意: 给一个数字n 求离n最近(且不等)的回文串 存在多个答案返回最小的 首先很容易想到 将数字分为两段,如 12345 -> 123/45,然后将后半段根据前面的进行镜像重置 123/45 ...

  6. ftrace的trace_options

    ftrace 中的 trace_options 选项用于控制追踪数据的收集和显示方式.你可以通过 /sys/kernel/debug/tracing/trace_options 文件来设置这些选项.每 ...

  7. GPT分区和MRB分区

    GPT分区和MBR分区都是硬盘分区的方式,但它们有不同的实现方法和优缺点. MBR(Master Boot Record)分区是传统的分区方式,它将硬盘分为四个主分区或者三个主分区和一个扩展分区.在每 ...

  8. 线段树介绍(segment tree)

    1.引入 给定一个区间\([1, n]\),希望你实现一种数据结构,支持以下操作: 1.修改\(i\)号节点的值. 2.询问区间\([i, j]\)中所有节点的和. 这不是树状数组板子 3.修改区间\ ...

  9. iOS中在导航条设置搜索框使用小结

    最近在项目开发中用到了搜索框,一般是设置在列表顶部或者导航条上.下面说一下在导航条上使用搜索框的思路,刚开始是直接将CCSearchBar添加到导航条,在viewWillDisappear设置隐藏,在 ...

  10. 宝塔部署java后端项目

    1. 安装插件 宝塔面板找到软件商店然后搜索 Java java项目管理安装 安装后点击设置准备安装 tomcat 2. 添加项目