通过将 Word 文档转换为 PDF,您可以确保文档在不同设备上呈现一致,并防止其他人对文档内容进行非授权修改。此外,在你需要打印文档时,转换为PDF还能确保打印输出的准确性。本文将介绍如何使用Python 库将Word文档转换为PDF格式

  • Python 将 Word DOCX/DOC 转换为 PDF
  • Python 将 Word转换为加密的PDF
  • Python 将 Word转为 PDF时嵌入字体

Python Word库安装

本文中使用到的python库为Spire.Doc for Python, 它能轻松实现 Word 文档的创建、读取、编辑和转换等功能。要使用此产品,可以通过以下pip 命令将其安装到你的 VS Code中。

pip install Spire.Doc

详细安装教程可参考: 如何在 VS Code中安装 Spire.XLS for Python

Python 将 Word DOCX/DOC 转换为 PDF

要实现该转换,仅需加载一个 .doc 或 .docx 文档,然后使用 Document.SaveToFile(string fileName, FileFormat.PDF) 方法就能将Word转为PDF格式。完整代码如下:

from spire.doc import *
from spire.doc.common import * # 创建Document对象
document = Document() # 加载Word文档
document.LoadFromFile("清单.docx") # 将文档保存为PDF格式
document.SaveToFile("Word转PDF.pdf", FileFormat.PDF)
document.Close()

Python 将 Word转换为加密的PDF

除了简单的Word转PDF外,Spire.Doc for Python 还提供了 ToPdfParameterList 类来控制转换过程。你可以先为生成的PDF设置密码,然后在转换时用Document.SaveToFile(string fileName, ToPdfParameterList paramList) 方法来将Word保存为加密的PDF文件。完整代码如下:

from spire.doc import *
from spire.doc.common import * # 创建Document对象
document = Document() # 加载Word文档
document.LoadFromFile("清单.docx") # 创建ToPdfParameterList对象
parameter = ToPdfParameterList() # 为生成的PDF文件设置打开密码和权限密码
openPsd = "abcd"
permissionPsd = "1234"
parameter.PdfSecurity.Encrypt(openPsd, permissionPsd, PdfPermissionsFlags.Default, PdfEncryptionKeySize.Key128Bit) # 将文档保存为加密的PDF
document.SaveToFile("输出文件.pdf", parameter)
document.Close()

Python 将 Word转为 PDF时嵌入字体

将字体嵌入到PDF中能确保文档在不同设备上正确显示,避免由于缺少字体而导致的问题。这对于包含自定义字体或特殊字形的文档尤其重要。Spire.Doc for Python 提供的ToPdfParameterList.IsEmbeddedAllFonts 属性能帮你实现Word转 PDF时嵌入字体。完整代码如下:

from spire.doc import *
from spire.doc.common import * # 创建Document对象
document = Document() # 加载Word文档
document.LoadFromFile("清单.docx") # 创建ToPdfParameterList对象
parameter = ToPdfParameterList() # 将字体嵌入到生成的PDF中
parameter.IsEmbeddedAllFonts = True # 将文档保存为PDF
document.SaveToFile("嵌入字体.pdf", parameter)
document.Close()

如果你想在转换Word到PDF时压缩图片以减小生成PDF的文件大小,可通过 Document.JPEGQuality 属性设置图片质量。此外,ToPdfParameterList 类还支持在转换时保留原有书签,或者按照标题创建新书签。

# 根据 Word 中的标题创建 PDF 书签
parames.CreateWordBookmarksUsingHeadings = True # 根据 Word 中的现有书签创建 PDF 书签
#parames.CreateWordBookmarks = True

Python 实现Word转PDF的更多相关文章

  1. 用python将word转pdf、doc转docx等

    word ==> pdf def doc2pdf(file_path): """ word格式转换doc|docx ==> pdf :return: &quo ...

  2. python word转pdf

    原理 使用python win32 库 调用word底层vba,将word转成pdf 安装pywin32 pip install pywin32 python代码 from win32com.clie ...

  3. 深入学习python解析并读取PDF文件内容的方法

    这篇文章主要学习了python解析并读取PDF文件内容的方法,包括对学习库的应用,python2.7和python3.6中python解析PDF文件内容库的更新,包括对pdfminer库的详细解释和应 ...

  4. Python实现doc转化pdf

    Python实现doc转化pdf python源码实现doc转化pdf #-*- coding:utf-8 -*- # doc2pdf.py: python script to convert doc ...

  5. 用Python将word文件转换成html(转)

    用Python将word文件转换成html   序 最近公司一个客户大大购买了一堆医疗健康方面的科普文章,希望能放到我们正在开发的健康档案管理软件上.客户大大说,要智能推送!要掌握节奏!要深度学习!要 ...

  6. word转pdf

    很多人在工作经常会遇到word转pdf功能,word转pdf还是比较复杂,网上各种包,如python的各种转换包,其实是存在很多问题 的,尤其是对比较复杂的格式,真正的还的是调用组件来转换,这里介绍的 ...

  7. 批量转换word为pdf

    自己写的一个小工具,用于批量转换word为pdf,使用方式: 将完整代码拷贝到文档中,并修改名称为words2pdfs.py将该文件拷贝到需要转换的文档目录下在终端中输入python words2pd ...

  8. Python编程初学者指南PDF高清电子书免费下载|百度云盘

    百度云盘:Python编程初学者指南PDF高清电子书免费下载 提取码:bftd 内容简介 Python是一种解释型.面向对象.动态数据类型的高级程序设计语言.Python可以用于很多的领域,从科学计算 ...

  9. 【源码】Word转PDF V1.0.1 小软件,供新手参考

    昨天有一朋友让我帮忙找一款Word转PDF的软件,今天自己捣鼓出点成果封装个Helper供大家使用~ 开源地址:https://github.com/dunitian/WordConvertPDF 软 ...

  10. java word 转 pdf

    这里使用jacob将word转pdf,使用的是jacob.jar import java.io.File;import com.jacob.activeX.ActiveXComponent;impor ...

随机推荐

  1. 驱动开发:内核远程线程实现DLL注入

    在笔者上一篇文章<内核RIP劫持实现DLL注入>介绍了通过劫持RIP指针控制程序执行流实现插入DLL的目的,本章将继续探索全新的注入方式,通过NtCreateThreadEx这个内核函数实 ...

  2. pta第三阶段题目集

    (1)前言 pta第三阶段作业中,主要包含了如下的主要内容: 1.全程贯穿了课程设计的程序,每一次都是上一次的迭代和修改,难度较大,中间涉及到先是类与类之间的多态和继承关系,后面的修改中,转变为了组合 ...

  3. 一次oracle行级锁导致的问题

    分析问题:我在plsql/developer是用的system用户连接的数据库,而在crt用  sqlplus / as  sysdba 连接数据库,是sys用户.现在在plsql/developer ...

  4. 大批量插入数据(sql insert)

    1.批量录入(方法一:mybiats foreach标签) 所述的MySQL和Oracle的批量插入区别可以看出可能有兼容性问题(使用Oracle 的同学重点参考下) 而且jdbc链接Url要加上 a ...

  5. selenium元素定位---ElementClickInterceptedException(元素点击交互异常)解决方法

    1.异常原因 在编写ui自动化时,执行报错元素无法点击:ElementClickInterceptedException 具体报错:selenium.common.exceptions.Element ...

  6. 如何开发 RESTful、GraphQL 和 SOAP 等不同类型的 API ?

    在软件开发中,API(应用程序编程接口)的重要性不言而喻.API已成为不可或缺的构建模块,使开发人员能够创建功能丰富.多样化和可扩展的应用程序.这是一篇综合指南,旨在深入探讨API开发,使初学者和有经 ...

  7. TCP/IP网络体系结构中,各层的作用,以及各层协议的作用。

    1.[TCP/IP]协议中每层的作用 从协议分层模型方面来讲,TCP/IP由四个层次组成:数据链路层(网络接口层).网络层.传输层.应用层 TCP/IP网络体系结构中,各层作用: 1.网络接口层:负责 ...

  8. Dubbo的高级特性:服务治理篇

    王有志,一个分享硬核Java技术的互金摸鱼侠 加入Java人的提桶跑路群:共同富裕的Java人 上一篇中,我们已经在Spring Boot应用中集成了Dubbo,并注册了一个服务提供方和一个服务使用方 ...

  9. 【环境搭建】多版本的jdk共存

    问题来源 burpsuite 2021需要使用Java 9及以上版本,而其他工具需要Java 8,因此需要两个版本共存,并且做到除了burpsuite以外的工具默认使用Java 8打开. 需要的软件 ...

  10. 关于DVWA靶场高难度命令执行的代码审计

    需要的环境:dvwa 使用的工具:PHP手册 high难度源代码: <?php if( isset( $_POST[ 'Submit' ] ) ) { // Get input $target ...