python是非常好用的一门语言,因为它有很多别人封装好底层逻辑的库,我们只需要用简单的函数调用或者经过并不复杂的初始化过程即可。最近要投递简历,所以在处理简历的时候遇到一个问题,就是生成了一份pdf简历,但有一页是多余的,一开始是用wps进行删除的,不过只进行删除然后保存一项操作,就要充钱了!!!吃相真难看!我是程序员,我还用你的逻辑吗?呸

截图转换成pdf

初始想法,是用截图的办法,来生成一张图片,然后使用pillow来进行处理(也就调用save函数,规定一下保存参数而已)。如下:

就一张截图,然后简单处理就可以了,需要说明的是下面用到的第三方库是pillow库:

from PIL import Image

def main():
path = "resume.png"
img = Image.open(path)
img.load()
background = Image.new('RGB', img.size, (255, 255, 255))
background.paste(img, mask=img.split()[3]) # 3 is the alpha channel
background.save('res.pdf', save_all=True)
img.close() if __name__ == '__main__':
main()

其实个人处理,直接用python的交互界面就行了的,简单快捷。不过最后得到的效果不好,因为照片转过来后,默认的转换得到的pdf很模糊。

第二弹

上面失败后,就想着从之前已经下载好的pdf入手,因为有两页,所以想切换成图片对象,然后把图片对象保存为pdf。

用到的库是pymupdf和上面的pillow。

import fitz #pymupdf库
from PIL import Image def main():
# 保存第二页pdf为图片
doc = fitz.open('balala.pdf')
trans = fitz.Matrix(1.0, 1.0).prerotate(0) #Matrix的参数是表示分辨率
pix = doc[1].get_pixmap(matrix=trans, alpha=False)
dpi = (pix.xres, pix.yres)
img = Image.frombytes('RGB', (pix.width, pix.height), pix.samples)
img.save('res.jpg', dpi=dpi)
img.close()
# 转换得到的图片为pdf
img_pdf = Image.open('res.jpg')
img_pdf.save('res.pdf', save_all=True)
img_pdf.close() if __name__ == "__main__":
main()

嗯,满心欢喜打开一看。。。。。。妈哎,这都啥?比上面的还要模糊,生成的图片和pdf都是目标内容,但清晰度不够,没法子了,不搞转换那一套了,直接处理pdf!!!

pdf处理PyPDF2

如题所示,这里要用到的是PyPDF2这么一个库,不浪费时间,直接上代码:

# encoding=utf-8
# 主要用到的就库里面的读取对象和写入对象
from PyPDF2 import PdfFileReader, PdfFileWriter def main():
pdf = PdfFileReader(open('test.pdf', 'rb'))
pdf_res = PdfFileWriter()
pdf_res.addPage(pdf.getPage(1)) #第二页,所以index是1
pdf_res.write(open('res.pdf', 'wb')) if __name__ == "__main__":
main()

嗯,这次总算是ok了。如果是交互界面进行的话,记得最后关掉cmd的python进程再查看结果pdf,不然会显示文件损坏。

pdf和图片的处理一记的更多相关文章

  1. C# 给PDF添加图片背景

    C# 给PDF添加图片背景 今天要实现的是给PDF文件添加图片背景这个功能.PDF是近年来最流行的文件之一,无论是办公还是日常生活中都经常会用到,很多时候,PDF文件的背景色都是白色,看多了难免觉得累 ...

  2. C# 第三方DLL,可以实现PDF转图片,支持32位系统、64位系统

    itextsharp.dll,是一个开源的在C#中用来生成PDF文档的库文件,不少C#爱好者用它制作出了PDF文档生成器.使用时只需在你的C#项目中添加引入此组件即可,使用方法网上有很多,自己查阅一下 ...

  3. PDF转图片 C# with Adobe API

    PDF转图片大概有十几种方式,褒贬不一,我就详细给大家说一下我认为效率最高的方式,使用Adobe官方的SDK 安装acrobat reader 9.0以上即可,勾选如下组件.

  4. 在线提取PDF中图片和文字

    无需下载软件,你就可以在线提取PDF中图片和文字,http://www.extractpdf.com/不仅可以获取本地PDF文档的图片和文字,还能获取远程PDF文档的图片和文字.如下图所示:结果本人测 ...

  5. .Net的PDF转图片

    用的是破解版的 O2S.Components.PDFRender4NET.dll 插件, 简单引用即可 public static class PdfToImage { , , ) { try { / ...

  6. 使用pdfbox分页保存pdf为图片

    一.背景 pdfbox作为Apache开源的PDF操作工具,允许创建新的PDF文档,操作现有文档,以及从文档中提取内容的能力.Apache PDFBox还包括一些命令行实用工具.本文楼主主要介绍其中的 ...

  7. JAVA中pdf转图片的方法

    JAVA中实现pdf转图片可以通过第三方提供的架包,这里介绍几种常用的,可以根据自身需求选择使用. 一.icepdf.有收费版和开源版,几种方法里最推荐的.转换的效果比较好,能识别我手头文件中的中文, ...

  8. 【JAVA】pdf转图片

    最近java项目中使用到了pdf转图片的需求,在此记录一下. 1.基于GhostScript p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 13.0px ...

  9. PDF转图片工具

    点击下载( 提取码:1ll1 ) 软件功能基于mupdf,UI使用wxpython开发 功能: 支持pdf转图片,图片格式png 支持批量转换 使用: 第一步,点击按钮添加文档到列表,或直接将待转换文 ...

  10. Ubuntu下pdf和图片互转

    前边文章可以将ppt转换为pdf  查看 使用unoconv将ppt转为pdf,再使用imagemagick将pdf转为图片 这次想将pdf和图片进行互转 当前目录下只有2.ppt 1.ppt转pdf ...

随机推荐

  1. 微服务实战系列(四)-注册中心springcloud alibaba nacos-copy

    1.场景描述 因要用到微服务,关于注册中心这块,与同事在技术原型上做了讨论,初步定的方案是使用:阿里巴巴的nacos+springcloud gateway,下面表格是同事整理的注册中心对比,以前用的 ...

  2. springboot-多模块构建-2

    三个标签完成springboot定时任务配置 1. 问题描述 Java项目定时任务是必备模块,月高风黑夜跑个批处理,记录或者统计一些系统信息. 2. 解决方案: 结合springboot,只需三个标签 ...

  3. 阿里云-数据库-ClickHouse

    https://help.aliyun.com/product/144466.html 云数据库ClickHouse是开源列式数据库管理系统ClickHouse在阿里云上的托管服务,用户可以在阿里云上 ...

  4. 项目PMP之一项目管理介绍

    一.项目定义: 概要:为创造独特的产品.服务或成果而进行的临时性工作 组织创造价值和效益.项目驱动变更创造商业价值的主要方式 特性/要素: 独特的产品.服务或成果,即一个或多个可交付成果(范围.进度( ...

  5. SpringSecurity详解

    认证+授权代码实现 Spring Security是 一种基于 Spring AOP 和 Servlet 过滤器的安全框架.它提供全面的安全性解决方案,同时在 Web 请求级和方法调用级处理身份确认和 ...

  6. cmake:引入第三方库

    需求:开源库中一般都需要引入第三方库,下面以引入boost库为例 (1)安装所需的三方库 boost安装:参考 (2)引入 这里的cmakelists文件为: # Import Boost (for ...

  7. Pebbles pg walkthrough Easy

    NMAP ┌──(root㉿kali)-[/home/ftpuserr] └─# nmap -p- -A -sS 192.168.239.52 Starting Nmap 7.95 ( https:/ ...

  8. linux--安装zeppelin

    可以下载源码安装也可以用docker安装 http://zeppelin.apache.org/download.html Zeppelin 安装目录的bin文件夹下,使用以下命令启动进程: /opt ...

  9. Java开发自学第一天

    Java学习日志 Day 01|2025/2/11|累计1天 今日学习时长 6小时 当日学习目标 1.了解JVM.JDK.JRE 2.学习Idea开发工具的基本使用 3.基本语法:运算符.数据类型.变 ...

  10. 「原创」Xiaomi-R3 免刷Openwrt实现路由器锐捷认证 (含网络守护脚本)

    引言 没有路由器 宿舍人均用网络月末苦不堪言,搭建一台路由器燃眉之急!! 设备选择 初代小米路由器产品均为OpenWrt深度定制后的产物,免去设备刷入固件时机器变砖的风险,本片记录的使用型号为 MIR ...