pdf文件自动剪裁（自动切白边）

FROM：http://www.ai7.org/wp/html/754.html

可能用到的环境、工具：Ubuntu 10.04+TeXLive 2008+pdfcrop+CUPS打印驱动，用Windows的兄弟就不用看了，这些工具理论上在Windows下也有，但是还要另外装不少东西。

下面假设原文件（也就是打算切白边的文件）叫abc.pdf

pdfcrop abc.pdf，默认会生成abc-crop.pdf文件，这个已经是切掉白边的了，要是你不嫌它大（或者它确实不大）的话，就完成了。
用阅读器（如evince）打开abc-crop.pdf，并通过CUPS打印到文件，打印时注意关闭所有和页面缩放有关的命令，并选中“使用文档的页面尺寸作为页面尺寸”。打印，完成。

说明：

pdfcrop其实是TeXLive自带的。本质上是一个perl脚本。
pdfcrop要调用gs(ghostscript)确定每页的白边大小。对于空白页，会报错，忽略即可。
pdfcrop还可以在切的时候留若干像素，具体请–help。
pdfcrop要调用pdftex以生成切白边后的文件。
pdfcrop本质上（猜想，没有阅读源码）是先将abc.pdf展开成单页的pdf，调用gs切白边，再用tex文件直接调用pdf页面，最后用pdftex生成输出。
pdfcrop直接生成的文件一般是原文件的20倍以上（本人测试的几个文件均是如此），虚拟打印到新的文件后，基本可以恢复到与原文件同样数量级的尺寸。
测试都是使用的内嵌字体的中英文PDF。扫描版的没试，估计够呛。

附一个类似的eps版工具

首先用下面的命令来去除白边。因为是程序来做的，去除白边的效果甚至比人自己做好：

epstool --copy --bbox input_file.eps input_file_temp.eps

第二步也是最后一步，将eps图像转成pdf，也只需要一行命令

epstopdf --hires --outfile=output.pdf input_file_temp.eps

这样就完成了eps到pdf的转换了。

上述的操作流程可以写成一个脚本

epstool --copy --bbox $1 my_epstopdf_temp.eps

epstopdf --hires --outfile=$2 my_epstopdf_temp.eps

rm my_epstopdf_temp.eps

【转】pdf文件自动切白边的更多相关文章

【转】Python编程: 多个PDF文件合并以及网页上自动下载PDF文件
1. 多个PDF文件合并1.1 需求描述有时候,我们下载了多个PDF文件, 但希望能把它们合并成一个PDF文件.例如:你下载的数个PDF文件资料或者电子发票,你可以使用python程序合并成一个PDF ...
PDF文件添加二维码水印教程
maven配置iText的jar,主要不是所有私服都有iText的jar,maven仓库没有的,可以去https://mvnrepository.com/artifact/com.itextpdf/i ...
php+tcpdf如何把生成的pdf文件保存在服务端
tcpdf组件目前应用得非常广泛,但是对于如何把生成的pdf文件自动保存在服务端却很少有人提及.让我们先来看看标准输出代码: //服务器存档模式 $pdf->Output('output.p ...
将HTML页面自动保存为PDF文件并上传的两种方式（一）-前端（react）方式
一.业务场景公司的样本检测报告以React页面的形式生成,已调整为A4大小的样式并已实现分页,业务上需要将这个网页生成PDF文件,并上传到服务器,后续会将这个文件发送给客户(这里不考虑). 二.原来 ...
IE浏览器不能自动显示PDF文件的解决办法
今天更新了Adobe的PDF Reader,更新后发现在网页上无法预览PDF文件了,点击PDF的连接,浏览器就会提示下载或者打开,感觉很不爽,经过一番百度,找到了解决办法,在这里分享一下. 打开IE浏 ...
用C#制作PDF文件全攻略
用C#制作PDF文件全攻略目录前言... 3 第一部分 iText的简单应用... 4 第一章创建一个Document 4 第一步创建一个Document实例:... 5 第二步 ...
页面直接导出为PDF文件，支持分页与页边距
将WEB页面直接导出为pdf文件是经常会用到的一个功能,尤其是各种报表系统.总结了一下目前几种主流的做法: 在后端用代码生成pdf文件,比如iText一类: 在后端抓取页面并生成pdf文件,比如pha ...
实战动态PDF在线预览及带签名的PDF文件转换
开篇语: 最近工作需要做一个借款合同,公司以前的合同都是通过app端下载,然后通过本地打开pdf文件,而喜欢创新的我,心想着为什么不能在线H5预览,正是这个想法,说干就干,实践过程总是艰难的,折腾了3 ...
前端工程师技能之photoshop巧用系列扩展篇——自动切图
× 目录 [1]初始设置 [2]自动切图前面的话随着photoshop版本的不断升级,软件本身增加了很多新的功能,也为切图工作增加了很多的便利.photoshop最新的版本新增了自动切图功能,本文 ...

随机推荐

主语，that和which
但除了名词以外还可以用代词.动名词.不定式短语,名词性从句.名词短语.表距离的地点副词短语等做主语. 1.名词作主语. The child is my daughter. 2.代词做主语. He al ...
LeetCode 916. Word Subsets
原题链接在这里:https://leetcode.com/problems/word-subsets/ 题目: We are given two arrays A and B of words. E ...
解决window.location.href参数太长 post提交数据
前言:一提到页面跳转,最常用的一般就是window.location.href,如果需要带参数,也许可以在后面用?拼上,但这样并不安全,而且有个更严重的问题,这样的拼接是有长度限制的,如果达到好几千个 ...
Python I/O编程 -- 序列化
序列化 pickle模块,json模块 (1)把变量从内存中变成可存储或传输的过程,称之为序列化.Python中叫pickling,其他语言中也被称为serialization,marshalling ...
洛谷1169 [ZJOI2007] 棋盘制作
题目链接题意概述:给出由0 1构成的矩阵,求没有0 1 相邻的最大子矩阵的最大子正方形. 解题思路:设f[i][j]表示i j向上能到哪,l[i][j] r[i][j]表示向左/右,转移时分开计算矩 ...
virsh使用总结
做下面操作前先安装这些工具: yum install virt-install libvirt-admin libvirt-client libvirt-daemon libvirt主要的配 ...
glew的安装
下载链接: https://sourceforge.net/project/downloading.php?group_id=67586&filename=glew-1.5.1-win32.z ...
PTES渗透测试执行标准
渗透测试注意事项: 1:测试一定要获得授权方才能进行,切勿进行恶意攻击 2:不要做傻事 3:在没有获得书面授权时,切勿攻击任何目标 4:考虑你的行为将会带来的后果 5:天网恢恢疏而不漏渗透测试执行标 ...
Excel自动语音点名-视频教学
请看2019年9月5日发布的第一篇推文. 标题:Excel自动语音点名-视频教学. 如果是笔记本的话, 要连接音频线进行扩音. 效果非常好. 测试了下, 11个人, 用了27秒. 可以休息下喉咙啦.. ...
动态查找之二叉树查找 c++实现
算法思想二叉搜索树(又称二叉查找树或二叉排序树)BST树二叉查找树二叉查找树,也称二叉搜索树,或二叉排序树.其定义也比较简单,要么是一颗空树,要么就是具有如下性质的二叉树: (1)若任意节点的左 ...

【转】pdf文件自动切白边

pdf文件自动剪裁（自动切白边）

【转】pdf文件自动切白边的更多相关文章

随机推荐

热门专题