使用iText快速更新书签
一.介绍
pdfbox基于Apache协议,商用无需开放源代码。
iText基于APGL协议,打包和修改需发布源码,除非花钱买断。
二.用途
下载的电子书,有的书签是FitHeight,也就是缩放后整个高度都显示出来,页面很小了。
我需要改成继承,也就是XYZ,x是left,y是height,z是zoom,继承的意思是根据当前pdf的缩放比例。
而且有的pdf书没有目录,大部分都是扫描版,需要目录找资料,这年代北漂南漂基本一年一般家,那么多书来回累死。
目录的话自己加太麻烦,从京东,亚马迅,当当上找目录,自动生成带跳转的目录。
三.pdfBox
结论:有Bug,或者是我不会用。
public static void main(String[] args) throws Exception
{ String filename="E:\\PDF\\Go\\Go语言编程.pdf";
Catalog catalog=new Catalog();
catalog.OpenPdf(filename);
catalog.AdjustCatalog();
}
//set scale to inherit
public void AdjustCatalog() throws Exception
{
//获取PDDocumentCatalog文档目录对象
PDDocumentCatalog catalog=document.getDocumentCatalog();
//获取PDDocumentOutline文档纲要对象
PDDocumentOutline outline=catalog.getDocumentOutline();
for (PDOutlineItem item:outline.children())
{
System.out.println(item.getTitle()+item.getDestination());
AdjustCatalogRecurse(item);
}
}
public void AdjustCatalogRecurse(PDOutlineItem item) throws Exception
{
// PDPageXYZDestination xyzDestination=new PDPageXYZDestination();
System.out.println(item.getDestination()==null?"null":item.getDestination().getClass());
System.out.println(item.getTitle());
// UpdatePageDestination(item.getDestination(),xyzDestination);
// item.setDestination(xyzDestination);
for (PDOutlineItem item_child:item.children())
{
AdjustCatalogRecurse(item_child);
}
}
System.out.println(item.getDestination()==null?"null":item.getDestination().getClass());
getDestination()是获取书签的页码,缩放,页面位置等信息,但是我测试了几本,有的好用,有的全部是null,有的一半是null,真晕了。
左边是用Xchange viewer打开,跳转都没问题,右边是输出的内容,全都是null


四.iText
结论:真难用,更新操作别扭。
PdfWriter只能新建用,更新的时候有保存书签的PdfOutline不给用,只能用一堆
https://stackoverflow.com/questions/46716567/get-the-page-number-from-document-outline-bookmarks
一个pdfWriter只能写不能读,还要加一个reader拷贝到writer,和我理解的输入输出有点不一样。
1.更新操作
有些pdf的书签设置缩放等级是适应高度,每次看完几页一点书签又变成小图了。
下面是更新操作,我把其他全部的缩放等级都改成XYZ,xyz是继承的,书签的缩放等级和你当前页面的一样,你的页面改成多大就多大,
其他的不动。
public void editBookmarks(String src, String dest) throws DocumentException, IOException {
PdfReader reader = new PdfReader(src);
PdfStamper stamper = new PdfStamper(reader, new FileOutputStream(dest));
List<HashMap<String, Object>> list = SimpleBookmark.getBookmark(reader);
changeList(list);
stamper.setOutlines(list);
stamper.close();
reader.close();
}
public void changeList(List<HashMap<String, Object>> list) {
for (HashMap<String, Object> entry : list) {
for (String key : entry.keySet()) {
if ("Kids".equals(key)) {
Object o = entry.get(key);
changeList((List<HashMap<String, Object>>) o);
} else if ("Page".equals(key)) {
String dest = (String) entry.get(key);
entry.put("Page", dest.replaceAll("\\b(Fit|FitV|FITB|FITBH|FITBV|FITH|FITR)\\b", "XYZ"));
}
}
}
}
二.添加书签
三点说明
1.目录的页码是书上写的页码,pdf中页码是实际的页码,包括目录和前言,所以针对每个pdf都需要自己调整偏移
2.父目录处理目前没有考虑中文的情况,比如第一章,第十六章,过段时间抽空加上。
3.目录上可能多个书签同一页,电脑因为缩放问题,会有点挤,如果强迫症就自己调吧,比如下面的21.4书签,21.4.3亮了,因为他们是同一页。
下面是spring攻略的pdf,测试过已经加好书签了,太详细的话做不到也没时间。

public void createBookmarks(List<BookMark> booksmarks, String src, String dest) throws Exception {
Document document = new Document();
reader=new PdfReader(src);
PdfCopy copy = new PdfCopy(document, new FileOutputStream(dest));
document.open();
PdfOutline root = copy.getRootOutline();
copy.addDocument(reader);
PdfDestination destination = new PdfDestination(
PdfDestination.XYZ, -1, -1, 0);
PdfAction action;
copy.freeReader(reader);
for(BookMark bookMark :booksmarks)
{
action = PdfAction.gotoLocalPage(bookMark.getNum(), destination, copy);
new PdfOutline(root, action, bookMark.getTitle(), false);
}
copy.flush();
copy.close();
document.close();
}
五.源码
https://github.com/zwxbest/Demo/tree/master/itextDemo
使用iText快速更新书签的更多相关文章
- 如何快速更新长缓存的 HTTP 资源
前言 HTTP 缓存时间一直让开发者头疼.时间太短,性能不够好:时间太长,更新不及时.当遇到严重问题需紧急修复时,尽管后端文件可快速替换,但前端文件仍从本地缓存加载,导致更新长时间无法生效. 对于这个 ...
- 论文写作中快速更新Word里面交叉引用的编号,巧用MathType
点击插入编号>>更新,即可快速更新交叉引用的编号,不用一个一个更新域!
- WPF界面开发必备技能!TreeListView - 如何快速更新多个项目属性
DevExpress广泛应用于ECM企业内容管理. 成本管控.进程监督.生产调度,在企业/政务信息化管理中占据一席重要之地.通过DevExpress WPF Controls,您能创建有着强大互动功能 ...
- 利用ROWID 快速更新单表记录
-----对于普通表 实现: UPDATE T_PM_DEPOSIT_HIS b SET flag = SUBSTR( flag, 1, 8 )||'4'|| CASE WHEN term <= ...
- 以A表中的值快速更新B表中记录的方法
1.问题描述 有两张表,A表记录了某些实体的新属性,B表记录了每个实体的旧属性,现在打算用A中的属性值去更新B中相同实体的旧属性,如下图所示: 类似这样的需求,怎样做比较高效呢? 2.制作模拟数据 ...
- winform 数据(双向)绑定 快速更新实体
写点东西感觉特别累,也已经很久没写了. 最近在做一个winform类型的系统,其涉及到大量的表,有些表又包含大量的字段,所以当添加.更新实体时便会十分的繁琐,一方面:需要把界面上的字段绑定到对应的实体 ...
- 【Azure API 管理】API Management如何有效且快速更新呢?如对APIs/Policy等设置内容
问题描述 APIM中的内容(API, Policy)等内容,如果有需要更新时候,通常可以在Azure APIM门户上操作,通过一个接口一个设置的修改,也可以针对一个接口导入/导出的方式修改.当APIM ...
- android SDK 快速更新配置(转)
http://blog.csdn.net/yy1300326388/article/details/45074447 1.强制使用http替换https链接 Tools>选择Options,勾选 ...
- android sdk国内快速更新下载
Android SDK在线更新镜像服务器 http://www.androiddevtools.cn/ 目前正在使用的是:包含详细的配图流程 http://android-mirror.bugly.q ...
随机推荐
- tomcat启动出现Preparing launch delegate,一直卡在100%
本地启动项目时,Tomcat一直停留在, Starting Tomcat V8.0 Server at localhost Preparing launch delegate... 百度可得 ...
- FI 业务
f-02 post f-03 clear[account]-> f-04 post with clear fb70/f-22 f-32 clear[account]->f-28 post ...
- tomcat中实现特定路径下的图片的url访问Tomcat配置图片保存路径,图片不保存在项目路径下
使用Tomcat作为服务器的时候,如果不配置图片保存路径,将图片保存在项目路径下,那么再次打war包发布项目可能会造成图片的丢失,每次重启前将图片先保存再copy到服务器明显不方便,这时可以配置图片保 ...
- Node内核基本自带模块fs 文件的读写
在node的内核中存在一些内置的模块 这些是最基本的服务端所必要的 1:node全局环境:global类似于浏览器端的window 2:文件读取模块:fs fs模块同时提供了异步和同步的方法. 'us ...
- 堆+建堆、插入、删除、排序+java实现
package testpackage; import java.util.Arrays; public class Heap { //建立大顶堆 public static void buildMa ...
- Python Scrapy 爬虫框架实例(一)
之前有介绍 scrapy 的相关知识,但是没有介绍相关实例,在这里做个小例,供大家参考学习. 注:后续不强调python 版本,默认即为python3.x. 爬取目标 这里简单找一个图片网站,获取图片 ...
- Pychram - 使用介绍
Pychram - 使用介绍 PyCharm中Directory与Python package的区别 对于Python而言,有一点是要认识明确的,python作为一个相对而言轻量级的,易用的脚本语言( ...
- Linux下的常用指令汇总
内容提纲: 1.ubuntu安装 2.linux目录结构 3.apt.dpkg 4.date.cal.tzselect 5.修改密码.忘记密码 6.注销/重启/关机 7.cd pwd 8.-h --h ...
- 注册表的作用、bat文件中REG ADD命令添加注册表项以及bat
注册表的用途与设置 注册表是windows的核心,里面储存着大量的系统信息,说白了就是一个庞大的数据库.如果你不懂什么是数据库,那没关系,不影响你了解注册表,不过最好对数据库有所了解.注册表里面所有的 ...
- 对nginx进行平滑升级
1.查看服务器当前nginx版本 [root@instance-hwl9ix5l licenses]# nginx -v #查看版本 nginx: nginx version: n ...