一.介绍

pdfbox基于Apache协议,商用无需开放源代码。

iText基于APGL协议,打包和修改需发布源码,除非花钱买断。

二.用途

下载的电子书,有的书签是FitHeight,也就是缩放后整个高度都显示出来,页面很小了。

我需要改成继承,也就是XYZ,x是left,y是height,z是zoom,继承的意思是根据当前pdf的缩放比例。

而且有的pdf书没有目录,大部分都是扫描版,需要目录找资料,这年代北漂南漂基本一年一般家,那么多书来回累死。

目录的话自己加太麻烦,从京东,亚马迅,当当上找目录,自动生成带跳转的目录。

三.pdfBox

结论:有Bug,或者是我不会用。

 public static void main(String[] args) throws Exception
{ String filename="E:\\PDF\\Go\\Go语言编程.pdf";
Catalog catalog=new Catalog();
catalog.OpenPdf(filename);
catalog.AdjustCatalog();
}
    //set scale to inherit
public void AdjustCatalog() throws Exception
{
//获取PDDocumentCatalog文档目录对象
PDDocumentCatalog catalog=document.getDocumentCatalog();
//获取PDDocumentOutline文档纲要对象
PDDocumentOutline outline=catalog.getDocumentOutline();
for (PDOutlineItem item:outline.children())
{
System.out.println(item.getTitle()+item.getDestination());
AdjustCatalogRecurse(item);
}
}
public void AdjustCatalogRecurse(PDOutlineItem item) throws Exception
{
// PDPageXYZDestination xyzDestination=new PDPageXYZDestination();
System.out.println(item.getDestination()==null?"null":item.getDestination().getClass());
System.out.println(item.getTitle());
// UpdatePageDestination(item.getDestination(),xyzDestination);
// item.setDestination(xyzDestination);
for (PDOutlineItem item_child:item.children())
{
AdjustCatalogRecurse(item_child);
}
}

System.out.println(item.getDestination()==null?"null":item.getDestination().getClass());

getDestination()是获取书签的页码,缩放,页面位置等信息,但是我测试了几本,有的好用,有的全部是null,有的一半是null,真晕了。

左边是用Xchange viewer打开,跳转都没问题,右边是输出的内容,全都是null

四.iText

结论:真难用,更新操作别扭。

PdfWriter只能新建用,更新的时候有保存书签的PdfOutline不给用,只能用一堆

https://stackoverflow.com/questions/46716567/get-the-page-number-from-document-outline-bookmarks

一个pdfWriter只能写不能读,还要加一个reader拷贝到writer,和我理解的输入输出有点不一样。

1.更新操作

有些pdf的书签设置缩放等级是适应高度,每次看完几页一点书签又变成小图了。

下面是更新操作,我把其他全部的缩放等级都改成XYZ,xyz是继承的,书签的缩放等级和你当前页面的一样,你的页面改成多大就多大,

其他的不动。

    public void editBookmarks(String src, String dest) throws DocumentException, IOException {
PdfReader reader = new PdfReader(src);
PdfStamper stamper = new PdfStamper(reader, new FileOutputStream(dest));
List<HashMap<String, Object>> list = SimpleBookmark.getBookmark(reader);
changeList(list);
stamper.setOutlines(list);
stamper.close();
reader.close();
} public void changeList(List<HashMap<String, Object>> list) {
for (HashMap<String, Object> entry : list) {
for (String key : entry.keySet()) {
if ("Kids".equals(key)) {
Object o = entry.get(key);
changeList((List<HashMap<String, Object>>) o);
} else if ("Page".equals(key)) {
String dest = (String) entry.get(key);
entry.put("Page", dest.replaceAll("\\b(Fit|FitV|FITB|FITBH|FITBV|FITH|FITR)\\b", "XYZ"));
}
}
}
}

二.添加书签

三点说明

1.目录的页码是书上写的页码,pdf中页码是实际的页码,包括目录和前言,所以针对每个pdf都需要自己调整偏移

2.父目录处理目前没有考虑中文的情况,比如第一章,第十六章,过段时间抽空加上。

3.目录上可能多个书签同一页,电脑因为缩放问题,会有点挤,如果强迫症就自己调吧,比如下面的21.4书签,21.4.3亮了,因为他们是同一页。

下面是spring攻略的pdf,测试过已经加好书签了,太详细的话做不到也没时间。

 public void createBookmarks(List<BookMark> booksmarks, String src, String dest) throws Exception {
Document document = new Document();
reader=new PdfReader(src);
PdfCopy copy = new PdfCopy(document, new FileOutputStream(dest));
document.open(); PdfOutline root = copy.getRootOutline(); copy.addDocument(reader);
PdfDestination destination = new PdfDestination(
PdfDestination.XYZ, -1, -1, 0); PdfAction action;
copy.freeReader(reader);
for(BookMark bookMark :booksmarks)
{
action = PdfAction.gotoLocalPage(bookMark.getNum(), destination, copy);
new PdfOutline(root, action, bookMark.getTitle(), false);
}
copy.flush();
copy.close();
document.close(); }

五.源码

https://github.com/zwxbest/Demo/tree/master/itextDemo

使用iText快速更新书签的更多相关文章

  1. 如何快速更新长缓存的 HTTP 资源

    前言 HTTP 缓存时间一直让开发者头疼.时间太短,性能不够好:时间太长,更新不及时.当遇到严重问题需紧急修复时,尽管后端文件可快速替换,但前端文件仍从本地缓存加载,导致更新长时间无法生效. 对于这个 ...

  2. 论文写作中快速更新Word里面交叉引用的编号,巧用MathType

    点击插入编号>>更新,即可快速更新交叉引用的编号,不用一个一个更新域!

  3. WPF界面开发必备技能!TreeListView - 如何快速更新多个项目属性

    DevExpress广泛应用于ECM企业内容管理. 成本管控.进程监督.生产调度,在企业/政务信息化管理中占据一席重要之地.通过DevExpress WPF Controls,您能创建有着强大互动功能 ...

  4. 利用ROWID 快速更新单表记录

    -----对于普通表 实现: UPDATE T_PM_DEPOSIT_HIS b SET flag = SUBSTR( flag, 1, 8 )||'4'|| CASE WHEN term <= ...

  5. 以A表中的值快速更新B表中记录的方法

    1.问题描述 有两张表,A表记录了某些实体的新属性,B表记录了每个实体的旧属性,现在打算用A中的属性值去更新B中相同实体的旧属性,如下图所示: 类似这样的需求,怎样做比较高效呢? 2.制作模拟数据   ...

  6. winform 数据(双向)绑定 快速更新实体

    写点东西感觉特别累,也已经很久没写了. 最近在做一个winform类型的系统,其涉及到大量的表,有些表又包含大量的字段,所以当添加.更新实体时便会十分的繁琐,一方面:需要把界面上的字段绑定到对应的实体 ...

  7. 【Azure API 管理】API Management如何有效且快速更新呢?如对APIs/Policy等设置内容

    问题描述 APIM中的内容(API, Policy)等内容,如果有需要更新时候,通常可以在Azure APIM门户上操作,通过一个接口一个设置的修改,也可以针对一个接口导入/导出的方式修改.当APIM ...

  8. android SDK 快速更新配置(转)

    http://blog.csdn.net/yy1300326388/article/details/45074447 1.强制使用http替换https链接 Tools>选择Options,勾选 ...

  9. android sdk国内快速更新下载

    Android SDK在线更新镜像服务器 http://www.androiddevtools.cn/ 目前正在使用的是:包含详细的配图流程 http://android-mirror.bugly.q ...

随机推荐

  1. poi导出excel 并处理插入网络图片 范例 处理文件下载中文乱码

    package com.inborn.inshop.controller.product; import com.inborn.inshop.common.util.DateUtils;import ...

  2. 爬虫系列之requests

    爬取百度内容: import requests url = "https://www.baidu.com" if __name__ == '__main__': try: kv = ...

  3. bean之间的属性是怎么维护的

    spring对象[bean]之间的属性是通过什么维护的: 1.构造方法:标签:constructor-arg 2.set方法:标签:property <beans xmlns="htt ...

  4. VR外包AR外包公司(虚拟现实外包公司)承接虚拟现实项目开发(企业、教育、游戏)

    VR外包AR外包公司(虚拟现实外包公司)承接虚拟现实项目开发(企业.教育.游戏) 可公对公签正规合同,开发票. 我们是北京的公司.专业团队,成员为专业 VR/AR 产品公司一线开发人员,有大型产品开发 ...

  5. 转一篇 ShaderVariantCollection介绍的比较详细的文章 感谢作者

    http://www.seven-fire.cn/archives/174 Unity3D Shader加载时机和预编译 焱燚(七火)  |    2016年7月6日  |   UnityShader ...

  6. PHP里获取一维数组里的最大值和最小值

    <?php $arr = ['10','100','50','90','2','5']; $min = min($arr); $max = max($arr); echo $min.PHP_EO ...

  7. [转]C++中const、volatile、mutable的用法

    原文:https://blog.csdn.net/imJaron/article/details/79657642 const意思是“这个函数不修改对象内部状态”. 为了保证这一点,编译器也会主动替你 ...

  8. SpringBoot简单的REST风格例子

    关于REST和RESTful的说明请移步至:怎样用通俗的语言解释REST,以及RESTful? 其实我自己也不是十分的理解,只是今天学SpringBoot时看到有个标着REST风格的简单例子,就记录一 ...

  9. 力扣(LeetCode)389. 找不同

    给定两个字符串 s 和 t,它们只包含小写字母. 字符串 t 由字符串 s 随机重排,然后在随机位置添加一个字母. 请找出在 t 中被添加的字母. 示例: 输入: s = "abcd&quo ...

  10. Restful Api 的好与坏

    restful 的特色是接口少 get,put,post,delete 好处是容易记, 统一. 但是业务上往往不会这么简单. 不同的 user/roles 调用同一个 get 接口, 出来的结果不一定 ...