Java 查找并替换PDF中的指定文本】的更多相关文章

itext没有提供直接替换PDF文本的接口,我们可以通过在原有的文本区域覆盖一个遮挡层,再在上面加上文本来实现. 所需jar包: 1.先在PDF需要替换的位置覆盖一个白色遮挡层(颜色可根据PDF文字背景色自行定义) import com.itextpdf.text.BaseColor; import com.itextpdf.text.DocumentException; import com.itextpdf.text.pdf.PdfContentByte; import com.itextp…
文档中可通过应用不同的字体来呈现不一样的视觉效果,通过字体来实现文档布局.排版等设计需要.应用字体时,可在创建文档时指定字体,也可以用新字体去替换文档中已有的字体.下面,以Java代码展示如何来替换PDF中的已有字体,包括: 替换所有字体 替换指定字体 引入jar Maven程序中配置pom.xml: <repositories> <repository> <id>com.e-iceblue</id> <url>https://repo.e-ic…
直接说问题,itext没有直接提供替换PDF中文本的接口(查看资料得到的结论是PDF不支持这种操作),不过存在解决思路:在需要替换的文本上覆盖新的文本.按照这个思路我们需要解决以下几个问题: itext怎样增加白色底的覆盖层 找到覆盖层的位置(左顶点的位置)和高度与宽带 这样做的目的是什么了?也告诉下大家,比如:现在要你将业务数据导出成PDF存档,且PDF的模板有现成的.对我们写程序的来说,变化的只是部分数据,假如我们可以直接替换里面的数据,是不是可以节省我们的开发时间. 1.itext怎样增加…
当你在使用文本文件时,很可能需要查找和替换文件中的字符串.sed 命令主要用于替换一个文件中的文本.在 Linux 中这可以通过使用 sed 命令和 awk 命令来完成. 在本教程中,我们将告诉你使用 sed 命令如何做到这一点,然后讨论讨论 awk 命令相关的. sed 命令是什么 sed 命令表示 Stream Editor(流编辑器),用来在 Linux 上执行基本的文本操作.它可以执行各种功能,如搜索.查找.修改.插入或删除文件. 此外,它也可以执行复杂的正则表达式匹配. 它可用于以下目…
作者:马健邮箱:stronghorse_mj@hotmail.com发布:2012.06.11 目录一.背景二.DjVu中的隐藏文本三.PDF中的隐藏文本 一.背景 目前对于扫描电子文档,网上比较流行的格式是PDF和DjVu.为了便于对扫描文档进行文字检索.复制,这两种格式均允许在扫描图像层之外,再加一层隐藏文字层,成为通常所说的“双层PDF”和“双层DjVu”. 对于双层PDF和DjVu来说,阅读者所直接看到的都是原汁原味的扫描页面,保留了原始书籍页面的全部内容和版式,但当阅读者用鼠标在页面上…
作者:马健邮箱:stronghorse_mj@hotmail.com发布:2012.06.11 目录一.背景二.能够校对的PDF需要满足的条件三.校对工具的选择四.校对过程五.延伸讨论 事先声明:本文所谈校对方法仅适用于DjVuToy.FreePic2Pdf.Pdg2Pic所生成的双层PDF,对其他软件生成的双层PDF无效,不喜勿进. 一.背景 随着在DjVuToy.FreePic2Pdf.Pdg2Pic中均支持双层PDF,一个 必然要问的问题是:如何对双层PDF进行校对?原因无他,双层PDF都…
在Java编程中,如何拆分正则表达式和字符串? 以下示例演示如何使用Matcher类的replaceFirst()方法替换字符中指定的子字符串的首次出现. package com.yiibai; import java.util.regex.Matcher; import java.util.regex.Pattern; public class ReplaceFirstOccurrence { public static void main(String args[]) { Pattern p…
个人博客 地址:http://www.wenhaofan.com/article/20180913160442 代码如下 package com.wenhaofan.common.kit; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import jav…
Spire.Cloud.SDK for Java提供了PdfImagesApi接口可用于添加图片到PDF文档addImage().提取PDF中的图片extractImages(),具体操作步骤和Java代码示例可参考以下内容. 一.导入jar文件.(有2种方式) (推荐)方式1. 创建Maven项目程序,通过maven仓库下载导入.以IDEA为例,新建Maven项目,在pom.xml文件中配置maven仓库路径,并指定spire.cloud.sdk的依赖,如下: <repositories>…
string jsonfile = @"E:\history.json";//JSON文件路径 using (System.IO.FileStream file = new FileStream(jsonfile, FileMode.Open, FileAccess.ReadWrite)) { var buffer = new byte[file.Length];//获取用字节表示的流长度 file.Read(buffer, , buffer.Length);//0 字节 1 偏移量…