uPDF-功能强大的PDF文件处理小工具
前几天因为工作原因,需要将一个PDF压缩一下。
网上找了半天,要么收费,要么就是转换的质量不太好。
论坛也找到一些破解的软件,但是总有点不太合适,有些功能还挺复杂。
也有些在线转换的,又考虑到自己较为隐私的pdf文件不想上传,不得已只能放弃。
索性自己写了个小工具,使用了网上的一些PDF类库,感谢提供类库的各位大神了。主要功能:
.PDF压缩
.PDF转word/excel/ppt/图片
.PDF文件中图片提取
.PDF文件合并/拆分
.OCR文字识别
.PDF文件去水印
.图片转PDF
.PDF去保护
关于使用:
1、去水印功能:去水印有默认模式和手动模式两种,一些图片水印或文字水印,本身含有“水印的标签”,此类水印可使用默认模式去除,某些水印图片或水印文字是通过非常规方法加入到PDF中的,本身不含有“水印标签”,对于此类水印,只能使用手动模式自行分析后去除。另外,有些PDF文件在同一位置加了多层水印,手动模式一次去除不干净,需要多次手动去除。同时有些水印加的比较“特别”,无法一步到位全去除,可以通过组合方式,例如先用模式1,再用模式2等,多步完成,这样做是为了将不同逻辑单独拆分,并通过多种组合的方式来使用更复杂情况的水印。2、OCR功能:在2.1及以后版本中重新设计了OCR功能,包括在线和离线两种方式,在线OCR使用了百度的接口,每日有5万次免费调用,超出后请第二天使用,后续考虑加入自定义key的功能,可用自己的key。离线OCR适合重要\保密PDF的文字识别,或无网络情况下的文字识别,请在下方的网盘中下载相关语言资源包,并按下图放置。未按此方式放置的,无法使用。
3、内存不足:在使用去水印功能或PDF压缩功能时,由于需要大量计算、分析,因此内存占用较高,而32位版应用在64位系统下运行时,默认最大可以使用2GB内存。因此即便系统内存有闲置,软件也无法调用到,容易出现“明明系统很多内存,为什么还报内存不足”。因此推出64位版本解决该问题。
关于程序:
1、关于报毒:程序做了加密和打包,绿色单文件,无需安装,方便携带,无毒,火绒测试通过,报毒的自行判断。
2、关于软件无法启动:多属于系统环境问题,需.NET 4.6以上环境支持,win7 和 win10 都测试通过,如果启动不了,可能是系统缺少运行库,可按提示自行解决。
3、软件免费使用,没有任何水印、页数限制或试用期限制,严禁倒卖,或者反编译后加入收费功能。
4、除在线更新功能以外,所有功能均可断网使用,包括OCR识别(在线OCR是提交至百度),因此软件在最大限度上保证了使用安全。
自2019年12月30日发布以来,得到了很多网友的喜欢,也看到很多网站提供了该软件的下载。
同时也真的没想到,不知不觉就走过了7个多月。
这7个多月里我一直坚持更新,作为一款免费软件来讲,应该还算是尽心尽力了。
期间自己提升了编程水平,也收获了不少朋友。
得到过鼓励,得到过认可,也遭受过非议。
但不论怎样,还有这么多喜欢该软件的网友,那也是我坚持更新下去的动力。
所以,让我们一起来看看,这个软件到底能更新多久,未来他到底会变成什么样子。
最后,强烈建议大家试试我的去水印。另外:为了实现自动更新,我自掏腰包购买了服务器,但毕竟个人能力有限,所以带宽不高,自动更新速度不快,结果回帖里就有人骂我“恶心”,花钱挨骂的事果然不少见。
同时也有网友反应为什么要强制更新,这是因为现在几个版本有些调整是必须的,比如严重bug,比如为了将来更好的自动更新。
因此,从2.2版开始,调整了文件存放服务器,下载速度更快,同时支持用户调用自己的下载器(IDM、迅雷等),我实测IDM下载更新速度1m/s。
另外,2.2版本开始,每次更新我也会单独传网盘。
12月30日更新 1.0版本:
修复了部分网友反馈的显示不正常的问题1月2日更新 1.1版本:
增加了PDF拆分功能1月3日更新 1.1.1版本:
修复了拆分功能里,选择每页拆分时必须要填写起始结束页的问题。1月7日更新 1.2版本:
加入了OCR识别,对于扫描件的PDF进行文字提取。本次OCR使用非网络接口,即断网状态依然可使用。
考虑到文件大小,仅加入了中文简体、中文繁体及英文字体的识别,即便这样,文件也达到了158M。
不需要OCR识别功能的可不使用此版本。
PS:此版本仅上传至百度网盘,因为蓝奏云有100M大小限制,我传不上去。1月9日更新 1.3 版本:
本次更新加入去水印功能,可一次性直接去除文字和图片水印。有些所谓的“水印”其实是扫描件里和扫描图相融为一体的,可以理解为水印图层和图像图层合二为一,这种就没办法去除了。
考虑到文件大小,依然发布两个版本,含OCR和不含OCR,可自行选择下载。
ps:ocr版本依然只上传了百度云。1月16日更新 1.4版本:
本次更新加入pdf文件合并功能,并修复了PDF文件图片提取、PDF转图片功能中,因为图片文件名重名可能导致的文件覆盖问题。3月6日更新 1.5版本:
本次更新修复了PDF文件合并功能中输出文件名因同名导致的错误。3月9日更新 1.6版本:
本次更新 新增了图片转换PDF功能,支持多图片文件合并转换PDF,也支持单图片文件转换PDF。3月27日更新 1.7.1版本:
本次更新,优化了去水印功能,可手动分析文字及图片水印并去除。4月3日更新 1.7.2版本:
本次更新,优化了去除图片水印功能,增加了水印扫描模式,更智能的识别水印图片。4月8日更新 1.7.3版本:
本次更新,优化了去文字水印功能,增加文字扫描模式,更智能的识别文字水印。4月10日更新 1.7.5版本:
不要问为什么没有1.7.4,因为这个版本我没发布,只做了内测。本次更新优化了文字去水印功能,去除部分超链接。
整体上去水印功能就告一段落了。水印的形式各种各样,无法做到一个程序解决市面上所有的水印,只能尽可能的覆盖各种情况。
希望能成为市面上最好用的小工具。4月13日更新 1.8版本:
新增权限解密功能,恢复PDF文件复制、编辑、打印等权限,并非破解PDF文件打开密码。4月22日更新 1.8.1版本:
文件合并、图片转PDF中,增加文件多选功能,方便多文件添加。4月23日更新 1.8.3版本:
优化超大文件去水印时报错及速度,363M文件去水印时,原先耗时10分钟,现在耗时十几秒。6月3日更新 1.8.5版本:
坛友说要有拖拽功能,于是就有了拖拽功能 。6月4日更新 1.8.7版本:
修复去水印功能按钮丢失bug 。6月5日更新 1.8.8版本:
修复去水印功能中的一处bug,修改批量添加文件时按名称排序。6月10日更新 1.8.9版本:
修复去水印功能中的一处bug。6月11日更新 1.9.0版本:
1、修复pdf压缩功能失效的问题;
2、重构大量代码,精简大量资源文件,大幅缩小文件体积;3、继续优化去水印功能。7月2日更新 2.0版本:
1、优化PDF文件压缩功能;
2、加入自动更新功能;7月8日更新 2.1版本:
1、优化图片转PDF功能,解决图片被拉伸问题;
2、加入OCR识别功能,可使用在线(每日5万次调用额度)及离线方式识别PDF文字,使用离线OCR功能时需下载语言资源文件至指定目录,详细放置方式见上方“关于使用”;7月9日更新 2.1.1版本:
1、编译32位和64位两个版本,64位版本可充分利用系统可用内存,在使用去水印及PDF压缩时不再出现内存不足问题;
2、继续优化图片转PDF功能;7月11日更新 2.2版本:
1、优化文字水印扫描,增加模式4,更加智能;
2、调整文件服务器,自动更新可调用用户下载工具(IDM、迅雷等),下载速度更快(实测1m/s以上)--从2.2版本开始;
下载地址:
百度云: https://pan.baidu.com/s/1996UoB8h-MIBmRj6p8HJ6g 提取码: 9h64
蓝奏云:https://howze.lanzous.com/b00to0k1a 密码:93xq
uPDF-功能强大的PDF文件处理小工具的更多相关文章
- 强大的pdf文件操作小工具——PDFtk的小白用法 【转载】
转载出处https://www.cnblogs.com/basterdaidai/p/6204518.html 前言 作为程序员,大家都知道的,总是会被技术小白问各种跟编程没什么关系的硬件.软件问题. ...
- 功能强大的PDF实用工具
PDF实用工具(PDFTool)是北京博信施科技有限有限公司研制开发的一款专门提供对PDF文件进行编辑.加工的处理软件.本软件具有对PDF文件进行分割.结合.加密.解密.添加水印.设定有效期限等多种功 ...
- 在windows下实时监控、接受文件变化小工具
在windows下实时监控文件变化小工具 在测试的时候,我们可能想实时监控系统打出的log信息,在unix系统上我们可以用"tail -f"实现,在windows下一般就无法做 ...
- 用C#Winform写个简单的批量清空文件内容和删除文件的小工具
用C#Winform写个简单的批量清空文件内容和删除文件的小工具 本文介绍这个简单得不能再简单的小项目.做这个项目,有以下目的. 1 当然是做个能用的工具 2 学习使用Github 关于用VS2013 ...
- 讲解开源项目:功能强大的 JS 文件上传库
本文作者:HelloGitHub-kalifun HelloGitHub 的<讲解开源项目>系列,项目地址:https://github.com/HelloGitHub-Team/Arti ...
- PDF文件比对工具
tex/PDF对比工具讨论:https://tex.stackexchange.com/questions/65453/track-changes-in-latex 如果有源文件,直接用latexpa ...
- 开源一个自动整理B站UWP客户端软件进行批量下载的视频文件的小工具BiliVideosReoganizeHelper
大家都知道B站是一个很受欢迎的视频学习网站,上面有很多无私的up主上传了大量优秀的教学视频,在此向B站致敬,向广大UP主致敬. 有时,我们需要下载收藏一些视频,以防止以后找不到了.那么我们可以用B ...
- pdf转换为word小工具,挺好
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvZGFwZW5nMDExMg==/font/5a6L5L2T/fontsize/400/fill/I0JBQk ...
- 测试修改hosts文件py小工具
import sys,osparm_list=sys.argvHOST_PATH=r'C:\liuliang\flask_test\test\hosts'class HostFile(object): ...
随机推荐
- Rectangle【思维+模拟】
Rectangle 题目链接(点击) frog has a piece of paper divided into nn rows and mm columns. Today, she would l ...
- 深入理解 nth-child 和 nth-of-type 的区别
ele:nth-of-type(n) 为什么叫 of-type ,就是说它是以“type”来区分的,也就是说ele:nth-of-type(n)指的是父元素下第n个ele元素. ele:nth-ch ...
- CAS(乐观锁)与ABA问题
cas是什么 CAS 全称 compare and swap 或者compare and exchange 比较并且交换.用于在没有锁的情况下,多个线程对同一个值的更新. cas原理 例如,我们对一 ...
- 『图论』LCA 最近公共祖先
概述篇 LCA (Least Common Ancestors) ,即最近公共祖先,是指这样的一个问题:在一棵有根树中,找出某两个节点 u 和 v 最近的公共祖先. LCA 可分为在线算法与离线算法 ...
- Ngnix 配置文件快速入门
转自https://www.cnblogs.com/knowledgesea/p/5175711.html 其实也没什么好说的,我想大部分人也不会在意nginx的实现原理啥的.服务器要部署的时候,把n ...
- 7.kubernetes集群版本升级
1.查看原集群的Node节点的版本号 [root@hdss7-22 opt]# kubectl get node -o wide 2.将要升级的kubernetes版本上传到node节点上并解压(v1 ...
- vue-admin-template搭建后台管理系统的学习(一)
首先我们来看看这个基础模版的目录结构 ├── build // 构建相关 ├── config // 配置相关├── src // 源代码│ ├── api // 所有请求│ ├── ass ...
- 如何修改git commit的author信息
本地有多个git账号时,容易发生忘记设置项目默认账号,最后以全局账号提交的情况,其实对代码本身并无影响,只是提交记录里显示的是别的名字稍显别扭. 举个例子: 查看提交日志,假设以a(a@email. ...
- 第四模块 :微服务调用链监控CAT架构和实践
采样率:每一个请求为都进行记录,或者100次请求为记录50次 各个开源框架都满足opentracing的标准,只要使用opentracing标准埋点的客户端,可以使用不同的客户端去展示,opentra ...
- android屏幕适配的全攻略3-动态获取手机屏幕宽高及动态设置控件宽高
1.获取手机屏幕宽高: DisplayMetrics dm = new DisplayMetrics(); getWindowManager().getDefaultDisplay().getMetr ...

