使用Python批量合并PDF文件(带书签功能)

网上找了几个合并pdf的软件,发现不是很好用,一般都没有添加书签的功能. 又去找了下python合并pdf的脚本,发现也没有添加书签的功能的. 于是自己动手编写了一个小工具,使用了PyPDF2. 下面是使用的截图: 代码如下: #!/usr/bin/env python3 # -*- coding: utf-8 -*- ''' #文件名:pdfmerge.py 本脚本用来合并pdf文件,输出的pdf文件按输入的pdf文件名生成书签使用示例如下: python pdfmerge.py -p "D…

pypdf2:下载Americanlife网页生成pdf合并pdf并添加书签

初步熟悉安装 pip install pypdf2 合并并添加书签 #!/usr/bin/env python3.5 # -*- coding: utf-8 -*- # @Time : 2019/12/1 下午3:42 # @Author : yon # @Email : xxx@qq.com # @File : tt.py import os , os.path from PyPDF2 import PdfFileReader, PdfFileWriter import time # imp…

ImageMagick convert多张照片JPG转成pdf格式，pdfunite合并PDF文件

在认识ImageMagick之前,我***的图像浏览软件是KuickShow,截图软件是KSnapShot,这两款软件都是KDE附带的软件,用起来也是蛮方便的.在一次偶然的机会中,我遇到了ImageMagick,才发现Linux竟然有如此功能强大的图像软件. 你将会发现,大部分的操作,你只要在终端下动动键盘即可,省得你用鼠标点来点去. 下面,我对ImageMagick的主要功能做一个简单的介绍,其中覆盖的大都是人们常用的一些功能,如果你要全面的了解它的知识,你可以看看它的man手册. con…

如何给PDF文件制作书签

书本阅读的时候我们有时候会制作一些漂亮的书签,那么电子文档也是有书签的,要怎么制作小伙伴们都知道吗?应该会有许多的小伙伴还不知道,今天就为大家分享一下电子文件如何添加书签的.就以PDF这个现在常用的电子文件来说吧. 操作软件:PDF编辑器 1.首先我们准备一个软件跟一个PDF文件,PDF文件的编辑是需要使用软件的,在电脑中下载一个迅捷PDF编辑器,然后在编辑器中找到书签工具,找到编辑器中的视图工具,我们可以看到视图工具的下拉菜单中就有我们需要的书签工具.然后点击书签工具. 2.点击书签工…

Python批量合并处理B站视频

最近想学习后端,又不想花钱,怎么办呢?于是在手机端B站(哔哩哔哩)上面找到了满意的免费视频教程,但是手机端看起来很不方便啊.于是,我通过在手机端缓存下来后,导入到了电脑端,但是我后面了发现两个问题: 1.本来一集视频按理说一段吧,但是B站下载下来的视频并不是完整的一段,而是被分成了多段blv格式的视频,所以需要想办法把它们拼接成完整的一段视频! 2.视频数量太大,不可能一个一个去修改,得想办法批量处理!(我这里有120个视频文件夹,下图所示,没显示完) 基于上述两个问题,必须用一种方法快速解决!…

Aspose.Pdf合并PDF文件

使用Aspose.Pdf类库,有很多种方法可以合并PDF文件,这里简单介绍小生见到的几种: Doucment.Pages.Add PdfFileEditor.Append PdfFileEditor.Concatenate Doucment.Pages.Add 要合并几个PDF文件,实际上就是把文档里的页合并到同一个文件里面, 所以可以打开PDF文件,简单的把其他文件的页面添加即可 Doucment pdfdoc1 = new Doucment("input.pdf"); Doucme…

怎样批量删除PDF文件中的注释

日常我们在阅读一些PDF文章时候,我们会发现有些PDF文章带有非常多的注释,显得非常不美观,影响了阅读体验.那么PDF文章里的批注应该怎么进行删除呢?怎样批量删除PDF文件中的注释? 操作教程: 1．首先我们点击安装在电脑上的PDF编辑器,运行程序,我在看见软件界面之后,我们点击软件界面的“打开”选项.添加并打开我们需要进行编辑的PDF文件. 2．PDF文件打开以后,在软件的工具栏里找到“注释”按钮,单击按钮,会弹出一个下拉框,然后选择“显示注释列表”功能,即可进行批量删除注释操作. …

使用ffmpeg批量合并flv文件

title: 使用ffmpeg批量合并flv文件 toc: false date: 2018-10-14 16:08:19 categories: methods tags: ffmpeg flv 使用youtube-dl从b站下的视频是分part的,因此需要合并一下. 首先需要把那些分part的视频重命名一下去掉中文和特殊字符数字前位用0补全,如01~19 然后在终端中进入当前目录执行命令: for f in *.flv; do echo "file '$f'" >>…

python批量处理压缩文件

python批量处理压缩文件博客小序:在数据的处理中,下载的数据很有可能是许多个压缩文件,自己一个一个解压较为麻烦,最近几日自己在处理一次下载的数据时,遇到大量的压缩数据需要处理,于是利用python进行了处理,特撰此博文以记之. 参考博客: https://blog.csdn.net/qq_38697681/article/details/79424259 https://blog.csdn.net/brucewong0516/article/details/79064384 1.脚本处理情…

使用ItextSharop合并pdf文件，体积变大的解决

通用的合并方式导致输出的pdf 文件中嵌入了大量的重复字体.导致文件体积膨胀. 使用基于内存流的方式,读取文件字节,可以解决重复字体的嵌入问题: public static string MergeFiles(string targetPdfFilesDir) { string outPath = string.Empty; //验证文件是否存在 if (!Directory.Exists(targetPdfFilesDir)) { throw new FileNotFoundException…

Java 合并PDF文件

处理PDF文档时,我们可以通过合并的方式,来任意合并几个不同的PDF文件,使我们方便的存储和管理文档.例如,在做毕业设计的时候,封面和论文正文往往是两个PDF文档,但是,上交电子档的时候,需要合二为一.下面将通过Java程序代码介绍具体的PDF合并方法. maven 依赖  <dependency> <groupId>com.lowagie</…

python批量运行py文件

import os path="E:\\python" #批量的py文件路径 for root,dirs,files in os.walk(path): #进入文件夹目录 for f in files: #文件夹下的文件 if os.path.splitext(f)[1]=='.py': #只运行py文件 os.chdir(root) os.system('python {}'.format(f)) #终端运行 python main.py…

使用PyPdf2合并PDF文件（没有空白、报错）

使用PyPdf2合并PDF文件(没有空白.报错) 对于合并之后pdf空白,或者出现 'latin-1' codec can't encode characters in position 8-11: ordinal not in range(256),请参照下面的链接对PyPdf2进行修改 https://blog.csdn.net/weixin_43116153/article/details/105218309 作者:小羊瓜瓜修改完成后,便可以正常使用PyPdf2库对文件进行合并代码如下…

设置Adobe Reader打开PDF文件保持记忆功能

设置Adobe Reader打开PDF文件保持记忆功能打开菜单“编辑”->“首选项”. 选择种类中的“文档”,在“打开设置”区域勾上“重新打开文档时恢复上次视图设置(R)”,确定之后就可以在下次打开文档时自动显示到上次打开的位置.…

PDF 补丁丁 0.4.2.891 测试版发布：合并PDF文件时设置书签文本和样式

新的测试版在合并文件界面增加了设置书签样式的功能.除了可以为所合并的图片(或PDF文件)指定书签文本之外,还可以指定其文本样式(文本颜色.粗体.斜体).如下图所示. 此外,合并文件界面还添加了文件夹历史记录列表,修复了选择书签颜色按钮的小问题. 为了加快添加文件的速度,新测试版删除了合并文件列表的文件页码和尺寸信息. 目前,PDF补丁丁是唯一一个可以将图片和PDF文件合并成新PDF文件,同时指定书签和书签样式的PDF文档合并工具.…

个人永久性免费-Excel催化剂功能第88波-批量提取pdf文件信息（图片、表格、文本等）

日常办公场合中,除了常规的Excel.Word.PPT等文档外,还有一个不可忽略的文件格式是pdf格式,而对于想从pdf文件中获取信息时,常规方法将变得非常痛苦和麻烦.此篇给大家送一pdf文件提取信息大集合,几乎可涵盖日常pdf文件提取信息的所有场景. 业务场景在日常工作中,为了保护数据免于被二次利用和为了在文件分发过程中,可以不受其他电脑因为软件版本不同等原因导致文件不能打开或打开格式版面大变形,将要分发的文件,无论是Excel.Word或PPT,转为pdf格式,是一个不错的主意. 在pdf…

python 批量打印PDF

有一批PDF文件,好几百个,每个只打印第2,3页,双面打印. 网上搜索一波,方案如下: 安装Ghostscript,GhostView,使用gsprint命令打印pdf文件. gsprint命令参数说明: "-dQUIET", 安静的意思,指代执行过程中尽可能少的输出日志等信息.(也可以简写为“-q”) "-dNOSAFER", 通过命令行运行 "-dBATCH", 执行到最后一页后退出 "-d…

基于Python实现对PDF文件的OCR识别

http://www.jb51.net/article/89955.htm https://pythontips.com/2016/02/25/ocr-on-pdf-files-using-python/ 大家可能听说过使用Python进行OCR识别操作.在Python中,最出名的库便是Google所资助的tesseract.利用tesseract可以很轻松地对图像进行识别.现在问题来了,如果想对一个PDF文档进行OCR识别,该怎么做呢?下面一起来看看. 最近在做一个项目的时候,需要将PDF文件…

将doc文件批量转为pdf文件

需要将不少doc文件转为pdf,WPS带有这种功能,但是鼠标点击次数太多以后整个人都变得很烦躁用了一下午去搜这方面的工具软件,找到若干.有一些免费,有一些试用的,但总归就找到一个真正能用,虽说生成的文件名中有未授权字样,但批量修改文件名简单多了. 谁知道到了实验室的电脑上因为什么打印机错误,还是不能用! 于是决定自己写一个, 第二天上午开始搜资料,乱搜一阵,居然发现WPS有二次开发的功能,大喜但是,没有C++开发接口的资料,而且官方论坛的C++例子是针对老版本的. 于是参考别人写的C#和VB…

python批量改动指定文件夹文件名称

这小样例仅仅要是说明用python怎么批量改动指定文件夹的文件名称: 记得要把脚本跟改动的文件放在同一个文件夹下 #encoding:utf-8 import os import sys files = os.listdir('D:\\1') #路径能够自己 for name in files: a = os.path.splitext(name) if a[1] == '.txt': #txt能够自己手动改动成你想改的文件名称 newname = a[0]+'.py' #.py也是能够改动 p…

C#调用Python脚本打印pdf文件

介绍:通过pdf地址先将文件下载到本地,然后调用打印机打印,最后将下载的文件删除. 环境:windows系统.(windows64位) windows系统中安装python3.6.2环境资料: O2S.Components.PDFRender4NET.dll(vs项目引用,这是在C#中调用打印机) python3.6.2 for windows python-3.6.2-amd64-webinstall 在python环境中添加:pywin32-221.win-amd64-py3.6 和 …

php 查询mysql数据批量转为PDF文件二（批量使用wkhtmltopdf html导出PDF）

上节讲到配置wkhtmltopdf,这节讲下如何批量操作首先讲下wkhtmltopdf如何使用直接命令行输入: wkhtmltopdf http://www.baidu.com/ baidu.pdf php使用 <?php shell_exec('wkhtmltopdf http://www.baidu.com/ baidu.pdf') //注:中间两个空格隔开 ?> 当前路径下会生成一个PDF文件: 批量操作: <?phpheader("Content-type:t…

php批量导出pdf文件的脚本（html-PDf）

背景:突然有大量的文件需要导出成PDF文件,写一个批量导出pdf的脚本,同时文件的命名也需要有一定的规则导出方式:向服务器中上传csv文件,csv文件中包含文件的地址和相对应的文件命名. 如下格式:(地址是已经加密的) 758cm1q8t3NMzbEcGhXLm03oiEelzomItxYT4PuGD3xoJkcRnZ5VrFmeOt_Kucw5vyPUJDiOv0ipLxY1jL_RUjAraovb-jYVMObT1fru0DViCy0ZDmXzTLcEoQFVSdD336MjtNHFHmU…

Python数据生成pdf文件

sklearn实战-乳腺癌细胞数据挖掘 https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share http://www.jb51.net/article/53233.htm 本文实例演示了Python生成pdf文件的方法,是比较实用的功能,主要包含2个文件.具体实现方法…

python批量读取txt文件为DataFrame

我们有时候会批量处理同一个文件夹下的文件,并且希望读取到一个文件里面便于我们计算操作.比方我有下图一系列的txt文件,我该如何把它们写入一个txt文件中并且读取为DataFrame格式呢? 首先我们要用到glob模块,这个python内置的模块可以说是非常的好用. glob.glob('*.txt') 得到如下结果: all.txt是我最后得到的结果文件.可以见返回的是一个包含txt文件名称的列表,当然如果你的文件夹下面只有txt文件,那么你用os.listdir()可以得到一个一样的列表然后…

python批量处理excel文件数据

https://www.zhihu.com/question/39299070?sort=created 作者:水中柳影链接:https://www.zhihu.com/question/39299070/answer/81062665来源:知乎著作权归作者所有,转载请联系作者获得授权. 该表列名:df.rename(columns={'原列名' : '新列名'}) df1.ix[1:3,['merge_add']] #取某一列的前3行 excel的内容需要有规律,python才能按顺序读…

matlab批量合并txt文件

1: %% merge.m 2: %%%%Main程序%%%%%% 3: %%%%%% 4: %%%%%%本程序合并完各个子文件夹中的txt到主文件目录下,并且合并的文件以子文件夹名字命名 5: %%%%%%同时,每次合并时,如果主文件夹已存在某一个子文件夹名字A的txt文件,那么此次合并,将把当前 6: %%%%%%这个子文件夹A中所有的txt文件追加到子文件夹A.txt文件的末尾处. 7: clear; 8: clc; 9: % MainFolder='D:\Master-FTP\磁流变阻尼…