PDF转置
import pdfplumber
#全是None
with pdfplumber.open(r"C:\Users\yjiang3\Desktop\Inv.pdf") as pdf:
table_page = pdf.pages[0]
table_page = pdf.pages[1]
table = table_page.extract_table(
table_settings={
"vertical_strategy": "text",
"horizontal_strategy": "text"
})
print(table)
import pdfplumber
from openpyxl import Workbook
#全是None
with pdfplumber.open(r"C:\Users\yjiang3\Desktop\32.pdf") as pdf:
table_page = pdf.pages[262]
table = table_page.extract_table(
table_settings={
"vertical_strategy": "text",
"horizontal_strategy": "text"
})
workbook = Workbook()
sheet = workbook.active
for row in table:
sheet.append(row)
workbook.save(r"C:\Users\yjiang3\Desktop\11.xlsx")
import pdfplumber
from openpyxl import Workbook
#全是None
with pdfplumber.open(r"C:\Users\yjiang3\Desktop\Inv.pdf") as pdf:
table_page = pdf.pages[1] table = table_page.extract_table(
table_settings={
"vertical_strategy": "text",
"horizontal_strategy": "text"
})
workbook = Workbook()
sheet = workbook.active
for row in table:
if not ''.join([str(item) for item in row]) == '': #去掉空行
sheet.append(row) workbook.save(r"C:\Users\yjiang3\Desktop\13.xlsx")
import pdfplumber
from openpyxl import Workbook
#全是None
with pdfplumber.open(r"C:\Users\yjiang3\Desktop\40.pdf") as pdf:
table_page = pdf.pages[38]
table = table_page.extract_table(
table_settings={
"vertical_strategy": "text",
"horizontal_strategy": "text"
})
workbook = Workbook()
sheet = workbook.active
for row in table:
if not ''.join([str(item) for item in row]) == '': #去掉空行
new_row = []
new_row.append(''.join([str(item) if item else '' for item in row[:4]]))
new_row += row[4:]
sheet.append(new_row) workbook.save(r"C:\Users\yjiang3\Desktop\12.xlsx")
import pdfplumber
from openpyxl import Workbook
with pdfplumber.open(r"C:\Users\yjiang3\Desktop\Inv.pdf") as pdf:
table_page = pdf.pages[1]
table = table_page.extract_table(
table_settings={
"vertical_strategy": "text",
"horizontal_strategy": "text"
})
workbook = Workbook()
sheet = workbook.active
for row in table:
if not ''.join([str(item) for item in row]) == '': #去掉空行
new_row = []
new_row.append(''.join([str(item) if item else '' for item in row[:6]]))
new_row += row[6:]
sheet.append(new_row)
workbook.save(r"C:\Users\yjiang3\Desktop\13.xlsx")
import pdfplumber
from openpyxl import Workbook
#全是None
with pdfplumber.open(r"C:\Users\yjiang3\Desktop\40.pdf") as pdf:
table_page = pdf.pages[40]
table = table_page.extract_table(
table_settings={
"vertical_strategy": "text",
"horizontal_strategy": "text"
})
workbook = Workbook()
sheet = workbook.active
for row in table:
if not ''.join([str(item) for item in row]) == '': #去掉空行
new_row = []
new_row.append(''.join([str(item) if item else '' for item in row[:4]]))
new_row += row[4:]
sheet.append(new_row) workbook.save(r"C:\Users\yjiang3\Desktop\20.xlsx")
PDF转置的更多相关文章
- 将excel文件批量转成pdf
防止数据编辑.改动带来的不一致性,常常要将excel文件转成pdf文件再共享.发送给对方.有时excel文件还挺多,手头上保存实在是太慢了.就考虑用VBA批量转置. 掌握几个东西,就比较容易了: 1. ...
- C#给PDF文档添加文本和图片页眉
页眉常用于显示文档的附加信息,我们可以在页眉中插入文本或者图形,例如,页码.日期.公司徽标.文档标题.文件名或作者名等等.那么我们如何以编程的方式添加页眉呢?今天,这篇文章向大家分享如何使用了免费组件 ...
- 在线浏览PDF之PDF.JS (附demo)
平台之大势何人能挡? 带着你的Net飞奔吧!:http://www.cnblogs.com/dunitian/p/4822808.html#skill 下载地址:http://mozilla.gith ...
- .NET平台开源项目速览(16)C#写PDF文件类库PDF File Writer介绍
1年前,我在文章:这些.NET开源项目你知道吗?.NET平台开源文档与报表处理组件集合(三)中(第9个项目),给大家推荐了一个开源免费的PDF读写组件 PDFSharp,PDFSharp我2年前就看过 ...
- C#如何在PDF文件添加图片印章
文档中添加印章可以起一定的作用,比如,防止文件随意被使用,或者确保文档内容的安全性和权威性.C#添加图片印章其实也有很多实现方法,这里我使用的是免费的第三方软件Free Spire.PDF,向大家阐述 ...
- C#中如何创建PDF网格并插入图片
这篇文章我将向大家演示如何以编程的方式在PDF文档中创建一个网格,并将图片插入特定的网格中. 网上有一些类似的解决方法,在这里我选择了一个免费版的PDF组件.安装控件后,创建新项目,添加安装目录下的d ...
- 在Asp.Net中操作PDF – iTextSharp - 使用表格
使用Asp.Net生成PDF最常用的元素应该是表格,表格可以帮助比如订单或者发票类型的文档更加格式化和美观.本篇文章并不会深入探讨表格,仅仅是提供一个使用iTextSharp生成表格的方法介绍 使用i ...
- 开源免费且稳定实用的.NET PDF打印组件itextSharp(.NET组件介绍之八)
在这个.NET组件的介绍系列中,受到了很多园友的支持,一些园友(如:数据之巅. [秦时明月]等等这些大神 )也给我提出了对应的建议,我正在努力去改正,有不足之处还望大家多多包涵.在传播一些简单的知识的 ...
- ASP.Net MVC——使用 ITextSharp 完美解决HTML转PDF(中文也可以)
前言: 最近在做老师交代的一个在线写实验报告的小项目中,有这么个需求:把学生提交的实验报告(HTML形式)直接转成PDF,方便下载和打印. 以前都是直接用rdlc报表实现的,可这次牵扯到图片,并且更为 ...
- 在禅道中实现WORD等OFFICE文档转换为PDF进行在线浏览
条件: 安装好禅道的服务器 能直接浏览PDF的浏览器(或通过 安装插件实现 ) 文档转换服务程序(建议部署在另一台服务器上) 实现 原理: 修改禅道的文件预览功能(OFFICE文档其使用的是下 ...
随机推荐
- 《【转载】ChatGPT创始人,给我们上的8堂课》 回复
<[转载]ChatGPT创始人,给我们上的8堂课> https://tieba.baidu.com/p/8276644432
- linux升级系统内核版导致死锁
如上图片,官方说明为linux内核版本过低,存在系统bug,具体说明如下: https://baijiahao.baidu.com/s?id=1652492237858209875&wfr=s ...
- OSPF配置知识总结2(单区域)
OSPF配置知识总结2 静态路由有静态路由的好处,但也有弊端,牵一发动全身,在一个路由路径上,只要变一个,其他所有的路由器上的静态路由都要跟着改变. 用动态路由OSPF很简单就能解决这个问题.如下: ...
- unity Android路径的相关部分代码
using System; using System.Collections; using System.Collections.Generic; using System.IO; using Uni ...
- c++游戏编程(1)开发环境与工具函数
c++游戏编程(1)开发环境与工具函数 文章目录 c++游戏编程(1)开发环境与工具函数 前言 1.开发工具 2.工具函数 2.1 windows.h 2.1.1 _mkdir() 2.1.2 _rm ...
- BIP查询框添加查询条件
// 搜索框添加查询条件 viewModel.on("afterMount", function (data) { let agentId = viewModel.getParam ...
- 在vite中怎么批量注册组件
1. 在webpack中使用require来获取组件 / 参数:1. 目录 2. 是否加载子目录 3. 加载的正则匹配 //匹配当前文件夹下的所有.vue文件 注册全局组件 const importF ...
- iOS底层原理01:源码探索的三种方式
ios 开发探索源码三种方法 1.下符号断点的形式直接跟流程 2.通过摁住 control + step into 3.汇编查看跟流程 1.符号断点直接跟流程 以alloc为例: 选择断点Symbo ...
- Nginx 配置https的单向或双向认证
一.自制https认证证书 1. 制作CA证书 A. 生成CA私钥:openssl genrsa -des3 -out ca.key 2048,注意要输入两次密码,若去除密码使用openssl rsa ...
- 《CSOL大灾变》Mobile开发进度记录——武器购买界面设计
又到了休息日,有点时间继续这个移植游戏的开发.这次主要是关于武器系统模块的开发记录,关于CS以及CSOL的武器系统,它的购买菜单页面虽然谈不上复杂,但是也包含很多GUI元素,下面是CSOL其中的一个武 ...