C#/VB.NET 将PDF转为Excel
PDF文档可以避免可防⽌他⼈⽆意中触到键盘修改⽂件内容。但是在避免他人⽆意修改的同时也妨碍了正常的修改。如果你想处理或修改PDF文档中的数据,不妨试试用Excel来实现。Excel拥有强大的数据处理功能,丰富的绘制图表功能,丰富的自动化功能。本文将分为两个部分详细为您介绍如何通过C#/VB.NET代码将PDF转为Excel格式。仅需简单几步即可实现此功能,详情请阅读以下内容。
将PDF转为Excel
将多页 PDF 转换为一个 Excel 工作表
类库引入及代码思路
方法 1:
在程序中引入 Spire.PDF.dll 文件;将Free Spire.PDF for .NET 下载到本地,解压,找到 BIN 文件夹下的 Spire.PDF.dll。然后在 Visual Studio 中打开“解决方案资源管理器”,鼠标右键点击“引用”,“添加引用”,将本地路径 BIN 文件夹下的 dll 文件添加引用至程序。
方法 2:
通过 NuGet 安装。可通过以下 2 种方法安装:
1. 可以在 Visual Studio 中打开“解决方案资源管理器”,鼠标右键点击“引用”,“管理 NuGet 包”,然后搜索“Free Spire.PDF”,点击“安装”。等待程序安装完成。
2. 将以下内容复制到 PM 控制台安装。
Install-Package FreeSpire.PDF -Version 8.2.0
将PDF转为Excel
具体步骤:
创建 PdfDocument 类的对象。
调用 PdfDocument.LoadFromFile() 方法加载 PDF 文档。
通过 PdfDocument.SaveToFile() 方法保存为Excel文件格式到指定路径。
完整代码:
【C#】
using Spire.Pdf;
using Spire.Pdf.Conversion; namespace ConvertPdfToExcel
{
class Program
{
static void Main(string[] args)
{
//创建 PdfDocument 类的对象
PdfDocument pdf = new PdfDocument();
//加载PDF文档
pdf.LoadFromFile("TableSample2.pdf"); //保存PDF为XLSX文件
pdf.SaveToFile("PdfToExcel2.xlsx", FileFormat.XLSX);
}
}
}
【VB.NET】
Imports Spire.Pdf
Imports Spire.Pdf.Conversion Namespace ConvertPdfToExcel Class Program Private Shared Sub Main(ByVal args() As String)
'创建 PdfDocument 类的对象
Dim pdf As PdfDocument = New PdfDocument
'加载PDF文档
pdf.LoadFromFile("TableSample2.pdf ")
'保存PDF为XLSX文件
pdf.SaveToFile("PdfToExcel2.xlsx", FileFormat.XLSX)
End Sub
End Class
End Namespace
文档效果:
原文档

输出文档

将多页 PDF 转换为一个 Excel 工作表
下面是将多页 PDF 转换为一个 Excel 工作表的具体步骤:
- 创建 PdfDocument 类的对象。
- 调用 PdfDocument.LoadFromFile() 方法加载 PDF 文档。
- 初始化XlsxLineLayoutOptions 类的一个实例,在类构造函数中,将第一个参数convertToMultipleSheet 设置为 false。
- 调用PdfDocument.ConvertOptions.SetPdfToXlsxOptions()方法设置PDF转XLSX选项。
- 用PdfDocument.SaveToFile()方法将PDF保存为Excel文档。
完整代码:
【C#】
using Spire.Pdf;
using Spire.Pdf.Conversion; namespace ConvertPdfToExcel
{
class Program
{
static void Main(string[] args)
{
//创建 PdfDocument 类的对象
PdfDocument pdf = new PdfDocument();
//加载PDF文档
pdf.LoadFromFile("TableSample.pdf"); //初始化XlsxLineLayoutOptions 类的一个实例,在类构造函数中,将第一个参数convertToMultipleSheet 设置为 false.
//四个参数分别代表:convertToMultipleSheet、showRotatedText、splitCell、wrapText
XlsxLineLayoutOptions options = new XlsxLineLayoutOptions(false, true, true, true);
//设置PDF转XLSX选项
pdf.ConvertOptions.SetPdfToXlsxOptions(options); //保存PDF为Excel文档
pdf.SaveToFile("PdfToOneExcelSheet.xlsx", FileFormat.XLSX);
}
}
}
【VB.NET】
Imports Spire.Pdf
Imports Spire.Pdf.Conversion Namespace ConvertPdfToExcel Class Program Private Shared Sub Main(ByVal args() As String)
'创建 PdfDocument 类的对象
Dim pdf As PdfDocument = New PdfDocument pdf.LoadFromFile("TableSample.pdf")
'初始化XlsxLineLayoutOptions 类的一个实例,在类构造函数中,将第一个参数convertToMultipleSheet 设置为 false.
'四个参数分别代表:convertToMultipleSheet、showRotatedText、splitCell、wrapText Dim options As XlsxLineLayoutOptions = New XlsxLineLayoutOptions(false, true, true, true)
'设置PDF转XLSX选项
pdf.ConvertOptions.SetPdfToXlsxOptions(options)
'保存PDF为Excel文档
pdf.SaveToFile("PdfToOneExcelSheet.xlsx", FileFormat.XLSX)
End Sub
End Class
End Namespace
文档效果:
原文档

输出文档

注:测试代码中的文件路径为程序Debug路径,文件路径可自定义为其他路径。
C#/VB.NET 将PDF转为Excel的更多相关文章
- C# 将PDF转为Excel
通常,PDF格式的文档能支持的编辑功能不如office文档多,针对PDF文档里面有表格数据的,如果想要编辑表格里面的数据,可以将该PDF文档转为Excel格式,然后编辑.本文,将以C#代码为例,介绍如 ...
- C#/VB.NET 将PDF转为OFD
OFD,全称Open Fixed-layout Document ,是一种可存储.读取以及编辑的国家标准版式的电子文档格式,属于中国的一种自主文件格式,在安全性上有可靠保证.为突破国外技术在我们软硬件 ...
- C#/VB.NET 将Html转为Excel
本文介绍通过C#和VB.NET代码展示将Html转为Excel文档的方法. dll引用 方法1 将 Spire.XLS for .NET 下载到本地,解压,安装.完成安装后,在安装路径下找到BIN文件 ...
- C#/VB.NET 将PDF转为PDF/X-1a:2001
PDF/X-1a是一种PDF文件规范标准,在制作.使用PDF以及印刷时所需要遵循的技术条件,属于PDF/X-1标准下的一个子标准. PDF/X-1标准有由CGATS于1999年制定的PDF/X-1:1 ...
- 【C#/VB.NET】 将PDF转为SVG/Image, SVG/Image转PDF
SVG是一种图形文件格式,它的英文全称为Scalable Vector Graphics,意思为可缩放的矢量图形.它在放大或者改变尺寸的情况下其图形质量不会有所损失,且与 JPG 和 GIF 图像比起 ...
- C# 将PDF转为线性化PDF
线性化PDF文件是PDF文件的一种特殊格式,可以通过Internet更快地进行查看.线性化的PDF,在页面数量很多的情况下,更能突出表现出快速浏览的优势.下面是通过后端.NET程序实现将PDF文件转为 ...
- Java将彩色PDF转为灰度
本文以Java代码为例介绍如何实现将彩色PDF文件转为灰度(黑白)的PDF文件,即:将PDF文档里面的彩色图片或者文字等通过调用PdfGrayConverter.toGrayPdf()方法转为文档页面 ...
- C# 将CSV转为Excel
CSV(Comma Separated Values)文件是一种纯文本文件,包含用逗号分隔的数据,常用于将数据从一个应用程序导入或导出到另一个应用程序.通过将CSV文件转为EXCEL,可执行更多关于数 ...
- vb.net字符串格式转为日期型
vb.net字符串格式转为日期型 比如 "20080815" 转换为"2008-05-15"Dim a As Date Dim s As String = ...
随机推荐
- JVM内存管理面试常见问题全解
目录 一.什么是JVM 1.jvm的三个组成部分 二.类加载系统 1.类的加载过程 2.类加载器 三.双亲委派机制 1.双亲委派机制介绍 2.为什么要双亲委派机制 3.双亲委派机制的核心源码 4.全盘 ...
- ASP.NETCore统一处理404错误都有哪些方式?
当未找到网页并且应用程序返回 404 错误时,ASP.NET Core MVC 仅呈现通用浏览器错误页面,如下图所示 这不是很优雅,是吗? 我们平时看到的404页面一般是这样的 还有这样的 试了下京东 ...
- python基础-基本数据类型(三)
一.散列类型 散列类型用来表示无序的集合类型 1.集合(set) Python中的集合与数学符号中的集合类似,都是用来表示无序不重复元素的集合. 1.1 集合的定义 集合使用一对{}来进行定义,集合中 ...
- XCTF练习题---MISC---stage1
XCTF练习题---MISC---stage1 flag:AlphaLab 解题步骤: 1.观察题目,下载附件 2.打开附件后发现是一张图片,初步判断是图片隐写,上Stegsolve进行转换,得到一张 ...
- [AcWing 2816] 判断子序列
点击查看代码 #include<iostream> using namespace std; const int N = 1e5 + 10; int a[N], b[N]; int mai ...
- FreeRTOS --(6)内存管理 heap5
转载自https://blog.csdn.net/zhoutaopower/article/details/106748308 FreeRTOS 中的 heap 5 内存管理,相对于 heap 4&l ...
- create-react-app的TS支持以及css模块化
开始: 利用官方脚手架,搭建react工程.参考:https://react.docschina.org/docs/create-a-new-react-app.html. 过程: 1.暴露webpa ...
- 2003031121-浦娟-python数据分析第四周作业-第二次作业
项目 内容 课程班级博客链接 20级数据班(本) 作业链接 Python第四周作业第二次作业 博客名称 2003031121-浦娟-python数据分析第四周作业-matolotlib的应用 要求 每 ...
- lab_0 清华大学ucore实验环境配置详细步骤!(小白入)
实验步骤 1.下载项目 从github上 的https://github.com/kiukotsu/ucore下载 ucore lab实验: git clone https://github.com/ ...
- [题解][YZOJ50074] 小 C 的岛屿
仅仅是对 \(O(n^4)\) 做法的一个记录. 简要题意 有 \(N\) 座岛屿,初始时没有边.每座岛屿都有一个概率值 \(p_i\) 和一个大小为 \(s_i\) 友好列表 \(A_i\) . 小 ...