【.net 深呼吸】导出 Office 文档中的图片
我们常用的 Office 文档其实就三种——Word、Excel、PowerPoint,分别对应的扩展名为:.docx、.pptx、.xlsx。
许多教程都告诉我们,要提取这些文件中的图片(其实像视频之类的媒体文件也一样),可以把文档的后缀名改为 .zip,然后打开,在 media 目录下就能找到文档中插入的图片文件。
要是嫌手动操作麻烦,其实我们完全可以用代码来完成。.net 类库自带可以操作 zip 压缩文档的 API,所以,我们不需要去找第六方组件。
好,F话少说,咱们开始吧,其实很是简单的。
try
{
ZipArchive zdoc = ZipFile.OpenRead(txtInput.Text);
// 搜索
foreach (ZipArchiveEntry et in zdoc.Entries)
{
// 分析文件后缀
if (et.Name.Contains(".jpg") || et.Name.Contains(".jpeg") || et.Name.Contains(".png"))
{
listBox1.Items.Add(et.FullName);
// 把文件实体复制到外部文件中
using (Stream strm = et.Open())
{
string path = BuildPath(txtOutput.Text, et.Name);
FileStream fsout = File.Open(path, FileMode.OpenOrCreate);
strm.CopyTo(fsout);
fsout.Close();
}
}
}
}
catch(Exception ex)
{
System.Diagnostics.Debug.WriteLine($"EXCEPTION: {ex.Message}");
MessageBox.Show("你的人品值不足,请及时充值。");
}
finally
{
……
}
注意,你要引入以下两个程序集:
System.IO.Compression
System.IO.Compression.FileSystem
我们直接把 Office 文件当成zip文件来处理就行了,调用 ZipFile 类的 OpenRead 方法(静态),可以以只读方式打开文件,我们这里只要读出图片文件就行了,所以只读方式打开就够了。打开文件后,返回一个 ZipArchive 实例,它表示一个zip文档的实例。
压缩档中的文件是以一个个实体的形式存放的,每个实体用一个 ZipArchiveEntry 实例封装,所以我们要通过循环,筛选出后缀为 .jpg、.jpeg、.png的文件。
找出相关的实体后就好办了,直接将文件流复制到输出流中即可。
using (Stream strm = et.Open())
{
string path = BuildPath(txtOutput.Text, et.Name);
FileStream fsout = File.Open(path, FileMode.OpenOrCreate);
strm.CopyTo(fsout);
fsout.Close();
}
这里用到一个 BuildPath 方法,是个自定义方法,目的是组装文件名,如果文件已存在,就生成像 abc(1) abc(2) 这样的文件名。代码如下。
/// <summary>
/// 该方法用来生成新的路径
/// </summary>
/// <param name="dir">要存放的目录</param>
/// <param name="fn">实体文件名</param>
/// <returns></returns>
string BuildPath(string dir, string fn)
{
string tmpPath = Path.Combine(dir, fn);
int i = ; //这个值用来自增长
// 循环,直到生成不重复的文件名
// 如果文件名已存在,就生成 xxx(1)、xxx(2)、xxx(3)这样的文件名
while (File.Exists(tmpPath))
{
// 不含后缀的文件名
string fn_1 = Path.GetFileNameWithoutExtension(fn);
// 扩展名,如.txt
string fn_ext = Path.GetExtension(fn);
// 重组文件名
string _fn = $"{fn_1}({i}){fn_ext}";
// 重组路径
tmpPath = Path.Combine(dir, _fn);
i++;
}
return tmpPath;
}
好了,就这么简单,完事了。
具体的,大家可以看源代码。
【.net 深呼吸】导出 Office 文档中的图片的更多相关文章
- VSTO 向office文档中插入内容
原文:VSTO 向office文档中插入内容 Word: Word.Selection sec = ThisAddIn.appWord.Selection; sec.Insert ...
- Java 用Freemarker完美导出word文档(带图片)
Java 用Freemarker完美导出word文档(带图片) 前言 最近在项目中,因客户要求,将页面内容(如合同协议)导出成word,在网上翻了好多,感觉太乱了,不过最后还是较好解决了这个问题. ...
- 【Java】用Freemarker完美导出word文档(带图片)
Java 用Freemarker完美导出word文档(带图片) 前言 最近在项目中,因客户要求,将页面内容(如合同协议)导出成word,在网上翻了好多,感觉太乱了,不过最后还是较好解决了这个问题. ...
- C# 提取Word文档中的图片
C# 提取Word文档中的图片 图片和文字是word文档中两种最常见的对象,在微软word中,如果我们想要提取出一个文档内的图片,只需要右击图片选择另存为然后命名保存就可以了,今天这篇文章主要是实现使 ...
- 在LaTeX文档中插入图片的几种常用的方法
LaTeX中一般只直接支持插入eps(Encapsulated PostScript)格式的图形文件, 因此在图片插入latex文档之前应先设法得到图片的eps格式的文件. 在LaTeX文档中插入图片 ...
- python、java、ruby、node等如何提取office文档中的内容?
我相信大家都有过这样的需求,把doc.ppt.excel.pdf.txt中的文本内容提取出来.提取出来的文本内容可用于文档内容的全文索引,文档的基本内容摘要等.在度娘上搜索“如何提取文档内容”,确实有 ...
- 利用POI操作不同版本号word文档中的图片以及创建word文档
我们都知道要想利用java对office操作最经常使用的技术就应该是POI了,在这里本人就不多说到底POI是什么和怎么用了. 先说本人遇到的问题,不同于利用POI去向word文档以及excel文档去写 ...
- php解析word,获得文档中的图片
背景 前段时间在写一个功能:用原生php将获得word中的内容并导入到网站系统中.因为文档中存在公式,图片,表格等,因此写的比较麻烦. 思路 大体思路是先将word中格式为doc的文档转化为docx, ...
- 第一节:python提取PDF文档中的图片
由于项目需要将PDF文档当中的图片转换成图片,所以参考了这篇文章https://blog.csdn.net/qq_15969343/article/details/81673302后项目得以解决. 1 ...
随机推荐
- 一些java方面面试题,没事做做看看(带答案)
1. Switch能否用string做参数? a.在?Java? <http://lib.csdn.net/base/java>7 之前, switch 只能支持byte,short,ch ...
- java注解编程
- LODOP之票据连续套打笔记<二>
接着上一篇博文,继续说说关于lodop,关于模板设计及相关的这里不多说了,上一篇博文最下面的推荐可以看看,说的很比较清楚,今天说说我在项目中运用套打实现分页预览和打印的, 之前弄lodop打印的时候发 ...
- 【原创】源码角度分析Android的消息机制系列(六)——Handler的工作原理
ι 版权声明:本文为博主原创文章,未经博主允许不得转载. 先看Handler的定义: /** * A Handler allows you to send and process {@link Mes ...
- axis1.4开发webservice服务端(快速入门)-基于jdk1.4
写在前面: 现在有很多开发webservice的方法以及框架,什么cxf等,但是这些在你编写服务类的时候都要用到注解这个功能.如果现在的jdk是1.4的,那么就不能使用注解这个功能了.所以这里可以用到 ...
- Scratch2的离线下载与安装
scratch是一种程序设计语言,可以用来设计 故事.动画.游戏.音乐和美术作品. Scratch主页:https://scratch.mit.edu/ Scratch的下载与安装: 首先下载并安装A ...
- day4作业小代码练习
登录模块: 我们无论上那个网站,经常遇到这样的情况,让我们登录这个网站,流程图如下: 思路: 1.当我们登录网站的时候,我们首先会输入用户名,这个时候,有些网站会提醒我们用户名是否存在,如果我们输入的 ...
- angular.js ng-repeat渲染时出现闪烁问题解决
当我们前端运用到angular.js框架时,想必大家都会遇到一些坑.其中,我也来分享一个常见的angular.js渲染时出现的坑. 当我们进行页面渲染时,绑定表达式最开始会用{{data.name}} ...
- jqueryEasyUI列表
背景 因为学习大数据开发这段时间,同时也学习java的一些知识.利用了近五个月的时间来投入学习,当然我选择了一个机构,因为已经做了四年多的开发,所以即使不是做的java但是java还是了解的,这段时间 ...
- P1280 尼克的任务
题目描述 尼克每天上班之前都连接上英特网,接收他的上司发来的邮件,这些邮件包含了尼克主管的部门当天要完成的全部任务,每个任务由一个开始时刻与一个持续时间构成. 尼克的一个工作日为N分钟,从第一分钟开始 ...