最近遇到一个项目就是要从一份word中提取出所有的图片信息,功能看起来不是很难,只要使用office自带的Microsoft.Office.Interop.Word就可以解决问题。网上也有不少的文章来说明如何去实现。不过总体来说网上的内容分为两派一个是使用剪贴板来实现,一个是通过将图片转为byte数组来完成。个人倾向于后者,但是在实践过程中遇到了问题。

问题一:通过byte的方式来实现图片的提取会导致提取出来的图片的质量严重下降,这样的图片质量下降是无法通过修改图片质量的代码来优化和提高的。目前为止我还没有想到什么办法来很好的解决,只能是换方法来实现, 不过个人猜想是因为word中图片的dpi问题导致,因为原本很小的图片导出后就会变的很大(尺寸)。所以不得不使用剪贴板的方法来实现,但是用第一种方法也会有局限性。

下面分别的贴出实现的代码

第一种,通过byte的方式,关键语句为(byte[])shape.Range.EnhMetaFileBits;

foreach(InlineShape shape in item.Range.InlineShapes)
{
  if (shape.Type == WdInlineShapeType.wdInlineShapePicture)
  {
    //获取Word中的图片
    byte[] img = (byte[])shape.Range.EnhMetaFileBits;
    Bitmap bmp = new Bitmap(new MemoryStream(img));
  }
}

第二种,通过剪贴板,如下

foreach (InlineShape shape in item.Range.InlineShapes)
{
    //判断类型
    if (shape.Type == WdInlineShapeType.wdInlineShapePicture)
    {
        //利用剪贴板保存数据
        shape.Select(); //选定当前图片
        WordApp.Selection.Copy();//copy当前图片
        if (Clipboard.ContainsImage())
        {
            Bitmap bmp = new Bitmap(Clipboard.GetImage());
            fileName = System.Guid.NewGuid() + defaultPicExtension;
            bmp.Save(savePath + fileName, System.Drawing.Imaging.ImageFormat.Png);
        }
    }
}

问题二:通过控制台的方式编写程序可能会遇到剪贴板无法使用的事情,需要引用System.Window.Form来解决问题。

希望有经验的朋友可以帮忙解释一下第一种方法的问题所在,最后贴上实现的全部代码

private void bt_readreport_Click(object sender, EventArgs e)
{
    //初始化控件值
    ClearControl();
    StringBuilder reportContent = new StringBuilder();     object Nothing = System.Reflection.Missing.Value;
    object filename = "文件完整路径和名称";
    Microsoft.Office.Interop.Word.Application WordApp = new Microsoft.Office.Interop.Word.ApplicationClass();
    Microsoft.Office.Interop.Word.Document WordDoc = WordApp.Documents.Open(ref filename, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing, ref Nothing);
    //循环文章中的各个章节
    foreach (Paragraph item in WordDoc.Paragraphs)
    {
        if (item != null)
        {
            if (item.Range.Text.Trim() != "")
            {
                //判断该范围内是否存在图片
                if (item.Range.InlineShapes.Count != 0)
                {
                    foreach (InlineShape shape in item.Range.InlineShapes)
                    {
                        //判断类型
                        if (shape.Type == WdInlineShapeType.wdInlineShapePicture)
                        {
                            //利用剪贴板保存数据
                            shape.Select(); //选定当前图片
                            WordApp.Selection.Copy();//copy当前图片
                            string fileName = "";
                            if (Clipboard.ContainsImage())
                            {
                                Bitmap bmp = new Bitmap(Clipboard.GetImage());
                                fileName = System.Guid.NewGuid() + ".png";
                                bmp.Save(savePath + fileName, System.Drawing.Imaging.ImageFormat.Png);
                            }
                        }
                    }
                }
                //在总目录中添加相应信息
                reportContent.AppendLine(item.Range.Text.Trim());
            }
        }
    }
    WordDoc.Close(ref Nothing, ref Nothing, ref Nothing);
    WordApp.Quit(ref Nothing, ref Nothing, ref Nothing);

对了,Png的效果要比JPG好,而且文件也不大,推荐使用

c# 提取word文件中的图片问题的更多相关文章

  1. Java 使用PDFBox提取PDF文件中的图片

    今天做PDF文件解析,遇到一个需求:提取文件中的图片并保存.使用的是流行的apache开源jar包pdfbox, 但还是遇到坑了,比如pdfbox版本太高或太低都不能用!!这个包竟然没有很好地做好兼容 ...

  2. Servlet从本地文件中读取图片,并显示在页面中

    import java.io.IOException; import javax.servlet.ServletException; import javax.servlet.http.HttpSer ...

  3. Silverlight读取Zip文件中的图片与视频

    首先看看Demo的截图: 下面我将一步步展示实现这个Demo的过程,这个需求就是读出Zip文件中的图片与视频. Demo整体架构: 首先我们准备几张图片和视频,然后将其压缩至resource.zip文 ...

  4. 从一个word文件中读取所有的表格和标题(1)

    首先讲需求: 从word文件中读表格里的数据,然后插入数据库中.word文件中的表格是带有标题的,把标题读出来,进行匹配数据库. 需求分析: word2007底层是以xml文件存储的,所以分析xml的 ...

  5. 提取PPT文件中的Vba ProjectStg Compressed Atom。Extract PPT VBA Compress Stream

    http://msdn.microsoft.com/en-us/library/cc313106(v=office.12).aspx  微软文档 PartI ********************* ...

  6. 借助python工具从word文件中抽取相关表的定义,最后组装建表语句-非常好

    借助python工具从word文件中抽取表的定义,最后组装建表语句-非常好 --如有转载请以超链接的方式注明原文章出处,谢谢大家.请尊重每一位乐于分享的原创者 1.python脚本 ## -*- co ...

  7. C#如何提取.txt文件中的每个字符串

    C#如何提取.txt文件中的每个字符串,并将其存放到一个类中. 将其中的编号 菜名 价格 分别存入不同的数组中. 注:在用ReadLine读取一行信息时为什么读取的中文字符变成了乱码. 20 满意答案 ...

  8. 吴裕雄--天生自然python学习笔记:python文档操作批量替换 Word 文件中的文字

    我们经常会遇到在不同的 Word 文件中的需要做相同的文字替换,若是一个一个 文件操作,会花费大量时间 . 本节案例可以找出指定目录中的所有 Word 文件(包含 子目录),并对每一个文件进行指定的文 ...

  9. 吴裕雄--天生自然python学习笔记:python文档操作自动查找替换 Word 文件中的指定文字

    Win32com 组件提供了自动替换 Word 文件中指定文字 的功能 .在使用“查找” 功能替换文字之前,可先清除源文字及目标文字的格式,以免影响替换效果,语法为 : 替换 Word 文件特定文字的 ...

随机推荐

  1. PHPstrom 增加emmet插件

    之前记得使用Eclipse的时候有一个插件叫 emmet 可以实现快速开发前端,简直就是前端开发秒杀神器: 输入对应的代码一个table键就搞定了一堆代码: 在emmet的官网上 看到其实是支持的PH ...

  2. linux定时执行php脚本

    1.查看lynx命令所在的路径 whereis lynx 或者 which lynx 如果没有,则安装 yum install lynx 或者 apt-get方式(ubuntu) 2.建立 shell ...

  3. Cassandra1.2文档学习(5)—— Snitch

    参考资料:http://www.datastax.com/documentation/cassandra/1.2/webhelp/index.html#cassandra/architecture/a ...

  4. mysql索引使用笔记

    1.使用explain语句查看性能mysql> explain select product_id from orders where order_id in (123, 312, 223, 1 ...

  5. Android开发第2篇 - Git插件安装

    一.Eclipse上安装GIT插件EGit Eclipse的版本eclipse-java-helios-SR2-win32.zip(在Eclipse3.3版本找不到对应的 EGit插件,无法安装) E ...

  6. WPF 数据绑定Bingding基础(第四天)

    程序的本质是数据加算法.数据会在存储.逻辑和展示三个层面沟通,在WPF中,展示层和逻辑层的沟通就使用Data Bingding来实现. Binding即“绑定”,如果把Bingding比作数据的桥梁, ...

  7. IQKeyboredManager使用

    这个库是一个单例,它一旦生效,全项目任何界面都有效.让它生效的代码可以写在任意位置,我写在AppDelegate里. 1 2 3 4 5 6 7 8 9 10 - (BOOL)application: ...

  8. Static File Middleware

    [ASP.NET Core] Static File Middleware   前言 本篇文章介绍ASP.NET Core里,用来处理静态档案的Middleware,为自己留个纪录也希望能帮助到有需要 ...

  9. 项目中常用功能,如:流媒体、健康数据(步数等)等-b

    整理iOS开发中使用的各种流媒体和常用的高级功能.由于时间关系,目前只写了一部分功能,全部都采用的是系统方法,没用第三方,截图如下: screen1.png screen2.png 个人比较懒,不爱多 ...

  10. 瑞昱Realtek(Realtek HD Audio Driver)音频声卡驱动R2.49 for Win7_Vista

    不管是在高端系列主板上,还是在低端系列主板上,我们都能看到Realtek瑞昱的身影,Realtek HD Audio Driver能够支持所有的Realtek HD Audio音频驱动.Realtek ...