最近在做一个项目要求word 中的图片与文字分离 ,找了好久终于找到一个完美的方法

c#实现word中的图文分离

 

part 1: class define



Code highlighting produced by Actipro CodeHighlighter (freeware)

http://www.CodeHighlighter.com/

-->publicclass WordSeparator:IDisposable
{

#region Constructor

public WordSeparator()

{

WordApp =new Microsoft.Office.Interop.Word.Application();

}

#endregion

#region Fields

private Microsoft.Office.Interop.Word.Application WordApp;

privateobject missing = System.Reflection.Missing.Value;

privateobject yes =true;

privateobject no =false;

private Microsoft.Office.Interop.Word.Document d;

privateobject filename =@"C:\example.rtf";

#endregion

#region Methods

publicvoid UpdateDoc()

{

d = WordApp.Documents.Open(ref filename, ref missing, ref no, ref missing,

ref missing, ref missing, ref missing, ref missing, ref missing,

ref missing, ref missing, ref yes, ref missing, ref missing, ref missing, ref missing);

List<Microsoft.Office.Interop.Word.Range> ranges =

new List<Microsoft.Office.Interop.Word.Range>();

foreach (Microsoft.Office.Interop.Word.InlineShape s in d.InlineShapes)

{

if (s.Type ==

Microsoft.Office.Interop.Word.WdInlineShapeType.wdInlineShapePicture)

{

ranges.Add(s.Range);

s.Delete();

}

}

foreach (Microsoft.Office.Interop.Word.Range r in ranges)

{

r.InlineShapes.AddPicture(

@"c:\PathToNewImage\Image.jpg", ref missing, ref missing, ref missing);

}

WordApp.Quit(ref yes, ref missing, ref missing);

}

publicvoid SeparateImageText()

{

//初始化程序

d = WordApp.Documents.Open(ref filename, ref missing, ref no, ref missing,

ref missing, ref missing, ref missing, ref missing, ref missing,

ref missing, ref missing, ref yes, ref missing, ref missing, ref missing, ref missing);

List<Microsoft.Office.Interop.Word.Range> ranges =

new List<Microsoft.Office.Interop.Word.Range>();

List<string> files =new List<string>();

foreach (Microsoft.Office.Interop.Word.InlineShape s in d.InlineShapes)

{

if (s.Type == Microsoft.Office.Interop.Word.WdInlineShapeType.wdInlineShapePicture

|| s.Type ==

Microsoft.Office.Interop.Word.WdInlineShapeType.wdInlineShapeEmbeddedOLEObject)

{

//获取图片数据

byte[] imgData = (byte[])s.Range.EnhMetaFileBits;

string file =string.Concat(Guid.NewGuid().ToString(), ".gif");

files.Add(file);

//构造图形

MemoryStream mStream =new MemoryStream(imgData);

Bitmap bmp =new Bitmap(mStream);

//保存到磁盘

bmp.Save(file);

mStream.Dispose();

bmp.Dispose();

ranges.Add(s.Range);

s.Delete();

}

}

; i < ranges.Count; i ++ )

{

Microsoft.Office.Interop.Word.Range r = ranges[i];

//替换图片

r.InsertBefore("<img src='"+ files[i] +"'>");

r.InsertAfter("</img>");

}

//退出程序

WordApp.Quit(ref yes, ref missing, ref missing);

}

///<summary>

/// 替换word中的图片

///</summary>

///<param name="serverPath">图片文件的存储物理路径</param>

///<param name="virtualPath">图片文件的标签虚拟路径</param>

publicvoid SeparateImageText(string serverPath, string virtualPath)

{

//初始化程序

d = WordApp.Documents.Open(ref filename, ref missing, ref no, ref missing,

ref missing, ref missing, ref missing, ref missing, ref missing,

ref missing, ref missing, ref yes, ref missing, ref missing, ref missing, ref missing);

List<Microsoft.Office.Interop.Word.Range> ranges =new List<Microsoft.Office.Interop.Word.Range>();

List<string> files =new List<string>();

foreach (Microsoft.Office.Interop.Word.InlineShape s in d.InlineShapes)

{

if (s.Type == Microsoft.Office.Interop.Word.WdInlineShapeType.wdInlineShapePicture

|| s.Type == Microsoft.Office.Interop.Word.WdInlineShapeType.wdInlineShapeEmbeddedOLEObject)

{

//获取图片数据

byte[] imgData = (byte[])s.Range.EnhMetaFileBits;

string file =string.Concat(Guid.NewGuid().ToString(), ".gif");

files.Add(file);

//构造图形

MemoryStream mStream =new MemoryStream(imgData);

Bitmap bmp =new Bitmap(mStream);

//保存到磁盘

bmp.Save(string.Concat(serverPath, "\\", file));

mStream.Dispose();

bmp.Dispose();

ranges.Add(s.Range);

s.Delete();

}

}

; i < ranges.Count; i++)

{

Microsoft.Office.Interop.Word.Range r = ranges[i];

//替换图片

r.InsertBefore("<img src='"+string.Concat(virtualPath,"//",files[i]) +"'>");

r.InsertAfter("</img>");

}

//退出程序

WordApp.Quit(ref yes, ref missing, ref missing);

}

///<summary>

/// 替换word中的图片

///</summary>

///<param name="targetFile">目标文件</param>

///<param name="serverPath">图片文件的存储物理路径</param>

///<param name="virtualPath">图片文件的标签虚拟路径</param>

publicvoid SeparateImageText(string targetFile,string serverPath, string virtualPath)

{

filename = targetFile;

//初始化程序

d = WordApp.Documents.Open(ref filename, ref missing, ref no, ref missing,

ref missing, ref missing, ref missing, ref missing, ref missing,

ref missing, ref missing, ref yes, ref missing, ref missing, ref missing, ref missing);

List<Microsoft.Office.Interop.Word.Range> ranges =new List<Microsoft.Office.Interop.Word.Range>();

List<string> files =new List<string>();

foreach (Microsoft.Office.Interop.Word.InlineShape s in d.InlineShapes)

{

if (s.Type == Microsoft.Office.Interop.Word.WdInlineShapeType.wdInlineShapePicture

|| s.Type == Microsoft.Office.Interop.Word.WdInlineShapeType.wdInlineShapeEmbeddedOLEObject)

{

//获取图片数据

byte[] imgData = (byte[])s.Range.EnhMetaFileBits;

string file =string.Concat(Guid.NewGuid().ToString(), ".gif");

files.Add(file);

//构造图形

MemoryStream mStream =new MemoryStream(imgData);

Bitmap bmp =new Bitmap(mStream);

//保存到磁盘

bmp.Save(string.Concat(serverPath, "\\", file));

mStream.Dispose();

bmp.Dispose();

ranges.Add(s.Range);

s.Delete();

}

}

; i < ranges.Count; i++)

{

Microsoft.Office.Interop.Word.Range r = ranges[i];

//替换图片

r.InsertBefore("<img src='"+string.Concat(virtualPath, "//", files[i]) +"'>");

r.InsertAfter("</img>");

}

//退出程序

WordApp.Quit(ref yes, ref missing, ref missing);

}

#endregion

#region IDisposable 成员

publicvoid Dispose()

{

if (d !=null)

{

System.Runtime.InteropServices.Marshal.ReleaseComObject(d);

d =null;

}

if (WordApp !=null)

{

System.Runtime.InteropServices.Marshal.ReleaseComObject(WordApp);

WordApp =null;

}

}

#endregion

}

part 2: usage code:



Code highlighting produced by Actipro CodeHighlighter (freeware)

http://www.CodeHighlighter.com/

-->WordSeparator w =new WordSeparator();

w.SeparateImageText();

 
 
 
Shape 对象代表文档中的图形对象,
InlineShape 代表文档中的嵌入式图形对象,
但是我又遇到了另外一种问题,word 中的图片除了InlineShape  的图片外还有  Shape 
 如果将 Shape  转化为  InlineShape  就会报错
 对于shape 还是没法做到完全分离,希望大神指点一二
 

.net 下word 中的图片与文字分离的更多相关文章

  1. 如何将word中的图片和文字导入自己的博客中

    目前大部分的博客作者在用Word写博客这件事情上都会遇到以下3个痛点: 1.所有博客平台关闭了文档发布接口,用户无法使用Word,Windows Live Writer等工具来发布博客.使用Word写 ...

  2. 怎样将word中的图片插入到CSDN博客中

    目前大部分的博客作者在用Word写博客这件事情上都会遇到以下3个痛点: 1.所有博客平台关闭了文档发布接口,用户无法使用Word,Windows Live Writer等工具来发布博客.使用Word写 ...

  3. 在RichTextBox控件中添加图片和文字

    public void SetText(RichTextBox rtb) { rtb.Text = "在RichTextBox控件中添加图片和文字" + Environment.N ...

  4. 如何把word中的图片怎么导出来呢?

    在办公使用word的过程中你可能经常会遇到这个问题:插入到word中的图片找不到导出来的方法,是不是很郁闷呢,别急,今天咱们研究一下把word中的图片导出来的方法(把"我的"变成你 ...

  5. Java 添加、删除、格式化Word中的图片

    本文介绍使用Spire.Cloud.SDK for Java提供的ImagesApi接口来操作Word中的图片.具体可通过addImage()方法添加图片.deleteImage()方法删除图片.up ...

  6. iOS开发小技巧--即时通讯项目:使用富文本在UILabel中显示图片和文字;使用富文本占位显示图片

    Label借助富文本显示图片 1.即时通讯项目中语音消息UI的实现,样式如图: 借助富文本在UILabel中显示图片和文字 // 1.创建一个可变的富文本 NSMutableAttributedStr ...

  7. 写带有清晰图片的博客:如何将word中的图片复制到windows live writer保持大小不变--清晰度不变

    写blog的习惯,先在word写了,复制到windows live writer,再发布到博客园.word中的文章,图片有缩放比例,复制到windows live writer后图片变得不清晰.除了一 ...

  8. word中更改图片和标题之间的垂直距离

    word中插入图片后.往往须要给图片加上标题. 你插入图片和给图片插入标题时,word用的是默认的格式给你插入的图片和标题. 假如原来的paragraph是2倍行距.你的图片和标题之间的距离也是2倍行 ...

  9. 利用POI抽取word中的图片并保存在文件中

    利用POI抽取word中的图片并保存在文件中 poi.apache.org/hwpf/quick-guide.html 1.抽取word doc中的图片 package parse; import j ...

随机推荐

  1. Python基础学习之文件(2)

    文件内建方法 1.输入 read()方法用来直接读取字节到字符串中,最多读取给定数目个字节.如果没有给定size参数(默认值为-1)或size值为负,文件将被读取直至末尾. readline()方法读 ...

  2. vue短信验证码组件

    Vue.component('timerBtn',{ template: '<button v-on:click="run" :disabled="disabled ...

  3. S7-1500 读取V90/S120/S210/G120的常用驱动参数

    S7-1500 读取V90/S120的常用驱动参数 此程序已更新,可以下载例子程序 https://files.cnblogs.com/files/lion-zheng/PLC_async_drive ...

  4. C++ POD类型

    POD( Plain Old Data)概念: Arithmetic types (3.9.1), enumeration types, pointer types, and pointer to m ...

  5. SQL-常用数据类型

    整数除了 INT 外,还有 TINYINT.SMALLINT.MEDIUMINT.BIGINT. CHAR 和 VARCHAR 的区别: CHAR 的长度是固定的,而 VARCHAR 的长度是可以变化 ...

  6. mysql默认字符集问题

    最近在使用mysql的时候出现了奇怪的乱码问题,最开始发现mysql的字符集的确存在一些问题. 经过修改配置文件/etc/my.cnf [mysqld] character-set-server=ut ...

  7. 模块和控制器包含在JS文件中

    在AngularJS应用程序中,通常是把模块和控制器包含在javascript文件中. <!DOCTYPE html><html><head><meta ht ...

  8. java多线程-概念&创建启动&中断&守护线程&优先级&线程状态(多线程编程之一)

    今天开始就来总结一下Java多线程的基础知识点,下面是本篇的主要内容(大部分知识点参考java核心技术卷1): 1.什么是线程以及多线程与进程的区别 2.多线程的创建与启动 3.中断线程和守护线程以及 ...

  9. LeetCode804. Unique Morse Code Words

    题目 国际摩尔斯密码定义一种标准编码方式,将每个字母对应于一个由一系列点和短线组成的字符串, 比如: "a" 对应 ".-", "b" 对应 ...

  10. Spring入门注解版

    参照博文Spring入门一,以理解注解的含义. 项目结构: 实现类:SpringHelloWorld package com.yibai.spring.helloworld.impl; import ...