C# 合并及拆分Word文档

本文简要分析一下如何如何使用C#简单实现合并和拆分word文档。平时我们在处理多个word文档时，可能会想要将两个文档合并为一个，或者是将某个文档的一部分添加到另一个文档中，有的时候也会想要将文档拆分。在Word中，合并或拆分文档最简单的方式就是打开一个原文档的副本文件，复制我们需要的部分，删除不需要的部分，然后再保存文档。使用这种方法在文档比较多或者比较大时手动操作起来比较费时，以下是使用C#实现合并一个Word文档的某一个section到另一个文档或者合并两个完整的Word文档到一个单独的文档以及如何根据section和page break来拆分一个Word文档的方法。

第一部分：合并Word文档

为了数据的保密性，我新创建了两个简单的word文档，如下图：

文档1

文档2

合并一个Word文档的某一个section到另一个文档

//加载文档1和文档2

Document doc1 = new Document();

doc1.LoadFromFile("Sales Report.docx", FileFormat.Docx);

Document doc2 = new Document();

doc2.LoadFromFile("Stories.docx", FileFormat.Docx);

//获取文档2的第一个section

Section sec = doc2.Sections[];

//克隆该section并把它添加到文档1

doc1.Sections.Add(sec.Clone());

doc1.SaveToFile("Mergesection.docx", FileFormat.Docx);

效果图：

合并两个完整的Word文档到一个单独的文档

//加载文档1

Document document = new Document();

document.LoadFromFile("Sales Report.docx", FileFormat.Docx);

//将文档2的所有内容插入到文档1

document.InsertTextFromFile("Stories.docx", FileFormat.Docx);

//将结果另存为到另一个单独的文档

document.SaveToFile("MergeFiles.docx", FileFormat.Docx);

效果图：

第二部分：拆分Word文档

根据section break拆分Word文档

//加载源文档

Document document = new Document();

document.LoadFromFile("Stories.docx");

//定义一个新的文档对象

Document newWord;

//遍历源文档的所有section，克隆每个section并将其添加至一个新的word文档，然后保存文档

for (int i = ; i < document.Sections.Count; i++)

{

    newWord = new Document();

    newWord.Sections.Add(document.Sections[i].Clone());

    newWord.SaveToFile(String.Format(@"test\output_{0}.docx", i));

}

效果图：

根据page break拆分Word文档

如下文档含有两个page break分别在第一页和第二页的末尾：

//加载源文档

Document original = new Document();

original.LoadFromFile("New Zealand.docx");

//创建一个新的文档并给它添加一个section

Document newWord = new Document();

Section section = newWord.AddSection();

int index = ;

//遍历源文档的所有section，检测page break并根据page break拆分文档

foreach (Section sec in original.Sections)

{

    foreach (DocumentObject obj in sec.Body.ChildObjects)

    {

        if (obj is Paragraph)

        {

            Paragraph para = obj as Paragraph;

            section.Body.ChildObjects.Add(para.Clone());

            foreach (DocumentObject parobj in para.ChildObjects)

            {

                if (parobj is Break && (parobj as Break).BreakType == BreakType.PageBreak)

                {

                    int i = para.ChildObjects.IndexOf(parobj);

                    for (int j = i; j < para.ChildObjects.Count; j++)

                    {

                        section.Body.LastParagraph.ChildObjects.RemoveAt(i);

                    }

                    newWord.SaveToFile(String.Format("result/out-{0}.docx", index), FileFormat.Docx);

                    index++;

                    newWord = new Document();

                    section = newWord.AddSection();

                    section.Body.ChildObjects.Add(para.Clone());

                    while (i >= )

                    {

                        section.Paragraphs[].ChildObjects.RemoveAt(i);

                        i--;

                    }

                    if (section.Paragraphs[].ChildObjects.Count == )

                    {

                        section.Body.ChildObjects.RemoveAt();

                    }

                }

            }

        }

        if (obj is Table)

        {

            section.Body.ChildObjects.Add(obj.Clone());

        }

    }

}

newWord.SaveToFile(String.Format("result/out-{0}.docx", index), FileFormat.Docx);

效果图：

完整代码：

合并

using Spire.Doc;

namespace Merge_Word_Document

{

    class Program

    {

        static void Main(string[] args)

        {

            //合并一个Word文档的某一个section到另一个文档

            /*Document doc1 = new Document();

            doc1.LoadFromFile("Sales Report.docx", FileFormat.Docx);

            Document doc2 = new Document();

            doc2.LoadFromFile("Stories.docx", FileFormat.Docx);

            Section sec = doc2.Sections[0];

            doc1.Sections.Add(sec.Clone());

            doc1.SaveToFile("Mergesection.docx", FileFormat.Docx);*/

            //合并两个完整的Word文档到一个单独的文档

            Document document = new Document();

            document.LoadFromFile("Sales Report.docx", FileFormat.Docx);

            document.InsertTextFromFile("Stories.docx", FileFormat.Docx);

            document.SaveToFile("MergeFiles.docx", FileFormat.Docx);

        }

    }

}

拆分

using System;

using Spire.Doc;

using Spire.Doc.Documents; 

namespace Split_Word_Document

{

    class Program

    {

        static void Main(string[] args)

        {

            //根据section拆分

            /*Document document = new Document();

            document.LoadFromFile("Stories.doc");

            Document newWord;

            for (int i = 0; i < document.Sections.Count; i++)

            {

                newWord = new Document();

                newWord.Sections.Add(document.Sections[i].Clone());

                newWord.SaveToFile(String.Format(@"test\out_{0}.docx", i));

            }*/

            //根据page break拆分

            Document original = new Document();

            original.LoadFromFile("New Zealand.docx");

            Document newWord = new Document();

            Section section = newWord.AddSection();

            int index = ;

            foreach (Section sec in original.Sections)

            {

                foreach (DocumentObject obj in sec.Body.ChildObjects)

                {

                    if (obj is Paragraph)

                    {

                        Paragraph para = obj as Paragraph;

                        section.Body.ChildObjects.Add(para.Clone());

                        foreach (DocumentObject parobj in para.ChildObjects)

                        {

                            if (parobj is Break && (parobj as Break).BreakType == BreakType.PageBreak)

                            {

                                int i = para.ChildObjects.IndexOf(parobj);

                                for (int j = i; j < para.ChildObjects.Count; j++)

                                {

                                    section.Body.LastParagraph.ChildObjects.RemoveAt(i);

                                }

                                newWord.SaveToFile(String.Format("result/out-{0}.docx", index), FileFormat.Docx);

                                index++;

                                newWord = new Document();

                                section = newWord.AddSection();

                                section.Body.ChildObjects.Add(para.Clone());

                                while (i >= )

                                {

                                    section.Paragraphs[].ChildObjects.RemoveAt(i);

                                    i--;

                                }

                                if (section.Paragraphs[].ChildObjects.Count == )

                                {

                                    section.Body.ChildObjects.RemoveAt();

                                }

                            }

                        }

                    }

                    if (obj is Table)

                    {

                        section.Body.ChildObjects.Add(obj.Clone());

                    }

                }

            }

            newWord.SaveToFile(String.Format("result/out-{0}.docx", index), FileFormat.Docx);

        }

    }

}

注意：这里我使用了一个免费的word API(http://freeword.codeplex.com)。

C# 合并及拆分Word文档的更多相关文章

java 在线拆分 word文档采用什么技术比较好？
在Java项目开发中,偶尔会遇到通过程序动态拆分word文档的需求,由于Java本身不能操作Word文档,在网上也都是讨论如何动态合并word,所以这个需求实现起来相当困难,下面就将近期对于Word文 ...
Java 合并、拆分PDF文档
处理PDF文档时,我们可以通过合并的方式,来任意组几个不同的PDF文件或者通过拆分将一个文件分解成多个子文件,这样的好处是对文档的存储.管理很方便.下面将通过Java程序代码介绍具体的PDF合并.拆分 ...
[.NET开发] C# 合并、拆分PDF文档
在整理文件时,将多个同类型文档合并是实现文档归类的有效方法,也便于文档管理或者文档传输.当然,也可以对一些比较大的文件进行拆分来获取自己想要的部分文档.可以任意地对文档进行合并.拆分无疑为我们了提供极 ...
C# 实现将多个word文档合并成一个word文档的功能
前段时间项目上遇到这么一个需求,需要将多个OCR识别的word文档合并成一个,于是就在网上找了找,自己修改了一下.在这里跟大家分享一下,希望有用的到的. 要做多word文档合并,首先要导入Micros ...
JAVA合并多个word文档根据文章标题生成目录
此产品版本是免费版的,我也是在用免费,除了只能单次识别25张一下的word和生成pdf有限制,其他的功能都和正式版差不多. 如果你几十个文档,每个文档几页,输出出来超过25页,那没关系,依然可以使用. ...
合并两个word文档，保持样式不变
一.需求说明例如将封面插入到word正文上方二.导入依赖 <dependency> <groupId>org.apache.poi</groupId> < ...
POI生成word文档完整案例及讲解
一,网上的API讲解其实POI的生成Word文档的规则就是先把获取到的数据转成xml格式的数据,然后通过xpath解析表单式的应用取值,判断等等,然后在把取到的值放到word文档中,最后在输出来. ...
C#使用NPOI对Word文档进行导出操作的dll最新版2.5.1
Npoi导出非模板最近使用NPOI做了个导出Word文档的功能,因为之前都是导出Excel很方便(不用模板),所以导出Word也选用了Npoi(也没有用模板,
Word文档合并的一种实现
今天遇到一个问题,就是需要把多个Word文档的内容追加到一个目标Word文档的后面,如果我有目标文档a.doc以及其他很多个文档b.doc,c.doc…等等数量很多.这个问题,如果是在服务端的话,直接 ...

随机推荐

sublime常用快捷键
自己觉得比较实用的sublime快捷键: Ctrl + / ---------------------注释 Ctrl + 滚动 --------------字体变大/缩小 Ctrl + N----- ...
我为什么要写LeetCode的博客？
# 增强学习成果有一个研究成果,在学习中传授他人知识和讨论是最高效的做法,而看书则是最低效的做法(具体研究成果没找到地址).我写LeetCode博客主要目的是增强学习成果.当然,我也想出名,然而不知 ...
[APUE]UNIX进程的环境(上)
一. 前言本章将学习:当执行程序时,其main函数是如何被调用的,命令行参数是如何传送给执行程序的,典型的存储器布局是什么样式,如何分配另外的存储空间,进程如何使用环境变量,进程终止的不同方式等.另 ...
CentOS 7配置LNMP开发环境及配置文件管理
安装并配置MySQL 5.6 从CentOS从7.x开始默认使用MariaDB.MariaDB完全兼容MySQL,包括API和命令行.但是很多时候我们还是会想要安装MySQL,所以不能直接通过yum命 ...
Android和JavaScript相互调用的方法
转载地址:http://www.jb51.net/article/77206.htm 这篇文章主要介绍了Android和JavaScript相互调用的方法,实例分析了Android的WebView执行 ...
css居中div的几种常用方法
在开发过程中,很多需求需要我们居中一个div,比如html文档流当中的一块div,比如弹出层内容部分这种脱离了文档流等.不同的情况有不同的居中方式,接下来就分享下一下几种常用的居中方式. 1.text ...
玩转spring boot——结合redis
一.准备工作下载redis的windows版zip包:https://github.com/MSOpenTech/redis/releases 运行redis-server.exe程序出现黑色窗口 ...
Javascript 代理模式模拟一个文件同步功能
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
iOS微信第三方登录实现
iOS微信第三方登录实现一.接入微信第三方登录准备工作.移动应用微信登录是基于OAuth2.0协议标准构建的微信OAuth2.0授权登录系统.在进行微信OAuth2.0授权登录接入之前,在微信开 ...
关于HTML语义化的一些理解
语义化这个词我想大家都看到了无数次,特别是在一些招聘广告上. 其实我自己也是,不过每次看到都觉得是那些招聘公司复制的,其实他们根本说不清语义化是什么,而且也根本不看重. 所以我一直也没把这东西当回事过 ...

C# 合并及拆分Word文档

C# 合并及拆分Word文档的更多相关文章

随机推荐

热门专题