企业有很多的科室,科室的每个人或多或少都会写一些文档,有些文档领导需要浏览,解决的办法是将编辑的文档打印出来,供领导浏览,或是为了节约企业成本,文档就在人与人这间或部门之间copy过来,copy过去。如果员工或领导不善于管理文档,就会造成有很多的版本,或者是在以后无法轻松的找到相关的文档。

所以企业专门找到一个人(文档管理员),让这个人负责文档的管理。而文档的管理的方式有两种形式,第一种是doc形式的(即word文档),第二种是分享形式的

对于第一种文档管理方式,只涉及到这个文档管理员,收集各部门的文档,将部门规划成一种如下图的形式:

然后在部门中再规划人员,如下图:

通过第一种形式,那么文档的管理也就解决了。只保存最新文档,对文档进行汇总等,如果领导需要什么文档的话,只需要让文档管理员打印并呈送就可以了。

但是领导或职员需要什么文档?领导也不是一台机器,没有过目不忘的本领,并不知道公司有什么文档?如果文档中有错字有谁来发现?所以为了解决这几个问题,需要实现文档的分享,也就是第二种文档管理方式。

解决思路是在局域网中建立一个网站,企业中的任何一个人都可以浏览公司的文档。通过这个网站,企业中的任何一个人也都知道本企业有什么文档,寻找资料也会方便些。

网站也很简单,只需要实现目录结构上的复制,部门对应部门,人员对应人员。再把doc转换成html,文档名称对应页面名称。然后再自动生成网站首页,这个网站也就做完了。

技术实现:
在这里只是大体介绍一下,如果需要了解技术详细的话,可以下载下面的源代码。

1.给定需要转换的目录(包含word文档的目录)和输出目录
2.读取目录中的所有word文档
3.将所有的word文章转换成Html文件,并将html文件保存到输出目录下对应的目录(即部门对应部门,人员对应人员),代码如下

public void ToHtml(string filePath)
{
this.FilePath = filePath;
Word.Application word = new Word.Application();
Type wordType = word.GetType();
Word.Documents docs = word.Documents;
Type docsType = docs.GetType();
Word.Document doc = (Word.Document)docsType.InvokeMember("Open",
System.Reflection.BindingFlags.InvokeMethod, null, docs,
new Object[] { (object)FilePath, true, true }); //打开word文档
Type docType = doc.GetType();
CreateDirectory(TargetDirectoryPath); //源目录对应目标目录
string strSaveFileName = TargetFilePath; //转换成目标文件路径
object saveFileName = (object)strSaveFileName;
//另存为html,关闭文档并退出
docType.InvokeMember("SaveAs", System.Reflection.BindingFlags.InvokeMethod,
null, doc, new object[] { saveFileName, Word.WdSaveFormat.wdFormatFilteredHTML });
docType.InvokeMember("Close", System.Reflection.BindingFlags.InvokeMethod, null, doc, null);
wordType.InvokeMember("Quit", System.Reflection.BindingFlags.InvokeMethod, null, word, null);
}

word转为html后,测试页面样式:

4.生成首页,并将首页保存到输出目录下。为使首页结构清晰,使用了jquery插件treeview。

public string ToHtmlStructure(DirectoryInfo directory)
{ FileInfo[] files = null;
DirectoryInfo[] subDirs = null;
files = directory.GetFiles("*.*");
_sb.AppendLine(AddUl());
foreach (FileInfo fi in files)
{ string relativelinks = Uri.EscapeUriString(fi.FullName.Replace(string.Format(@"{0}\", DirectoryPath), "").Replace('\', '/'));
_sb.AppendLine(string.Format("<li><a href='{0}' target='_blank'>{1}</a></li>",relativelinks, fi.Name));
}
subDirs = directory.GetDirectories();
foreach (DirectoryInfo dirInfo in subDirs)
{
_sb.AppendLine("<li>");
_sb.AppendLine(dirInfo.Name);
ToHtmlStructure(dirInfo);
_sb.AppendLine("</li>");
}
_sb.AppendLine("</ul>");
return _sb.ToString();
}

生成的首页显示大体如下(非企业的文档,而是自己的文档):

开发环境:win7+vs2010+office2007

测试环境:win7+office2007

总结:
在开发这个工具时,最主要的还是word转html。而我使用的方式是com方法调用word的open,saveas,close和quit。这种方式会在word的最近浏览记录中留下信息,如下:

并且html的生成完全由word控制,生成的html的样式也完全由word控制。有的文章转换为html后,显得html内容不美观。我测试了一下,安装不同的office版本,office2003(无法转换高版本的文档),office2007,office2010,版本越高,转换后的html样式越好。

我也在网上寻找了word转html的控制方式(包括国内的、国外的),发现如果想完全控制转换,似乎是不可能的。当然也有doc转换工具,如google doc。不知道我这个观点对不对?

源代码下载:源码Convertor.rar

自动化工具word文档批量转html的更多相关文章

  1. word文档批量合并工具

    #NoEnv ; Recommended for performance and compatibility with future AutoHotkey releases. ; #Warn ; En ...

  2. Python将word文档批量转PDF

    前面有一篇<Python批量创建word文档(2)- 加图片和表格>的文章,利用这篇文章创建的word文档来批量转PDF文档.代码: 1 ''' 2 #python批量将word文档转换成 ...

  3. python 使用win32com实现对word文档批量替换页眉页脚

    最近由于工作需要,需要将70个word文件的页眉页脚全部进行修改,在想到这个无聊/重复/没有任何技术含量的工作时,我的内心是相当奔溃的.就在我接近奔溃的时候我突然想到完全可以用python脚本来实现这 ...

  4. python自动化之word文档

    #########################docx文件############################ ''' .docx文件有很多结构,有3种不同的类型来表示 在最高一层,Docum ...

  5. 如何用python自动编写《赤壁赋》word文档

    目录 前言 安装-python-docx 一.自动编写<赤壁赋> 准备数据 新建文档 添加标题 添加作者 添加朝代 添加图片 添加段落 保存word文档 二.自动提取<赤壁赋> ...

  6. 使用Python3将word文档和pdf电子书进行格式互转(兼容Windows/Linux)

    原文转载自「刘悦的技术博客」https://v3u.cn/a_id_96 一些重要文档格式之间的互转在目前显得尤为重要,pdf作为通用格式在现在各个平台上兼容性是最好的,所以写python脚本将这些w ...

  7. 一键批量打印EXCEL、WORD文档

    一键批量打印EXCEL.WORD文档,本方法也可以打印同一个文档N份,可以批量打印A3.A4文档,包括单.双面打印等.希望能帮到广大朋友.请大家注重原创版权,不得在未经许可的下转载.传播,或者用来对同 ...

  8. 批量导出access某表内容到word文档

    一.需求: 需要将表中每一条记录中的某些内容导出在一个word文档中,并将这些文档保存在指定文件夹目录下 二.界面,简单设计如下: 三.添加office相关引用 添加后可在解决方案资源管理器中看到: ...

  9. word文档标题级别批量更改——批量降级与升级实例

    word文档标题级别批量更改——批量降级与升级实例   word文档标题级别批量更改——批量降级实例 2012年12月21日16:30:44 现有一个3级文档结构的word文档,如下图所示 先需要将上 ...

随机推荐

  1. 【狼】unity 鼠标拖拽物体实现任意角度自旋转

    主要涉及函数 Input.GetAxis(“Mouse x”) 可取得鼠标横向(x轴)移动增量 Input.GetAxis(“Mouse y”) 可取得鼠标竖向(y轴)移动增量 通过勾股定理获取拖拽长 ...

  2. 二:java语法基础:

    1,关键字:其实就是某种语言赋予了特殊含义的单词. 保留字:其实就是还没有赋予特殊含义,但是准备日后要使用过的单词. 2,标示符:其实就是在程序中自定义的名词.比如类名,变量名,函数名.包含 0-9. ...

  3. 【动态规划】天堂(Heaven) 解题报告

    天堂(heaven) 题目描述 每一个要上天堂的人都要经历一番考验,当然包括小X,小X开始了他进入天堂的奇异之旅.地狱有18层,天堂竟然和地狱一样,也有很多很多层,天堂共有N层.从下到上依次是第1,2 ...

  4. 用js判断一个复选框是否被选中

    <html> <head>        <title>            复选框全选.全不选.反选.必选一个        </title>    ...

  5. 6 Java学习之 枚举

    1. 概念    枚举是一种规范,它规范了参数的形式,这样就可以不用考虑类型的不匹配,并且显示的替代了int型参数可能带来的模糊概念.   常用来定义一个final类型的变量(常量),保证输入安全.如 ...

  6. JQuery ajax调用asp.net的webMethod

    本文章转载:http://www.cnblogs.com/zengxiangzhan/archive/2011/01/16/1936938.html 在vs2010中,用JQuery ajax调用as ...

  7. 每天一个JavaScript实例-从一个div元素删除一个段落

    <!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content ...

  8. 基于XMPP实现的Openfire的配置安装+Android客户端的实现[转]

    最近在整理一些这方面的资料,闲话少说,咱还是直奔主题吧 :) http://blog.csdn.net/sk719887916/article/details/40541163 https://git ...

  9. 虚拟化技术性能总结:Zones, KVM, Xen

    [译]虚拟化技术性能总结:Zones, KVM, Xen 时间 2014-04-29 16:52:44  Babyfacer_陈晓炜 原文  http://blog.csdn.net/babyface ...

  10. qt 状态栏

    有段时间没有写过博客了.假期去上海旅游,所以一直没有能够上网.现在又来到这里,开始新的篇章吧!   今天的内容主要还是继续完善前面的那个程序.我们要为我们的程序加上一个状态栏.   状态栏位于主窗口的 ...