由于word表格的特殊性,其本身中的数据本来就不够完善,不能够很好的知道其具体的合并、跨行的相关属性,表格的单位可能是PT或者是百分比,并且是共存的,为处理带来了一定的负担,本代码实现了一个将Word表格解析为XMLTable。

 由于没找到上传附件的位置,仅提供部分代码,有需要的可email我(提供联系方式)或进群:490571636,我会提供全部代码。

/// <summary>         /// 分析表格通过位置跨度         /// </summary>         /// <param name="table">word表格对象</param>         /// <returns>自定义的表格对象</returns>         public static WordTable ParserTableByPositionSpan(Word.Table table)         {             List<double> positionList = new List<double>();             WordTable wordTable = new WordTable();

wordTable.RowCount = table.Rows.Count;             wordTable.ColCount = table.Columns.Count;             positionList.Add(0);             double tableWidth = 0;             //获取所有行中的单元格及位置列表 如果有的列没有获取,说明没有或被上边的单元格合并(只有上边被合并的列才会)             for (var row = 1; row <= table.Rows.Count; row++)             {                 WTRow currRow = wordTable.AddRow();                 currRow.RowIndex = row;                 double leftPosition = 0;                 for (var col = 1; col <= table.Columns.Count; col++)                 {                     Word.Cell cell = null;                     try                     {                         //获取指定位置的单元格,如果没有会触发异常                         cell = table.Cell(row, col);                     }                     catch (Exception e)                     {                         //System.Diagnostics.Trace.                     }                                         //指定的位置有单元格则直接添加到当前行                     if (cell != null)                     {                         //第一行的宽度肯定会有值不会了现9999999的情况                         if (row == 1)                         {                             tableWidth += cell.Width;                         }                                                                         WTCol wTCol = currRow.AddCol();                         wTCol.Value = GetRangeParagraphs(cell.Range);

double width = cell.Width;                                                 //cell的宽度有三种形式                         //按内容展示(磅值)Word.WdPreferredWidthType.wdPreferredWidthAuto 属性width有值 PreferredWidth为0                         //固定宽度(磅值) Word.WdPreferredWidthType.wdPreferredWidthPoints 属性width有值 PreferredWidth有时为9999999                         //匹配窗口(百分比)Word.WdPreferredWidthType.wdPreferredWidthPercent 属性width有时为9999999 PreferredWidth为百分比                         switch (cell.PreferredWidthType)                         {                             case Word.WdPreferredWidthType.wdPreferredWidthAuto:                                 width = cell.Width;                                 break;                             case Word.WdPreferredWidthType.wdPreferredWidthPoints:                                 ///9999999为百分比或磅值时  取PreferredWidth的宽度                                 if (width == 9999999)                                 {                                     width = cell.PreferredWidth;                                 }                                 break;                             case Word.WdPreferredWidthType.wdPreferredWidthPercent:                                 ///9999999为百分比或磅值时  width和PreferredWidth所对应的宽度                                 if (width == 9999999)                                 {                                     width = GetPercentWidth(tableWidth, cell.PreferredWidth);                                 }                                 break;                         }                                                 wTCol.Width = width;                         wTCol.RealCol = col;                         wTCol.Left = leftPosition;                         leftPosition += width;                         AddNewPosition(positionList, leftPosition);                         continue;                     }

//WTCol prevRowWTCol1 = wordTable.GetPreviousRowRefCol(row, col);                     //WTCol prevRowWTCol2 = wordTable.GetPreviousRowRefColByLeft(row, leftPosition);                     WTCol prevRowWTCol1 = wordTable.GetPreviousRowRefColByLeft(row, leftPosition);                                         //第一列 如果没有单元格说明被上边的行给合并了                     if (prevRowWTCol1 != null)                     {                         //if (prevRowWTCol1.Left + prevRowWTCol1.Width > leftPosition)                         {                             prevRowWTCol1.RowSpan += 1;                         }                         leftPosition += prevRowWTCol1.Width;                         continue;                     }                                        //if (prevRowWTCol2 != null)                     //{

//}                     //else                 }             }

wordTable.ColCount = positionList.Count - 1;

//矫正列合并处理 由于列合并不会产生空的单元格,以列宽判断列合并情况(默认均为合并1列)             foreach (var row in wordTable.Rows)             {                 //int realColCount = 1;                 foreach (var col in row.Cols)                 {                     int colSpan = GetPositionSpan(positionList, col.Left, col.Left + col.Width);

col.ColSpan = colSpan;                     col.RealCol = GetRealColByPositionList(positionList, col.Left); //realColCount;                     //realColCount += colSpan;                     //realColCount                 }             }

return wordTable;         }

解析word中的表格的更多相关文章

  1. Delphi读取不Word中不规则表格数据并转换成标准表格

    程序需要,需要将word中不规则的表格数据转换为标准的表格,即合并的单元格按正常格式解析,word中的表格格式如下: 解析后数据如下: 借鉴了网上代码,如下处理: procedure TfrmMain ...

  2. word模板导出的几种方式:第一种:占位符替换模板导出(只适用于word中含有表格形式的)

    1.占位符替换模板导出(只适用于word中含有表格形式的): /// <summary> /// 使用替换模板进行到处word文件 /// </summary> public ...

  3. 【转】一张图解析FastAdmin中的表格列表的功能

     一张图解析FastAdmin中的表格列表的功能 功能描述请根据图片上的数字索引查看对应功能说明. 1.时间筛选器如果想在搜索栏使用时间区间进行搜索,则可以在JS中修改修改字段属性,如 {field: ...

  4. 教你如何将word中的表格完美粘贴到ppt中

    经常操作办公软件的人一定有一个困惑,ppt本身表格编辑能力似乎很弱,如果从word里直接将一个编辑好的表格复制粘贴到ppt中,整个表格一定会发生让你没有预料的变化,还得重新花老大的劲去重新编辑,有人屛 ...

  5. C# 在Word中添加表格的方法

    表格是组织整理数据的一种重要手段,应在生活中的方方面面.在Word文档中将繁杂的文字表述内容表格化,能快速.直接地获取关键内容信息.那么,通过C#,我们也可以在Word文档中添加表格,这里将介绍两种不 ...

  6. python简单爬虫 用lxml解析页面中的表格

    目标:爬取湖南大学2018年在各省的录取分数线,存储在txt文件中 部分表格如图: 部分html代码: <table cellspacing="0" cellpadding= ...

  7. Java使用POI读取Word中的表格

    个人博客 地址:https://www.wenhaofan.com/a/20190627135921 代码 package live.autu.word; import java.io.FileInp ...

  8. 外部应用复制 表格 到word中 设置表格自适应

    word 批量设置表格宽度自适应 描述 : 我们经常从 外部 如 excel,html 等其他文件 中复制的表格到word 文档 经常会出现在 word 中显示不全的问题 主要是源格式的表格 宽度比 ...

  9. 关于Word中复杂表格转完美的Markdown格式的技巧

    背景 我们都知道有很多工具能做到Word转Markdown格式,但是在某些复杂的需求下,比如带合并单元格的表格,就会出现错乱,效果非常不理想. 那我们今天来学习和探讨下怎么实现完美转换. 转换 如果想 ...

随机推荐

  1. NODE.JS安装配置

  2. hdu 1242 Rescue_bfs+优先队列

    翻出以前的代码看看 题意:走迷宫,遇到敌人要花一分钟. #include<iostream> #include<queue> using namespace std; char ...

  3. 为下拉式菜单(DropDownList)添加第一个选项

    很多方法可以为为下拉式菜单(DropDownList)添加第一个选项,下面是Insus.NET小结了几个方法,仅供参考: Html code: <body>    <form id= ...

  4. Sereja and Coat Rack(水)

    Sereja and Coat Rack Time Limit:1000MS     Memory Limit:262144KB     64bit IO Format:%I64d & %I6 ...

  5. (原)工具篇-利用fis压缩项目

    fis3 1.添加 fis-conf.js 到项目根目录中 fis-conf.js 内容如下 : //配置MD5版本控制 fis.match('*.{js,css,png,jpg}', { useHa ...

  6. Ajax实现动态的二级级联菜单

    今天花了点时间用Ajax实现了一个二级级联菜单.整理总结一下.为了把重点放在Ajax和级联菜单的实现上,本文省略了数据库建表语句和操作数据库的代码! 数据库建表语句就不帖出来了.主要有两张表,区域表: ...

  7. BigDecimal类对象的使用详解

    双精度浮点型变量double可以处理16位有效数.在实际应用中,需要对更大或者更小的数进行运算和处理.Java在java.math包中提供的API类BigDecimal,用来对超过16位有效位的数进行 ...

  8. javascript 数据结构和算法读书笔记 > 第四章 栈

    1. 对栈的操作 栈是一种特殊的列表,栈中的元素只能通过列表的一端进行访问,即栈顶.类似于累起一摞的盘子,只能最后被放在上面的,最先能被访问到. 就是我们所说的后入先出(LIFO). 对栈主要有入栈p ...

  9. thinkphp批量删除的实现

    今天自己在写后台的时候需要把以前上传的测试文章全部删除掉,但是利用 [操作]里面的一个个删除比较慢,因此想出一个批量删除的解决方案. 首先在前端页面里面建立一个表单,这个表单是把你选中的单选按钮提交到 ...

  10. 稀疏图(邻接链表),并查集,最短路径(Dijkstra,spfa),最小生成树(kruskal,prim)

    全部函数通过杭电 1142,1162,1198,1213等题目测试. #include<iostream> #include<vector> #include<queue ...