dotnet OpenXML 文本删除线解析方法
本文来告诉大家如何解析读取在 OpenXML 里面存放的文本删除线,本文使用 PowerPoint 作为例子来告诉大家如何读取然后在 WPF 应用里面显示
在开始之前,期望大家已了解如何在 dotnet 应用里面读取 PPT 文件,如果还不了解读取方法,请参阅 C# dotnet 使用 OpenXml 解析 PPT 文件
期望在阅读本文之前,先阅读 dotnet OpenXML 简单聊聊 PPT 文本解析
以下是本文效果

在 OpenXML 文档,将文本的删除线放在了文本的 Run 属性里面,大概内容如下
<a:r>
<a:rPr lang="en-US" altLang="zh-CN" strike="sngStrike" dirty="0" smtClean="0" />
<a:t>123123</a:t>
</a:r>
以上代码的 strike 表示的就是删除线的内容。和 WPF 的设计不同的是,在 WPF 里面,无论是下划线还是删除线等,都是属于文本装饰。但是在 PPT 里面,下划线是下划线,而删除线是删除线。同时下划线和删除线的样式也是特别多的
如删除线的 TextStrikeValues 的枚举,在 ECMA 376 的第 20.1.10.78 章可以了解到有单线条的删除线和双线条的删除线,在 OpenXML 里面的枚举如下
/// <summary>
/// Text Strike Type
/// </summary>
public enum TextStrikeValues
{
/// <summary>
/// Text Strike Enum ( No Strike ).
/// <para>When the item is serialized out as xml, its value is "noStrike".</para>
/// </summary>
[EnumString("noStrike")]
NoStrike,
/// <summary>
/// Text Strike Enum ( Single Strike ).
/// <para>When the item is serialized out as xml, its value is "sngStrike".</para>
/// </summary>
[EnumString("sngStrike")]
SingleStrike,
/// <summary>
/// Text Strike Enum ( Double Strike ).
/// <para>When the item is serialized out as xml, its value is "dblStrike".</para>
/// </summary>
[EnumString("dblStrike")]
DoubleStrike,
}
下面开始在一个空 WPF 项目里面尝试去读取一个包含删除线文本的 PPT 文件,然后将文本在界面渲染
在开始之前,先读取 PPT 文件,代码如下
var file = new FileInfo("Test.pptx");
using var presentationDocument =
DocumentFormat.OpenXml.Packaging.PresentationDocument.Open(file.FullName, false);
拿到第一个页面
var slide = presentationDocument.PresentationPart.SlideParts.First().Slide;
接着获取文本元素的坐标
var shape = slide.CommonSlideData.ShapeTree.GetFirstChild<Shape>();
// 获取坐标
var offset = shape.ShapeProperties.Transform2D.Offset;
var x = new Emu(offset.X);
var y = new Emu(offset.Y);
以上的 EMU 是通过 dotnetCampus.OpenXMLUnitConverter 开源仓库提供的,详细请看 Office Open XML 的测量单位
获取文本元素的文本内容,文本内容需要先读取段落,接着再获取文本属性和文本
// 读取文本内容
var textBody = shape.TextBody;
// 读取段落
var paragraph = textBody.GetFirstChild<Paragraph>();
// 读取段落的文本
var run = paragraph.GetFirstChild<Run>();
// 读取删除线
var strike = run.RunProperties.Strike;
转换为 WPF 的元素,代码如下
// 创建元素
var textBlock = new TextBlock()
{
TextDecorations = strike.Value == TextStrikeValues.NoStrike? new TextDecorationCollection():TextDecorations.Strikethrough,
Text = run.Text.Text,
Margin = new Thickness()
{
Left = x.ToPixel().Value,
Top = y.ToPixel().Value,
}
};
Canvas.Children.Add(textBlock);
以上代码的 Canvas 是放在 XAML 的控件,本文所有代码放在github 和 gitee 欢迎访问
可以通过如下方式获取本文的源代码,先创建一个空文件夹,接着使用命令行 cd 命令进入此空文件夹,在命令行里面输入以下代码,即可获取到本文的代码
git init
git remote add origin https://gitee.com/lindexi/lindexi_gd.git
git pull origin c7d8eb1b879f3e5ba418f8efba290081cd6263ae
以上使用的是 gitee 的源,如果 gitee 不能访问,请替换为 github 的源
git remote remove origin
git remote add origin https://github.com/lindexi/lindexi_gd.git
获取代码之后,进入 Pptx 文件夹
如果要支持双删除线,可以使用如下代码
var textBlock = new TextBlock()
{
TextDecorations = strike.Value switch
{
TextStrikeValues.NoStrike => new TextDecorationCollection(),
TextStrikeValues.SingleStrike => TextDecorations.Strikethrough,
TextStrikeValues.DoubleStrike => new TextDecorationCollection()
{
new TextDecoration(TextDecorationLocation.Strikethrough,new Pen(Brushes.Black,1), -1, TextDecorationUnit.Pixel, TextDecorationUnit.Pixel),
new TextDecoration(TextDecorationLocation.Strikethrough,new Pen(Brushes.Black,1), 1, TextDecorationUnit.Pixel, TextDecorationUnit.Pixel)
},
_ => throw new ArgumentException()
},
Text = run.Text.Text,
Margin = new Thickness()
{
Left = x.ToPixel().Value,
Top = y.ToPixel().Value,
}
};
效果如下

更多请看 Office 使用 OpenXML SDK 解析文档博客目录
dotnet OpenXML 文本删除线解析方法的更多相关文章
- 画删除线的方法,如何找替代方法,Deprecated注释
用@Deprecated注释的程序元素,不鼓励程序员使用这样的元素,通常是因为它很危险或存在更好的选择.在使用不被赞成的程序元素或在不被赞成的代码中执行重写时,编译器会发出警告. 那么相应的替代方法应 ...
- python 对过时类或方法添加删除线的方法
class Cat(Animal): def __init__(self): import warnings warnings.warn("Cat类带删除线了", Deprecat ...
- CSS上划线、下划线、删除线等方法
text-decoration:underline; 下划线 text-decoration:overline; 顶划线 text-decoration:line-through; 删 ...
- NSMutableAttributedString 富文本删除线的用法
#import <UIKit/UIKit.h> //价格 NSString *priceStr = @"99元 剁手价66元"; NSMutableAttributed ...
- html 中几次方,平方米,立方米,下标,上标,删除线等的表示方法
html 中几次方,平方米,立方米,上标,下标,删除线等的表示方法 上标下标删除线 小号字 M2 54 X24+Y1<3=100 NN <sup>上标</sup> &l ...
- jQuery 表格中实现“删除线”的增进方法
之前做了一个删除线的效果,就是类似这样的,在内容的中间加一条线. 但是又有点不同的是,这种删除线不是单纯的在文字之上,而是给一个Table中的一行加上这种删除线效果. 这里有两个方法,是在不同时期写的 ...
- The usage of Markdown---文字强调:加粗/斜体/文本高亮/删除线/下划线/按键效果
更新时间:2019.09.14 1. 序言 有时候,我们需要对某些文字进行强调,例如粗体和斜体.而Markdown通常可以使用星号*或者下划线_进行文字强调. 2. 加粗 如果想要达到加粗的效果,可以 ...
- ios 富文本 加颜色 删除线
UILabel *valueL = [JAppViewTools getLabel:CGRectMake(JFWidth(15), CGRectGetMaxY(proName.frame)+JFWid ...
- Document树的解析方法
一.本次总结用到的xml文本 1. <?xml version="1.0" encoding="UTF-8" standalone="no ...
- 【转】Android TextView SpannableStringBuilder 图文混排颜色斜体粗体下划线删除线
spannableStringBuilder 用法详解: SpannableString ss = new SpannableString("红色打电话斜体删除线绿色下划线图片:." ...
随机推荐
- Cesium渲染模块之FBO与RBO
1. 引言 Cesium是一款三维地球和地图可视化开源JavaScript库,使用WebGL来进行硬件加速图形,使用时不需要任何插件支持,基于Apache2.0许可的开源程序,可以免费用于商业和非商业 ...
- 记录--你真的能区分JavaScript的各种导入导出方式吗?
这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前言 我们在无论是在查阅别人的代码,还是在实际项目开发的过程中,肯定都会使用导入导出的功能,有时候我们会搞混这几种方式到底有什么区别,今天 ...
- linux系统centos7.9如何安装nginx
1.官网下载nginx nginx官网:https://nginx.org/ 选择稳定版进行下载,也可以下载老版本,下载成功后上传到服务器. 2.使用wget下载 访问nginx官网,在下载页面鼠标右 ...
- 【已解决】解决Python打开文件---路径报错问题(SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape)
原因分析: 在windows系统当中读取文件路径可以使用\,但是在python字符串中\有转义的含义, 如\t可代表TAB,\n代表换行, 所以我们需要采取一些方式使得\不被解读为转义字符.目前有3个 ...
- 白话分解入门操作系统到 Java
一.完成一个任务需要什么? 时间 + 资源 + 处理能力 时间就是时间. 资源就是资源. 处理能力就是能够利用时间和资源完成任务的主体. 二.关于操作系统 处理能力就是cpu. 资源就是存储. 时间就 ...
- MyBatis的映射关系
MyBatis的映射关系是有一个默认的,采用下划线命名的方式将数据库表的列名按照驼峰式映射成 Java 实体类的属性名 举个例子数据库表名为 tb_user,其中的字段名为 inst_code,对应的 ...
- #范德蒙德卷积,第二类斯特林数,NTT#洛谷 2791 幼儿园篮球题
题目 \(T(T\leq 200)\)组数据求 \[\frac{1}{C(n,k)}\sum_{i=0}^kC(m,i)C(n-m,k-i)i^L \] 对于所有数据满足 \(n,m,k\leq 2* ...
- #线段树,二分#洛谷 2824 [HEOI2016/TJOI2016]排序
题目 分析 这排序就很难实现,考虑定一个基准,小于该基准的视为0,否则视为1, 那排序可以看作将0和1分开,这就很好用线段树实现了 如果该位置是0,说明这个基准太高,显然可以用二分答案(基准),那么时 ...
- #状压dp#JZOJ 3853 帮助Bsny
题目 一共有\(n\)本书,混乱值是连续相同高度书本的段数. 可以取出\(k\)本书随意放回,问最小混乱值,高度\([25\sim 32]\) 分析 设\(f[i][j][k][mask]\)表示前\ ...
- #模拟#洛谷 5957 [POI2017]Flappy Bird
题目 分析 小鸟所在坐标的奇偶性一定相同, 考虑每次维护一个可行区间表示小鸟在当前列可以进入的纵坐标区间, 那么它有\(x_i-x_{i-1}\)的纵坐标最大改变差,然后根据奇偶性以及限制区间缩小范围 ...