dotnet OpenXML 解析 PPT 图表 解析日期时间表示内容
在 OpenXML 里的图表存放的日期时间很多存放的是数值,需要进行转换才能获取到用户可见的字符串
日期在 OpenXML 里可以使用数值存放,需要根据数值和格式化字符串转换为用户可见的字符串
如以下的 PPT 文件

存储的代码如下
<c:cat>
<c:numRef>
<c:f>Sheet1!$A$2:$A$6</c:f>
<c:numCache>
<c:formatCode>m/d/yyyy</c:formatCode>
<c:ptCount val="5" />
<c:pt idx="0">
<c:v>37261</c:v>
</c:pt>
<c:pt idx="1">
<c:v>37262</c:v>
</c:pt>
<c:pt idx="2">
<c:v>37263</c:v>
</c:pt>
<c:pt idx="3">
<c:v>37264</c:v>
</c:pt>
<c:pt idx="4">
<c:v>37265</c:v>
</c:pt>
</c:numCache>
</c:numRef>
</c:cat>
本文将告诉大家如何从上面的数据转换为日期字符串
本文基于 dotnet OpenXML 解析 PPT 图表 面积图入门 的内容,替换了 PPT 文档。可以从本文最后获取到测试的文件和所有代码
在以上的测试的文档,类别的内容是日期,存储代码如上。在开始解析之前,需要了解 PPT 的图表的日期存放格式。这个存放格式有两套,分别是使用 1904 作为基础和使用 1900 作为基础的时间,和 Excel 存储日期相同,请看 Date systems in Excel
为了了解当前的图表采用的基础时间,先读取 ChartSpace 的 Date1904 属性,如以下代码
var useDate1904 = chartSpace.Date1904?.Val?.Value ?? false;
根据 ECMA 376 的第 21.2.2.38 章的描述,在 Date1904 属性设置为 true 时,将采用 1904 作为基础的日期。计算方法是使用 1904 或 1900 的前一天,分别是 1903.12.31 和 1899.12.31 作为计算。存放的数值表示的是加上当前的天数,计算到日期字符串,需要减去当天
在获取到 NumericValue 的值,如以下代码的 numericValueText 可以进行计算
if (numericValueText != null && double.TryParse(numericValueText, out var value))
{
var days = value;
days--; // 不包括当天
// 这里只格式化日期的
// This element specifies that the chart uses the 1904 date system. If the 1904 date system is used, then all dates
// and times shall be specified as a decimal number of days since Dec. 31, 1903. If the 1904 date system is not
// used, then all dates and times shall be specified as a decimal number of days since Dec. 31, 1899.
var useDate1904 = chartSpace.Date1904?.Val?.Value ?? false;
if (useDate1904)
{
list.Add(new DateTime(1903, 12, 31).AddDays(days).ToString(format));
}
else
{
list.Add(new DateTime(1899, 12, 31).AddDays(days).ToString(format));
}
}
以上的 format 是格式化字符串,格式化字符串可以用来告诉软件如何格式化日期等内容
在 NumberingCache 存在格式化字符串的定义,如不写将不进行格式化。在 NumberingCache 的每个 NumericPoint 也可以存放格式化字符串,给每个数值定义格式化字符串。如果 NumericPoint 没有定义,将继承使用 NumberingCache 的格式化字符串,如以下代码,获取类别的数值定义的格式化字符串
// 读取缓存
var categoryAxisDataNumberingCache = categoryAxisDataNumberReference
.GetFirstChild<DocumentFormat.OpenXml.Drawing.Charts.NumberingCache>()!;
// 字符串格式化方式,例如日期方式格式化,可以是空,空表示不需要格式化
var formatCodeText = categoryAxisDataNumberingCache.FormatCode?.Text;
foreach (var numericPoint in categoryAxisDataNumberingCache
.Elements<DocumentFormat.OpenXml.Drawing.Charts.NumericPoint>())
{
var numericPointFormatCode = numericPoint.FormatCode;
var numericPointFormatCodeText = numericPointFormatCode?.Value ?? formatCodeText;
}
以上代码的 numericPointFormatCodeText 就是格式化字符串的内容
在 PPT 里,对于日期,如果格式化字符串是默认的字符串,将采用所运行的设备的语言文化进行格式化。例如在使用中文的设备上运行 PPT 软件,将使用 yyyy/M/d 作为默认的格式化
如在使用中文的设备,需要使用以下代码进行处理
var format = numericPointFormatCodeText;
if (format == null || format == "m/d/yyyy")
{
// 如果是空和默认的,转换为中文的。后续可以根据设备的语言,转换为对应的日期
format = "yyyy/M/d";
}
将以上的代码组合,即可解析图表类别的日期内容
// 类别轴上的数据 横坐标轴上的数据
var categoryAxisData =
areaChartSeries.GetFirstChild<DocumentFormat.OpenXml.Drawing.Charts.CategoryAxisData>()!;
// 类别轴上的数据 横坐标轴上的数据 可能是数据,也就是 NumberReference 类型。也可能是字符串,也就是 StringReference 类型。这份课件里面,存放的是 NumberReference 类型,以下代码只演示采用 NumberReference 类型的读取方式,还请在具体项目,自行判断
// 以下是 NumberReference 类型读取的例子
var categoryAxisDataNumberReference = categoryAxisData
.GetFirstChild<DocumentFormat.OpenXml.Drawing.Charts.NumberReference>();
if (categoryAxisDataNumberReference != null)
{
// 这个公式表示是从 Excel 哪个数据获取的,获取的方式比较复杂。这里还是先从缓存获取
var categoryAxisDataFormula = categoryAxisDataNumberReference
.GetFirstChild<DocumentFormat.OpenXml.Drawing.Charts.Formula>();
// 读取缓存
var categoryAxisDataNumberingCache = categoryAxisDataNumberReference
.GetFirstChild<DocumentFormat.OpenXml.Drawing.Charts.NumberingCache>()!;
// 字符串格式化方式,例如日期方式格式化,可以是空,空表示不需要格式化
var formatCodeText = categoryAxisDataNumberingCache.FormatCode?.Text;
var list = new List<string>();
foreach (var numericPoint in categoryAxisDataNumberingCache
.Elements<DocumentFormat.OpenXml.Drawing.Charts.NumericPoint>())
{
var numericPointFormatCode = numericPoint.FormatCode;
var numericPointFormatCodeText = numericPointFormatCode?.Value ?? formatCodeText;
var numericValueText = numericPoint.NumericValue?.Text;
var format = numericPointFormatCodeText;
if (format == null || format == "m/d/yyyy")
{
// 如果是空和默认的,转换为中文的。后续可以根据设备的语言,转换为对应的日期
format = "yyyy/M/d";
}
if (numericValueText != null && double.TryParse(numericValueText, out var value))
{
var days = value;
days--; // 不包括当天
// 这里只格式化日期的
// This element specifies that the chart uses the 1904 date system. If the 1904 date system is used, then all dates
// and times shall be specified as a decimal number of days since Dec. 31, 1903. If the 1904 date system is not
// used, then all dates and times shall be specified as a decimal number of days since Dec. 31, 1899.
// [Date systems in Excel](https://support.microsoft.com/en-us/office/date-systems-in-excel-e7fe7167-48a9-4b96-bb53-5612a800b487 )
var useDate1904 = chartSpace.Date1904?.Val?.Value ?? false;
if (useDate1904)
{
list.Add(new DateTime(1903, 12, 31).AddDays(days).ToString(format));
}
else
{
list.Add(new DateTime(1899, 12, 31).AddDays(days).ToString(format));
}
}
else
{
list.Add(numericValueText ?? string.Empty);
}
}
}
以上代码的 list 集合就存放了类别的内容
运行的效果如下

本文以上的测试文件和代码放在github 和 gitee 欢迎访问
可以通过如下方式获取本文的源代码,先创建一个空文件夹,接着使用命令行 cd 命令进入此空文件夹,在命令行里面输入以下代码,即可获取到本文的代码
git init
git remote add origin https://gitee.com/lindexi/lindexi_gd.git
git pull origin 9edb86c15c3f7c9aff9896ffc2de903464b2feb7
以上使用的是 gitee 的源,如果 gitee 不能访问,请替换为 github 的源
git remote remove origin
git remote add origin https://github.com/lindexi/lindexi_gd.git
获取代码之后,进入 MainWindow.xaml.cs 文件,在这个文件里就是本文的例子代码
更多请看 Office 使用 OpenXML SDK 解析文档博客目录
dotnet OpenXML 解析 PPT 图表 解析日期时间表示内容的更多相关文章
- dotnet OpenXML 读取 PPT 内嵌 ole 格式 Excel 表格的信息
在 Office 中,可以在 PPT 里面插入表格,插入表格有好多不同的方法,对应 OpenXML 文档存储的更多不同的方式.本文来介绍如何读取 PPT 内嵌 ole 格式的 xls+ 表格的方法 在 ...
- vscode 用户代码片段 vue初始化模板 Snippet #新加入开头注释 自动生成文件名 开发日期时间等内容
vue文件模板 模板变量 https://code.visualstudio.com/docs/editor/userdefinedsnippets#_variables vue.json { // ...
- C#中用DateTime的ParseExact方法解析日期时间(excel中使用系统默认的日期格式)
最近做的项目中服务器是英文的系统,系统需要通过excel的单元格导入日期,excel中的日期格式是系统默认的日期格式,如下图所示 以上日期格式,会跟着操作系统设置的日期格式相同例如我的中文系统的日期格 ...
- 全面解析Java日期时间API
时区 GMT(Greenwich Mean Time):格林尼治时间,格林尼治标准时间的正午是指当太阳横穿格林尼治子午线时(也就是在格林尼治上空最高点时)的时间. UTC(Universal Time ...
- Java日期时间API系列21-----Jdk8中java.time包中的新的日期时间API类,xk-time时间转换,计算,格式化,解析的工具
通过工作之余,对Java8中java.time包源码的不断学习,使用和总结,开发了xk-time,初步完成,欢迎试用和提出建议! xk-time xk-time is a datetime conve ...
- 解析php时间戳与日期的转换
php中时间戳与日期的转换. 实现功能:获取某个日期的时间戳,或获取某个时间的PHP时间戳. strtotime能将任何英文文本的日期时间描述解析为Unix时间戳,我们结合mktime()或date( ...
- 解析MySQL中存储时间日期类型的选择问题
解析MySQL中存储时间日期类型的选择问题_Mysql_脚本之家 https://www.jb51.net/article/125715.htm 一般应用中,我们用timestamp,datetime ...
- WPF解析PPT为图片
偶遇需要解析 PPT为单张图片 其中,对于包含动画的PPT页,分别对动画最后效果进行截取,即每个连续动画截取 (动画N个)N+1(原图)张 http://git.oschina.net/jiailiu ...
- DELPHI解析JSON格式化的日期
DELPHI解析JSON格式化的日期 json返回的日期是 /Date(1560355200000)/ 这样的格式. 这个1560355200000,是指1970年以后的秒数. DELPHI如何解析这 ...
- dotnet OpenXML 转换 PathFillModeValues 为颜色特效
在 OpenXml 预设形状,有一些形状设置了 PathFillModeValues 枚举,此枚举提供了亮暗的蒙层特效.具体的特效是让形状选择一个画刷,在画刷上加上特效.如立体几何 Cube 形状,在 ...
随机推荐
- 介绍几款WPF应用的UI库
在WPF中对于前端页面的书写,我们有现成的UI类库,不需要我们自己再去写 我这里介绍几款 1.MahApps 官网 https://mahapps.com/ 使用,在App.xaml中添加 <A ...
- C++关于栈对象返回的问题
本次实验环境 环境1:Win10, QT 5.12 环境2:Centos7,g++ 4.8.5 一. 主要结论 可以返回栈上的对象(各平台会有不同的优化),不可以返回栈对象的引用. 二.先看看函数传参 ...
- PS-AXI-GPIO-流水灯设计
PS-AXI-GPIO-流水灯设计 1.实验目的 在了解了AXI协议的基本内容后,通过已经设计好的AXI的IP核来了解实际设计中AXI的工作原理和设计原理是必要的.这个实验以前实际上按照教程做过,但是 ...
- 数字集成电路设计之CMOS
数字集成电路设计理论 1.基本的理论结构 现在主流的集成电路器件还是CMOS,所以理论的结构还是基于CMOS.CMOS有N和P两种MOS组合组合在一起.CMOS最简单的器件就是反相器.然后是标准的逻辑 ...
- KingabseES 隐式游标属性值(SQL%attribute)
隐式游标介绍 Oracle数据库迁移到KingbaseES数据库,不需要将源PL/SQL脚本,大规模修改为KES语法,因为KingbaseES支持大部分PLSQL语法. 1.隐式游标 隐式游标是由 P ...
- 【已解决】ajax和flask路由传json格式数据出现undefined和object错误
描述一下问题背景: 前台封装一个json字符串给后台传输数据,后台的ajax获取请求之后把接收的数据显示到前台html表格上. jsonify:这个方法可以把字典转化为json字符串 通过jsonif ...
- SqlServer的实用且高级玩法.md
1.常见表表达式(CTEs) 如果您想要查询子查询,那就是CTEs施展身手的时候 - CTEs基本上创建了一个临时表. 使用常用表表达式(CTEs)是模块化和分解代码的好方法,与您将文章分解为几个段落 ...
- Linux是什么与如何学习
重点回顾 操作系统(Operation System) 主要在管理与驱动硬件,因此必须要能够管理内存.管理装置. 负责行程管理以及系统呼叫等等.因此,只要能够让硬件准备妥当(Ready)的情况, 就是 ...
- 学习 Tensorflow 的困境与解药
我构建的预测模型 在过去的一段时间里我抓去了小宇宙内上万条播客节目的首日播放量的数据,并利用这些数据构建了一个用于预测播客节目播放量的模型.包含以下六个输入参数: 节目发布于一周中的哪一天 节目发布于 ...
- 解密数仓的SQL ON ANYWHERE技术
本文分享自华为云社区<GaussDB DWS的SQL ON ANYWHERE技术解密>,作者:tooooooooooomy. 1. 前言 适用版本:[8.1.1(及以上)] 查询分析是大数 ...