Excel催化剂开源第38波-json字符串转多个表格结构
作为开发者来说,面对json字符一点不陌生,但对于普通用户来说,更合适的是数据表结构的数据,最好数据已经躺在Excel表格内,不用到处导入导出操作。所以开发者和用户之间是有不同的数据使用思维和需求的。
此篇给大家带来一些新的思路,怎样可以让用户自主地参与到获取数据过程中来,减少开发工作量的同时却收获了用户满意度。
IT领域收智商税的时代终将会过去
作为一个非IT科班出身的笔者,对IT领域的了解也不深,姑且谈下自己的一些小见解。
普通人对IT的出品各种系统和各种软件,可畏爱恨交加。好的系统或软件,带来许多重复性工作的效率提升,不好的系统或软件,一天到晚被虐着做一些无聊的数据录入和忍受各种的不完善。
从老板的角度,IT系统、软件这些,也真的很容易被交智商税,售前吹得天花乱坠,只要给钱,钱到位,什么功能都可以做,上了系统,整个公司就天下无敌了。
当然收费也是天价一般了,大部分非IT人员都感知不到成本有多高,为何可以卖这么贵。
所以从用户被教育的角度来看,收高智商税的时代,终将会过去,就如现在零售市场那样,大家最后都会趟向理性消费,货比三家,只买合适的性价比高的东西,包括IT产品。
怎样可以做一个性价比高的产品?
好像扯远了,回到此篇的json转换功能,笔者理解是:让用户的参与感更多地加进来,不要把用户培养成只会傻瓜式的操作,最大限度地调动用户的自身水平,特别是OFFICE办公软件技能这些能力,加到自己的软件产品使用中来。
为用户造一款最傻瓜式的产品,要考虑的东西肯定多,成本必要增加,产品通用性也大打折扣。
当用户的能力被调动起来后,最终就可以实现类似本篇的功能那样,丢给用户一个json字符串,用户自己去解释它,选择自己要的数据内容,无需过多的开发工作量辅助。
json字符到用户想看的数据的距离
json字符,可以存储整个数据模型dataset,多个表混在其中,有一对一、一对多、多对多的关系结构,必要普通用户难以驾驭。
所以从用户的角度出发,肯定需要界面化操作,引导用户自己选择要哪个表的数据(这个表数据要完全的反规范化,将所有其他一端属性表信息都带进去,方便用户可以马上使用,无需重新手动复杂关联),然后再让用户自己选择需要返回的数据字段,实现一个全动态化、解藕的工具化输出。
核心实现过程和代码
只给大家一段主方法的代码,可以作下参考,具体思路如下:
private void ConvertJsonToDataTable()
{
var jsonInfo = JsonInfos.FirstOrDefault();
JObject jObject = JObject.Parse(jsonInfo.JsonString);
////拿到要遍历的数组路径,需要有【数字】的结构,query获取到最后一是【数字】的结构
var paths = jObject.Descendants().Select(s => s.Path).Distinct().ToArray();
var query = paths.Where(s => Regex.IsMatch(s, @"\[\d+\]"))
.Select(t => Regex.Match(t, @".+(?=\[\d+\])").Value)
.Distinct().ToArray();
//再将含数字的数组path去掉数字后分组取第1条,为了减少因多层数组嵌套而引起多条记录,产生多个表的情况。
var arrPaths = query.GroupBy(s => Regex.Replace(s, @"\[\d+\]", "")).Select(t => t.FirstOrDefault()).ToArray();
//如果没有数组出现时,就遍历所有后代
int tableIndex = 0;
if (arrPaths.Length == 0)
{
var mainFieldPathList = paths.Select(s => jObject.SelectToken(s)).Where(t => t is JValue).Select(t => t.Parent.Path).ToList();
var mainFieldList = mainFieldPathList.Select(s => Regex.Replace(s, @"\[.+?\]", "")).Distinct().ToList();//将字段中的【*】或【0】等都替换为空
var detailFieldList = new List<string>();
DataTable dataTable = GetDataTableStructure(mainFieldPathList, detailFieldList);
AddMainFieldDataToDataRow(jObject, mainFieldPathList, ref dataTable, jsonInfo.AddinalFieldData);
outputTableInfos.Add(
new OutputTableInfo()
{
HasArrayDetail = false,
ArrJsonPath = "唯一表",
MainFieldPathList = mainFieldPathList,
MainFieldList = mainFieldPathList,
DetailFieldList = detailFieldList,
TableIndex = tableIndex,
OutputTable = dataTable
}
);
}
else
{
foreach (var arrPath in arrPaths)
{
List<string> mainFieldPathList = new List<string>();
List<string> mainFieldList = new List<string>();
List<string> detailFieldList = new List<string>();
var arrItemJoken = jObject.SelectToken(arrPath);
//获得它的所有子项,不包含后面还有数组的情况,并且把那些不是叶子级的path也过滤了,
//replace是只替换最后一个数字编号,之前的属于其父级的数组不替换,但存放的表的字段时要替换
var arrPathEscape = arrPath.Replace("[", @"\[").Replace("]", @"\]").Replace(".", @"\.");
var detailDecendantsAll = arrItemJoken.Parent.Descendants().Select(s => s.Path)
.Where(r => !Regex.IsMatch(r, arrPathEscape + @"\[\d+\].+\[\d+\]"))
.Where(t => Regex.IsMatch(t, arrPathEscape + @"\[\d+\].+")).Distinct().ToList();
var detailDecendantsDistinct = detailDecendantsAll.Select(n => Regex.Replace(n, @"(?<=.+)\[\d+\]", "[*]"))
.Distinct()
.ToList();
detailFieldList.AddRange(detailDecendantsDistinct.Select(s => Regex.Replace(s, @"\[.+?\]", "")).Distinct());//将字段中的【*】或【0】等都替换为空
mainFieldPathList = GetMainFieldPathList(jObject, arrItemJoken);
mainFieldList.AddRange(mainFieldPathList.Select(s => Regex.Replace(s, @"\[.+?\]", "")).Distinct());//将字段中的【*】或【0】等都替换为空
DataTable dataTable = GetDataTableStructure(mainFieldList, detailFieldList);
AddDetailDataToDataRow(jObject, mainFieldPathList, detailDecendantsAll, detailDecendantsDistinct.Count, ref dataTable, jsonInfo.AddinalFieldData);
outputTableInfos.Add(
new OutputTableInfo()
{
HasArrayDetail = true,
MainFieldList = mainFieldPathList,
DetailFieldList = detailFieldList,
ArrJsonPath = arrPath,
TableIndex = tableIndex,
OutputTable = dataTable
});
tableIndex++;
}//foreach (var arrPath in arrPaths)
}//if (arrPaths.Length == 0)
}
一、因着dataset多表结构的存在,每个数组节点,需要做一个表来存储数据,避免多对多关系的数据返回,引起数据错误、重复和冗余。

二、对Array节点下的子记录进行解释,如子节点下仍然有Array结构,这部分Array结构就不再解释,同样防止多对多的数据结构产生。
若需要解释其下面的子Array时,它就是一张更明细化的表,相对于其父祖宗有Array出现的表来说。

三、对本Array以上的祖宗所对应的object结果及其下面的属性字段进行解释,这些部分将构成了对本Array节点下的详细信息描述的一端数据字段。

四、对本Array的同级兄弟节点进行解释,只

五、经历以上对本Array节点、祖宗节点、同级兄弟节点处理完后,需要处理自己的平行节点数据,使用正则进行平等节点的信息都解释。

最终效果
将一串json的dataset结构经过以上解释后,将出现多个表的结构,都是一对多的关系,不存在多对多关系,如下表如示,简单用界面封装下,就可以让用户更轻松自如地操作。



技术交流QQ群
QQ群名:Excel催化剂开源讨论群, QQ群号:788145319

关于Excel催化剂
Excel催化剂先是一微信公众号的名称,后来顺其名称,正式推出了Excel插件,插件将持续性地更新,更新的周期视本人的时间而定争取一周能够上线一个大功能模块。Excel催化剂插件承诺个人用户永久性免费使用!
Excel催化剂插件使用最新的布署技术,实现一次安装,日后所有更新自动更新完成,无需重复关注更新动态,手动下载安装包重新安装,只需一次安装即可随时保持最新版本!
Excel催化剂插件下载链接:https://pan.baidu.com/s/1Iz2_NZJ8v7C9eqhNjdnP3Q


取名催化剂,因Excel本身的强大,并非所有人能够立马享受到,大部分人还是在被Excel软件所虐的阶段,就是头脑里很清晰想达到的效果,而且高手们也已经实现出来,就是自己怎么弄都弄不出来,或者更糟的是还不知道Excel能够做什么而停留在不断地重复、机械、手工地在做着数据,耗费着无数的青春年华岁月。所以催生了是否可以作为一种媒介,让广大的Excel用户们可以瞬间点燃Excel的爆点,无需苦苦地挣扎地没日没夜的技巧学习、高级复杂函数的烧脑,最终走向了从入门到放弃的道路。
最后Excel功能强大,其实还需树立一个观点,不是所有事情都要交给Excel去完成,也不是所有事情Excel都是十分胜任的,外面的世界仍然是一个广阔的世界,Excel只是其中一枚耀眼的明星,还有其他更多同样精彩强大的技术、工具等。*Excel催化剂也将借力这些其他技术,让Excel能够发挥更强大的爆发!
关于Excel催化剂作者
姓名:李伟坚,从事数据分析工作多年(BI方向),一名同样在路上的学习者。
服务过行业:零售特别是鞋服类的零售行业,电商(淘宝、天猫、京东、唯品会)
技术路线从一名普通用户,通过Excel软件的学习,从此走向数据世界,非科班IT专业人士。
历经重重难关,终于在数据的道路上达到技术平原期,学习众多的知识不再太吃力,同时也形成了自己的一套数据解决方案(数据采集、数据加工清洗、数据多维建模、数据报表展示等)。
擅长技术领域:Excel等Office家族软件、VBA&VSTO的二次开发、Sqlserver数据库技术、Sqlserver的商业智能BI技术、Powerbi技术、云服务器布署技术等等。
2018年开始职业生涯作了重大调整,从原来的正职工作,转为自由职业者,暂无固定收入,暂对前面道路不太明朗,苦重新回到正职工作,对Excel催化剂的运营和开发必定受到很大的影响(正职工作时间内不可能维护也不可能随便把工作时间内的成果公布于外,工作外的时间也十分有限,因已而立之年,家庭责任重大)。
和广大拥护者一同期盼:Excel催化剂一直能运行下去,我所惠及的群体们能够给予支持(多留言鼓励下、转发下朋友圈推荐、小额打赏下和最重点的可以和所在公司及同行推荐推荐,让我的技术可以在贵司发挥价值,实现双赢(初步设想可以数据顾问的方式或一些小型项目开发的方式合作)。
Excel催化剂开源第38波-json字符串转多个表格结构的更多相关文章
- Excel催化剂开源第39波-json字符串解释的超能类库
对一般VBA开发群体来说,处理json.xml结构的数据源,在VB6的世界里,是一件非常不容易的事情,隐约记得当年自己从哪里找到了一个使用字典实现的json解释的函数,实在非常稀有. 在.Net的世界 ...
- Excel催化剂开源第23波-VSTO开发辅助录入功能关键技术
Excel催化剂开源第23波-VSTO开发辅助录入功能关键技术 Excel催化剂 2019.01.12 14:10* 字数 2948 阅读 41评论 0喜欢 0 编辑文章 在Excel催化剂的几大 ...
- Excel催化剂开源第22波-VSTO的帮助文档在哪里?
Excel催化剂开源第22波-VSTO的帮助文档在哪里? Excel催化剂 2019.01.12 14:10 字数 2930 阅读 55评论 0喜欢 0 编辑文章 对于专业程序猿来说,查找文档不是 ...
- Excel催化剂开源第49波-Excel与PowerBIDeskTop互通互联之第三篇
在PowerBIDeskTop开启的SSAS服务,和Sqlserver所开启的一个本质的区别是,前者其端口号是随机生成的,即上一次打开获得的端口号,下一次关闭后再打开,系统分配给它新的端口号,而后者因 ...
- Excel催化剂开源第48波-Excel与PowerBIDeskTop互通互联之第二篇
前一篇的分享中,主要谈到Excel透视表连接PowerBIDeskTop的技术,在访问SSAS模型时,不止可以使用透视表的方式访问,更可以发数据模型发起DAX或MDX查询,返回一个结果表数据,较透视表 ...
- Excel催化剂开源第42波-与金融大数据TuShare对接实现零门槛零代码获取数据
在金融大数据功能中,使用了TuShare的数据接口,其所有接口都采用WebAPI的方式提供,本来还在纠结着应该搬那些数据接口给用户使用,后来发现,所有数据接口都有其通用性,结合Excel灵活友好的输入 ...
- Excel催化剂开源第36波-图片Exif信息提取,速度超快,信息超全
Excel催化剂在文件处理方面,功能做到极致,但其实很大功劳都是引用一些开源社区的轮子库,不敢独占好处,此篇给大家分享下抓取图片的Exif信息的好用的轮子. 此篇对应的Excel催化剂功能实现:第83 ...
- Excel催化剂开源第51波-Excel催化剂遍历单元格操作性能保障
在Excel催化剂推出的这一年多时间里,经常性听到一种声音,大概意思是真正会写代码的人,都不会看上Excel催化剂写出来的功能,自己造一个更舒服贴心,仿佛会一点VBA就可以天下无敌一般,也好像Exce ...
- Excel催化剂开源第50波-Excel与PowerBIDeskTop互通互联之第四篇
答应过的全盘分享,也必承诺到底,此篇PowerBI功能分享的最后一篇,讲述如何导出数据模型的元数据,笔者定义其为模型的数据字典. 此篇对应功能实现出自:第6波-导出PowerbiDesktop模型数据 ...
随机推荐
- 使用Advanced Installer 13.1打包发布 Windows Service服务程序
原文: 使用Advanced Installer 13.1打包发布 Windows Service服务程序 项目中需要用到一个定时推送案件状态的需求,本人小菜一只,在同事建议下要写成一个windows ...
- ef 查询总结
1.Linq 查询两张表:a表和b表,要得到的数据是a表数据b表没有 例如:a表有5条数据1,2,3,4,5:b表有2条数据1,3:那么就用dataGridView1输出2,4,5:link语句要怎么 ...
- C#图片旋转
这里以Bitmap为例说明问题. 可以看到,旋转方法需要传入一个参数,而这个参数是一个枚举类型,RotateFlipType. 系统提供了两大类型的旋转, 1.旋转后不翻转. 2.旋转后接着翻转.翻转 ...
- 在Window和Linux下使用Zthread库(跨平台高级面向对象的线性和sycnchronization 库)
ZThread库是一个开源的跨平台高级面向对象的线性和sycnchronization 库,以运行POSIX 和Win32 系统中的C++程序. ZThread库的主页:http://zthread. ...
- 非常简单的利用CreateProcess注入DLL的方法
TCHAR szDll[] = TEXT("d:\\test.dll"); STARTUPINFO si = {0}; PROCESS_INFORMATION pi = {0}; ...
- SYN011型 B码时统
SYN011型 B码时统 产品概述 SYN011型B码时统是由西安同步电子科技有限公司精心设计.自行研发生产的一款专用时统设备,从GPS/北斗卫星上/和外部输入的IRIG-B码获取标准时钟信号信 ...
- KNN算法——分类部分
1.核心思想 如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性.也就是说找出一个样本的k个最近邻居,将这些邻居的属性的平均值赋给该 ...
- PWN 菜鸡入门之 shellcode编写 及exploid-db用法示例
下面我将参考其他资料来一步步示范shellcode的几种编写方式 0x01 系统调用 通过系统调用execve函数返回shell C语言实现: #include<unistd.h> #in ...
- Spring 5.x 、Spring Boot 2.x 、Spring Cloud 与常用技术栈整合
项目 GitHub 地址:https://github.com/heibaiying/spring-samples-for-all 版本说明: Spring: 5.1.3.RELEASE Spring ...
- 系统学习 Java IO (六)----管道流 PipedInputStream/PipedOutputStream
目录:系统学习 Java IO---- 目录,概览 PipedInputStream 类使得可以作为字节流读取管道的内容. 管道是同一 JVM 内的线程之间的通信通道. 使用两个已连接的管道流时,要为 ...