作为开发者来说,面对json字符一点不陌生,但对于普通用户来说,更合适的是数据表结构的数据,最好数据已经躺在Excel表格内,不用到处导入导出操作。所以开发者和用户之间是有不同的数据使用思维和需求的。

此篇给大家带来一些新的思路,怎样可以让用户自主地参与到获取数据过程中来,减少开发工作量的同时却收获了用户满意度。

IT领域收智商税的时代终将会过去

作为一个非IT科班出身的笔者,对IT领域的了解也不深,姑且谈下自己的一些小见解。

普通人对IT的出品各种系统和各种软件,可畏爱恨交加。好的系统或软件,带来许多重复性工作的效率提升,不好的系统或软件,一天到晚被虐着做一些无聊的数据录入和忍受各种的不完善。

从老板的角度,IT系统、软件这些,也真的很容易被交智商税,售前吹得天花乱坠,只要给钱,钱到位,什么功能都可以做,上了系统,整个公司就天下无敌了。

当然收费也是天价一般了,大部分非IT人员都感知不到成本有多高,为何可以卖这么贵。

所以从用户被教育的角度来看,收高智商税的时代,终将会过去,就如现在零售市场那样,大家最后都会趟向理性消费,货比三家,只买合适的性价比高的东西,包括IT产品。

怎样可以做一个性价比高的产品?

好像扯远了,回到此篇的json转换功能,笔者理解是:让用户的参与感更多地加进来,不要把用户培养成只会傻瓜式的操作,最大限度地调动用户的自身水平,特别是OFFICE办公软件技能这些能力,加到自己的软件产品使用中来。

为用户造一款最傻瓜式的产品,要考虑的东西肯定多,成本必要增加,产品通用性也大打折扣。

当用户的能力被调动起来后,最终就可以实现类似本篇的功能那样,丢给用户一个json字符串,用户自己去解释它,选择自己要的数据内容,无需过多的开发工作量辅助。

json字符到用户想看的数据的距离

json字符,可以存储整个数据模型dataset,多个表混在其中,有一对一、一对多、多对多的关系结构,必要普通用户难以驾驭。

所以从用户的角度出发,肯定需要界面化操作,引导用户自己选择要哪个表的数据(这个表数据要完全的反规范化,将所有其他一端属性表信息都带进去,方便用户可以马上使用,无需重新手动复杂关联),然后再让用户自己选择需要返回的数据字段,实现一个全动态化、解藕的工具化输出。

核心实现过程和代码

只给大家一段主方法的代码,可以作下参考,具体思路如下:

  private void ConvertJsonToDataTable()
{
var jsonInfo = JsonInfos.FirstOrDefault(); JObject jObject = JObject.Parse(jsonInfo.JsonString); ////拿到要遍历的数组路径,需要有【数字】的结构,query获取到最后一是【数字】的结构
var paths = jObject.Descendants().Select(s => s.Path).Distinct().ToArray();
var query = paths.Where(s => Regex.IsMatch(s, @"\[\d+\]"))
.Select(t => Regex.Match(t, @".+(?=\[\d+\])").Value)
.Distinct().ToArray(); //再将含数字的数组path去掉数字后分组取第1条,为了减少因多层数组嵌套而引起多条记录,产生多个表的情况。
var arrPaths = query.GroupBy(s => Regex.Replace(s, @"\[\d+\]", "")).Select(t => t.FirstOrDefault()).ToArray();
//如果没有数组出现时,就遍历所有后代
int tableIndex = 0;
if (arrPaths.Length == 0)
{
var mainFieldPathList = paths.Select(s => jObject.SelectToken(s)).Where(t => t is JValue).Select(t => t.Parent.Path).ToList();
var mainFieldList = mainFieldPathList.Select(s => Regex.Replace(s, @"\[.+?\]", "")).Distinct().ToList();//将字段中的【*】或【0】等都替换为空 var detailFieldList = new List<string>();
DataTable dataTable = GetDataTableStructure(mainFieldPathList, detailFieldList); AddMainFieldDataToDataRow(jObject, mainFieldPathList, ref dataTable, jsonInfo.AddinalFieldData); outputTableInfos.Add(
new OutputTableInfo()
{
HasArrayDetail = false,
ArrJsonPath = "唯一表",
MainFieldPathList = mainFieldPathList,
MainFieldList = mainFieldPathList,
DetailFieldList = detailFieldList,
TableIndex = tableIndex,
OutputTable = dataTable
}
);
}
else
{ foreach (var arrPath in arrPaths)
{ List<string> mainFieldPathList = new List<string>(); List<string> mainFieldList = new List<string>();
List<string> detailFieldList = new List<string>(); var arrItemJoken = jObject.SelectToken(arrPath);
//获得它的所有子项,不包含后面还有数组的情况,并且把那些不是叶子级的path也过滤了,
//replace是只替换最后一个数字编号,之前的属于其父级的数组不替换,但存放的表的字段时要替换 var arrPathEscape = arrPath.Replace("[", @"\[").Replace("]", @"\]").Replace(".", @"\.");
var detailDecendantsAll = arrItemJoken.Parent.Descendants().Select(s => s.Path)
.Where(r => !Regex.IsMatch(r, arrPathEscape + @"\[\d+\].+\[\d+\]"))
.Where(t => Regex.IsMatch(t, arrPathEscape + @"\[\d+\].+")).Distinct().ToList(); var detailDecendantsDistinct = detailDecendantsAll.Select(n => Regex.Replace(n, @"(?<=.+)\[\d+\]", "[*]"))
.Distinct()
.ToList(); detailFieldList.AddRange(detailDecendantsDistinct.Select(s => Regex.Replace(s, @"\[.+?\]", "")).Distinct());//将字段中的【*】或【0】等都替换为空 mainFieldPathList = GetMainFieldPathList(jObject, arrItemJoken);
mainFieldList.AddRange(mainFieldPathList.Select(s => Regex.Replace(s, @"\[.+?\]", "")).Distinct());//将字段中的【*】或【0】等都替换为空 DataTable dataTable = GetDataTableStructure(mainFieldList, detailFieldList); AddDetailDataToDataRow(jObject, mainFieldPathList, detailDecendantsAll, detailDecendantsDistinct.Count, ref dataTable, jsonInfo.AddinalFieldData);
outputTableInfos.Add(
new OutputTableInfo()
{
HasArrayDetail = true,
MainFieldList = mainFieldPathList,
DetailFieldList = detailFieldList,
ArrJsonPath = arrPath,
TableIndex = tableIndex,
OutputTable = dataTable
});
tableIndex++;
}//foreach (var arrPath in arrPaths)
}//if (arrPaths.Length == 0)
}

一、因着dataset多表结构的存在,每个数组节点,需要做一个表来存储数据,避免多对多关系的数据返回,引起数据错误、重复和冗余。

二、对Array节点下的子记录进行解释,如子节点下仍然有Array结构,这部分Array结构就不再解释,同样防止多对多的数据结构产生。

若需要解释其下面的子Array时,它就是一张更明细化的表,相对于其父祖宗有Array出现的表来说。

三、对本Array以上的祖宗所对应的object结果及其下面的属性字段进行解释,这些部分将构成了对本Array节点下的详细信息描述的一端数据字段。

四、对本Array的同级兄弟节点进行解释,只

五、经历以上对本Array节点、祖宗节点、同级兄弟节点处理完后,需要处理自己的平行节点数据,使用正则进行平等节点的信息都解释。

最终效果

将一串json的dataset结构经过以上解释后,将出现多个表的结构,都是一对多的关系,不存在多对多关系,如下表如示,简单用界面封装下,就可以让用户更轻松自如地操作。

技术交流QQ群

QQ群名:Excel催化剂开源讨论群, QQ群号:788145319

关于Excel催化剂

Excel催化剂先是一微信公众号的名称,后来顺其名称,正式推出了Excel插件,插件将持续性地更新,更新的周期视本人的时间而定争取一周能够上线一个大功能模块。Excel催化剂插件承诺个人用户永久性免费使用!

Excel催化剂插件使用最新的布署技术,实现一次安装,日后所有更新自动更新完成,无需重复关注更新动态,手动下载安装包重新安装,只需一次安装即可随时保持最新版本!

Excel催化剂插件下载链接:https://pan.baidu.com/s/1Iz2_NZJ8v7C9eqhNjdnP3Q

取名催化剂,因Excel本身的强大,并非所有人能够立马享受到,大部分人还是在被Excel软件所虐的阶段,就是头脑里很清晰想达到的效果,而且高手们也已经实现出来,就是自己怎么弄都弄不出来,或者更糟的是还不知道Excel能够做什么而停留在不断地重复、机械、手工地在做着数据,耗费着无数的青春年华岁月。所以催生了是否可以作为一种媒介,让广大的Excel用户们可以瞬间点燃Excel的爆点,无需苦苦地挣扎地没日没夜的技巧学习、高级复杂函数的烧脑,最终走向了从入门到放弃的道路。

最后Excel功能强大,其实还需树立一个观点,不是所有事情都要交给Excel去完成,也不是所有事情Excel都是十分胜任的,外面的世界仍然是一个广阔的世界,Excel只是其中一枚耀眼的明星,还有其他更多同样精彩强大的技术、工具等。*Excel催化剂也将借力这些其他技术,让Excel能够发挥更强大的爆发!

关于Excel催化剂作者

姓名:李伟坚,从事数据分析工作多年(BI方向),一名同样在路上的学习者。

服务过行业:零售特别是鞋服类的零售行业,电商(淘宝、天猫、京东、唯品会)

技术路线从一名普通用户,通过Excel软件的学习,从此走向数据世界,非科班IT专业人士。

历经重重难关,终于在数据的道路上达到技术平原期,学习众多的知识不再太吃力,同时也形成了自己的一套数据解决方案(数据采集、数据加工清洗、数据多维建模、数据报表展示等)。

擅长技术领域:Excel等Office家族软件、VBA&VSTO的二次开发、Sqlserver数据库技术、Sqlserver的商业智能BI技术、Powerbi技术、云服务器布署技术等等。

2018年开始职业生涯作了重大调整,从原来的正职工作,转为自由职业者,暂无固定收入,暂对前面道路不太明朗,苦重新回到正职工作,对Excel催化剂的运营和开发必定受到很大的影响(正职工作时间内不可能维护也不可能随便把工作时间内的成果公布于外,工作外的时间也十分有限,因已而立之年,家庭责任重大)。

和广大拥护者一同期盼:Excel催化剂一直能运行下去,我所惠及的群体们能够给予支持(多留言鼓励下、转发下朋友圈推荐、小额打赏下和最重点的可以和所在公司及同行推荐推荐,让我的技术可以在贵司发挥价值,实现双赢(初步设想可以数据顾问的方式或一些小型项目开发的方式合作)。

Excel催化剂开源第38波-json字符串转多个表格结构的更多相关文章

  1. Excel催化剂开源第39波-json字符串解释的超能类库

    对一般VBA开发群体来说,处理json.xml结构的数据源,在VB6的世界里,是一件非常不容易的事情,隐约记得当年自己从哪里找到了一个使用字典实现的json解释的函数,实在非常稀有. 在.Net的世界 ...

  2. Excel催化剂开源第23波-VSTO开发辅助录入功能关键技术

    Excel催化剂开源第23波-VSTO开发辅助录入功能关键技术 Excel催化剂   2019.01.12 14:10* 字数 2948 阅读 41评论 0喜欢 0 编辑文章 在Excel催化剂的几大 ...

  3. Excel催化剂开源第22波-VSTO的帮助文档在哪里?

    Excel催化剂开源第22波-VSTO的帮助文档在哪里? Excel催化剂   2019.01.12 14:10 字数 2930 阅读 55评论 0喜欢 0 编辑文章 对于专业程序猿来说,查找文档不是 ...

  4. Excel催化剂开源第49波-Excel与PowerBIDeskTop互通互联之第三篇

    在PowerBIDeskTop开启的SSAS服务,和Sqlserver所开启的一个本质的区别是,前者其端口号是随机生成的,即上一次打开获得的端口号,下一次关闭后再打开,系统分配给它新的端口号,而后者因 ...

  5. Excel催化剂开源第48波-Excel与PowerBIDeskTop互通互联之第二篇

    前一篇的分享中,主要谈到Excel透视表连接PowerBIDeskTop的技术,在访问SSAS模型时,不止可以使用透视表的方式访问,更可以发数据模型发起DAX或MDX查询,返回一个结果表数据,较透视表 ...

  6. Excel催化剂开源第42波-与金融大数据TuShare对接实现零门槛零代码获取数据

    在金融大数据功能中,使用了TuShare的数据接口,其所有接口都采用WebAPI的方式提供,本来还在纠结着应该搬那些数据接口给用户使用,后来发现,所有数据接口都有其通用性,结合Excel灵活友好的输入 ...

  7. Excel催化剂开源第36波-图片Exif信息提取,速度超快,信息超全

    Excel催化剂在文件处理方面,功能做到极致,但其实很大功劳都是引用一些开源社区的轮子库,不敢独占好处,此篇给大家分享下抓取图片的Exif信息的好用的轮子. 此篇对应的Excel催化剂功能实现:第83 ...

  8. Excel催化剂开源第51波-Excel催化剂遍历单元格操作性能保障

    在Excel催化剂推出的这一年多时间里,经常性听到一种声音,大概意思是真正会写代码的人,都不会看上Excel催化剂写出来的功能,自己造一个更舒服贴心,仿佛会一点VBA就可以天下无敌一般,也好像Exce ...

  9. Excel催化剂开源第50波-Excel与PowerBIDeskTop互通互联之第四篇

    答应过的全盘分享,也必承诺到底,此篇PowerBI功能分享的最后一篇,讲述如何导出数据模型的元数据,笔者定义其为模型的数据字典. 此篇对应功能实现出自:第6波-导出PowerbiDesktop模型数据 ...

随机推荐

  1. Win10的UWP之进度条

    原文:Win10的UWP之进度条 关于UWP的进度条的处理的方案有两种方案 我们新建一个项目,然后处理的界面如下的代码 <Grid.RowDefinitions> <RowDefin ...

  2. Windows完成端口与猪肉佬

    首先应该说明的是,我也是第一次使用完成端口.虽然以前偶尔在网上看到完成端口的文章和代码,但真正自己动手写还是第一次,不过我这个人有个特点就是大胆,例如没有写那个界面编程系列前,其实我甚至不知道原来一个 ...

  3. 网易Lofter

    作为老网虫,对网易的感情是很深的.当我知道Lofter这个东西后,曾经很兴奋要好好打理自己的博客,然而兴奋很快过了.因为Lofter无时无刻不在刷存在感.无限空间加无限图片流量,国内的服务无法做的更好 ...

  4. GetParent、SetParent、MoveWindow - 获取、指定父窗口和移动窗口,IsChild - 判断两个窗口是不是父子关系

    提示: SetParent 应该 Windows.SetParent, 因为 TForm 的父类有同名方法. //声明: {获取父窗口句柄} GetParent(hWnd: HWND): HWND; ...

  5. 深入浅出RPC——深入篇(转载)

    本文转载自这里是原文 <深入篇>我们主要围绕 RPC 的功能目标和实现考量去展开,一个基本的 RPC 框架应该提供什么功能,满足什么要求以及如何去实现它? RPC 功能目标 RPC的主要功 ...

  6. JS基本类型特性总结

    本文代码测试环境: win7 32位,chrome 版本如下: 一,JS基本数据类型:Undefined, Null, Boolean, Number, String, Object六种. 1,Und ...

  7. PHP PSR4自动加载代码赏析

    第一部分是引入自动加载配置文件 1.入口文件:autoload.php里面没什么东西,就是导入ComposerAutoloader主题文件,一般由一个复杂的名字,不过不用担心就是机器随机生成的一个码而 ...

  8. JCS学习记录 --Java Caching System

    Java Caching System--JCS 缓存工具 //jcs版本 jcs-1.3.jar //jcs--cache.ccf缓存配置文件 cache.ccf //所依赖的jar包concurr ...

  9. 北京信息科技大学第十一届程序设计竞赛(重现赛)I

    I andy种树 题目链接:https://ac.nowcoder.com/acm/contest/940/I 题目描述 andy在他的庄园里种了n棵树,排列成一排,标号为1到n.最开始的时候n棵树的 ...

  10. Python笔记【6】_函数

    #!/usr/bin/env/python #-*-coding:utf-8-*- #Author:LingChongShi #查看源码Ctrl+左键 ''' def:函数是一段可以重复调用的代码,通 ...