Json序列化与反序列化导致多线程运行速度和单线程运行速度一致问题
紧跟上篇文章 十个进程开启十个bash后一致写入命令执行完毕之后产生了很多很多的文件,博主需要对这些文件同意处理,也就是说对几十万个文件进行处理,想了又想,单线程处理那么多数据肯定不行,于是乎想到了使用多线程,紧接着就引发了一系列问题,其中做大的问题就是json序列化,导致了多条线程运行和单线程运行时间一致问题。
我们正常去读取json文件转成一般是通过实体类去使用JsonConvert.DeserializeObject方法进行接收的,然后再通过实体类去进行一系列的操作,目前遇到的问题就是读取上万的json文件进行反序列化与序列化进行操作,如果一条一条的去操作的话速度可谓是非常非常慢,然后经过大佬的推荐和自己了解决定使用微软专门推出的一个操作json的类。
这个类说的也非常清楚,提供高性能、低分配和标准兼容的功能,以处理 JavaScript 对象表示法 (JSON),其中包括将对象序列化为 JSON 文本以及将 JSON 文本反序列化为对象(内置 UTF-8 支持)。 它还提供类型以用于读取和写入编码为 UTF-8 的 JSON 文本,以及用于创建内存中文档对象模型 (DOM) 以在数据的结构化视图中随机访问 JSON 元素。
虽然这个类库专门针对于性能来优化的,但是使用起来往往非常的困难,没有我们大众所使用的JsonConvert.DeserializeObject方便,但是如像我一样对待性能有极致的要求的话,可以使用这个类库,用法也非常简单,下面我给出例子
引入命名空间:
System.Text.Json
那么具体如何使用呢?我这里给出具体的使用方法以及详细的例子。
JsonDocument document1 = null; StreamReader f2 = new StreamReader(filePath, Encoding.UTF8);
String line;
while ((line = f2.ReadLine()) != null)
{
document1 = JsonDocument.Parse(line);
}
f2.Close();
f2.Dispose();
这里我们去读取filepath,filepath是json文件路径。我们使用 JsonDocument.Parse对json文件进行操作。这个方法表示单个 JSON 字节值的 UTF-8 编码文本形式的序列分析为 JsonDocument。
把json文件序列分析为JsonDocument类型了下面就是对这个类型进行操作,为什么现在好多人不喜欢使用这种方法,大概率是因为取值比较难
对于JsonDocument如何取出我们想要的值或者节点呢?看下面的例子:
{
"ClassName": "Science",
"Teacher\u0027s Name": "Jane",
"Semester": "2019-01-01",
"Students": [
{
"Name": "John",
"Grade": 94.3
},
{
"Name": "James",
"Grade": 81.0
},
{
"Name": "Julia",
"Grade": 91.9
},
{
"Name": "Jessica",
"Grade": 72.4
},
{
"Name": "Johnathan"
}
],
"Final": true
}
上述是一个json文件内的数据,我们解析JsonDocument如何解析出Class Name节点值呢?
可以使用如下操作
//定义变量去接收
var className = "0";
//判断我们解析出来的JsonDocument是否为空
if (document1 != null)
{
JsonElement root = document1.RootElement;
className = root.TryGetProperty("ClassName", out var temp) ? temp.GetInt32().ToString() : "0";
}
首先使用 JsonDocument.RootElement属性 获取此 JSON 文档的根元素。
对于根元素进行解析,JsonElemet.TryGetProperty() 查找当前对象中名为 ClassName 的属性,返回一个指示此类属性是否存在的值。 如果此属性存在,会将其值分配给 value 参数。现在value参数对应temp,解析时还应注意属性值类型,如果为string类型则使用GetString(),去进行转换,int类型可以使用GetInt32(),进行转换,具体其他类型可以查看微软官方给出的类型。
使用TryGetProperty()方法有什么好处呢?
可以去判断json文件内有没有当前的属性,如果有的话,去返回属性值,无,则返回null。
现在我们取单独属性已经会了,那么如何取数组呢?如何取数组对象呢?
例子:
double sum = 0;
int count = 0; using (JsonDocument document = JsonDocument.Parse(jsonString))
{
JsonElement root = document.RootElement;
JsonElement studentsElement = root.GetProperty("Students");
count = studentsElement.GetArrayLength(); foreach (JsonElement student in studentsElement.EnumerateArray())
{
if (student.TryGetProperty("Grade", out JsonElement gradeElement))
{
sum += gradeElement.GetDouble();
}
else
{
sum += 70;
}
}
} double average = sum / count;
Console.WriteLine($"Average grade : {average}");
上面这个例子是微软官方给出的例子,但是使用与我们已经知道json文件格式的情况。
使用之前我们可以使用TryGetProperty方法先判断json属性是否存在,存在的话去定义一个value值进行接收,先判断是否为存在,存在则把value值进行遍历,然后再去判断这个数组内的属性是否存在,存在的话返回属性值,以此类推便可以拿到所有的json文件中的属性值啦!
性能提升:说了这么多到底这种方法能够提升多少速度呢,经过博主测试JsonConvert.DeserializeObject方法在线程或者进程内使用的话开启多个和单个线程(进程)速度相差基本不大,就好比我开了十个线程,去读取十万个文件,结果和单个线程去读取十万个文件相差几秒??是不是非常离谱。
换用这种高性能处理json文件的类库之后,开启十个线程去操作文件速度直接减少了三分之二!!!!!!
Json序列化与反序列化导致多线程运行速度和单线程运行速度一致问题的更多相关文章
- Newtonsoft.Json 序列化和反序列化 时间格式
From : http://www.cnblogs.com/litian/p/3870975.html 1.JSON序列化 string JsonStr= JsonConvert.SerializeO ...
- Newtonsoft.Json 序列化和反序列化 时间格式 [转]
1.JSON序列化 string JsonStr= JsonConvert.SerializeObject(Entity); eg: A a=new A(); a.Name="Elain ...
- [转]Newtonsoft.Json 序列化和反序列化 时间格式
本文转自:http://www.cnblogs.com/litian/p/3870975.html 1.JSON序列化 string JsonStr= JsonConvert.SerializeObj ...
- Newtonsoft.Json 序列化和反序列化 以及时间格式
1.JSON序列化 string JsonStr= JsonConvert.SerializeObject(Entity); eg: A a=new A(); a.Name="Elain ...
- WPF中的常用布局 栈的实现 一个关于素数的神奇性质 C# defualt关键字默认值用法 接口通俗理解 C# Json序列化和反序列化 ASP.NET CORE系列【五】webapi整理以及RESTful风格化
WPF中的常用布局 一 写在开头1.1 写在开头微软是一家伟大的公司.评价一门技术的好坏得看具体的需求,没有哪门技术是面面俱到地好,应该抛弃对微软和微软的技术的偏见. 1.2 本文内容本文主要内容 ...
- 在net中json序列化与反序列化 面向对象六大原则 (第一篇) 一步一步带你了解linq to Object 10分钟浅谈泛型协变与逆变
在net中json序列化与反序列化 准备好饮料,我们一起来玩玩JSON,什么是Json:一种数据表示形式,JSON:JavaScript Object Notation对象表示法 Json语法规则 ...
- DotNet的JSON序列化与反序列化
JSON(JavaScript Object Notation)JavaScript对象表示法,它是一种基于文本,独立于语言的轻量级数据交换格式.在现在的通信中,较多的采用JSON数据格式,JSON有 ...
- C#中JSON序列化和反序列化
有一段时间没有到博客园写技术博客了,不过每天逛逛博客园中大牛的博客还是有的,学无止境…… 最近在写些调用他人接口的程序,用到了大量的JSON.XML序列化和反序列化,今天就来总结下json的序列化和反 ...
- Net中JSON序列化和反序列化处理(日期时间特殊处理)
0 缘由 笔者最近在web api端使用Json.Net进行序列化处理,而在调用端使用DataContractSerializer进行反序列化,遇到日期时间处理反序列化不成功[备注:笔者使用Net ...
随机推荐
- su 和 sudo的区别
su是一个命令,可切换其他用户进行操作:而 '-' 号则是代表是否完全切换指定的用户环境信息 sudo是一个服务,可通过/etc/sudoers进行配置文件,让被限制的用户只能执行被授予的命令操作.
- 构造器注入和 setter 依赖注入,那种方式更好?
每种方式都有它的缺点和优点.构造器注入保证所有的注入都被初始化,但是 setter 注入提供更好的灵活性来设置可选依赖.如果使用 XML 来描述依赖, Setter 注入的可读写会更强.经验法则是强制 ...
- 聊一聊Java8 Optional,让你的代码更加优雅
码农在囧途 随着时间的推移,曾经我们觉得重要的东西,可能在今天看来是如此的浅薄和无知,同理,今天我们放不下,想不开,觉得重要的东西,多年后我们可能也会觉得也就那样,所以,今天的的所有烦恼,忧愁,想不开 ...
- 解决HDFS无法启动namenode,报错Premature EOF from inputStream;Failed to load FSImage file, see error(s) above for more info
一.情况描述 启动hadoop后发现无法打开hdfs web界面,50070打不开,于是jps发现少了一个namenode: 查看日志信息,发现如下报错: 2022-01-03 23:54:10,99 ...
- jdbc连接MySQL数据库+简单实例(普通JDBC方法实现和连接池方式实现)
jdbc连接数据库 总结内容 1. 基本概念 jdbc的概念 2. 数据库连接 数据库的连接 DAO层思想 重构设计 3. 事务 概念 事务的ACID属性 事务的操作 4. 连接池 为什么要使用连接池 ...
- 攻防世界——stegano
分析 1. 一个pdf,里边都是英文. 打开pdf "ctrl + F",检查flag 然活这里边直接告诉你,flag不在这里,一般都这么说了那就是真的不在了. 2. txt打开, ...
- python"温度转换"实例编写
介绍 实现华氏度和摄氏度之间的转换. 代码: #TempCovert.py TempStr = input("请输入带有符号的温度值") if TempStr[-1] in [&q ...
- c++对c的拓展_命名空间_简单使用
名字的控制:c可使用static关键字使该关键字在本单元内可见,c++则使用命名空间对名字的可见性及产生进行控制 命名空间:控制标识符的作用域(本质上就是一个作用域) 使用特点:1.必须定义在全局范围 ...
- Struct2中三种获取表单数据的方式
1.使用ActionContext类 //1获取ActionContext对象 ActionContext context = ActionContext.getContext(); //2.调用方法 ...
- python版本共存与语法的注释
python的多种版本共存 首先还是先下载python解释器除最高版本的另外两个版本 个人推荐的是 3.6.8和2.7.14 首先我电脑是win7系统 在计算机属性右键点开高级设置点击环境变量 将下载 ...