迟来的Json反序列化

 

  源码发布

搞了一个下午,终于搞定改了这个号称中国的github...以后源码直接在这里发布了(英文实在太烂了)

https://code.csdn.net/jy02305022/blqw-json

  相关回顾

  废话

自从上次发表了Json序列化的方案之后,已经整整一个月了。

原本是想序列化写完马上开始写反序列化的,但是来看了大家的回复之后得到了很多启示,所以这一个月直接在做优化的工作(当然还有带BB)。

我发现博客园真是个好地方,以前在QQ空间,点点,微博发表技术文章的时候根本没有人回复,了不起有几个转载的。。。

在这里大家一起参与讨论,才能获得更多的启示和发现,才能更好的提高自己!

  blqw.Json方案整体结构

blqw.Json

├─JsonBuilder                  //用于将C#转换为Json字符串

├─QuickJsonBuilder           //快速的将任意C#对象转换为Json字符串,继承自JsonBuilder

├─UnsafeStringWriter        //程序集可用,未公开对象.以非安全方式访问指针操作字符串直接写入内存,以提高字符串拼接效率

├─JsonParser                    //用于将Json字符串转换为C#对象

└─UnsafeJsonReader         //程序集可用,未公开对象.以非安全方式访问指针遍历内存中的字符串,以提高访问效率

ps:1,2,3是序列化用的,4,5是反序列化用的,项目还引用了Literacy用于IL方式反射访问对象属性 

  反序列化设计

反序列化相关的类只有2个UnsafeJsonReader,JsonParser 。一个用于读字符串,一个用于生成对象

UnsafeJsonReader 负责从Json字符串中读取指定的内容,读出的内容只能是最基本的String,Number,DateTime,true,false等

JsonParser 负责解析具体对象,并命令UnsafeJsonReader读取需要的内容,如果有必要,得到对象后进行一次转换然后赋值给对象

ps:JsonParser目前不支持转为DataSet或DataTable,因为把我觉得没什么必要,即使转了转过来都是String的也没什么用是吧

  • 图例

  • 示例代码
//json:{"Name":"blqw","Age":27}

class User
{
public string Name { get; set; }
public int Age { get; set; }
}
User ToUser(string json)
{
UnsafeJsonReader reader = new UnsafeJsonReader(json); //构造UnsafeJsonReader,这里只是例子而已,真是情况不是这样的 if (reader.SkipChar('{') == false) //跳过 左花括号 ,此操作忽略所有空格
{ //如果跳过空格后第一个字符不是{,返回false,如果是返回true,且跳过{
ThrowMissingCharException('{'); //返回false 则抛出异常 "缺少{符号"
} User user = new User();
while (true)
{
var pn = reader.ReadString(); //读取一个String ,String第一次字符必须是 双引号 或 单引号,否则会抛出异常
if (reader.SkipChar(':') == false) //跳过 冒号
{
ThrowMissingCharException(':'); //失败抛出异常
}
if (pn == "Name") //判断读出的String是Name还是Age 这只是个例子.....
{
user.Name = reader.ReadString();//如果是Name 继续出一个String,作为名称
}
else if (pn == "Age")
{
var num = reader.ReadConsts(); //如果是Age,则读出一个常量,可能是true,false,number,null,-Infinity,Infinity
//读取失败抛出异常
user.Age = (int)Convert.ChangeType(num, typeof(int));//转为int
}
if (reader.SkipChar(',')) //跳过一个 逗号
{
continue; //成功说明还有下一个属性
}
else if (reader.Current == '}') //如果失败,直接判断当前字符,如果是 右花括号,说明已经结束了
{
break;
}
else //既不是 逗号 也不是 右花括号 ,那就是作死的节奏了....
{
ThrowException("错误的结束符号:" + reader.Current);
}
}
reader.MoveNext(); //能到这里说明遇到右花括号了,跳过这个字符
if (reader.IsEnd()) //判断字符串是否已经结尾了,这个操作依然会跳过空白和回车字符
{
return user;
}
else //如果他还没有结束,我只能遗憾的说,你赢了!
{
ThrowException();
}
}

整体的流程大致就是这么一个情况,当然上面那个是精简的不能再精简的例子,真实情况要复杂很多,不过只要知道思路了对于我们程序猿来说,不是都差不多嘛

  异常设计

  • 如果User.Age是int类型的,但是Json字符串是这样的{age:"aa"}

    这点我参考了大多数人的做法,直接抛出。第一这样做对于性能的影响最小,第二这样做对于调用者来说最直观

    我之前的做法是忽略这个属性,后来发现这样做虽然程序没有异常了,但往往错误的时候也不知道,很多值都被直接以默认值的形式插入到数据库去了

  • 如果是Json属性不存在对象中 json:{"Name":"blqw", "Address":"gz"},Address不是类User的属性

    我使用一个叫SkipValue的方法,在字符串中立即跳过这个属性对应的值部分的字符串

  • 如果对象中的属性不在Json字符串中,就不管了,也不会有异常抛出

  性能设计

这里是比较重点要说明的,因为这部分是花时间最多的部分。

怎么才能设计出高效的反序列化方法?

  • 1.字符串尽量只遍历一次(UnsafeJsonReader就是用来干这个的),重复遍历毫无意义。当然有的时候为了保持程序的可读性不能不这样或者那样设计。这个时候就需要权衡可读性和性能的取舍了。
    例如:{"number":"123.165aafdsafdsafdsafds"},有些人会这样处理,先取出123.165aafdsafdsafdsafds,然后再判断是否是数字,这就是多此一举了,在遍历到第一个a的时候到直接就可以给出不是数字的结论了,为什么还要继续?
  • 2.所有对象只解析一次,在fastJson中,他将所有的字符串先解析成为一个List或者一个Dictionary,然后再吧Dictionary或者List解析成别的对象,这样做虽然可以使得程序可读性更好,便于维护。但是性能上的浪费是显而易见的。
  • 3.在字符串转换较慢的类型上重新实现转换方法,比如DateTime,Number(所有数字类型)---这里比较看个人水品了
  • 4.了解不同类型在性能上的细微差别,特别是可空值类型,我觉得他就是性能杀手(参考:学习笔记1,学习笔记2)
  • 5.使用最适合的方法处理,比如ReadString这个方法会从Json字符串当前位置读取一个String并返回,有的时候我只想跳过,不想返回,当然使用ReadString也是可以达到呀求的,只要不处理返回值就行了。但是这在性能上就有所浪费了,既然不用,那就不要返回,重新实现一个SkipString会比较合适
 ReadString
 SkipString

可以看到这2个方法的代码量都不是一个级别的,性能自然不用说

  • 6.使用指针.在类中使用指针一定要注意锁定指针,不然很容易读取到错误的内存块
  • 7.善于使用性能分析工具帮助你找出你程序中占用时间长的函数,并合理的修改他
  • 8.防止过度设计!(这点我感觉非常重要,最早版本的反序列化一共设计了4个类,就属于过度设计了,不仅增加了代码的复杂度而且降低了性能,都后都精简了)
  • 9.合理利用一些小技巧

比如,如何判断一个char是数字还是字母?

常规的方法是

char c = '\0';
if (c >= '0' && c <= '9')
{
// c是数字
}
else if ((c >= 'a' && c <= 'z') || c >= 'A' && c <= 'Z')
{
//c是字母
}
else if (c == '\'' && c == '"')
{
//c是单引号或双引号
}
else if (c == ':')
{
//c是冒号
}
else//if ....
{
//....
}

修改后的方法

 
char c = '\0';
switch (Chars[c])
{
case 1:
// c是数字
break;
case 2:
//c是字母
break;
case 3:
//c是单引号或双引号
break;
case 4:
//c是冒号
break;
default:
//...
break;
}

  效果

  • 序列化

  • 反序列化

  性能

这里提供一份几个常用Json组件的性能测试,也可以看出优化后的性能变化

  • 测试对象:

   源码下载

包含测试代码

http://files.cnblogs.com/blqw/blqw.Json.rar

  源码发布

搞了一个下午,终于搞定改了这个号称中国的github...以后源码直接在这里发布了(英文实在太烂了)

https://code.csdn.net/jy02305022/blqw-json

各位看官博友,看完之后如果对你有所启发请别忘了点一下推荐,让其他人也可以看到

如果有不同意见欢迎留言一起讨论

我写的文章,除了纯代码,其他的都是想表达一种思想,一种解决方案.希望各位看官不要局限于文章中的现成的代码,要多关注整个文章的主题思路,谢谢
 
分类: C#

Json反序列化的更多相关文章

  1. C# Json反序列化处理

    最近换工作了 从客户端转到Web端 第一个任务就是去别人的页面上抓取数据 用到的是JSON 因为他们网站json的格式有点怪 所以 就在JSON反序列化上面 花了一点时间 首先用到的工具是http:/ ...

  2. C#在Json反序列化中处理键的特殊字符

    假设有如下Json 数据: 1.{ 2."id" : 1, 3."@value" : "this a @", 4."$p" ...

  3. C# Json反序列化

    Json反序列化有两种方式[本人],一种是生成实体的,方便处理大量数据,复杂度稍高,一种是用匿名类写,方便读取数据,较为简单. 使用了Newtonsoft.Json,可以自行在nuget中导入 Jso ...

  4. .net Json 反序列化时,属性带点

    .net Json 反序列化时,属性带点 使用[JsonProperty("xxx.xxx")] static void Main(string[] args) { string ...

  5. Newtonsoft.Json反序列化(Deserialize)出错:Bad JSON escape sequence

    使用Newtonsoft.Json反序列化收到的字串为JObject或其它支持的数据模型,有时错误,提示如下: Bad JSON escape sequence: \c. Path , positio ...

  6. C# json反序列化 对象中嵌套数组 (转载) 可能会导致循环或多重级联路径。请指定 ON DELETE NO ACTION 或 ON UPDATE NO ACTION,或修改其他 FOREIGN KEY 约束。

    C# json反序列化 对象中嵌套数组 (转载)   看图: 这里可以看到是二层嵌套!!使用C#如何实现?? 思路:使用list集合实现 → 建立类 → list集合 → 微软的   Newtonso ...

  7. C# Json反序列化 C# 实现表单的自动化测试<通过程序控制一个网页> 验证码处理类:UnCodebase.cs + BauDuAi 读取验证码的值(并非好的解决方案) 大话设计模式:原型模式 C# 深浅复制 MemberwiseClone

    C# Json反序列化   Json反序列化有两种方式[本人],一种是生成实体的,方便处理大量数据,复杂度稍高,一种是用匿名类写,方便读取数据,较为简单. 使用了Newtonsoft.Json,可以自 ...

  8. json-lib json反序列化——日期转换

    将json格式的字符串转为对象,其中key-value有将String的日期转为Date类型,怪现象就是,转出来的Date类型的值是当前的系统时间. 网上有许多答案,在反序列化之前需要注册Date解析 ...

  9. json反序列化与pickle的用法

    json反序列化与pickle 一.定义 序列化:将内存中的不可持久化和传输对象转换为可方便持久化和传输对象的过程. 反序列化:将可持久化和传输对象转换为不可持久化和传输对象的过程. 二. 应用场景 ...

随机推荐

  1. Hadoop之环境搭建

    初学Hadoop之环境搭建   阅读目录 1.安装CentOS7 2.安装JDK1.7.0 3.安装Hadoop2.6.0 4.SSH无密码登陆 本文仅作为学习笔记,供大家初学Hadoop时学习参考. ...

  2. CSS3 制作向左、向右及关闭图标的效果 (另一种思路)

    最终效果 制作步骤 1.边框 CSS及Html代码 显示效果 2.向左的标志 CSS及Html代码,增加的代码在黄色范围内 显示效果 方向不对了,马上修改一下方向,逆时针旋转45度调整一下 CSS及H ...

  3. LeetCode——Spiral Matrix

    Given a matrix of m x n elements (m rows, n columns), return all elements of the matrix in spiral or ...

  4. Excel 宏

    实现1到40行的第一列 ,全部 累加一个字符串 A1 Sub Macro1() Dim i As IntegerFor i = 1 To 40Sheets(1).Cells(i, 1).Value = ...

  5. Web API-属性路由

    路由(Routing)就是Web API如何将一个URI匹配到一个action的过程.Web API 2 支持一个新的路由方式-属性路由(attribute routing).顾名思义,属性路由使用标 ...

  6. .net 职责链来实现 插件模式

    .net 职责链来实现 插件模式 插件式的例子 QQ电脑管家,有很多工具列表,点一下工具下载后就可以开始使用了 eclipse ,X Server 等等 插件式的好处 插件降低框架的复杂性,把扩展功能 ...

  7. 探秘ReSharper8.1版本中Architecture(架构工具)的改进

    在ReSharper 8.0新版本中,有一个叫做Architecture(结构工具)的新功能,此功能被定义为项目依赖关系分析.其目的是让用户可视化操作解决方案的结构.接下来,小编将在ReSharper ...

  8. a:focus{outline: none;} 如何去掉点击链接时周围的虚线框outline属性

    1. CSS方式 在IE下是使用html属性:hideFoucs,在HTML标签中加上hidefocus=”true”属性即可,但这个属性是IE私有的,Firefox是不认的. 加了hidefocus ...

  9. js实现在新标签页打开页面

    这种方法打开新标签页要在IE9+以上浏览器才可以! <html> <head> <meta http-equiv="Content-type" con ...

  10. TRIGGER的使用(修改SP自动触发)

    CREATE TRIGGER [trg_save_change_SP] ON DATABASE FOR CREATE_PROCEDURE, ALTER_PROCEDURE,DROP_PROCEDURE ...