本文采用以下协议进行授权: 自由转载-非衍生-保持署名|Creative Commons BY-NC-ND 3.0 ,转载请注明作者及出处。

cJSON是一个超轻巧,携带方便,单文件,简单的可以作为ANSI-C标准的Json格式解析库。

那什么是Json格式?这里照搬度娘百科的说法:

Json(JavaScript Object Notation)
是一种轻量级的数据交换格式。它基于JavaScript(Standard ECMA-262 3rd Edition – December
1999)的一个子集。JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C, C++, C#, Java,
JavaScript, Perl, Python等)。这些特性使JSON成为理想的数据交换语言。易于人阅读和编写,同时也易于机器解析和生成。

更加详细的解释和示例请查看 http://www.json.org/
主页。

其实简单说,Json就是一种信息交换格式,而cJSON其实就是对Json格式的字符串进行构建和解析的一个C语言函数库。

可以在以下地址下载到cJSON的源代码:

http://sourceforge.net/projects/cjson/

__MACOSX目录是提供给Mac OS的源码,我的机器运行的是Fedora 18,所以选择另外一个目录即可。

简单的阅读下README文件,先学习cJSON库的使用方法。若是连库都还不会使用,分析源码就无从谈起了。通过简单的了解,我们得知cJSON库实际上只有cJSON.c和cJSON.h两个文件组成,绝对轻量级。

不过,代码风格貌似有点非主流,先用indent格式化一下代码吧。我个人喜欢K&R风格的代码,使用的indent命令行参数如下:

indent -bad -bli 0 -ce -kr -nsob --space-after-if --space-after-while --space-after-for --use-tabs -i8
1

indent - bad - bli 0 - ce - kr - nsob -- space - after - if -- space - after - while -- space - after - for -- use - tabs - i8

格式化之后,代码结构看起来清晰多了。

那么,从何处下手来分析呢?打开代码文件逐行阅读么?当然不是了,有main函数的程序大都是从main函数开始分析,那么没有main函数的纯函数库呢?那就自己写main函数呗。

cJSON作为Json格式的解析库,其主要功能无非就是构建和解析Json格式了,我们先写一个构建Json格式字符串的程序,尽可能的使其用到的类型多一点(事实上README文件里提供了不错的示例代码,我们直接借鉴一下吧)。代码如下:

#include <stdio.h>
#include <stdlib.h>

#include "cJSON.h"

int main(int argc, char *argv[])
{
cJSON *root, *fmt;

root = cJSON_CreateObject();
cJSON_AddStringToObject(root, "name", "Jack (\"Bee\") Nimble");
fmt = cJSON_CreateObject();
cJSON_AddItemToObject(root, "format", fmt);
cJSON_AddStringToObject(fmt, "type", "rect");
cJSON_AddNumberToObject(fmt, "width", 1920);
cJSON_AddFalseToObject(fmt, "interlace");

char *result = cJSON_Print(root);
puts(result);

free(result);
cJSON_Delete(root);

return EXIT_SUCCESS;
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

#include <stdio.h>

#include <stdlib.h>

    

#include "cJSON.h"

    

int main ( int argc , char * argv [ ] )

{

cJSON * root , * fmt ;

            

root = cJSON_CreateObject ( ) ;

cJSON_AddStringToObject ( root , "name" , "Jack (\"Bee\") Nimble" ) ;

fmt = cJSON_CreateObject ( ) ;

cJSON_AddItemToObject ( root , "format" , fmt ) ;

cJSON_AddStringToObject ( fmt , "type" , "rect" ) ;

cJSON_AddNumberToObject ( fmt , "width" , 1920 ) ;

cJSON_AddFalseToObject ( fmt , "interlace" ) ;

    

char * result = cJSON_Print ( root ) ;

puts ( result ) ;

            

free ( result ) ;

cJSON_Delete ( root ) ;

    

return EXIT_SUCCESS ;

}

编译运行后 ( 编译时注意要链接数学库,参数行要加 -lm) ,运行结果如下:

{
"name": "Jack (\"Bee\") Nimble",
"format": {
"type": "rect",
"width": 1920,
"interlace": false
}
}
1
2
3
4
5
6
7
8
{

"name" : "Jack (\"Bee\") Nimble" ,

     "format" : {

"type" : "rect" ,

"width" : 1920 ,

"interlace" : false

     }
}

打开cJSON.h这个头文件,我们可以看到每一个节点,实际上都是由cJSON这个结构体来描述的:

typedef struct cJSON {
struct cJSON *next, *prev;
struct cJSON *child;

int type;

char *valuestring;
int valueint;
double valuedouble;

char *string;
} cJSON;

1
2
3
4
5
6
7
8
9
10
11
12

typedef struct cJSON {

struct cJSON * next , * prev ;

struct cJSON * child ;

    
     int type ;
    

char * valuestring ;

int valueint ;

double valuedouble ;

    

char * string ;

} cJSON ;

结合这个结构体和上面相关API的调用,其实我们大概可以猜测出cJSON对于Json格式的描述和处理的方法了:

每一个cJSON结构都描述了一项”键-值”对的数据,其中next和prev指针显然是指向同级前后的cJSON结构,而child指针自然是指向孩子节点的cJSON结构。type类型显然是为了区分值的类型而设置的,在cJSON.h文件一开始就定义了这些类型的值:

/* cJSON Types: */
#define cJSON_False 0
#define cJSON_True 1
#define cJSON_NULL 2
#define cJSON_Number 3
#define cJSON_String 4
#define cJSON_Array 5
#define cJSON_Object 6
1
2
3
4
5
6
7
8

/* cJSON Types: */

#define cJSON_False  0

#define cJSON_True   1

#define cJSON_NULL   2

#define cJSON_Number 3

#define cJSON_String 4

#define cJSON_Array  5

#define cJSON_Object 6

很显然通过检测这里的type字段,就很容易知道该节点的类型以及其实际存储数据的字段了。其它的字段是什么意思呢?cJSON.h文件里的注释说的很明白了,valueint,valuedouble以及valuestring保存的是相应的值,string存放的是本字段的名字。

接下来分析程序的执行过程,编译参数加上-g,使用gdb调试程序,画出整个构造过程的函数调用图。具体的调试过程就不细说了,我捡一些关键点说说:

调试过程中,我们发现 cJSON_AddStringToObject() 等其实是宏定义,本质上调用的都是 cJSON_AddItemToObject() 函数,在cJSON.h文件中可以看到如下定义:

#define cJSON_AddNullToObject(object,name) cJSON_AddItemToObject(object, name, cJSON_CreateNull())
#define cJSON_AddTrueToObject(object,name) cJSON_AddItemToObject(object, name, cJSON_CreateTrue())
#define cJSON_AddFalseToObject(object,name) cJSON_AddItemToObject(object, name, cJSON_CreateFalse())
#define cJSON_AddBoolToObject(object,name,b) cJSON_AddItemToObject(object, name, cJSON_CreateBool(b))
#define cJSON_AddNumberToObject(object,name,n) cJSON_AddItemToObject(object, name, cJSON_CreateNumber(n))
#define cJSON_AddStringToObject(object,name,s) cJSON_AddItemToObject(object, name, cJSON_CreateString(s))
1
2
3
4
5
6

#define cJSON_AddNullToObject(object,name)      cJSON_AddItemToObject(object, name, cJSON_CreateNull())

#define cJSON_AddTrueToObject(object,name)      cJSON_AddItemToObject(object, name, cJSON_CreateTrue())

#define cJSON_AddFalseToObject(object,name)     cJSON_AddItemToObject(object, name, cJSON_CreateFalse())

#define cJSON_AddBoolToObject(object,name,b)    cJSON_AddItemToObject(object, name, cJSON_CreateBool(b))

#define cJSON_AddNumberToObject(object,name,n)  cJSON_AddItemToObject(object, name, cJSON_CreateNumber(n))

#define cJSON_AddStringToObject(object,name,s)  cJSON_AddItemToObject(object, name, cJSON_CreateString(s))

另外 cJSON_CreateNull() 等函数都是调用 cJSON_New_Item() 函数申请到初始化为0的空间构造相关的节点信息。构造过程中的函数调用图如下:

构造的Json字符串最终在内存中形成的结构如下图所示:

构造过程相对来说比较简单,数组类型这里没有涉及到,但是分析起来也很简单。

我们最后调用 cJSON_Print()
函数生成这个结构所对应的字符串。生成说起来容易,遍历起整个结构并进行字符串格式控制却比较繁琐。这里相关的代码还有递归清理这个内存结构的函数不再赘述,有兴趣的同学请自行研究。

构造的过程我们就说到这里,明天我们研究下解析的过程。


昨天简单的分析了一下cJSON对Json格式的构造过程,今天仔细读了读README文件,发现README其实说的已经很详细了。重复造轮子就重复造轮子吧,今天我们再一起分析解析的过程。

继续用之前构造的Json格式来进行解析,之前分析构造函数的时候,我们只是简单的分析了几个cJSON结构的构造过程,并没有涉及到各种类型的数组等构造。因为我觉得理解了一般的构造过程,更复杂的类型自己再简单看看源码,画画图就很容易理解。

 

学习一个事物一定要先抓住主线,先掌握一个事物最常用的那50%,其他的边边角角完全可以留给实践去零敲碎打(孟岩语)。

闲话打住,先上一段解析使用的代码:

#include <stdio.h>
#include <stdlib.h>
  
#include "cJSON.h"
  
int main(int argc, char *argv[])
{
  char *text = "{\"name\": \"Jack (\\\"Bee\\\") Nimble\", "
   "\"format\": {\"type\": \"rect\", "
   "\"width\": 1920, \"interlace\": false}}";
  
  cJSON *root = cJSON_Parse(text);
  if (!root) {
    printf("Error before: [%s]\n", cJSON_GetErrorPtr());
    return EXIT_FAILURE;
  }
  
  char *out = cJSON_Print(root);
  printf("text:\n%s\n\n", out);
  free(out);
  
  char *name = cJSON_GetObjectItem(root, "name")->valuestring;
  printf("name : %s\n", name);
  cJSON *format = cJSON_GetObjectItem(root, "format");
  int width = cJSON_GetObjectItem(format, "width")->valueint;
  printf("width : %d\n", width);
  
  cJSON_Delete(root);
  
  return EXIT_SUCCESS;
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

#include <stdio.h>

#include <stdlib.h>

#include "cJSON.h"

int main ( int argc , char * argv [ ] )

{

char * text = "{\"name\": \"Jack (\\\"Bee\\\") Nimble\", "

"\"format\": {\"type\": \"rect\", "

"\"width\": 1920, \"interlace\": false}}" ;

cJSON * root = cJSON_Parse ( text ) ;

if ( ! root ) {

printf ( "Error before: [%s]\n" , cJSON_GetErrorPtr ( ) ) ;

return EXIT_FAILURE ;

}

char * out = cJSON_Print ( root ) ;

printf ( "text:\n%s\n\n" , out ) ;

free ( out ) ;

char * name = cJSON_GetObjectItem ( root , "name" ) -> valuestring ;

printf ( "name : %s\n" , name ) ;

cJSON * format = cJSON_GetObjectItem ( root , "format" ) ;

int width = cJSON_GetObjectItem ( format , "width" ) -> valueint ;

printf ( "width : %d\n" , width ) ;

cJSON_Delete ( root ) ;

return EXIT_SUCCESS ;

}

程序运行输出:

text:
{
  "name": "Jack (\"Bee\") Nimble",
  "format":{
    "type": "rect",
    "width": 1920,
    "interlace": false
  }
}
  
name : Jack ("Bee") Nimble
width : 1920
1
2
3
4
5
6
7
8
9
10
11
12
text :
{

"name" : "Jack (\"Bee\") Nimble" ,

"format" : {
"type" : "rect" ,
"width" : 1920 ,

"interlace" : false

}
}

name : Jack ( "Bee" ) Nimble

width : 1920

从这段代码中可以看到,解析过程就 cJSON_Parse() 一个接口,调用成功返回cJSON结构体的指针,错误返回NULL,此时调用 cJSON_GetErrorPtr() 可以得要错误原因的描述字符串。

查看 cJSON_GetErrorPtr() 的源码可以得知,其实错误信息就保存在全局字符串指针ep里。

关键就是对 cJSON_Parse() 过程的分析了,我们带参数-g重新编译代码并下断点开始调试跟踪。

首先 cJSON_Parse() 调用 cJSON_New_Item() 申请一个新的cJSON节点,然后使用函数对输入字符串进行解析(中间使用了 skip() 函数来跳过空格和换行符等字符)。

         parse_value() 函数对输入字符串进行匹配和解析,检测输入数据的类型并调用 parse_string()parse_number()parse_array()parse_object() 等函数进行解析,然后返回结束的位置。

函数调用的关系如下图:

这些函数之间相互调用,传递待解析的字符串直到结束或者遇见错误便返回,最后会构建出一个和之前结构一样的Json内存结构来,解析的过程就完成了。检索过程很简单 cJSON_GetObjectItem()
函数负责进行某个对象的自成员的名字比对和指针的返回。不过要注意这里采用了 cJSON_strcasecmp()
这个无视大小写的字符串比较函数,因为Json格式的键值对的名称不区分大小写。

这样cJSON库的整个构建和解析过程的主干内容就总结出来了,剩下的边边角角可以在这个主线分析结束之后再继续下去,比如Json格式化,解析出来的内存结构复制,从这个内存结构解析出字符串以及这个内存结构的递归删除等等留给大家自己进行吧。

P.S. cJSON_InitHooks()
这个函数不过是cJSON允许用户使用其它的内存申请和释放函数罢了(默认是malloc和free),另外啰嗦一下,这个接口也可以用来检测内存泄露。只要实现malloc和free的包装函数,在其中统计和打印内存申请释放操作就可以了。

若无特别声明,本站文章皆为原创,转载时烦请注明:
转载自
浅墨的博客

cJSON库源码分析的更多相关文章

  1. Redis网络库源码分析(1)之介绍篇

    一.前言 Redis网络库是一个单线程EPOLL模型的网络库,和Memcached使用的libevent相比,它没有那么庞大,代码一共2000多行,因此比较容易分析.其实网上已经有非常多有关这个网络库 ...

  2. springBoot集成Redis遇到的坑(择库)源码分析为什么择库失败

    提示: springboot提供了一套链接redis的api,也就是个jar包,用到的连接类叫做LettuceConnectionConfiguration,所以我们引入pom时是这样的 <de ...

  3. 经典iOS第三方库源码分析 - YYModel

    YYModel介绍 YYModel是一个针对iOS/OSX平台的高性能的Model解析库,是属于YYKit的一个组件,创建是ibireme. 其实在YYModel出现之前,已经有非常多的Model解析 ...

  4. AspNetCore.AsyncInitialization库源码分析

    AspNetCore.AsyncInitialization 这个库是用来实现在asp.net core应用程序启动时异步执行异步任务.可参考:如何在ASP.NET Core程序启动时运行异步任务(2 ...

  5. Redis事件库源码分析

    由于老大在新项目中使用redis的事件库代替了libevent,我也趁着机会读了一遍redis的事件库代码,第一次读到“优美,让人愉快”的代码,加之用xmind制作的类图非常帅,所以留文纪念. Red ...

  6. Redis网络库源码分析(3)之ae.c

    一.aeCreateEventLoop & aeCreateFileEvent 上一篇文章中,我们已经将服务器启动,只是其中有些细节我们跳过了,比如aeCreateEventLoop函数到底做 ...

  7. Redis网络库源码分析(2)之启动服务器

    一.从main开始 main函数定义在server.c中,它的内容如下: //server.c int main() { signal(SIGPIPE, SIG_IGN); //忽略SIGPIPE信号 ...

  8. Redis 专栏(使用介绍、源码分析、常见问题...)

    一.介绍相关 说Redis : 介绍Redis特性,使用场景,使用Jedis操作Redis等. 二.源码分析 1. 数据结构 Redis源码分析(sds):Redis自己封装的C语言字符串类型. Re ...

  9. cJSON源码分析

    JSON (JavaScript Object Notation) 是一种常见使用的轻量级的数据交换格式,既有利于人工读写,也方便于机器的解析和生成. 关于JSON格式的定义,参看网站[1].在该网站 ...

随机推荐

  1. 1091 N-自守数 (15 分)

    如果某个数 K 的平方乘以 N 以后,结果的末尾几位数等于 K,那么就称这个数为“N-自守数”.例如 3×92​2​​=25392,而 25392 的末尾两位正好是 92,所以 92 是一个 3-自守 ...

  2. Scala 中 for 循环 和 generator 的使用例子

    这个例子是,从每个list中,找到age最大的那个node. class Node(vName: String, vAge: Int) { // Entity class var name: Stri ...

  3. 小a的计算器

    链接:https://ac.nowcoder.com/acm/contest/317/A来源:牛客网 小a的数学基础实在太差了,以至于他只会用计算器算数.他的计算器比较特殊,只有+,−,×,/+,−, ...

  4. python爬虫之User-Agent用户信息

    python爬虫之User-Agent用户信息 爬虫是自动的爬取网站信息,实质上我们也只是一段代码,并不是真正的浏览器用户,加上User-Agent(用户代理,简称UA)信息,只是让我们伪装成一个浏览 ...

  5. Python 读取Excel数据 xlrd

    #导入相关模块 from xlrd import open_workbook #打开excel file = open_workbook("test.xlsx") #获取sheet ...

  6. Apache Beam的架构概览

    不多说,直接上干货! Apache Beam是一个开源的数据处理编程库,由Google贡献给Apache的项目,前不久刚刚成为Apache TLP项目.它提供了一个高级的.统一的编程模型,允许我们通过 ...

  7. 一键压测工具改造(locust)

    本文内容来自“天外归云”大神,原文链接http://www.cnblogs.com/LanTianYou/p/5987741.html,目前只对启动脚本做了一些改造,应该说是,不适用powershel ...

  8. vim代码折叠命令

    1. 折叠方式 可用选项 'foldmethod' 来设定折叠方式:set fdm=*****. 有 6 种方法来选定折叠:           manual           手工定义折叠 ind ...

  9. 自定义django admin及其界面

    1.在项目目录下新创建一个app,命名为kingadmin,在templates目录下新建kingadmin目录,用来存放相关页面的模板文件,新建一个templatetags目录,用来存放处理前端模板 ...

  10. [转] EF cannot be tracked because another instance of this type with the same key is already being tracked

    本文转自:http://stackoverflow.com/questions/6033638/an-object-with-the-same-key-already-exists-in-the-ob ...