cJSON库源码分析
本文采用以下协议进行授权: 自由转载-非衍生-保持署名|Creative Commons BY-NC-ND 3.0 ,转载请注明作者及出处。
cJSON是一个超轻巧,携带方便,单文件,简单的可以作为ANSI-C标准的Json格式解析库。
那什么是Json格式?这里照搬度娘百科的说法:
Json(JavaScript Object Notation)
是一种轻量级的数据交换格式。它基于JavaScript(Standard ECMA-262 3rd Edition – December
1999)的一个子集。JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C, C++, C#, Java,
JavaScript, Perl, Python等)。这些特性使JSON成为理想的数据交换语言。易于人阅读和编写,同时也易于机器解析和生成。
更加详细的解释和示例请查看 http://www.json.org/
主页。
其实简单说,Json就是一种信息交换格式,而cJSON其实就是对Json格式的字符串进行构建和解析的一个C语言函数库。
可以在以下地址下载到cJSON的源代码:
http://sourceforge.net/projects/cjson/
__MACOSX目录是提供给Mac OS的源码,我的机器运行的是Fedora 18,所以选择另外一个目录即可。
简单的阅读下README文件,先学习cJSON库的使用方法。若是连库都还不会使用,分析源码就无从谈起了。通过简单的了解,我们得知cJSON库实际上只有cJSON.c和cJSON.h两个文件组成,绝对轻量级。
不过,代码风格貌似有点非主流,先用indent格式化一下代码吧。我个人喜欢K&R风格的代码,使用的indent命令行参数如下:
|
1
|
indent - bad - bli 0 - ce - kr - nsob -- space - after - if -- space - after - while -- space - after - for -- use - tabs - i8 |
格式化之后,代码结构看起来清晰多了。
那么,从何处下手来分析呢?打开代码文件逐行阅读么?当然不是了,有main函数的程序大都是从main函数开始分析,那么没有main函数的纯函数库呢?那就自己写main函数呗。
cJSON作为Json格式的解析库,其主要功能无非就是构建和解析Json格式了,我们先写一个构建Json格式字符串的程序,尽可能的使其用到的类型多一点(事实上README文件里提供了不错的示例代码,我们直接借鉴一下吧)。代码如下:
#include <stdlib.h>
#include "cJSON.h"
int main(int argc, char *argv[])
{
cJSON *root, *fmt;
root = cJSON_CreateObject();
cJSON_AddStringToObject(root, "name", "Jack (\"Bee\") Nimble");
fmt = cJSON_CreateObject();
cJSON_AddItemToObject(root, "format", fmt);
cJSON_AddStringToObject(fmt, "type", "rect");
cJSON_AddNumberToObject(fmt, "width", 1920);
cJSON_AddFalseToObject(fmt, "interlace");
char *result = cJSON_Print(root);
puts(result);
free(result);
cJSON_Delete(root);
return EXIT_SUCCESS;
}
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
|
#include <stdio.h> #include <stdlib.h> #include "cJSON.h" int main ( int argc , char * argv [ ] ) {
cJSON * root , * fmt ; root = cJSON_CreateObject ( ) ; cJSON_AddStringToObject ( root , "name" , "Jack (\"Bee\") Nimble" ) ; fmt = cJSON_CreateObject ( ) ; cJSON_AddItemToObject ( root , "format" , fmt ) ; cJSON_AddStringToObject ( fmt , "type" , "rect" ) ; cJSON_AddNumberToObject ( fmt , "width" , 1920 ) ; cJSON_AddFalseToObject ( fmt , "interlace" ) ; char * result = cJSON_Print ( root ) ; puts ( result ) ; free ( result ) ; cJSON_Delete ( root ) ; return EXIT_SUCCESS ; }
|
编译运行后 ( 编译时注意要链接数学库,参数行要加 -lm) ,运行结果如下:
"name": "Jack (\"Bee\") Nimble",
"format": {
"type": "rect",
"width": 1920,
"interlace": false
}
}
|
1
2
3
4
5
6
7
8
|
{
"name" : "Jack (\"Bee\") Nimble" , "format" : {
"type" : "rect" , "width" : 1920 , "interlace" : false }
}
|
打开cJSON.h这个头文件,我们可以看到每一个节点,实际上都是由cJSON这个结构体来描述的:
struct cJSON *next, *prev;
struct cJSON *child;
int type;
char *valuestring;
int valueint;
double valuedouble;
char *string;
} cJSON;
|
1
2
3
4
5
6
7
8
9
10
11
12
|
typedef struct cJSON { struct cJSON * next , * prev ; struct cJSON * child ; int type ;
char * valuestring ; int valueint ; double valuedouble ; char * string ; } cJSON ;
|
结合这个结构体和上面相关API的调用,其实我们大概可以猜测出cJSON对于Json格式的描述和处理的方法了:
每一个cJSON结构都描述了一项”键-值”对的数据,其中next和prev指针显然是指向同级前后的cJSON结构,而child指针自然是指向孩子节点的cJSON结构。type类型显然是为了区分值的类型而设置的,在cJSON.h文件一开始就定义了这些类型的值:
#define cJSON_False 0
#define cJSON_True 1
#define cJSON_NULL 2
#define cJSON_Number 3
#define cJSON_String 4
#define cJSON_Array 5
#define cJSON_Object 6
|
1
2
3
4
5
6
7
8
|
/* cJSON Types: */ #define cJSON_False 0 #define cJSON_True 1 #define cJSON_NULL 2 #define cJSON_Number 3 #define cJSON_String 4 #define cJSON_Array 5 #define cJSON_Object 6 |
很显然通过检测这里的type字段,就很容易知道该节点的类型以及其实际存储数据的字段了。其它的字段是什么意思呢?cJSON.h文件里的注释说的很明白了,valueint,valuedouble以及valuestring保存的是相应的值,string存放的是本字段的名字。
接下来分析程序的执行过程,编译参数加上-g,使用gdb调试程序,画出整个构造过程的函数调用图。具体的调试过程就不细说了,我捡一些关键点说说:
调试过程中,我们发现 cJSON_AddStringToObject() 等其实是宏定义,本质上调用的都是 cJSON_AddItemToObject() 函数,在cJSON.h文件中可以看到如下定义:
#define cJSON_AddTrueToObject(object,name) cJSON_AddItemToObject(object, name, cJSON_CreateTrue())
#define cJSON_AddFalseToObject(object,name) cJSON_AddItemToObject(object, name, cJSON_CreateFalse())
#define cJSON_AddBoolToObject(object,name,b) cJSON_AddItemToObject(object, name, cJSON_CreateBool(b))
#define cJSON_AddNumberToObject(object,name,n) cJSON_AddItemToObject(object, name, cJSON_CreateNumber(n))
#define cJSON_AddStringToObject(object,name,s) cJSON_AddItemToObject(object, name, cJSON_CreateString(s))
|
1
2
3
4
5
6
|
#define cJSON_AddNullToObject(object,name) cJSON_AddItemToObject(object, name, cJSON_CreateNull()) #define cJSON_AddTrueToObject(object,name) cJSON_AddItemToObject(object, name, cJSON_CreateTrue()) #define cJSON_AddFalseToObject(object,name) cJSON_AddItemToObject(object, name, cJSON_CreateFalse()) #define cJSON_AddBoolToObject(object,name,b) cJSON_AddItemToObject(object, name, cJSON_CreateBool(b)) #define cJSON_AddNumberToObject(object,name,n) cJSON_AddItemToObject(object, name, cJSON_CreateNumber(n)) #define cJSON_AddStringToObject(object,name,s) cJSON_AddItemToObject(object, name, cJSON_CreateString(s)) |
另外 cJSON_CreateNull() 等函数都是调用 cJSON_New_Item() 函数申请到初始化为0的空间构造相关的节点信息。构造过程中的函数调用图如下:

构造的Json字符串最终在内存中形成的结构如下图所示:

构造过程相对来说比较简单,数组类型这里没有涉及到,但是分析起来也很简单。
我们最后调用 cJSON_Print()
函数生成这个结构所对应的字符串。生成说起来容易,遍历起整个结构并进行字符串格式控制却比较繁琐。这里相关的代码还有递归清理这个内存结构的函数不再赘述,有兴趣的同学请自行研究。
构造的过程我们就说到这里,明天我们研究下解析的过程。
昨天简单的分析了一下cJSON对Json格式的构造过程,今天仔细读了读README文件,发现README其实说的已经很详细了。重复造轮子就重复造轮子吧,今天我们再一起分析解析的过程。
继续用之前构造的Json格式来进行解析,之前分析构造函数的时候,我们只是简单的分析了几个cJSON结构的构造过程,并没有涉及到各种类型的数组等构造。因为我觉得理解了一般的构造过程,更复杂的类型自己再简单看看源码,画画图就很容易理解。
学习一个事物一定要先抓住主线,先掌握一个事物最常用的那50%,其他的边边角角完全可以留给实践去零敲碎打(孟岩语)。
闲话打住,先上一段解析使用的代码:
#include <stdlib.h>
#include "cJSON.h"
int main(int argc, char *argv[])
{
char *text = "{\"name\": \"Jack (\\\"Bee\\\") Nimble\", "
"\"format\": {\"type\": \"rect\", "
"\"width\": 1920, \"interlace\": false}}";
cJSON *root = cJSON_Parse(text);
if (!root) {
printf("Error before: [%s]\n", cJSON_GetErrorPtr());
return EXIT_FAILURE;
}
char *out = cJSON_Print(root);
printf("text:\n%s\n\n", out);
free(out);
char *name = cJSON_GetObjectItem(root, "name")->valuestring;
printf("name : %s\n", name);
cJSON *format = cJSON_GetObjectItem(root, "format");
int width = cJSON_GetObjectItem(format, "width")->valueint;
printf("width : %d\n", width);
cJSON_Delete(root);
return EXIT_SUCCESS;
}
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
|
#include <stdio.h> #include <stdlib.h> #include "cJSON.h" int main ( int argc , char * argv [ ] ) {
char * text = "{\"name\": \"Jack (\\\"Bee\\\") Nimble\", " "\"format\": {\"type\": \"rect\", " "\"width\": 1920, \"interlace\": false}}" ; cJSON * root = cJSON_Parse ( text ) ; if ( ! root ) {
printf ( "Error before: [%s]\n" , cJSON_GetErrorPtr ( ) ) ; return EXIT_FAILURE ; }
char * out = cJSON_Print ( root ) ; printf ( "text:\n%s\n\n" , out ) ; free ( out ) ;
char * name = cJSON_GetObjectItem ( root , "name" ) -> valuestring ; printf ( "name : %s\n" , name ) ; cJSON * format = cJSON_GetObjectItem ( root , "format" ) ; int width = cJSON_GetObjectItem ( format , "width" ) -> valueint ; printf ( "width : %d\n" , width ) ; cJSON_Delete ( root ) ; return EXIT_SUCCESS ; }
|
程序运行输出:
{
"name": "Jack (\"Bee\") Nimble",
"format":{
"type": "rect",
"width": 1920,
"interlace": false
}
}
name : Jack ("Bee") Nimble
width : 1920
|
1
2
3
4
5
6
7
8
9
10
11
12
|
text :
{
"name" : "Jack (\"Bee\") Nimble" , "format" : {
"type" : "rect" ,
"width" : 1920 ,
"interlace" : false }
}
name : Jack ( "Bee" ) Nimble width : 1920
|
从这段代码中可以看到,解析过程就 cJSON_Parse() 一个接口,调用成功返回cJSON结构体的指针,错误返回NULL,此时调用 cJSON_GetErrorPtr() 可以得要错误原因的描述字符串。
查看 cJSON_GetErrorPtr() 的源码可以得知,其实错误信息就保存在全局字符串指针ep里。
关键就是对 cJSON_Parse() 过程的分析了,我们带参数-g重新编译代码并下断点开始调试跟踪。
首先 cJSON_Parse() 调用 cJSON_New_Item() 申请一个新的cJSON节点,然后使用函数对输入字符串进行解析(中间使用了 skip() 函数来跳过空格和换行符等字符)。
parse_value() 函数对输入字符串进行匹配和解析,检测输入数据的类型并调用 parse_string() 、 parse_number() 、 parse_array() 、 parse_object() 等函数进行解析,然后返回结束的位置。
函数调用的关系如下图:

这些函数之间相互调用,传递待解析的字符串直到结束或者遇见错误便返回,最后会构建出一个和之前结构一样的Json内存结构来,解析的过程就完成了。检索过程很简单 cJSON_GetObjectItem()
函数负责进行某个对象的自成员的名字比对和指针的返回。不过要注意这里采用了 cJSON_strcasecmp()
这个无视大小写的字符串比较函数,因为Json格式的键值对的名称不区分大小写。
这样cJSON库的整个构建和解析过程的主干内容就总结出来了,剩下的边边角角可以在这个主线分析结束之后再继续下去,比如Json格式化,解析出来的内存结构复制,从这个内存结构解析出字符串以及这个内存结构的递归删除等等留给大家自己进行吧。
P.S. cJSON_InitHooks()
这个函数不过是cJSON允许用户使用其它的内存申请和释放函数罢了(默认是malloc和free),另外啰嗦一下,这个接口也可以用来检测内存泄露。只要实现malloc和free的包装函数,在其中统计和打印内存申请释放操作就可以了。
若无特别声明,本站文章皆为原创,转载时烦请注明:
转载自
浅墨的博客
cJSON库源码分析的更多相关文章
- Redis网络库源码分析(1)之介绍篇
一.前言 Redis网络库是一个单线程EPOLL模型的网络库,和Memcached使用的libevent相比,它没有那么庞大,代码一共2000多行,因此比较容易分析.其实网上已经有非常多有关这个网络库 ...
- springBoot集成Redis遇到的坑(择库)源码分析为什么择库失败
提示: springboot提供了一套链接redis的api,也就是个jar包,用到的连接类叫做LettuceConnectionConfiguration,所以我们引入pom时是这样的 <de ...
- 经典iOS第三方库源码分析 - YYModel
YYModel介绍 YYModel是一个针对iOS/OSX平台的高性能的Model解析库,是属于YYKit的一个组件,创建是ibireme. 其实在YYModel出现之前,已经有非常多的Model解析 ...
- AspNetCore.AsyncInitialization库源码分析
AspNetCore.AsyncInitialization 这个库是用来实现在asp.net core应用程序启动时异步执行异步任务.可参考:如何在ASP.NET Core程序启动时运行异步任务(2 ...
- Redis事件库源码分析
由于老大在新项目中使用redis的事件库代替了libevent,我也趁着机会读了一遍redis的事件库代码,第一次读到“优美,让人愉快”的代码,加之用xmind制作的类图非常帅,所以留文纪念. Red ...
- Redis网络库源码分析(3)之ae.c
一.aeCreateEventLoop & aeCreateFileEvent 上一篇文章中,我们已经将服务器启动,只是其中有些细节我们跳过了,比如aeCreateEventLoop函数到底做 ...
- Redis网络库源码分析(2)之启动服务器
一.从main开始 main函数定义在server.c中,它的内容如下: //server.c int main() { signal(SIGPIPE, SIG_IGN); //忽略SIGPIPE信号 ...
- Redis 专栏(使用介绍、源码分析、常见问题...)
一.介绍相关 说Redis : 介绍Redis特性,使用场景,使用Jedis操作Redis等. 二.源码分析 1. 数据结构 Redis源码分析(sds):Redis自己封装的C语言字符串类型. Re ...
- cJSON源码分析
JSON (JavaScript Object Notation) 是一种常见使用的轻量级的数据交换格式,既有利于人工读写,也方便于机器的解析和生成. 关于JSON格式的定义,参看网站[1].在该网站 ...
随机推荐
- poj1002 字典树+map+查询单词出现次数
487-3279 Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 309235 Accepted: 55223 Descr ...
- Js与标签属性
关于在JS中设置标签属性 2017-10-09 23:04 by 清风221, 12790 阅读, 0 评论, 收藏, 编辑 Attribute 该属性主要是用来在标签行内样式,添加.删除.获取属性. ...
- oracle 笔记---(四)__数据字典
数据字典 user_* 该视图存储了关于当前用户所拥有的对象的信息.(即所有在该用户模式下的对象) all_* 该试图存储了当前用户能够访问的对象的信息.(与user_*相比,all_* 并不需要拥 ...
- oracle 基础知识(一)
Oracle 用户.权限.角色管理 01.概念 用户:对数据库的访问需要以适当的身份通过验证,这就是用户的作用:每个Oracle用户都有自己的用户名和密码,并且拥有他们所创建的任意表.视图和其他资源, ...
- Python 字典的取值
不能用.取值 .是获取属性或方法 只能用中括号或者get方法 中括号和get中可以放字符串或者变量 get与[]的区别在于当key不存在,get不会报错,而且get可以设置取不到值时返回的默认值.
- (Frontend Newbie)Web三要素(三)
上一篇简单介绍了Web三要素中的层叠样式表,本篇主要介绍三要素中最后一个,也是最难掌握的一个-----JavaScript. JavaScript 老规矩不能破,先简要交代 JavaScript 的历 ...
- 在Spark shell中基于Alluxio进行wordcount交互式分析
Spark是一个分布式内存计算框架,可部署在YARN或者MESOS管理的分布式系统中(Fully Distributed),也可以以Pseudo Distributed方式部署在单个机器上面,还可以以 ...
- Apache Beam的目标
不多说,直接上干货! Apache Beam的目标 统一(UNIFIED) 基于单一的编程模型,能够实现批处理(Batch processing).流处理(Streaming Processing), ...
- 如何将项目部署到远程的Linux机器上的tomcat上
下面来练习一下如何将本地的一个项目部署到远程的Linux机器上去. 第一步:将要部署到Linux机器上的项目打成一个war包 war包有一个好处tomcat可以自动解压 第二步:将打好的war上传到L ...
- Android中的ListView点击时的背景颜色设置
想设置listview中每行在点击.选中等不同状态下有不同的背景颜色,或者背景图片. 这可以用Android的Selector来实现.它可以定义组件在不同状态下的显示方式. 新建一个xml文件list ...