准备工作

import json

# 准备数据：

d = dict(name = 'Tom',age = 18)

json_str = '{"name":"Tom","age":18}'

# 注：json字符串中的引号必须为双引号，若为单引号会转换出错。

json数据类型和python数据类型的对应关系

{} <——> dict
[] <——> list
"string" <——> "str"或u"unicode"
123.4 <——> int或float
true/false <——> True/False
null <——> None

常用方法

把字典转换成json字符串

ret = json.dumps(d)

print ret

print type(ret)

{"age": 18, "name": "Tom"}

<type 'str'>

把json字符串转成字典

ret = json.loads(json_str)

print ret

print type(ret)

{u'age': 18, u'name': u'Tom'}

<type 'dict'>

把字典转换成json字符串并写入文件

with open('out.txt','w+') as f:

    json.dump(d,f)

从文件中读取一个json字符串并转换为字典

# 文件(out.txt)内容：{"age": 18, "name": "Tom"}

with open('out.txt','r') as f:

    ret = json.load(f)

    print ret

    print type(ret)

{u'age': 18, u'name': u'Tom'}

<type 'dict'>

自定义对象转成json字符串

class Student(object):

    def __init__(self,name,age):

        self.name = name

        self.age = age

s = Student('Tom',18)

print json.dumps(s)

#　输出：

# TypeError: <__main__.Student object at 0x7f7ab808cf10> is not JSON serializable

出错原因：Student对象不是一个可序列化为json的对象。

解决方法1：写个转换函数

def student2dict(std):

    return {'name':std.name,'age':std.age}

print json.dumps(s,default = student2dict)

{"age": 18, "name": "Tom"}

解决方法2：传入Student对象内置属性：dict

print json.dumps(s,default = lambda obj:obj.__dict__)

{"age": 18, "name": "Tom"}

json字符串转换为自定义对象

def dict2student(d):

    return Student(d['name'],d['age'])

ret = json.loads(json_str,object_hook = dict2student)

print ret

print ret.__dict__

print type(ret)

<__main__.Student object at 0x7f7aaa713ad0>

{'age': 18, 'name': u'Tom'}

<class '__main__.Student'>

补充

更好地输出json

json.dumps(json.loads(json_str),indent = 4)  # indent为缩进的字符数

'{\n    "age": 18, \n    "name": "Tom"\n}'

保持json字符串中属性的顺序

from collections import OrderedDict

data = json.loads(json_str,object_pairs_hook = OrderedDict)

print data

OrderedDict([(u'name', u'Tom'), (u'age', 18)])

引申：object_pairs_hook是个什么玩意？

这时候就有疑惑了，这个object_pairs_hoo参数是个什么玩意？为什么加上：object_pairs_hook = OrderedDict这样一个参数，解析的字典就可以有序了？

为了揭开这个谜团，首先去看看json.loads()函数文档，发现文档中对object_pairs_hook参数的描述是这样的：

``object_pairs_hook`` is an optional function that will be called with the

    result of any object literal decoded with an ordered list of pairs.  The

    return value of ``object_pairs_hook`` will be used instead of the ``dict``.

    This feature can be used to implement custom decoders that rely on the

    order that the key and value pairs are decoded (for example,

    collections.OrderedDict will remember the order of insertion). If

    ``object_hook`` is also defined, the ``object_pairs_hook`` takes priority.

大致意思就是：object_pairs_hook实际上是一个函数对象（钩子函数），它的入参是json文本的有序键值对的列表（ordered list of pairs），返回值是一个经过自定义处理的值，json.loads()函数的返回值也会是这个钩子函数的返回值。

说了半天估计也没看明白，那就实际写个demo试一把，先看最简单的一个demo：

# coding:utf-8

import json

def deal_with_pairs(pairs):

    '''

    自定义的钩子函数，处理从json文本中解析出的有序键值对列表

    :param pairs: 从json文本中解析出的有序键值对列表

    :return: 自定义的对象

    '''

    return pairs

json_str = '{"a":"111","b":"222"}'

data = json.loads(json_str,object_pairs_hook = deal_with_pairs)

print data

输出：

[(u'a', u'111'), (u'b', u'222')]

可以看出，输出的就是json文本中的有序键值对列表。

下面继续看一个稍微复杂一点的demo：

# coding:utf-8

import json

# 存放json中重复的key列表

duplicate_keys = []

def deal_with_pairs(pairs):

    '''

    自定义的钩子函数，处理从json文本中解析出的有序键值对列表

    :param pairs: 从json文本中解析出的有序键值对列表

    :return: 自定义的对象

    '''

    data = {}

    for k,v in pairs:

        # 如果键已经在data的键中存在了，那么把它添加到duplicate_keys列表

        if k in data:

            duplicate_keys.append(k)

        # 否则添加到data中

        else:

            data[k] = v

    return data

json_str = '{"a":"111","b":"222","a":"345"}'

data = json.loads(json_str,object_pairs_hook = deal_with_pairs)

print data

print duplicate_keys

输出：

{u'a': u'111', u'b': u'222'}

[u'a']

可以看出，上面这个程序的作用就是找出了json文本中有哪些键是重复的。

最后再来一个嵌套的有重复key的json字符串，来看看效果：

# coding:utf-8

import json

# 存放json中重复的key列表

duplicate_keys = []

def deal_with_pairs(pairs):

    '''

    自定义的钩子函数，处理从json文本中解析出的有序键值对列表

    :param pairs: 从json文本中解析出的有序键值对列表

    :return: 自定义的对象

    '''

    print 'pairs is: {0}'.format(pairs)

    data = {}

    for k,v in pairs:

        # 如果键已经在data的键中存在了，那么把它添加到duplicate_keys列表

        if k in data:

            duplicate_keys.append(k)

        # 否则添加到data中

        else:

            data[k] = v

    return data

json_str = '{"a":"111","b":{"b1":"b111","b2":"b222","b1":"b123"},"a":"345"}'

data = json.loads(json_str,object_pairs_hook = deal_with_pairs)

print data

print duplicate_keys

输出：

pairs is: [(u'b1', u'b111'), (u'b2', u'b222'), (u'b1', u'b123')]

pairs is: [(u'a', u'111'), (u'b', {u'b1': u'b111', u'b2': u'b222'}), (u'a', u'345')]

{u'a': u'111', u'b': {u'b1': u'b111', u'b2': u'b222'}}

[u'b1', u'a']

可以看出这里输出了两个pairs列表，第一个是内层的子json的键值对列表，第二个是外层的json键值对列表。最终查找出来的重复的键有：'b1'和'a'，和我们的预期相符。

随机推荐

图像处理之拼接---图像拼接opencv
基于SURF特征的图像与视频拼接技术的研究和实现(一) 一直有计划研究实时图像拼接,但是直到最近拜读西电2013年张亚娟的<基于SURF特征的图像与视频拼接技术的研究和实现>,条 ...
linux 知识点拾遗
文件名称在 Linux 底下,每个档案或文件夹的文件名称最长能够到达 255 的字符,加上完整路径时,最长可达 4096 个字符; 因为 Linux 在文字接口下的一些指令操作关系,一般来说,您在设 ...
cinder服务端的keystone认证机制
keystone在openstack中的地位 Keystone作为OpenStack中的身份管理与授权模块,主要实现系统用户的身份认证.基于角色的授权管理.其他OpenStack服务的地址发现和安全策 ...
Windows下通过Composer安装Yii2
安装好大于5.4或更高版本的PHP环境并开启openssl扩展.如果是Apache服务器,加载Apache的mod_ssl模块. 下载Composer并安装. 开始->运行[或者WIN+R]-& ...
Linux初学者学习资料
鸟哥的Linux私房菜 http://vbird.dic.ksu.edu.tw/linux_basic/linux_basic.php
高并发分布式系统如何做到唯一Id
又一个多月没冒泡了,其实最近学了些东西,但是没有安排时间整理成博文,后续再奉上.最近还写了一个发邮件的组件以及性能测试请看 <NET开发邮件发送功能的全面教程(含邮件组件源码)> ,还弄了 ...
.NET中的枚举用法浅析
本文简单分析了.NET中的枚举用法.分享给大家供大家参考.具体分析如下: 我理解的枚举就是编程中约定的一个“可选值”:例如QQ的在线状态,分别有在线,Q我吧,隐身,忙碌等等...我觉得这就是一 ...
js转译html标签
api返回的接口数据是这样的"<div>测试数据</div>" js拼接html时会过滤掉<div></div> 所以需要对< ...
Laravel5.1 分页展示
Laravel为我们提供了一套分页的逻辑,我们无需自己实现分页逻辑,只需要执行几个简单的方法就能实现漂亮的分页. 1 simplePaginate 这是一种只显示上一页下一页的样式分页,我们来看看怎么 ...
解决百度地图Fragment切换黑屏问题
https://blog.csdn.net/rentalphang/article/details/52076330 轻松解决啦!

$ python-json模块的基本用法