准备工作

import json

# 准备数据:
d = dict(name = 'Tom',age = 18)
json_str = '{"name":"Tom","age":18}'
# 注:json字符串中的引号必须为双引号,若为单引号会转换出错。

json数据类型和python数据类型的对应关系

  • {} <——> dict
  • [] <——> list
  • "string" <——> "str"或u"unicode"
  • 123.4 <——> int或float
  • true/false <——> True/False
  • null <——> None

常用方法

把字典转换成json字符串

ret = json.dumps(d)
print ret
print type(ret)
{"age": 18, "name": "Tom"}
<type 'str'>

把json字符串转成字典

ret = json.loads(json_str)
print ret
print type(ret)
{u'age': 18, u'name': u'Tom'}
<type 'dict'>

把字典转换成json字符串并写入文件

with open('out.txt','w+') as f:
json.dump(d,f)

从文件中读取一个json字符串并转换为字典

# 文件(out.txt)内容:{"age": 18, "name": "Tom"}
with open('out.txt','r') as f:
ret = json.load(f)
print ret
print type(ret)
{u'age': 18, u'name': u'Tom'}
<type 'dict'>

自定义对象转成json字符串

class Student(object):
def __init__(self,name,age):
self.name = name
self.age = age s = Student('Tom',18)
print json.dumps(s)
# 输出:
# TypeError: <__main__.Student object at 0x7f7ab808cf10> is not JSON serializable

出错原因:Student对象不是一个可序列化为json的对象。

  • 解决方法1:写个转换函数
def student2dict(std):
return {'name':std.name,'age':std.age}
print json.dumps(s,default = student2dict)
{"age": 18, "name": "Tom"}
  • 解决方法2:传入Student对象内置属性:dict
print json.dumps(s,default = lambda obj:obj.__dict__)
{"age": 18, "name": "Tom"}

json字符串转换为自定义对象

def dict2student(d):
return Student(d['name'],d['age'])
ret = json.loads(json_str,object_hook = dict2student)
print ret
print ret.__dict__
print type(ret)
<__main__.Student object at 0x7f7aaa713ad0>
{'age': 18, 'name': u'Tom'}
<class '__main__.Student'>

补充

更好地输出json

json.dumps(json.loads(json_str),indent = 4)  # indent为缩进的字符数
'{\n    "age": 18, \n    "name": "Tom"\n}'

保持json字符串中属性的顺序

from collections import OrderedDict
data = json.loads(json_str,object_pairs_hook = OrderedDict)
print data
OrderedDict([(u'name', u'Tom'), (u'age', 18)])

引申:object_pairs_hook是个什么玩意?

这时候就有疑惑了,这个object_pairs_hoo参数是个什么玩意?为什么加上:object_pairs_hook = OrderedDict这样一个参数,解析的字典就可以有序了?

为了揭开这个谜团,首先去看看json.loads()函数文档,发现文档中对object_pairs_hook参数的描述是这样的:

``object_pairs_hook`` is an optional function that will be called with the
result of any object literal decoded with an ordered list of pairs. The
return value of ``object_pairs_hook`` will be used instead of the ``dict``.
This feature can be used to implement custom decoders that rely on the
order that the key and value pairs are decoded (for example,
collections.OrderedDict will remember the order of insertion). If
``object_hook`` is also defined, the ``object_pairs_hook`` takes priority.

大致意思就是:object_pairs_hook实际上是一个函数对象(钩子函数),它的入参是json文本的有序键值对的列表(ordered list of pairs),返回值是一个经过自定义处理的值,json.loads()函数的返回值也会是这个钩子函数的返回值。

说了半天估计也没看明白,那就实际写个demo试一把,先看最简单的一个demo:

# coding:utf-8
import json def deal_with_pairs(pairs):
'''
自定义的钩子函数,处理从json文本中解析出的有序键值对列表
:param pairs: 从json文本中解析出的有序键值对列表
:return: 自定义的对象
'''
return pairs json_str = '{"a":"111","b":"222"}'
data = json.loads(json_str,object_pairs_hook = deal_with_pairs)
print data

输出:

[(u'a', u'111'), (u'b', u'222')]

可以看出,输出的就是json文本中的有序键值对列表。

下面继续看一个稍微复杂一点的demo:

# coding:utf-8
import json # 存放json中重复的key列表
duplicate_keys = [] def deal_with_pairs(pairs):
'''
自定义的钩子函数,处理从json文本中解析出的有序键值对列表
:param pairs: 从json文本中解析出的有序键值对列表
:return: 自定义的对象
'''
data = {}
for k,v in pairs:
# 如果键已经在data的键中存在了,那么把它添加到duplicate_keys列表
if k in data:
duplicate_keys.append(k)
# 否则添加到data中
else:
data[k] = v return data json_str = '{"a":"111","b":"222","a":"345"}'
data = json.loads(json_str,object_pairs_hook = deal_with_pairs)
print data
print duplicate_keys

输出:

{u'a': u'111', u'b': u'222'}
[u'a']

可以看出,上面这个程序的作用就是找出了json文本中有哪些键是重复的。

最后再来一个嵌套的有重复key的json字符串,来看看效果:

# coding:utf-8
import json # 存放json中重复的key列表
duplicate_keys = [] def deal_with_pairs(pairs):
'''
自定义的钩子函数,处理从json文本中解析出的有序键值对列表
:param pairs: 从json文本中解析出的有序键值对列表
:return: 自定义的对象
'''
print 'pairs is: {0}'.format(pairs)
data = {}
for k,v in pairs:
# 如果键已经在data的键中存在了,那么把它添加到duplicate_keys列表
if k in data:
duplicate_keys.append(k)
# 否则添加到data中
else:
data[k] = v return data json_str = '{"a":"111","b":{"b1":"b111","b2":"b222","b1":"b123"},"a":"345"}'
data = json.loads(json_str,object_pairs_hook = deal_with_pairs)
print data
print duplicate_keys

输出:

pairs is: [(u'b1', u'b111'), (u'b2', u'b222'), (u'b1', u'b123')]
pairs is: [(u'a', u'111'), (u'b', {u'b1': u'b111', u'b2': u'b222'}), (u'a', u'345')]
{u'a': u'111', u'b': {u'b1': u'b111', u'b2': u'b222'}}
[u'b1', u'a']

可以看出这里输出了两个pairs列表,第一个是内层的子json的键值对列表,第二个是外层的json键值对列表。最终查找出来的重复的键有:'b1'和'a',和我们的预期相符。

随机推荐

  1. 第二百零四节,jQuery EasyUI,Dialog(对话框)组件

    jQuery EasyUI,Dialog(对话框)组件 学习要点: 1.加载方式 2.属性列表 3.事件列表 4.方法列表 本节课重点了解EasyUI中Dialog(窗口)组件的使用方法,这个组件依赖 ...

  2. Extjs5 app.js缓冲设置

    在6月2日Extjs5正式版公布后.粗略研究了一下,sencha推荐使用project编译来公布应用.开发过程中用sencha app watch命令就可以生成服务.每建立一个js类,就须要Ctrl+ ...

  3. smartJS 0.1 API 讲解 - PromiseEvent

    上篇简单的介绍smartjs了一些通用方法的api.这篇介绍基础的PromiseEvent(这个名字一直没想好,以前准备用callbacks的,但避免与jquery混淆,st的命名空间可以直接挂到$上 ...

  4. iOS开发之 -- oc和swift下输出乘法口诀表

    闲来无事,写着玩: oc: //乘法口诀表输出 ; i<=; i++) { ; j<=i; j++) { NSLog(@"%dx%d=%d\n",i,j,i*j); } ...

  5. Domino移动Web上传的附件到RichText域

    只是从网上拷贝下来,没有测试. 得到上传文件的路径http://searchdomino.techtarget.com/tip/Trap-an-attachment-path-via-the-Domi ...

  6. 《程序员级别鉴定书》 ----中级.NET开发者

    面向接口.面向对象和面向方面编程区别 面向接口编程 是面向对象编程体系中的思想精髓之一 (博客园文章链接面向接口编程详解(一)——思想基础) 面向接口编程 接口是一组规则集合 面向对象编程 对具有相同 ...

  7. linux时间格式化

    echo `date +'[%Y-%m-%d %H:%M:%S]'`

  8. jQuery.ajax jQuery.post

    $.ajax()函数依赖服务器提供的信息来处理返回的数据.如果服务器报告说返回的数据是XML,那么返回的结果就可以用普通的XML方法或者jQuery的选择器来遍历.如果见得到其他类型,比如HTML,则 ...

  9. phpmail发送邮件

    ---恢复内容开始--- 首先.需要phpmailer的包. 地址:https://github.com/Synchro/PHPMailer 解开压缩包,将class.phpmailer.php,cl ...

  10. 第09章—使用Lombok插件

    spring boot 系列学习记录:http://www.cnblogs.com/jinxiaohang/p/8111057.html 码云源码地址:https://gitee.com/jinxia ...