Pythoy 数据类型序列化——json&pickle 模块

TOC

  • 什么是序列化/反序列化
  • pickle 模块
  • json 模块
  • 对比json和pickle
  • json.tool 命令行接口

什么是序列化/反序列化?

就是将内存中的数据类型变成可存储或传输的东西,这一过程叫做序列化,在python中叫pickling,在其它语言叫 serialization,marshalling,flattening等,其实base64转码也可叫做序列化,因为很多文本协议如http,smtp都是只支持ascii编码传输。

序列化之后可以将内容写入磁盘,或通过网络传输到其它机器。

反序列化就是序列化的逆过程,unpickling

__Python__提供了两个模块来进行序列化操作,分别是pickle和json

pickle模块

pickle是python语言专属的序列化方式。

pickle模块可以将python中的任何数据类型进行序列化,并序列化为bytes类型。

pickle模块提供的方法

  • dump(obj, fp) 将obj序列化后直接写入fp对象中
  • dumps(obj) 将obj序列化为bytes,方法return该bytes对象
  • load(fp) 从fp中读取序列化bytes对象并反序列化
  • loads(bytes) 将bytes反序列化

    实践:
import pickle
with open('test.pkl', 'wb') as fp: # 注意因为pickle序列化后是bytes所以file-object 能够写入二进制,那么open的打开方式就必须是二进制方式'wb'。
pickle.dump({'a': 1, 'b': 2}, fp) with open('test.txt', 'rb') as fp: # 同样读取也是要是一个binary file-object
print(pickle.load(fp))
  • 助记:dumps带s就是序列化为string,dump不带s就是序列化为string后直接写入fp。load和loads也一样这样记。
  • 如果pickle序列化写入文件,那么这个文件后缀最好用.pkl或.pk,辨识度高

json模块

json不多说,是数据交换的一种格式。叫 json document

json模块方法和pickle类似:

  • dump(obj, fp) 将obj序列化后直接写入fp对象中,由于序列化后的json是字符串,所fp必须是text Stream类型
  • dumps(obj) 将obj序列化为json字符串,方法return该json字符串
  • load(fp) 从fp中读取json并反序列化 ,这个就不要求fp是text Stream类型,也就是从文件中既可以读取bytes,也可以string。
  • loads(obj) 将json反序列化,可以是json的字符串或bytes 或bytearray
  • 注意,tuple元组的序列化会会编程json的array数组,如果再进行deserialize就编程了列表而不是元组。

    实验:
import json

i = 10
s = 'hello world!'
t = (1,)
l = [10, 'hello world!', ['a', 'b'], {'a': 1, 'b': 2}]
d = {'a': 1, 'b': 2, 'c': l} print(json.dumps(i))
print(json.dumps(s))
print(json.dumps(t))
print(json.dumps(l))
print(json.dumps(d)) with open('test.json', 'w') as fp:
json.dump(l, fp) with open('test.json', 'rb') as fp:
print(json.load(fp)) print(json.loads(b'[10, "hello world!", ["a", "b"], {"a": 1, "b": 2}]'))

结果:

10

"hello world!"

[1]

[10, "hello world!", ["a", "b"], {"a": 1, "b": 2}]

{"a": 1, "b": 2, "c": [10, "hello world!", ["a", "b"], {"a": 1, "b": 2}]}

[10, 'hello world!', ['a', 'b'], {'a': 1, 'b': 2}]

[10, 'hello world!', ['a', 'b'], {'a': 1, 'b': 2}]

对比json和pickle

json

  • 在python中一般只能序列化int/str/list/dict
  • 跨语言

pickle

  • 能序列化python任何对象
  • 只能在python中使用

json.tool 命令行接口

json.tool提供在命令行对json字符串进行json格式校验和漂亮打印pretty-print

用法:

:> echo '{"josn": "obj"}' | python -m json.tool

{

"json":"obj"

}

:> python -m json.tool mp_films.json # 后面跟json文件

Pythoy 数据类型序列化——json&pickle 模块的更多相关文章

  1. python之os与json&pickle模块

     一.os模块 简单概述一下os模块就是与操作系统交互的一个接口 import os #os.getcwd() print(os.getcwd()) # 获取到当前工作目录 # 运行结果:E:\pyt ...

  2. [re模块、json&pickle模块]

    [re模块.json&pickle模块] re模块 什么是正则? 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法.或者说:正则就是用来描述一类事物的规则 ...

  3. 20181205(模块循环导入解决方案,json&pickle模块,time,date,random介绍)

    一.补充内容 循环导入 解决方案: 1.将导入的语句挪到后面. ​ 2.将导入语句放入函数,函数在定义阶段不运行 #m1.pyprint('正在导入m1')   #②能够正常打印from m2 imp ...

  4. json/pickle模块(序列化)

    什么叫序列化? 序列化是指把内存里的数据类型转变成字符串,以使其能存储到硬盘或通过网络传输到远程,因为硬盘或网络传输时只能接受bytes 为什么要序列化? 你打游戏过程中,打累了,停下来,关掉游戏.想 ...

  5. day 19 os模块的补充 序列化 json pickle

    os   模块 os.path.abspath  规范绝对路径 os.path.split() 把路径分成两段,第二段是一个文件或者是文件夹 os.path.dirname    取第一部分 os.p ...

  6. 模块 序列化 json pickle shelv xml

    序列化 序列化是指把内存里的数据类型转变成字符串,以使其能存储到硬盘或通过网络传输到远程,因为硬盘或网络传输时只能接受bytes. json 模块 json.dump(d,f) json.load(f ...

  7. Python(正则 Time datatime os sys random json pickle模块)

    正则表达式: import re #导入模块名 p = re.compile(-]代表匹配0至9的任意一个数字, 所以这里的意思是对传进来的字符串进行匹配,如果这个字符串的开头第一个字符是数字,就代表 ...

  8. json&pickle模块

    序列化:我们把对象(变量)从内存中变成可存储或传输的过程称之为序列化 反序列化:把变量内容从序列化的对象重新读到内存中,这一过程称为反序列化 为什么要序列化? 1.持久保存状态 一个软件的执行就是在处 ...

  9. Day 4-5 序列化 json & pickle &shelve

    序列化: 序列化是指把内存里的数据类型转变成字符串,以使其能存储到硬盘或通过网络传输到远程,因为硬盘或网络传输时只能接受bytes. 反序列化: 把字符转成内存里的数据类型. 用于序列化的两个模块.他 ...

随机推荐

  1. Java提高篇(三):内部类和匿名内部类

    一,内部类 其实内部类是十分简单的,我们根据其字里行间的意义就可以知道内部类应该是一个类当中的一个类,相当于一个类进行了嵌套,就如同循环的嵌套一般. 内部类有一个特征:内部类当中可以调用外部类当中的属 ...

  2. SQL基本注入演示

    作者:ZERO 所属团队:Arctic Shell 参考文献:<sql注入攻击与防御> 使用平台:pikachu漏洞练习平台 导语:  在owasp发布的top10排行榜中注入漏洞一直是危 ...

  3. Python程序员为什么一定要掌握Linux?

    不少Python新手经常问到学Python到底需不需要学习Linux? Python不是支持Windows和Linux操作系统吗?能在Windows下开发为什么还要学习Linux? 问这样的问题的朋友 ...

  4. java初见

    public class Diyi{ public static void main(String[] args){ System.out.println("Hello,world" ...

  5. IO复用(较详细)

    进程与线程的描述 一个进程至少会创建一个线程,多个线程共享一个程序进程的内存.程序的运行最终是靠线程来完成操作的.线程的数量跟CPU核数有关,一个核最多能发出两个线程.线程的操作主要分为:一:给CPU ...

  6. Python内置函数(28)——hash

    英文文档: hash(object)Return the hash value of the object (if it has one). Hash values are integers. The ...

  7. Vue生命周期详解

    Vue所有的生命周期钩子自动绑定在this上下文到实例中,因此你可以访问数据,对属性和方法进行运算.这意味着你不能使用箭头函数来定义一个生命周期方法.这是因为箭头函数绑定了父上下文,因此this与你期 ...

  8. Python爬虫入门教程 18-100 煎蛋网XXOO图片抓取

    写在前面 很高兴我这系列的文章写道第18篇了,今天写一个爬虫爱好者特别喜欢的网站煎蛋网http://jandan.net/ooxx,这个网站其实还是有点意思的,网站很多人写了N多的教程了,各种方式的都 ...

  9. Node.js API 初解读(三)

    目录 Node.JS API 初解读三 Node.JS API 初解读三 Version: NodeJs v6.2.0 一. DNS (Domain Name Server) [域名服务器] 1.简介 ...

  10. SSL / TSL 传输加密算法 初解读

    SSL(SecureSocketLayer)是netscape公司提出的主要用于web的安全通信标准,.TLS(TransportLayerSecurity)是IETF的TLS工作组在SSL3.0基础 ...