python全栈开发-json和pickle模块(数据的序列化)

一、什么是序列化？

　　我们把对象(变量)从内存中变成可存储或传输的过程称之为序列化，在Python中叫pickling，在其他语言中也被称之为serialization，marshalling，flattening等等，都是一个意思。

　　为什么要序列化？

　　1、持久保存状态

　　需知一个软件/程序的执行就在处理一系列状态的变化，在编程语言中，'状态'会以各种各样有结构的数据类型(也可简单的理解为变量)的形式被保存在内存中。

内存是无法永久保存数据的，当程序运行了一段时间，我们断电或者重启程序，内存中关于这个程序的之前一段时间的数据（有结构）都被清空了。

在断电或重启程序之前将程序当前内存中所有的数据都保存下来（保存到文件中），以便于下次程序执行能够从文件中载入之前的数据，然后继续执行，这就是序列化。

具体的来说，如，虚拟机状态的挂起等。

　　2、跨平台数据交互

序列化之后，不仅可以把序列化后的内容写入磁盘，还可以通过网络传输到别的机器上，如果收发的双方约定好实用一种序列化的格式，那么便打破了平台/语言差异化带来的限制，实现了跨平台数据交互。

反过来，把变量内容从序列化的对象重新读到内存里称之为反序列化，即unpickling。

　　如果我们要在不同的编程语言之间传递对象，就必须把对象序列化为标准格式，比如XML，但更好的方法是序列化为JSON，因为JSON表示出来就是一个字符串，可以被所有语言读取，也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式，并且比XML更快，而且可以直接在Web页面中读取，非常方便。

JSON表示的对象就是标准的JavaScript语言的对象，JSON和Python内置的数据类型对应如下：

二、json序列化

1、dumps序列化和loads反序列化

dumps()序列化

import  json   #导入json模块

info = {

     'name':"qianduoduo",

     "age":22,

}

with open("test.json","w") as f:  #以普通模式写入

f.write(json.dumps(info)) #把内存对象转为字符串

#写到文件中

#test.json文件中的内容

{"name": "qianduoduo", "age": 22}

loads()反序列化

import json   #导入json模块

with open("test.json","r") as f:  #以普通模式读

data = json.loads(f.read())   #用loads反序列化

print(data["age"])     #date.get("age")   一样的

#输出

22

2、dump序列化和load反序列化

dump()序列化

import  json

info = {

    'name':"qianduoduo",

     "age":22

}

with open("test.json","w") as f:   #文件以写的方式打开

　　json.dump(info,f)    #第1个参数是内存的数据对象 ，第2个参数是文件句柄

#test.json文件中的内容

{"name": "qianduoduo", "age": 22}

load()反序列化

import json

with open("text.txt","r") as f:   #以读的方式打开文件

　　data = json.load(f)  #输入文件对象

print(data.get("age"))   #date["age"]

#输出

22

3、序列化函数（不支持的，直接报错）

总结：

　　1、dumps和loads是成对使用的，dump和load是成对使用的。

　　2、dumps和loads由于序列化的是内容，所以后面要加s，但是dump和load序列化的内容是对象，所以单数。

　　3、json只能处理简单的数据类型，例如：字典、列表、字符串等，不能处理函数等复杂的数据类型。

　　为什么不能处理复杂的因为python 和别的语言定义函数，类完全不一样，特性也不一样

　　4、json是所有语言通用的，所有语言都支持json，如果我们需要python跟其他语言进行数据交互，那么就用json格式。

三、pickle序列化

1、dumps序列化和loads反序列化

dumps()序列化

import pickle

info = {

    'name':"qianduoduo",

    "age":22,

}

with open("test.json","wb") as f:   #以二进制的形式写入

　　data = pickle.dumps(info)   #序列化成字符串

　　f.write(data)   #写入text.txt 文件中

#输出到test.json文件中的内容   我们看不懂的二级制

�}q (X   nameqX

qianduoduoqX   ageqKu.

loads()反序列化

import pickle

with open("text.txt","rb") as f: #以二进制的模式读

　　data = pickle.loads(f.read())   #反序列化操作

print(data.get("age"))    #date["age"]  是一样的

#输出

22

2、dump序列化和load反序列化

dump()序列化

import pickle

info = {

    'name':"qianduoduo",

    "age":22,

}

with open("text.txt","wb") as f:

　　pickle.dump(info,f)  #序列化

#输出

�}q (X   nameqX

qianduoduoqX   ageqKu.

load()反序列化

import pickle

with open("text.txt","rb") as f:

　　data = pickle.load(f)  #反序列化成内存对象

print(data.get("age"))     #or   date["age"]  一样的

#输出

22

3、序列化函数

序列化

import pickle

def sayhi(name):   #函数

　　print("hello:",name)

info = {

   'name':"duoduo",

   "age":22,

   "func":sayhi    #"func"对应的值sayhi，是函数名  如果sayhi加()就执行这个函数

}

with open("test.json","wb") as f:

　　data = pickle.dumps(info)

　　f.write(data)

#输出test.json

�}q (X   nameqX

qianduoduoqX   ageqKX   funcqc__main__

sayhi

反序列化

import pickle

def sayhi(name):   #在反序列化中必须写上此函数，不然会报错，因为在加载的时候，函数没有加载到内存

　　print("hello:",name)

with open("test.json","rb") as f:

　　data = pickle.loads(f.read())

　　print(data["age"])

data.get("func")("qianduoduo")  #执行函数sayhi

#输出

22

hello: qianduoduo   #输出的函数体中的逻辑也是可以变的，但是函数名必须要相同，这又是要注意的地方

小结：

　　1、json值支持简单的数据类型，pickle支持python所有的数据类型。

　　2、pickle只能支持python本身的序列化和反序列化，不能用作和其他语言做数据交互，而json可以。

　　3、pickle序列化的是整个的数据对象，所以反序列化函数时，函数体中的逻辑变了，是跟着新的函数体逻辑。

　　4、pickle和json在3.0中只能dump一次和load一次，dump在2.7里面可以dump多次，load多次，anyway，以后只记住，只需要dump一次，load一次就可以了。

Pickle的问题和所有其他编程语言特有的序列化问题一样，就是它只能用于Python，并且可能不同版本的Python彼此都不兼容，因此，只能用Pickle保存那些不重要的数据，不能成功地反序列化也没关系。