python全栈开发-json和pickle模块(数据的序列化)
一、什么是序列化?
我们把对象(变量)从内存中变成可存储或传输的过程称之为序列化,在Python中叫pickling,在其他语言中也被称之为serialization,marshalling,flattening等等,都是一个意思。
为什么要序列化?
1、持久保存状态
需知一个软件/程序的执行就在处理一系列状态的变化,在编程语言中,'状态'会以各种各样有结构的数据类型(也可简单的理解为变量)的形式被保存在内存中。
内存是无法永久保存数据的,当程序运行了一段时间,我们断电或者重启程序,内存中关于这个程序的之前一段时间的数据(有结构)都被清空了。
在断电或重启程序之前将程序当前内存中所有的数据都保存下来(保存到文件中),以便于下次程序执行能够从文件中载入之前的数据,然后继续执行,这就是序列化。
具体的来说,如,虚拟机状态的挂起等。
2、跨平台数据交互
序列化之后,不仅可以把序列化后的内容写入磁盘,还可以通过网络传输到别的机器上,如果收发的双方约定好实用一种序列化的格式,那么便打破了平台/语言差异化带来的限制,实现了跨平台数据交互。
反过来,把变量内容从序列化的对象重新读到内存里称之为反序列化,即unpickling。
如果我们要在不同的编程语言之间传递对象,就必须把对象序列化为标准格式,比如XML,但更好的方法是序列化为JSON,因为JSON表示出来就是一个字符串,可以被所有语言读取,也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式,并且比XML更快,而且可以直接在Web页面中读取,非常方便。
JSON表示的对象就是标准的JavaScript语言的对象,JSON和Python内置的数据类型对应如下:

二、json序列化
1、dumps序列化和loads反序列化
dumps()序列化
import json #导入json模块
info = {
'name':"qianduoduo",
"age":22,
}
with open("test.json","w") as f: #以普通模式写入
f.write(json.dumps(info)) #把内存对象转为字符串
#写到文件中
#test.json文件中的内容
{"name": "qianduoduo", "age": 22}
loads()反序列化
import json #导入json模块
with open("test.json","r") as f: #以普通模式读
data = json.loads(f.read()) #用loads反序列化
print(data["age"]) #date.get("age") 一样的
#输出
22
2、dump序列化和load反序列化
dump()序列化
import json
info = {
'name':"qianduoduo",
"age":22
}
with open("test.json","w") as f: #文件以写的方式打开
json.dump(info,f) #第1个参数是内存的数据对象 ,第2个参数是文件句柄
#test.json文件中的内容
{"name": "qianduoduo", "age": 22}
load()反序列化
import json
with open("text.txt","r") as f: #以读的方式打开文件
data = json.load(f) #输入文件对象
print(data.get("age")) #date["age"]
#输出
22
3、序列化函数(不支持的,直接报错)
总结:
1、dumps和loads是成对使用的,dump和load是成对使用的。
2、dumps和loads由于序列化的是内容,所以后面要加s,但是dump和load序列化的内容是对象,所以单数。
3、json只能处理简单的数据类型,例如:字典、列表、字符串等,不能处理函数等复杂的数据类型。
为什么不能处理复杂的因为python 和别的语言定义函数,类完全不一样,特性也不一样
4、json是所有语言通用的,所有语言都支持json,如果我们需要python跟其他语言进行数据交互,那么就用json格式。

三、pickle序列化
1、dumps序列化和loads反序列化
dumps()序列化
import pickle
info = {
'name':"qianduoduo",
"age":22,
}
with open("test.json","wb") as f: #以二进制的形式写入
data = pickle.dumps(info) #序列化成字符串
f.write(data) #写入text.txt 文件中
#输出到test.json文件中的内容 我们看不懂的二级制
�}q (X nameqX
qianduoduoqX ageqKu.
loads()反序列化
import pickle
with open("text.txt","rb") as f: #以二进制的模式读
data = pickle.loads(f.read()) #反序列化操作
print(data.get("age")) #date["age"] 是一样的
#输出
22
2、dump序列化和load反序列化
dump()序列化
import pickle
info = {
'name':"qianduoduo",
"age":22,
}
with open("text.txt","wb") as f:
pickle.dump(info,f) #序列化
#输出
�}q (X nameqX
qianduoduoqX ageqKu.
load()反序列化
import pickle
with open("text.txt","rb") as f:
data = pickle.load(f) #反序列化成内存对象
print(data.get("age")) #or date["age"] 一样的
#输出
22
3、序列化函数
序列化
import pickle def sayhi(name): #函数
print("hello:",name)
info = {
'name':"duoduo",
"age":22,
"func":sayhi #"func"对应的值sayhi,是函数名 如果sayhi加()就执行这个函数
}
with open("test.json","wb") as f:
data = pickle.dumps(info)
f.write(data)
#输出test.json
�}q (X nameqX
qianduoduoqX ageqKX funcqc__main__
sayhi
反序列化
import pickle def sayhi(name): #在反序列化中必须写上此函数,不然会报错,因为在加载的时候,函数没有加载到内存
print("hello:",name) with open("test.json","rb") as f:
data = pickle.loads(f.read())
print(data["age"])
data.get("func")("qianduoduo") #执行函数sayhi
#输出
22
hello: qianduoduo #输出的函数体中的逻辑也是可以变的,但是函数名必须要相同,这又是要注意的地方
小结:
1、json值支持简单的数据类型,pickle支持python所有的数据类型。
2、pickle只能支持python本身的序列化和反序列化,不能用作和其他语言做数据交互,而json可以。
3、pickle序列化的是整个的数据对象,所以反序列化函数时,函数体中的逻辑变了,是跟着新的函数体逻辑。
4、pickle和json在3.0中只能dump一次和load一次,dump在2.7里面可以dump多次,load多次,anyway,以后只记住,只需要dump一次,load一次就可以了。

Pickle的问题和所有其他编程语言特有的序列化问题一样,就是它只能用于Python,并且可能不同版本的Python彼此都不兼容,因此,只能用Pickle保存那些不重要的数据,不能成功地反序列化也没关系。
python全栈开发-json和pickle模块(数据的序列化)的更多相关文章
- Python全栈开发【re正则模块】
re正则模块 本节内容: 正则介绍 元字符及元字符集 元字符转义符 re模块下的常用方法 正则介绍(re) 正则表达式(或 RE)是一种小型的.高度专业化的编程语言. 在Python中,它内嵌在Pyt ...
- python全栈开发 * 线程锁 Thread 模块 其他 * 180730
一,线程Thread模块1.效率更高(相对于进程) import time from multiprocessing import Process from threading import Thre ...
- python 全栈开发,Day31(re模块)
回顾昨天的内容 异常处理 try except 一定要在except之后写一些提示或者处理的内容 try: '''可能会出现异常的代码''' except ValueError: '''打印一些提示或 ...
- python 全栈开发,Day6(is,小数据池,编码转换)
一.is a = 100 b = 100 print(a == b) print(a is b) 执行输出: TrueTrue 查看内存地址,使用id函数 print(id(a)) print(id( ...
- python全栈开发_day17_时间,系统模板和序列化
一:时间模板 1)time 常用功能: time.sleep() time.time() time.strftime() import time print(time.strftime("% ...
- python全栈开发学习_内容目录及链接
python全栈开发学习_day1_计算机五大组成部分及操作系统 python全栈开发学习_day2_语言种类及变量 python全栈开发_day3_数据类型,输入输出及运算符 python全栈开发_ ...
- Python全栈开发【模块】
Python全栈开发[模块] 本节内容: 模块介绍 time random os sys json & picle shelve XML hashlib ConfigParser loggin ...
- python全栈开发中级班全程笔记(第二模块、第四章)(常用模块导入)
python全栈开发笔记第二模块 第四章 :常用模块(第二部分) 一.os 模块的 详解 1.os.getcwd() :得到当前工作目录,即当前python解释器所在目录路径 impor ...
- python全栈开发中级班全程笔记(第二模块、第四章(三、re 正则表达式))
python全栈开发笔记第二模块 第四章 :常用模块(第三部分) 一.正则表达式的作用与方法 正则表达式是什么呢?一个问题带来正则表达式的重要性和作用 有一个需求 : 从文件中读取所有联 ...
随机推荐
- FJUT16级第一周寒假作业题解D题
题目链接:http://210.34.193.66:8080/vj/Contest.jsp?cid=160#P3 第八集,体能训练 TimeLimit:1000MS MemoryLimit:128M ...
- 关于各种文件用Editplus的方式打开出现“向程序发送命令时出现问题”的解决方法
其实网上有很多解决方法,但是我试过都没有用. 我出现这个错误的原因是因为我的Editplus是以管理员的方式运行的,所以解决的办法有两种: 一.修改Editplus的兼容性,方法如下: 首先在Edit ...
- python趣味——与MS系列编译器一样强大的Unicode变量名支持
中文变量名,中文函数名,中文类名等,可惜Python2不支持,但在Python3时代,这些都可以完美支持了. def 中文函数(): return 1
- 来自后端的突袭? --浅尝最新开源的C# Web引擎 Blazor
在今年年初, 恰逢新春佳节临近的时候. 微软给全球的C#开发者们, 着实的送上了一分惊喜. 微软正式开源Blazor ,将.NET带回到浏览器. 这个小惊喜, 迅速的在dotnet开发者中间传开了. ...
- 1-1 maven 学习笔记(1-6章)
一.基础概念 1.Maven作为Apache组织中颇为成功的开源项目,主要服务于基于Java平台的项目构建,依赖管理和项目信息管理.从清理,编译,测试到生成报告,到打包部署,自动化构建过程. 还可以跨 ...
- javascript - 个人笔记汇总
1. onSubmit = "return function ()"; 2. <input type="text" name="fname&q ...
- 【Python】 Selenium 模拟浏览器 寻路
selenium 最开始我碰到SE,是上学期期末,我们那个商务小组做田野调查时发的问卷的事情.当时在问卷星上发了个问卷,但是当时我对另外几个组员的做法颇有微词,又恰好开始学一些软件知识了,就想恶作剧( ...
- 在用jQuery时遇到的小问题
1. class类名问题? 在我在class ='看看(2)' ,凡是这样的居然给自身加其他style样式,居然添加不上,后来改成其他类名不带括号里的,居然好了. 2. line-height 引入的 ...
- c++ --> cin和cout输入输出格式
cin和cout输入输出格式 Cout 输出 1>. bool型输出 cout << true <<" or " << false < ...
- 如何在C#项目中使用NHibernate
现代化大型项目通常使用独立的数据库来存储数据,其中以采用关系型数据库居多.用于开发项目的高级语言(C#.Java等)是面向对象的,而关系型数据库是基于关系的,两者之间的沟通需要一种转换,也就是对象/关 ...