序列化

什么是序列化

序列化是将字典、列表等数据类型转化成一个字符串的过程

序列化的目的

1. 以某种存储形式使自定义对象持久化（存储）

2. 将对象从一个地方传递到另一个我地方（传输）

3. 使程序更具维护性

json模块

json是很多语言通用的一种数据标准，json可以转化的数据类型包括：str int bool dict list(tuple) None

json模块有四种方法：dumps， loads, dump, load

dumps和loads

处理列表

import json

lst = [1, 2, "a", "哈哈"]

s = json.dumps(lst, ensure_ascii=False)   # 包含非ascii字符时要加上ensure_ascii=False

print(s[0])      # [ 可以像字符串一样取值

print(s[1])     #

print(s[1:8])     # 也可以切片  1, 2, "  注意列表元素之间有空格

print(s, type(s))     # [1, 2, "a", "哈哈"] <class 'str'>

l1 = json.loads(s)

print(l1, type(l1))    # [1, 2, 'a', '哈哈'] <class 'list'>

dumps也可以处理嵌套的数据类型，注意json会自动把字典的key变成字符串格式，元组转化之后会变成列表

 import json

 dic = {"": {1: "青", 2: "梅", 3: "竹", 4: "马"}, "": {1: "两", 2: "小", 3: "无", 4: "猜"}}

 s = json.dumps(dic, ensure_ascii=False)

 # print(s)

 dic1 = json.loads(s)

 print(dic1)    # {'1': {'1': '青', '2': '梅', '3': '竹', '4': '马'}, '2': {'1': '两', '2': '小', '3': '无', '4': '猜'}}

dump和load

dump和load用于将数据写入文件和读出

 import json

 dic = {1: "你", 2: "我"}

 with open("序列化.json", encoding="utf-8", mode="w") as f1:

     json.dump(dic, f1, ensure_ascii=False)

 with open("序列化.json", encoding="utf-8", mode="r") as f2:

     ret = json.load(f2)

 print(ret)    # {'1': '你', '2': '我'}

一次只能写入一个数据，超过一个读取就会出错

 import json

 dic1 = {1: "你", 2: "我"}

 dic2 = {1: "我", 2: "你"}

 a = None

 with open("序列化.json", encoding="utf-8", mode="w") as f1:

     json.dump(dic1, f1, ensure_ascii=False)

     json.dump(dic2, f1, ensure_ascii=False)

 with open("序列化.json", encoding="utf-8", mode="r") as f2:

     ret1 = json.load(f2)    # 报错json.decoder.JSONDecodeError: Extra data: line 1 column 21 (char 20)

     ret2 = json.load(f2)

怎么同时写入多个数据呢，循环使用dumps，先用dumps把数据转化成json字符串，再用文件句柄写入

 import json

 dic1 = {1: "你", 2: "我"}

 dic2 = {1: "我", 2: "你"}

 a = None   # 写进文件会变成null

 b = 100

 c = (1, 2, 3)

 d = True

 with open("序列化.json", encoding="utf-8", mode="w") as f1:

     f1.write(json.dumps(dic1, ensure_ascii=False))   # {"1": "你", "2": "我"}

     f1.write("\n")

     f1.write(json.dumps(dic2, ensure_ascii=False))   # {"1": "我", "2": "你"}

     f1.write("\n")

     f1.write(json.dumps(a))   # null

     f1.write("\n")

     f1.write(json.dumps(b))   #

     f1.write("\n")

     f1.write(json.dumps(c))   # [1, 2, 3]    # 元组反序列化之后是列表

     f1.write("\n")

     f1.write(json.dumps(d))   # true

pickle模块

json模块只能将常用的数据类型进行序列化，pickle模块是python独有的，可以将所有的python的数据类型（包括对象)序列化

 import pickle

 dic1 = {1: "你", 2: "我"}

 p1 = pickle.dumps(dic1)

 print(p1)   # b'\x80\x03}q\x00(K\x01X\x03\x00\x00\x00\xe4\xbd\xa0q\x01K\x02X\x03\x00\x00\x00\xe6\x88\x91q\x02u.'

pickle是将数据类型转化成bytes类型存入文件中，用load也可以读出来

with open("p1.pickle", mode="rb") as f2:   # 注意这里是rb模式

    re = pickle.load(f2)

print(re)   # {1: '你', 2: '我'}

与json不同，pickle可以一次写入和读取多个数据

 import pickle

 dic1 = {1: "你", 2: "我"}

 dic2 = {1: "我", 2: "你"}

 a = None   # 写进文件会变成null

 b = 100

 c = (1, 2, 3)

 d = True

 with open("p1.pickle", mode="wb") as f1:

     pickle.dump(dic1, f1)

     pickle.dump(dic2, f1)

     pickle.dump(a, f1)

     pickle.dump(b, f1)

     pickle.dump(c, f1)

 with open("p1.pickle", mode="rb") as f2:

     ret1 = pickle.load(f2)

     ret2 = pickle.load(f2)

     ret3 = pickle.load(f2)

     ret4 = pickle.load(f2)

     ret5 = pickle.load(f2)   # pickle反序列化出来还是元组

 print(ret1)    # {1: '你', 2: '我'}

 print(ret2)    # {1: '我', 2: '你'}

 print(ret3)    # None

 print(ret4)    #

 print(ret5)    # (1, 2, 3)

pickle也可以转化python对象

 import pickle

 def func():

     print(111)

 with open("p2.pickle", mode="wb") as f1:   # 模式必须是wb

     pickle.dump(func, f1)

 with open("p2.pickle", mode="rb") as f2:

     re = pickle.load(f2)

 print(re)   # <function func at 0x000001D1FF081E18>

json与pickele比较

1. json是通用的，别的语言也可以识别，pickle只能python识别

2. json只能转化str int bool dict list(tuple) None，pickle可以转化所有Python数据类型

shelve模块

shelve也是python提供给我们的序列化工具，比pickle用起来更简单一些。shelve只提供给我们一个open方法，是用key来访问的，使用起来和字典类似

 import shelve

 f = shelve.open("shelve_file")  # 写入了三个文件bak dat dir

 f["key"] = {"int": 10, "float": 3.4}

 f.close()

 f = shelve.open("shelve_file")

 print(f["key"])    # {'int': 10, 'float': 3.4}

 f.close()

存储到shelve的文件一般不让修改，如果要修改可以加一个参数writeback=True

不加参数

 f1 = shelve.open("shelve_file")

 f1["key"]["int"] = 20

 f1.close()

 f2 = shelve.open("shelve_file")

 print(f2["key"])  # {'int': 10, 'float': 3.4} 并没有修改

加上writeback=True

 f3 = shelve.open("shelve_file", writeback=True)

 f3["key"]["int"] = 20

 f3.close()

 f4 = shelve.open("shelve_file")

 print(f4["key"])   # {'int': 20, 'float': 3.4}

 f4.close()

总结

1. 序列化就是把其他数据类型转化成字符串的过程

2. 常用的序列化模块是json，可以不同语言间通用，使用方法有dumps, loads 和dump, load

3. pickle是python独有的，可以转化所有Python数据类型

4. shelve像字典一样可以用key来访问，一般不让修改

python模块之序列化的更多相关文章

Python模块02/序列化/os模块/sys模块/haslib加密/collections
Python模块02/序列化/os模块/sys模块/haslib加密/collections 内容大纲 1.序列化 2.os模块 3.sys模块 4.haslib加密 5.collections 1. ...
Python模块(二)(序列化)
1. namedtuple 命名元组->类似创建了一个类 from collections import namedtuple p = namedtuple("Point", ...
python模块之序列化模块
序列化 """ 序列--字符串序列化--其他数据类型转化为字符串数据类型反序列化--字符串转化为其他数据类型 """ json模块 &q ...
python-学习笔记之-Day5 双层装饰器字符串格式化 python模块递归生成器迭代器序列化
1.双层装饰器 #!/usr/bin/env python # -*- coding: utf-8 -*- # author:zml LOGIN_INFO = False IS_ADMIN = Fal ...
Python库：序列化和反序列化模块pickle介绍
1 前言在“通过简单示例来理解什么是机器学习”这篇文章里提到了pickle库的使用,本文来做进一步的阐述. 通过简单示例来理解什么是机器学习 pickle是python语言的一个标准模块,安装pyt ...
Python模块之time、random、os、sys、序列化、re
Time模块和时间有关系的我们就要用到时间模块.在使用模块之前,应该首先导入这个模块. #常用方法 1.time.sleep(secs) (线程)推迟指定的时间运行.单位为秒. 2.time.tim ...
[python](windows)分布式进程问题：pickle模块不能序列化lambda函数
运行错误:_pickle.PicklingError: Can't pickle <function <lambda> at 0x000002BAAEF12F28>: attr ...
Python开发之序列化与反序列化：pickle、json模块使用详解
1 引言在日常开发中,所有的对象都是存储在内存当中,尤其是像python这样的坚持一切接对象的高级程序设计语言,一旦关机,在写在内存中的数据都将不复存在.另一方面,存储在内存够中的对象由于编程语言. ...
python之路----模块与序列化模块
认识模块什么是模块什么是模块? 常见的场景:一个模块就是一个包含了python定义和声明的文件,文件名就是模块名字加上.py的后缀. 但其实import加载的模块分为四个通用类别: 1 使用pyt ...

随机推荐

HAOI2018 简要题解
这套题是 dy, wearry 出的.学长好强啊,可惜都 \(wc\) 退役了.. 话说 wearry 真的是一个计数神仙..就没看到他计不出来的题...每次考他模拟赛总有一两道毒瘤计数TAT 上午的 ...
photoshop学习4
蒙版路径学习一.蒙版蒙版可以理解为一层在图层上的遮挡布,为什么要将图层遮住呢,有什么好处.好处在于容易编辑. 在一个图层上建立一个蒙版之后,可以用再删掉不需要的部分,从而露出原图层的部分.那么这 ...
【拓扑排序】烦人的幻灯片(slides)
1395:烦人的幻灯片(slides) 时间限制: 1000 ms 内存限制: 65536 KB提交数: 753 通过数: 416 [题目描述] 李教授将于今天下午作一次非常重 ...
POJ1061 青蛙的约会（扩展欧几里得）
题目链接:http://poj.org/problem?id=1061 青蛙的约会 Time Limit: 1000MS Memory Limit: 10000K Total Submission ...
Ubuntu下安装Flask虚拟环境及使用
一.关于Flask介绍诞生时间:Flask诞生于2010年,是Armin ronacher(人名)用 Python 语言基于 Werkzeug工具箱编写的轻量级Web开发框架. Flask框架包含两 ...
HDU/HDOJ 4864 Task
贪心题. 贪心方法很是naive...... 首先我们就能注意到一个性质:优先选择时间(x)长的,然后才是等级(y). 所以我们把机器和任务排好序,从大到小枚举任务.对于每一个x满足的机器,x也一定满 ...
bash 6
1)如果在开发过程中,遇到大段的代码需要临时注释起来,过一会儿又取消注释,怎么办呢? 每一行加个#符号太费力了,可以把这一段要注释的代码用一对花括号括起来,定义成一个函数, 没有地方调用这个函数,这块 ...
Day8--Python--文件操作
对文件内部的内容进行操作1.open('文件路径', mode='模式(默认是读r)', encoding='编码') 读取内容: f = open('d:/练习.txt', mode='r', en ...
HTTP请求头和响应头的格式
请求头: 请求头肯定带着客户端信息,比如host主机名,User-Agent用户代理信息,Cookie等等响应头: 响应头带有服务端信息:Server服务器信息,Last-Modified最后修改 ...
【清北学堂2018-刷题冲刺】Contest 2
这场比赛的T1相当智熄.由于至今无法理解题意,我只能解出前20分.诸位dalao谁能比较好地理解题意(独立性)的,请联系我,不胜感激. 在此本蒟蒻只能贴上题面: Task 1:选举 [问题描述] ...

python模块之序列化

序列化