序列化

什么是序列化

序列化是将字典、列表等数据类型转化成一个字符串的过程

序列化的目的

1. 以某种存储形式使自定义对象持久化(存储)

2. 将对象从一个地方传递到另一个我地方(传输)

3. 使程序更具维护性

json模块

json是很多语言通用的一种数据标准,json可以转化的数据类型包括:str   int   bool   dict   list(tuple)   None

json模块有四种方法:dumps, loads, dump, load

dumps和loads

处理列表

import json
lst = [1, 2, "a", "哈哈"]
s = json.dumps(lst, ensure_ascii=False) # 包含非ascii字符时要加上ensure_ascii=False
print(s[0]) # [ 可以像字符串一样取值
print(s[1]) #
print(s[1:8]) # 也可以切片 1, 2, " 注意列表元素之间有空格
print(s, type(s)) # [1, 2, "a", "哈哈"] <class 'str'>
l1 = json.loads(s)
print(l1, type(l1)) # [1, 2, 'a', '哈哈'] <class 'list'>

dumps也可以处理嵌套的数据类型,注意json会自动把字典的key变成字符串格式,元组转化之后会变成列表

 import json
dic = {"": {1: "青", 2: "梅", 3: "竹", 4: "马"}, "": {1: "两", 2: "小", 3: "无", 4: "猜"}}
s = json.dumps(dic, ensure_ascii=False)
# print(s)
dic1 = json.loads(s)
print(dic1) # {'1': {'1': '青', '2': '梅', '3': '竹', '4': '马'}, '2': {'1': '两', '2': '小', '3': '无', '4': '猜'}}

dump和load

dump和load用于将数据写入文件和读出

 import json
dic = {1: "你", 2: "我"}
with open("序列化.json", encoding="utf-8", mode="w") as f1:
json.dump(dic, f1, ensure_ascii=False) with open("序列化.json", encoding="utf-8", mode="r") as f2:
ret = json.load(f2) print(ret) # {'1': '你', '2': '我'}

一次只能写入一个数据,超过一个读取就会出错

 import json
dic1 = {1: "你", 2: "我"}
dic2 = {1: "我", 2: "你"}
a = None
with open("序列化.json", encoding="utf-8", mode="w") as f1:
json.dump(dic1, f1, ensure_ascii=False)
json.dump(dic2, f1, ensure_ascii=False) with open("序列化.json", encoding="utf-8", mode="r") as f2:
ret1 = json.load(f2) # 报错json.decoder.JSONDecodeError: Extra data: line 1 column 21 (char 20)
ret2 = json.load(f2)

怎么同时写入多个数据呢,循环使用dumps,先用dumps把数据转化成json字符串,再用文件句柄写入

 import json
dic1 = {1: "你", 2: "我"}
dic2 = {1: "我", 2: "你"}
a = None # 写进文件会变成null
b = 100
c = (1, 2, 3)
d = True
with open("序列化.json", encoding="utf-8", mode="w") as f1:
f1.write(json.dumps(dic1, ensure_ascii=False)) # {"1": "你", "2": "我"}
f1.write("\n")
f1.write(json.dumps(dic2, ensure_ascii=False)) # {"1": "我", "2": "你"}
f1.write("\n")
f1.write(json.dumps(a)) # null
f1.write("\n")
f1.write(json.dumps(b)) #
f1.write("\n")
f1.write(json.dumps(c)) # [1, 2, 3] # 元组反序列化之后是列表
f1.write("\n")
f1.write(json.dumps(d)) # true

pickle模块

json模块只能将常用的数据类型进行序列化,pickle模块是python独有的,可以将所有的python的数据类型(包括对象)序列化

 import pickle
dic1 = {1: "你", 2: "我"}
p1 = pickle.dumps(dic1)
print(p1) # b'\x80\x03}q\x00(K\x01X\x03\x00\x00\x00\xe4\xbd\xa0q\x01K\x02X\x03\x00\x00\x00\xe6\x88\x91q\x02u.'

pickle是将数据类型转化成bytes类型存入文件中,用load也可以读出来

with open("p1.pickle", mode="rb") as f2:   # 注意这里是rb模式
re = pickle.load(f2)
print(re) # {1: '你', 2: '我'}

与json不同,pickle可以一次写入和读取多个数据

 import pickle
dic1 = {1: "你", 2: "我"}
dic2 = {1: "我", 2: "你"}
a = None # 写进文件会变成null
b = 100
c = (1, 2, 3)
d = True
with open("p1.pickle", mode="wb") as f1:
pickle.dump(dic1, f1)
pickle.dump(dic2, f1)
pickle.dump(a, f1)
pickle.dump(b, f1)
pickle.dump(c, f1) with open("p1.pickle", mode="rb") as f2:
ret1 = pickle.load(f2)
ret2 = pickle.load(f2)
ret3 = pickle.load(f2)
ret4 = pickle.load(f2)
ret5 = pickle.load(f2) # pickle反序列化出来还是元组
print(ret1) # {1: '你', 2: '我'}
print(ret2) # {1: '我', 2: '你'}
print(ret3) # None
print(ret4) #
print(ret5) # (1, 2, 3)

pickle也可以转化python对象

 import pickle
def func():
print(111) with open("p2.pickle", mode="wb") as f1: # 模式必须是wb
pickle.dump(func, f1) with open("p2.pickle", mode="rb") as f2:
re = pickle.load(f2)
print(re) # <function func at 0x000001D1FF081E18>

json与pickele比较

1. json是通用的,别的语言也可以识别,pickle只能python识别

2. json只能转化str   int   bool   dict   list(tuple)   None,pickle可以转化所有Python数据类型

shelve模块

shelve也是python提供给我们的序列化工具,比pickle用起来更简单一些。shelve只提供给我们一个open方法,是用key来访问的,使用起来和字典类似

 import shelve
f = shelve.open("shelve_file") # 写入了三个文件bak dat dir
f["key"] = {"int": 10, "float": 3.4}
f.close() f = shelve.open("shelve_file")
print(f["key"]) # {'int': 10, 'float': 3.4}
f.close()

存储到shelve的文件一般不让修改,如果要修改可以加一个参数writeback=True

不加参数

 f1 = shelve.open("shelve_file")
f1["key"]["int"] = 20
f1.close() f2 = shelve.open("shelve_file")
print(f2["key"]) # {'int': 10, 'float': 3.4} 并没有修改

加上writeback=True

 f3 = shelve.open("shelve_file", writeback=True)
f3["key"]["int"] = 20
f3.close() f4 = shelve.open("shelve_file")
print(f4["key"]) # {'int': 20, 'float': 3.4}
f4.close()

总结

1. 序列化就是把其他数据类型转化成字符串的过程

2. 常用的序列化模块是json,可以不同语言间通用,使用方法有dumps, loads 和dump, load

3. pickle是python独有的,可以转化所有Python数据类型

4. shelve像字典一样可以用key来访问,一般不让修改

python模块之序列化的更多相关文章

  1. Python模块02/序列化/os模块/sys模块/haslib加密/collections

    Python模块02/序列化/os模块/sys模块/haslib加密/collections 内容大纲 1.序列化 2.os模块 3.sys模块 4.haslib加密 5.collections 1. ...

  2. Python模块(二)(序列化)

    1. namedtuple 命名元组->类似创建了一个类 from collections import namedtuple p = namedtuple("Point", ...

  3. python模块之序列化模块

    序列化 """ 序列--字符串 序列化--其他数据类型转化为字符串数据类型 反序列化--字符串转化为其他数据类型 """ json模块 &q ...

  4. python-学习笔记之-Day5 双层装饰器 字符串格式化 python模块 递归 生成器 迭代器 序列化

    1.双层装饰器 #!/usr/bin/env python # -*- coding: utf-8 -*- # author:zml LOGIN_INFO = False IS_ADMIN = Fal ...

  5. Python库:序列化和反序列化模块pickle介绍

    1 前言 在“通过简单示例来理解什么是机器学习”这篇文章里提到了pickle库的使用,本文来做进一步的阐述. 通过简单示例来理解什么是机器学习 pickle是python语言的一个标准模块,安装pyt ...

  6. Python模块之time、random、os、sys、序列化、re

    Time模块 和时间有关系的我们就要用到时间模块.在使用模块之前,应该首先导入这个模块. #常用方法 1.time.sleep(secs) (线程)推迟指定的时间运行.单位为秒. 2.time.tim ...

  7. [python](windows)分布式进程问题:pickle模块不能序列化lambda函数

    运行错误:_pickle.PicklingError: Can't pickle <function <lambda> at 0x000002BAAEF12F28>: attr ...

  8. Python开发之序列化与反序列化:pickle、json模块使用详解

    1 引言 在日常开发中,所有的对象都是存储在内存当中,尤其是像python这样的坚持一切接对象的高级程序设计语言,一旦关机,在写在内存中的数据都将不复存在.另一方面,存储在内存够中的对象由于编程语言. ...

  9. python之路----模块与序列化模块

    认识模块 什么是模块 什么是模块? 常见的场景:一个模块就是一个包含了python定义和声明的文件,文件名就是模块名字加上.py的后缀. 但其实import加载的模块分为四个通用类别: 1 使用pyt ...

随机推荐

  1. HAOI2018 简要题解

    这套题是 dy, wearry 出的.学长好强啊,可惜都 \(wc\) 退役了.. 话说 wearry 真的是一个计数神仙..就没看到他计不出来的题...每次考他模拟赛总有一两道毒瘤计数TAT 上午的 ...

  2. photoshop学习4

    蒙版 路径学习 一.蒙版 蒙版可以理解为一层在图层上的遮挡布,为什么要将图层遮住呢,有什么好处.好处在于容易编辑. 在一个图层上建立一个蒙版之后,可以用再删掉不需要的部分,从而露出原图层的部分.那么这 ...

  3. 【拓扑排序】烦人的幻灯片(slides)

    1395:烦人的幻灯片(slides) 时间限制: 1000 ms         内存限制: 65536 KB提交数: 753     通过数: 416 [题目描述] 李教授将于今天下午作一次非常重 ...

  4. POJ1061 青蛙的约会(扩展欧几里得)

    题目链接:http://poj.org/problem?id=1061 青蛙的约会 Time Limit: 1000MS   Memory Limit: 10000K Total Submission ...

  5. Ubuntu下安装Flask虚拟环境及使用

    一.关于Flask介绍 诞生时间:Flask诞生于2010年,是Armin ronacher(人名)用 Python 语言基于 Werkzeug工具箱编写的轻量级Web开发框架. Flask框架包含两 ...

  6. HDU/HDOJ 4864 Task

    贪心题. 贪心方法很是naive...... 首先我们就能注意到一个性质:优先选择时间(x)长的,然后才是等级(y). 所以我们把机器和任务排好序,从大到小枚举任务.对于每一个x满足的机器,x也一定满 ...

  7. bash 6

    1)如果在开发过程中,遇到大段的代码需要临时注释起来,过一会儿又取消注释,怎么办呢? 每一行加个#符号太费力了,可以把这一段要注释的代码用一对花括号括起来,定义成一个函数, 没有地方调用这个函数,这块 ...

  8. Day8--Python--文件操作

    对文件内部的内容进行操作1.open('文件路径', mode='模式(默认是读r)', encoding='编码') 读取内容: f = open('d:/练习.txt', mode='r', en ...

  9. HTTP请求头和响应头的格式

    请求头: 请求头肯定带着客户端信息,比如host主机名,User-Agent用户代理信息,Cookie等等  响应头: 响应头带有服务端信息:Server服务器信息,Last-Modified最后修改 ...

  10. 【清北学堂2018-刷题冲刺】Contest 2

     这场比赛的T1相当智熄.由于至今无法理解题意,我只能解出前20分.诸位dalao谁能比较好地理解题意(独立性)的,请联系我,不胜感激.  在此本蒟蒻只能贴上题面: Task 1:选举 [问题描述] ...