python中用于序列化的模块总结

pickle模块

shelve模块

xml模块

pickle模块

介绍

Pickle的问题和所有其他编程语言特有的序列化问题一样，就是它只能用于Python，并且可能不同版本的Python彼此都不兼容，因此，只能用Pickle保存那些不重要的数据，不能成功地反序列化也没关系，所以只用在数据存储上，但是json能做数据传输和存储。
优点就是支持的数据类型多，能序列化函数、类。

使用

json会把数据转为字符串

pickle会把数据转为字节类型的数据

四个方法
pickle.dumps() 
pickle.dump()
pickle.load()
pickle.load()
四个方法的使用方法和json模块一样
具体可以结合json模块一起学习
https://www.cnblogs.com/-wenli/p/10187130.html

#存储数据

import pickle

dic={'name':'linlin','age':18}

data1 = pickle.dumps(dic) #序列化

f = open('file1','wb') #存储

f.write(data1)

f.close()

运行结果：

可以看到存储到文件的数据，我们是看不懂的，不同于json

#读取数据

import pickle

f = open('file1','rb') 

data2=f.read()

data2=pickle.loads(data2)#反序列化

print(data2)

key_value=data2['name']

print(key_value)

f.close()

运行结果：

shelve模块

shelve类似于一个存储持久化对象的持久化字典，即字典文件。

使用方法也类似于字典。

shelve模块可以当成一个轻量的数据库db，将数据以字典的类型（key，value）通过文件持久化,模拟出简单的db效果。

存储数据

注意：shelve模块有个限制，它不支持多个应用同一时间往同一个DB（文件）进行写操作。

import shelve

db1 = shelve.open('file') #打开一个文件

db1['dic'] = {'int':12, 'float':2.5, 'string':'shelve db'} 
#这里dic为key，key必须为字符串，而值可以是python所支持的数据类型

#直接对文件句柄［key］操作，就可以存入数据

db1.close()

且重要的是它还会直接在打开的当前目录生成三个文件：

file.bak

file.dat

file.dir
其中shelve.db1.dat 存储的就是b字节数据类型的数据， bak和dir后缀的就可能是和数据库相关的设计缓存之类的东西。

读取数据

注意：取出数据的时候也只需要直接用字典的操作方法获取即可，但是如果key不存在会报错

import shelve

f = shelve.open('file') #打开一个文件

#第一种方式
print(f.get('dic')['int']) #12

print(f.get('dic')['float']) #2.5

print(f.get('dic')['string']) #shelve db

#第二种方式

print(f['dic']['int'])#12

print(f['dic']['float']) #2.5

print(f['dic']['string']) #shelve db

修改数据

由于shelve在默认情况下是不会记录对持久化对象（字典下的键的值-条目）做出修改的，

所以在shelve.open()时候需要修改默认参数writeback=True，

否则对象的条目修改不会'拷贝回写'来进行保存。

当试图让shelve去自动捕获对象的变化时，应当在打开shelf的时候将writeback设置为True。
而将writeback这个flag设置为True以后，shelf将会将所有从DB中读取的对象存放到一个内存缓存。
当close() shelf的时候，缓存中所有的对象会被重新写入DB。

#第一种方法
#修改键值
import shelve

f = shelve.open('file',writeback=True) #打开一个文件

data=f['dic']['int']

data = 10

f.close() #这里一定要关闭文件，才能读取到修改后的值

print(data) #10

#添加列表值

import shelve
list1 = ['tie', 'le', 'yu']
# 既然最终生成的文件会是dat格式的，何不一开始就指定后缀是dat
db2 = shelve.open('shelve_db2.dat')
db2['lis'] = list1
# 文件句柄是通过字典的操作方式去拿里面的键值对，lis这个键对应的值是一个列表
db2['lis'].append('mao')
#　而此列表增加一个字符串元素后再打印，感觉不出有发生增加的变化
print(type(db2['lis']), db2['lis'])
# 返回列表：['tie', 'le', 'yu']
#这里返回的结果没有'mao',因为没有写回。

#第二种方法
import shelve

f = shelve.open('file') #打开一个文件

temp=f['dic'] #从文件中读取之前存储的对象

temp['int']=12 #直接对对象进行修改

f['dic']=temp #重新存储至字典文件对象中

print(f['dic']) #{'int': 12, 'float': 2.5, 'string': 'shelve db'}

总结

第一种方法shelve会将所有从DB中读取的对象存放到一个内存缓存，当close() shelf的时候，缓存中所有的对象会被重新写入DB，所以一定要关闭文件，重新读取才能生效

writeback方式有优点也有缺点

优点是减少了我们出错的概率，且让对象的持久化对用户更加的透明了

但这种方式并不是所有的情况下都需要

首先，使用writeback以后，shelf在open()的时候会增加额外的内存消耗

并且当DB在close()的时候会将缓存中的每一个对象都写入到DB，这也会带来额外的等待时间

因为shelve没有办法知道缓存中哪些对象修改了，哪些对象没有修改，因此所有的对象都会被写入

第二种方法通过中间变量实现了修改，这种属于直接赋值和拷贝写回无关，会生效，新值覆盖旧值

所以我们一定要弄明白一件事情

从shelve的db文件中重新再访问一个key拿的是它的拷贝

修改此拷贝后不做拷贝写回并不影响原来的key

但你要是直接做的操作是赋值新的值到一个key里，那肯定就是指向原来的key，会被覆盖的

而这种赋值覆盖对于shelve来说这是一个正常的行为阿

和键中的值看起来不能被修改一事并不矛盾

python的pickle和shelve模块的更多相关文章

python pickle 和 shelve模块
pickle和shelve模块都可以把python对象存储到文件中,下面来看看它们的用法吧 1.pickle 写: 以写方式打开一个文件描述符,调用pickle.dump把对象写进去 dn = {'b ...
python基础--json,pickle和shelve模块
一.JSON &pickle 用于序列化的两个模块 json,用于字符串和 python数据类型间进行转换字符串必须是双引号,不能是单引号 pickle,用于python特有的类型和 ...
python json、 pickle 、shelve 模块
json 模块用于序列化的模块 json,用于字符串和 python数据类型间进行转换 Json模块提供了四个功能:dumps.dump.loads.load #!/usr/bin/env pyt ...
小白的Python之路 day5 shelve模块讲解
shelve模块讲解一.概述之前我们说不管是json也好,还是pickle也好,在python3中只能dump一次和load一次,有什么方法可以向dump多少次就dump多少次,并且load不会出 ...
os常用模块，json，pickle，shelve模块，正则表达式（实现运算符分离），logging模块，配置模块，路径叠加，哈希算法
一.os常用模块显示当前工作目录 print(os.getcwd()) 返回上一层目录 os.chdir("..") 创建文件包 os.makedirs('python2/bin ...
（十四）json、pickle与shelve模块
任何语言,都有自己的数据类型,那么不同的语言怎么找到一个通用的标准? 比如,后端用Python写的,前端是js,那么后端如果传一个dic字典给前端,前端肯定不认. 所以就有了序列化这个概念. 什么是序 ...
Python序列化-pickle和json模块
Python的“file-like object“就是一种鸭子类型.对真正的文件对象,它有一个read()方法,返回其内容.但是,许多对象,只要有read()方法,都被视为“file-like obj ...
Python标准库之shelve模块(序列化与反序列化)
shelve模块是一个简单的key,value将内存数据通过文件持久化的模块,可以持久化任何picklel可支持的Python数据格式. 序列化序列化源代码: import shelve impor ...
第九节：os、sys、json、pickle、shelve模块
OS模块: os.getcwd()获取当前路径os.chdir()改变目录os.curdir返回当前目录os.pardir()父目录os.makedirs('a/b/c')创建多层目录os.remov ...

随机推荐

TCP传输协议
TCP是主机对主机层的传输控制协议,提供可靠的连接服务,采用三次握手确认建立一个连接,四次挥手断开连接. 三次握手是指建立一个TCP连接时,需要客户端和服务端总共发送3个包以确认连接建立成功.在so ...
JavaScript学习 - 基础(四) - 控制语句/异常处理
控制语句 if-else 语句 <script> //控制语句 //if-else格式: var x = 1 if(x==1){ console.log("this is if& ...
[转]gcc -ffunction-sections -fdata-sections -Wl,–gc-sections 参数详解
背景有时我们的程序会定义一些暂时使用不上的功能和函数,虽然我们不使用这些功能和函数,但它们往往会浪费我们的ROM和RAM的空间.这在使用静态库时,体现的更为严重.有时,我们只使用了静态库仅有的几个功 ...
sqlplus连接远程数据库
方式一:简易连接,不用进行网络配置,其实就是tnsname.ora文件命令:sqlplus 用户名/密码@ip地址[:端口]/service_name [as sysdba] 示例:sqlplus ...
中间人攻击之ettercap嗅探
中间人攻击: 中间人攻击(Man-in-the-MiddleAttack,简称“MITM攻击”)是一种“间接”的入侵攻击,这种攻击模式是通过各种技术手段将受入侵者控制的一台计算机虚拟放置在网络连接中的 ...
unicode 和 utf-8字符编码的区别
作者:于洋链接:https://www.zhihu.com/question/23374078/answer/69732605来源:知乎著作权归作者所有,转载请联系作者获得授权. 原文:unico ...
Tomcat启动项目时内存溢出问题如何解决
在Eclipse中,内存溢出(报不能创建JAVA虚拟机错时,也可能是这里配错了.) 1.双击Tomcat,点击Open launch configuration,Arguments, 2.在VM ar ...
React-Native 之网络请求 fetch
前言学习本系列内容需要具备一定 HTML 开发基础,没有基础的朋友可以先转至 HTML快速入门(一) 学习本人接触 React Native 时间并不是特别长,所以对其中的内容和性质了解可能会有所 ...
centos6.5系统bash损坏之救援模式修复
1.模拟bash被损坏的情况 # mv /bin/bash /tmp [root@localhost ~]# sync [root@localhost ~]# shutdown -r now 2.挂载 ...
View动画（补间动画）
补间动画的属性 Animation的属性 JAVA方法 XML属性解释 setDetachWallpaper(boolean) android:detachWallpaper 是否在壁纸上运行 se ...

python的pickle和shelve模块

python中用于序列化的模块总结

pickle模块

shelve模块

python的pickle和shelve模块的更多相关文章

随机推荐

热门专题