python对象序列化或持久化的方法

http://blog.csdn.net/chen_lovelotus/article/details/7233293

一、Python对象持久化方法

目前为止，据我所知，在python中对象持久化有以下几种方法：

1. 使用(dbhash/bsddb, dbm, gdbm, dumbdbm 等）以及它们的"管理器"( anydbm )。只提供了 Python 字
符串的永久性储存. 提供一个类似字典和文件的对象，可以完成字符串的永久性存储。

2. 使用marshal和pickle来序列化python对象，并具备存储到介质上的功能。两者的区别在于：marshal只能处理简单的Python对象，包括数字、序列、映射、以及代码对象；而pickle还可以处理递归对象，被不同地方多次引用的对象，以及用户定义的类和实例。其中，pickle有一个C语言实现的版本——cPickle，具有更高的效率，建议使用cPickle。

3. 虽然pickle提供非常强大的功能了，已经可以满足我们大部分的需求了，但是，人类的需求是无止境的，光序列化不行啊，只用 pickle 不能解决命名和查找 pickle 文件这样的问题，要是可以对序列化的对象提供管理功能，支持并发访问就好了。因此，人们发明了shelve模块，它是前两者的综合。shelve模块使用anydbm模块寻找合适的DBM模块，然后使用cPickle来完成对象存储转换过程。shelve模块允许对数据库文件进行并发的读访问，但不允许共享读/写访问。

4. 还有一种方案，是在IBM的网站上看到的。那就是ZODB了。ZODB比简单的 pickle 文件更健壮以及更具有可伸缩性。ZODB是一个针对Python的Z对象数据库，是一个健壮的、多用户的和面向对象的数据库系统，它能够存储和管理任意复杂的 Python 对象，并支持事务操作和并发控制。其实，ZODB也依靠Python 的本机序列化能力，而且要有效地使用 ZODB，必须充分了解 pickle。

5. 最后一只知道的解决持久性问题的方法是 Prevayler，PyPerSyst 将整个对象系统保存在内存中，并通过不时地将系统快照 pickle 到磁盘以及维护一个命令日志（通过此日志可以重新应用最新的快照）来提供灾难恢复。所以，尽管使用 PyPerSyst 的应用程序受到可用内存的限制，但好处是本机对象系统可以完全装入到内存中，因而速度极快，而且实现起来要比如 ZODB 这样的数据库简单，ZODB 允许对象的数目比同时在能内存中所保持的对象要多。

背景知识：它最初是用 Java 实现的。后来，一群 Python 程序员将 Prevayler 移植到了 Python 上，另起名为 PyPerSyst，由 SourceForge 托管。Prevayler/PyPerSyst 概念也是建立在 Java 和 Python 语言的本机序列化能力之上。

6. 我今天又发现了一个模块Durus，非常好的模块，支持多线程并发操作，支持回滚操作。不过安装的时候没装上，好像是缺少vc里面文件似的，不管了。

二、我该如何选择

上面5种方案是我在综合相关资料汇总的，那么现在轮到如何选择。我选择的一个原则：“懒”，怎么讲，就是尽量在完成任务的情况下，降低复杂度和将来的兼容性。第五种方案对我不太适用，全部load到内存基本不可能，所以我先暂时选第四种方案吧，方便读取，使用对象数据库对于我的项目应该是有好处的。

参考性的意见，我认为得看自己定了，如果想简单，用pickle就能解决问题。我也想用pickle的，可是一大堆对象，还需要检索方便，当然选择第四种方案。其实第三种方案也适合我的，如果时间充裕的话，我还想第四种方案和第三种做一个实验，比较一下，再写一篇文章给大家参考。

参考资料：

1. Python 持久性管理 http://www.ibm.com/developerworks/cn/linux/l-pypers/

2. shelve — Python object persistence http://docs.python.org/library/shelve.html

3. Core Python Programming, Second Edition By Wesley J. Chun

4. ZODB 入门 http://www.ibm.com/developerworks/cn/aix/library/au-zodb/?S_TACT=105AGX52&S_CMP=tec-csdn

python对象序列化或持久化的方法的更多相关文章

python对象序列化之pickle
本片文章主要是对pickle官网的阅读记录. The pickle module implements binary protocols for serializing and de-serializ ...
python对象序列化pickle
import pickle class A: users = {} c = 1 def get_self(self): return self def n(self): return 1 def pi ...
cPickle对python对象进行序列化，序列化到文件或内存
pickle模块使用的数据格式是python专用的,并且不同版本不向后兼容,同时也不能被其他语言说识别.要和其他语言交互,可以使用内置的json包 cPickle可以对任意一种类型的python对象进 ...
python 模块 - 序列化 json 和 pickle
1,引入之前我们学习过用eval内置方法可以将一个字符串转成python对象,不过,eval方法是有局限性的,对于普通的数据类型,json.loads和eval都能用,但遇到特殊类型的时候,eval ...
JAVA的序列化和持久化的区别与联系
持久化(Persistence) 即把数据(如内存中的对象)保存到可永久保存的存储设备中(如磁盘).持久化的主要应用是将内存中的对象存储在关系型的数据库中,当然也可以存储在磁盘文件中.XML数据文 ...
java 对象序列化与反序列化
Java序列化与反序列化是什么? 为什么需要序列化与反序列化? 如何实现Java序列化与反序列化? 本文围绕这些问题进行了探讨. 1.Java序列化与反序列化 Java序列化是指把Java对象转换为 ...
Hibernate相关概念及序列化和持久化的区别
hibernate是一种ORM(object relation mapping,对象关系映射)框架,所谓的对象关系映射,通俗的说,就是把JAVA对象保存到关系型数据库中. hibernate要做的事, ...
JSON实现序列化dump和dumps方法，JSON实现反序列化loads和load方法
通过文件操作,我们可以将字符串写入到一个本地文件.但是,如果是一个对象(例如列表.字典.元组等),就无法直接写入到一个文件里,需要对这个对象进行序列化,然后才能写入到文件里. 设计一套协议,按照某种 ...
python pickle模块的使用/将python数据对象序列化保存到文件中
# Python 使用pickle/cPickle模块进行数据的序列化 """Python序列化的概念很简单.内存里面有一个数据结构, 你希望将它保存下来,重用,或者发送 ...

随机推荐

python中deque类详解
最近在pythonTip做题的时候,遇到了deque类,以前对其不太了解,现在特此总结一下 deque类是python标准库collections模块中的一项,它提供了两端都可以操作的序列,这意味着, ...
【SQL】宿主语言接口
一般情况下,SQL语句是嵌套在宿主语言(如C语言)中的.有两种嵌套方式: 1.调用层接口(CLI):提供一些库,库中的函数和方法实现SQL的调用 2.直接嵌套SQL:在代码中嵌套SQL语句,提交给预处 ...
vue学习记录：vue引入，validator验证，数据信息，vuex数据共享
最近在学习vue,关于学习过程中所遇到的问题进行记录,包含vue引入,validator验证,数据信息,vuex数据共享,传值问题记录 1.vue 引入vue vue的大致形式如下: <temp ...
IOC（控制反转）的理解
1.IOC的理论背景我们知道在面向对象设计的软件系统中,它的底层都是由N个对象构成的,各个对象之间通过相互合作,最终实现系统地业务逻辑[1]. 图1 软件系统中耦合的对象如果我们打开机械式手表的后 ...
Ubuntu 16.04下开启Mysql 3306端口远程访问
原文地址:传送门 0. 前言网上看到很多开启Mysql远程访问端口,修改的配置文件我都没有找到. 特意查看了我的Linux版本 $ sudo lsb_release -a 显示如下: Distrib ...
HDU 1236 排名（结构体+排序）
今天的上机考试虽然有实时的Ranklist,但上面的排名只是根据完成的题数排序,没有考虑每题的分值,所以并不是最后的排名.给定录取分数线,请你写程序找出最后通过分数线的考生,并将他们的成绩按降序打 ...
gcc与gdb的使用
1.gcc/g++编译过程: gcc/g++的编译格式: gcc [option][filename]... g++ [option][filename]... 1)processing:预处理过程, ...
ACM-ICPC 2018 沈阳赛区网络预赛 D. Made In Heaven（第k短路模板）
求第k短路模板先逆向求每个点到终点的距离,再用dij算法,不会超时(虽然还没搞明白为啥... #include<iostream> #include<cstdio> #inc ...
线段树+差分【p1438】无聊的数列
Description 维护一个数列{a[i]},支持两种操作: 1.1 L R K D:给出一个长度等于R-L+1的等差数列,首项为K,公差为D,并将它对应加到a[L]~a[R]的每一个数上.即:令 ...
Hibernate 配置文件precision与scale
Oracle使用标准.可变长度的内部格式来存储数字.这个内部格式精度可以高达38位. NUMBER数据类型可以有两个限定符,如: column NUMBER ( precision, scale) 表 ...

python对象序列化或持久化的方法

python对象序列化或持久化的方法的更多相关文章

随机推荐

热门专题