Python的数据持久化操作主要是六类：普通文件、DBM文件、Pickled对象存储、shelve对象存储、对象数据库存储、关系数据库存储。

普通文件不解释了，DBM就是把字符串的键值对存储在文件里：

Python代码

% python

>>> import anydbm

>>> file = anydbm.open('movie', 'c')        # make a DBM file called 'movie'

>>> file['Batman'] = 'Pow!'                 # store a string under key 'Batman'

>>> file.keys( )                                 # get the file's key directory

['Batman']

>>> file['Batman']                          # fetch value for key 'Batman'

'Pow!'

Pickled就是把对象序列化到文件，可以存储复杂类型：

Python代码

% python

>>> table = {'a': [1, 2, 3],

             'b': ['spam', 'eggs'],

             'c': {'name':'bob'}}

>>>

>>> import pickle

>>> mydb  = open('dbase', 'w')

>>> pickle.dump(table, mydb)

下面是反序列化：

Python代码

% python

>>> import pickle

>>> mydb  = open('dbase', 'r')

>>> table = pickle.load(mydb)

>>> table

{'b': ['spam', 'eggs'], 'a': [1, 2, 3], 'c': {'name': 'bob'}}

shelve存储差不多就是DBM和Pickled方式的结合，以键值对的形式把对象序列化到文件：

Python代码

% python

>>> import shelve

>>> dbase = shelve.open("mydbase")

>>> object1 = ['The', 'bright', ('side', 'of'), ['life']]

>>> object2 = {'name': 'Brian', 'age': 33, 'motto': object1}

>>> dbase['brian']  = object2

>>> dbase['knight'] = {'name': 'Knight', 'motto': 'Ni!'}

>>> dbase.close( )

取数据：

Python代码

% python

>>> import shelve

>>> dbase = shelve.open("mydbase")

>>> len(dbase)                             # entries

2  

>>> dbase.keys( )                          # index

['knight', 'brian']  

>>> dbase['knight']                        # fetch

{'motto': 'Ni!', 'name': 'Knight'}

对象数据库的存储没怎么了解，因为不习惯用它存储数据。感觉应该和shelve差不多吧，只是把数据保存到了数据库里（其实还是一个文件嘛），然后增加了些事务之类的高级功能。

Python中关系数据库的存储是重点，操作关系数据库最“简单”的就是直接用DB-API，就像Java里的JDBC；当然，数据结构复杂了、设计要求高了，就得找些ORM框架偷懒了，主要有独立的SQLAlchemy，Django的自带ORM等。这部分内容还是下一篇博客写吧，我不喜欢文章拉得长长的……

简单比较Python的数据持久化操作（二）

Python中操作关系数据库最直接的就是用DB-API了，流程一般是：连接、执行SQL语句、提交、断开。以MySQL为例，下面是各步骤的代码示例：

首先是连接：

Python代码

% python

>>> import MySQLdb

>>> conn = MySQLdb.connect(host='localhost', user='root', passwd='python')

接着便可以执行语句了，但在执行SQL语句前要先获取指针：

Python代码

>>> curs = conn.cursor( )

>>> curs.execute('create database peopledb')

1L

>>> curs.execute('use peopledb')

0L

>>> tblcmd = 'create table people (name char(30), job char(10), pay int(4))'

>>> curs.execute(tblcmd)

0L

添加数据：

Python代码

>>> curs.execute('insert people values (%s, %s, %s)', ('Bob', 'dev', 5000))

1L

>>> curs.executemany('insert people values (%s, %s, %s)',

...          [ ('Sue', 'mus', '70000'),

...            ('Ann', 'mus', '60000')])

2L

>>> conn.commit( )

执行查询：

Python代码

>>> curs.execute('select * from people')

6L

>>> curs.fetchall( )

(('Bob', 'dev', 5000L), ('Sue', 'mus', 70000L), ('Ann', 'mus', 60000L), ('Tom',

'mgr', 100000L))

执行完数据库操作记得断开连接：

Python代码

conn.close( )        # close, _ _del_ _ call rollback if changes not committed yet

如果数据结构不是很复杂，配合Python强大的列表解析能力，不用ORM框架也是很方便的；或者自己封装对象映射也不是很难。

如果使用了Django框架，可以使用它自带的ORM工具来操作数据库。首先当然是编写实体类（或者叫模型）了：

Python代码

from django.db import models  

class Musician(models.Model):

    first_name = models.CharField(max_length=50)

    last_name = models.CharField(max_length=50)

    instrument = models.CharField(max_length=100)  

class Album(models.Model):

    artist = models.ForeignKey(Musician)

    name = models.CharField(max_length=100)

    release_date = models.DateField()

    num_stars = models.IntegerField()

Python的代码已经很清楚了，类对应表，成员变量对应表的列，列属性由models.XXXField(…)定义。如果实体类没有显式定义主键，Django会默认加上一句：

Python代码

id = models.AutoField(primary_key=True)

Django里可以这样定义枚举型数据：

Python代码

class Person(models.Model):

    GENDER_CHOICES = (

        (u'M', u'Male'),

        (u'F', u'Female'),

    )

    name = models.CharField(max_length=60)

    gender = models.CharField(max_length=2, choices=GENDER_CHOICES)

对于关联关系，在做列的映射定义时可以这么写：

Python代码

poll = models.ForeignKey(Poll)

sites = models.ManyToManyField(Site)

place = models.OneToOneField(Place")

在Django里定义关联关系还有更多功能，详细的还是看官方文档吧~

Django的Model基类中已经定义了基本的数据库操作，因为所有的实体类都是继承自Model类，所以也就有了这些操作。例如新建并保存一个person只需要这么做：

Python代码

>>> p = Person(name="Fred Flinstone", gender="M")

>>> p.save()

Django会通过查询对象的主键是否存在来决定该UPDATE还是INSERT，当然你也可以强制框架执行某种操作。如果你不满意框架自带的方法，可以重写它：

Python代码

class Blog(models.Model):

    name = models.CharField(max_length=100)

    tagline = models.TextField()  

    def save(self, *args, **kwargs):

        do_something()

        super(Blog, self).save(*args, **kwargs) # Call the "real" save() method.

        do_something_else()

发现没，Django里存取数据不需要那种session，最讨厌Hibernate里的session了，总是报“Session Closed”错误……

Python还有一个独立的ORM框架——SQLAlchemy。功能更强大，支持的数据库也比Django自带的ORM工具要多。它有两种建立实体类的方法。

一种是分开定义，再将表定义和类定义映射起来。首先是建立表的定义：

Python代码

>>> from sqlalchemy import Table, Column, Integer, String, MetaData, ForeignKey

>>> metadata = MetaData()

>>> users_table = Table('users', metadata,

...     Column('id', Integer, Sequence('user_id_seq'), primary_key=True),

...     Column('name', String(50)),

...     Column('fullname', String(50)),

...     Column('password', String(12))

... )

接着定义实体类：

Python代码

>>> class User(object):

...     def __init__(self, name, fullname, password):

...         self.name = name

...         self.fullname = fullname

...         self.password = password

这还没完，还要把他们映射起来：

Python代码

>>> from sqlalchemy.orm import mapper

>>> mapper(User, users_table)

这样的过程有点像Hibernate里将XML的Map文件和实体类的映射。Hibernate中还可以方便的直接用注释在实体类中完成与表的映射，当然SQLAlchemy也有直接的方法：

Python代码

>>> from sqlalchemy.ext.declarative import declarative_base  

>>> Base = declarative_base()

>>> class User(Base):

...     __tablename__ = 'users'

...

...     id = Column(Integer, primary_key=True)

...     name = Column(String)

...     fullname = Column(String)

...     password = Column(String)

作为一个独立的ORM框架，实体类的存取当然就不会像Django那样集成的那么完美了，SQLAlchemy里存取数据也是要Session的：

Python代码

>>> from sqlalchemy.orm import sessionmaker

>>> Session = sessionmaker(bind=engine)

这里的engine对象需要这样建立：

Python代码

>>> from sqlalchemy import create_engine

>>> engine = create_engine('<span style="font-family: monospace; white-space: normal; color: #333333; line-height: 20px;">dialect+driver://user:password@host/dbname[?key=value..]</span>', echo=True)

对于存取操作，如果是保存就这么写：

Python代码

>>> ed_user = User('ed', 'Ed Jones', 'edspassword')

>>> session.add(ed_user)

如果要查询，就是类似的这种形式：

Python代码

>>> our_user = session.query(User).filter_by(name='ed').first()

执行完一些数据操作，必要的时候要提交或是回滚：

Python代码

>>> session.rollback()

或者

>>> session.commit()

SQLAlchemy框架还有一个衍生产品——Elixir，在SQLAlchemy的基础上对其映射方式做了些封装，使得实体类的定义有点类似Django中的定义方式。

话说Django的ORM与它的其他模块结合的很紧密，不好单独使用；SQLAlchemy虽然强大，但风格不太喜欢，所以下一步打算深入两个ORM框架的代码，看看他们是怎么实现的。一方面好抉择用哪一个，另外也可以看看在自己的应用中能否自己做一个简单的ORM。

python数据的存储和持久化操作的更多相关文章

python 数据的存储
数据的存储思考:为什么使用计算机?存储数据,计算数据思考:数据存在哪里?数据存储在内存里思考:数据怎么在内存里存储的?首先弄明白怎么存储数字 1010.5“sunck is a good man ...
python数据持久存储：pickle模块的基本使用
经常遇到在Python程序运行中得到了一些字符串.列表.字典等数据,想要长久的保存下来,方便以后使用,而不是简单的放入内存中关机断电就丢失数据. 这个时候Pickle模块就派上用场了,它可以将对象转换 ...
Quartz任务调度(3)存储与持久化操作配置详细解
内存存储RAMJobStore Quartz默认使用RAMJobStore,它的优点是速度.因为所有的 Scheduler 信息都保存在计算机内存中,访问这些数据随着电脑而变快.而无须访问数据库或IO ...
python数据持久存储：pickle模块的使用
python的pickle模块实现了基本的数据序列和反序列化.通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储:通过pickle模块的反序列化操作,我们能够从文件 ...
[转]python数据持久存储：pickle模块的基本使用
python的pickle模块实现了基本的数据序列和反序列化.通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储:通过pickle模块的反序列化操作,我们能够从文件 ...
python数据持久存储-pickle模块
pickle模块实现了基本的数据序列和反序列化.pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,通过pickle模块的反序列化操作,能够从文件中创建上一次程序保存的对象. 接 ...
python数据储存
python数据储存 csv文件的操作安装csv包打开cmd 执行 pip install csv引入的模块名为csv 读取文件 with open("xx.csv"," ...
Android持久化存储——（包含操作SQLite数据库）
<第一行代码>读书手札你可能会遇到的问题:解决File Explorer 中无显示问题 Android中,持久化存储,常见的一共有三种方法实现 (一.)利用文件存储文件存储是Andro ...
Python -- 数据加载、存储与文件格式
标签(空格分隔): Python 读入读出通常可以划分为几个大类:读取文本文件和其他更高效的磁盘存储格式,加载数据库中的数据,利用Web API操作网络资源. 读写文本格式的数据 pandas提供了一 ...

随机推荐

多线程 - 线程同步锁（lock、Monitor）
1. 前言多线程编程的时候,我们不光希望两个线程间能够实现逻辑上的先后顺序运行,还希望两个不相关的线程在访问同一个资源的时候,同时只能有一个线程对资源进行操作,否则就会出现无法预知的结果. 比如,有 ...
CoreMotion(加速计)
加速计的作用用于检测设备的运动(比如摇晃) 加速计的经典应用场景摇一摇计步器 ********************************** Core Motion获取数据的两种方式 pu ...
HTML页面中启用360浏览器极速模式
今天做页面突然遇到浏览器一直在兼容模式下运行,体验不好,通过查询文档,在<head>中加入<meta name="renderer" content=" ...
c++文件读写相关
在看C++编程思想中,每个练习基本都是使用ofstream,ifstream,fstream,以前粗略知道其用法和含义,在看了几位大牛的博文后,进行整理和总结: 这里主要是讨论fstream的内容: ...
Problem 1108 - 淼·诺贝尔
#include<iostream> #include<vector> #include<algorithm> using namespace std; struc ...
python3 读取大文件分解成若干小文件
有个数据实在太大了,有1.7G,打开慢,改文件也慢,我们将其分解成若干个中等文件 #!/usr/bin/env python3 # -*- coding: utf-8 -*- f = open(& ...
chdir 改变当前目录为起始目录
<?php chdir(dirname(__FILE__));//把当前目录设置为当前目录?> 将 PHP 的当前目录改为 directory. 参数 directory 新的当前目录返 ...
[转]jQuery,javascript获得网页的高度和宽度
网页可见区域宽: document.body.clientWidth网页可见区域高: document.body.clientHeight网页可见区域宽: document.body.offsetWi ...
极简主义，对逻辑操作符||和&&深度运用的理解
丧心病狂的代码压缩好像违背了愉快阅读的本真,所以刨根问底想要了解个究竟,最后发现这不只是前端大牛装逼卖萌的绝技,也是代码洁癖爱好者的利器,毕竟这样看上去确实蛮优雅的; 一开始,我们接触到的代码是这样的 ...
masonry结合json 制作无限滚动的瀑布流
做前端这行的能直接贴代码就直接贴代码了,不用多说什么别的效果需要引入jquery和jquery.masonry.min.js这两个JS JS代码如下: $(document).ready(func ...

python数据的存储和持久化操作

简单比较Python的数据持久化操作（二）

python数据的存储和持久化操作的更多相关文章

随机推荐

热门专题