技术背景

在各种python的项目中，我们时常要持久化的在系统中存储各式各样的python的数据结构，常用的比如字典等。尤其是在云服务类型中的python项目中，要持久化或者临时的在缓存中储存一些用户认证信息和日志信息等，最典型的比如在数据库中存储用户的token信息。在本文中我们将针对三种类型的python持久化存储方案进行介绍，分别是json、pickle和python自带的数据库sqlite3。

使用json存储字典对象

json格式的数据存储也是云服务项目中常用的类型，具备十分轻量级和易使用的特性，这里我们展示一个案例：如何使用json格式存储一个用python产生的斐波那契数列。斐波那契数列中的每一个元素，都等于前一个数和前前一个数的和，即：\(f(n)=f(n-1)+f(n-2)\)，而最常见的斐波那契数列的前两位数都是1。如下是一个产生斐波那契数列的python代码：

# json_dic.py

import json

number = {1:1, 2:1}

for i in range(3, 11):

    number[i] = number[i - 1] + number[i - 2]

print (number)

代码的执行结果如下：

[dechin@dechin-manjaro store_class]$ python3 json_dic.py

{1: 1, 2: 1, 3: 2, 4: 3, 5: 5, 6: 8, 7: 13, 8: 21, 9: 34, 10: 55}

我们可以从结果中看到，第10个斐波那契数是55。接下来我们来看看这样的一个字典，如何持久化的存储到json格式的文件中，以下是一个使用的示例：

# json_dic.py

import json

number = {1:1, 2:1}

for i in range(3, 11):

    number[i] = number[i - 1] + number[i - 2]

with open('number.json', 'w') as file:

    json.dump(number, file)

with open('number.json', 'r') as file:

    data = json.load(file)

print (data)

执行这个python文件，我们可以获得如下所示的输出：

[dechin@dechin-manjaro store_class]$ python3 json_dic.py

{'1': 1, '2': 1, '3': 2, '4': 3, '5': 5, '6': 8, '7': 13, '8': 21, '9': 34, '10': 55}

这里我们发现在当前目录下产生了一个json的文件：

[dechin@dechin-manjaro store_class]$ ll

总用量 8

-rw-r--r-- 1 dechin dechin 265  3月 20 12:32 json_dic.py

-rw-r--r-- 1 dechin dechin  85  3月 20 12:32 number.json

我们可以看一下这个json文件中存储了什么样的数据：

[dechin@dechin-manjaro store_class]$ cat number.json

{"1": 1, "2": 1, "3": 2, "4": 3, "5": 5, "6": 8, "7": 13, "8": 21, "9": 34, "10": 55}

在验证了相关的数据已经被持久化存储了之后，同时我们也注意到一个问题，我们产生斐波那契数列的时候，索引\(1,2,3...\)使用的是整型变量，但是存储到json格式之后，变成了字符串格式。我们可以使用如下的案例来说明这其中的区别：

# json_dic.py

import json

number = {1:1, 2:1}

for i in range(3, 11):

    number[i] = number[i - 1] + number[i - 2]

with open('number.json', 'w') as file:

    json.dump(number, file)

with open('number.json', 'r') as file:

    data = json.load(file)

print (data)

print (number[10])

print (data['10'])

print (data[10])

执行的输出如下：

[dechin@dechin-manjaro store_class]$ python3 json_dic.py

{'1': 1, '2': 1, '3': 2, '4': 3, '5': 5, '6': 8, '7': 13, '8': 21, '9': 34, '10': 55}

55

55

Traceback (most recent call last):

  File "json_dic.py", line 16, in <module>

    print (data[10])

KeyError: 10

这里的输出就有一个报错信息，这是因为我们使用了整型索引变量来寻找json存储的字典对象中对应的值，但是因为前面存储的时候这些整型的索引已经被转换成了字符串的索引，因此实际上在存储的对象中已经不存在整型的键值，所以执行结果会报错，而如果输入的是字符串类型的键值，则成功的找到了第10个斐波那契数。

使用pickle存储字典对象

关于斐波那契数列的信息，在上一章节中已经介绍，这里我们直接进入pickle的使用案例：

# pickle_dic.py

import pickle

number = {1:1, 2:1}

for i in range(3, 11):

    number[i] = number[i - 1] + number[i - 2]

with open('number.pickle', 'wb') as file:

    pickle.dump(number, file)

with open('number.pickle', 'rb') as file:

    data = pickle.load(file)

print (data)

这里注意一个细节，在json格式的存储中我们使用的文件打开格式是w，而在pickle这里我们使用的存储文件打开格式是wb，pickle的读取也是用的rb的二进制的读取格式。上述代码的执行输出结果如下：

[dechin@dechin-manjaro store_class]$ python3 pickle_dic.py

{1: 1, 2: 1, 3: 2, 4: 3, 5: 5, 6: 8, 7: 13, 8: 21, 9: 34, 10: 55}

这里我们可以发现，由pickle所存储的字典格式中的整型的索引也被成功的存储起来，在当前目录下产生了一个名为number.pickle的文件就是持久化存储的对象。

[dechin@dechin-manjaro store_class]$ ll

总用量 12

-rw-r--r-- 1 dechin dechin 320  3月 20 12:45 json_dic.py

-rw-r--r-- 1 dechin dechin  85  3月 20 12:46 number.json

-rw-r--r-- 1 dechin dechin  56  3月 20 12:44 number.pickle

-rw-r--r-- 1 dechin dechin 279  3月 20 12:44 pickle_dic.py

类似于json格式中的持久化读取验证，我们也可以简单修改一个类似的pickle的案例：

# pickle_dic.py

import pickle

number = {1:1, 2:1}

for i in range(3, 11):

    number[i] = number[i - 1] + number[i - 2]

with open('number.pickle', 'wb') as file:

    pickle.dump(number, file)

with open('number.pickle', 'rb') as file:

    data = pickle.load(file)

print (data)

print (number[10])

print (data[10])

执行结果如下所示：

{1: 1, 2: 1, 3: 2, 4: 3, 5: 5, 6: 8, 7: 13, 8: 21, 9: 34, 10: 55}

55

55

从结果中我们发现存储后的对象用一样的读取格式被成功读取。

使用sqlite3存储字典对象

在常用的Linux操作系统中都会自带sqlite3数据库，如果是windows和Mac的操作系统，可以按照这个教程中给的方案进行安装。

SQLite是一个进程内的库，实现了自给自足的、无服务器的、零配置的、事务性的 SQL 数据库引擎。它是一个零配置的数据库，这意味着与其他数据库不一样，您不需要在系统中配置。

就像其他数据库，SQLite引擎不是一个独立的进程，可以按应用程序需求进行静态或动态连接。SQLite直接访问其存储文件。

同时在python3的库中一般也自带了sqlite3，不需要自己安装，下面我们用ipython演示一下如何在python中使用sqlite3数据库：

[dechin@dechin-manjaro store_class]$ ipython

Python 3.8.5 (default, Sep  4 2020, 07:30:14)

Type 'copyright', 'credits' or 'license' for more information

IPython 7.19.0 -- An enhanced Interactive Python. Type '?' for help.

In [1]: import sqlite3

In [2]: conn = sqlite3.connect('test_sqlite3.db') # 如果有db文件就读取，没有就创建

In [3]: cur = conn.cursor()

In [8]: sql_test_1 = '''CREATE TABLE number

   ...:         (i NUMBER,

   ...:          n NUMBER);''' # 创建一个名为number的表，有两列数据i和n作为键值对

In [9]: cur.execute(sql_test_1) # 执行字符串指令

Out[9]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [10]: sql_test_2 = "INSERT INTO number VALUES(1,1)" # 插入新的数据

In [11]: cur.execute(sql_test_2)

Out[11]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [12]: sql_test_2 = "INSERT INTO number VALUES(2,1)"

In [13]: sql_test_3 = "INSERT INTO number VALUES(2,1)"

In [14]: cur.execute(sql_test_3)

Out[14]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [15]: sql_test_4 = "SELECT * FROM number WHERE i=1" # 检索数据

In [16]: cur.execute(sql_test_4)

Out[16]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [17]: cur.fetchall()

Out[17]: [(1, 1)]

In [18]: sql_test_5 = "SELECT * FROM number WHERE i>=1"

In [19]: cur.execute(sql_test_5)

Out[19]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [20]: cur.fetchall() # 读取检索返回值

Out[20]: [(1, 1), (2, 1)]

In [21]: for i in range(3, 11):

    ...:     sql_test_6 = "SELECT * FROM number WHERE i={}".format(i-1)

    ...:     cur.execute(sql_test_6)

    ...:     select_result1 = cur.fetchall()[0][1]

    ...:     sql_test_7 = "SELECT * FROM number WHERE i={}".format(i-2)

    ...:     cur.execute(sql_test_7)

    ...:     select_result2 = cur.fetchall()[0][1]

    ...:     cur.execute("INSERT INTO number VALUES({},{})".format(i, select_result1+select_res

    ...: ult2))

    ...: 

In [22]: sql_test_8 = "SELECT * FROM number WHERE i>=1"

In [23]: cur.execute(sql_test_8)

Out[23]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [24]: cur.fetchall()

Out[24]:

[(1, 1),

 (2, 1),

 (3, 2),

 (4, 3),

 (5, 5),

 (6, 8),

 (7, 13),

 (8, 21),

 (9, 34),

 (10, 55)]

In [25]: exit() # 退出ipython

在上述示例中我们演示了如何使用sqlite3创建数据库和表，以及对表的内容的一些常用操作。在执行完上述示例后，会在当前目录下产生一个新的db文件：

[dechin@dechin-manjaro store_class]$ ll

总用量 24

-rw-r--r-- 1 dechin dechin  320  3月 20 12:45 json_dic.py

-rw-r--r-- 1 dechin dechin   85  3月 20 12:46 number.json

-rw-r--r-- 1 dechin dechin   56  3月 20 12:47 number.pickle

-rw-r--r-- 1 dechin dechin  315  3月 20 12:47 pickle_dic.py

-rw-r--r-- 1 dechin dechin 8192  3月 20 13:05 test_sqlite3.db

如果在运行过程中出现如下所示的报错，就代表有其他的进程正在占用这个db文件，因此会有进程将这个数据库进行锁定：

Traceback (most recent call last):

  File "sqlite3_dic.py", line 15, in <module>

    cur.execute("INSERT INTO number VALUES(1,1)")

sqlite3.OperationalError: database is locked

解决的办法是，首先用fuser查看这个db文件被哪个用户所占用：

[dechin@dechin-manjaro store_class]$ fuser test_sqlite3.db

/home/dechin/projects/2021-python/store_class/test_sqlite3.db:  5120

我们查看到是5120这个进程占用了数据库文件，也是这个进程将数据库锁定了。通常这种情况出现的原因是，在python中执行的数据库操作指令未成功完成，导致数据库的进程没有结束，而我们也无法再通过这个进程向数据库中输入新的指令。因此我们只能通过将该进程杀死的方案来解决这个问题：

[dechin@dechin-manjaro store_class]$ kill -9 5120

还有一个需要注意的点是，上面所用到的数据库操作实际上并未真正的被保存到数据库文件中，需要经过commit之后才会被保存到数据库文件中。接下来我们还是用斐波那契数列的例子来演示数据库操作的使用：

# sqlite3_dic.py

import sqlite3

from tqdm import trange

conn = sqlite3.connect('test_sqlite3.db')

cur = conn.cursor()

try:

    sql_test_1 = '''CREATE TABLE number

                    (i NUMBER,

                     n NUMBER);'''

    cur.execute(sql_test_1)

except:

    pass

cur.execute("INSERT INTO number VALUES(1,1)")

cur.execute("INSERT INTO number VALUES(2,1)")

for i in trange(3, 11):

    sql_test_6 = "SELECT * FROM number WHERE i={}".format(i - 1)

    cur.execute(sql_test_6)

    select_result1 = cur.fetchall()[0][1]

    sql_test_7 = "SELECT * FROM number WHERE i={}".format(i - 2)

    cur.execute(sql_test_7)

    select_result2 = cur.fetchall()[0][1]

    cur.execute("INSERT INTO number VALUES({},{})".format(i, select_result1 + select_result2))

cur.execute("SELECT * FROM number WHERE i=10")

print (cur.fetchall())

conn.commit()

cur.close()

conn.close()

在上述用例中我们补充了commit操作和close操作，一方面持久化的保存了数据，另一方面也避免因为程序中其他地方的问题而导致了前面所提到的数据库被锁定的问题。我们看一下这个用例的执行输出情况：

[dechin@dechin-manjaro store_class]$ python3 sqlite3_dic.py

100%|█████████████████████████████████████████████████████████| 8/8 [00:00<00:00, 31775.03it/s]

[(10, 55)]

第10个斐波那契数被成功输出，在数据库的输出中，使用的格式是一个列表包含多个元组的形式。其中每一个元组代表一个满足检索条件的键值对，每一个元组中的元素代表每一列的值。

前面提到了持久化保存的问题，我们也用一个简单示例来验证刚才经过commit之后是否被成功的保存起来了：

# test_recall_sqlite3.py

import sqlite3

from tqdm import trange

conn = sqlite3.connect('test_sqlite3.db')

cur = conn.cursor()

cur.execute("SELECT * FROM number WHERE i=10")

print (cur.fetchall())

conn.commit()

cur.close()

conn.close()

执行输出如下：

[dechin@dechin-manjaro store_class]$ python3 test_recall_sqlite3.py

[(10, 55)]

这个结果表明前面存储下来的斐波那契数列已经被持久化的保存到了数据库文件中，我们只要链接上该数据库就可以随时的读取该数据。

总结概要

本文介绍了三种python的字典对象持久化存储方案，包含json、pickle和数据库sqlite，并且配合一个实际案例斐波那契数列来演示了不同解决方案的使用方法。这里三种方案实际上各有优劣，推荐的使用场景为：在轻量级、日常使用中可以重点使用json格式进行对象的存储，我们也可以很方便的在系统上直接查看json格式的文件内容;在多用户或多进程使用的案例中，推荐使用pickle的方案，可以更高性能、更低开销的持久化存储python对象;如果是需要对外提供服务的，我们推荐可以直接使用sqlite，对外可以提供一个数据库查询的解决方案，便不需要在本地存储大量的数据或者可以更方便的对大规模数据进行处理。

版权声明

本文首发链接为：https://www.cnblogs.com/dechinphy/p/sqlite.html

作者ID：DechinPhy

更多原著文章请参考：https://www.cnblogs.com/dechinphy/

python3使用json、pickle和sqlite3持久化存储字典对象的更多相关文章

python3模块: json & pickle
概念: 序列化(Serialization): 将对象的状态信息转换为可以存储或可以通过网络传输的过程,传输的格式可以是JSON,XML等.反序列化就是从存储区域(JSON,XML)读取反序列化对象的 ...
0816 1459 json & pickle ，目录导入，目录规范
---恢复内容开始--- 1.json & pickle 磁盘上只能存储字符串或二进制数据,直接存字典.列表.元组等是存不了的,所以需要把各种数据转换成字符串格式,然后再存到硬盘. 直接将一个 ...
electron使用动态配置文件及持久化存储
1.如何在打包之后,把动态配置文件比如[config.json]放在根目录,不被打包到asar文件中 //解决思路,electron可以拷贝静态资源,比如你把config.json放在项目的根目录下, ...
Python3基础（4）匿名函数、装饰器、生成器、迭代器、内置函数、json&pickle序列化、软件目录开发规范、不同目录间模块调用
---------------个人学习笔记--------------- ----------------本文作者吴疆-------------- ------点击此处链接至博客园原文------ 1 ...
python 全栈开发，Day25(复习,序列化模块json,pickle,shelve,hashlib模块)
一.复习反射必须会必须能看懂必须知道在哪儿用 hasattr getattr setattr delattr内置方法必须能看懂能用尽量用__len__ len(obj)的结果依赖于obj. ...
python模块概况，json/pickle，time/datetime，logging
参考: http://www.cnblogs.com/wupeiqi/articles/5501365.html http://www.cnblogs.com/alex3714/articles/51 ...
scrapy之持久化存储
scrapy之持久化存储 scrapy持久化存储一般有三种,分别是基于终端指令保存到磁盘本地,存储到MySQL,以及存储到Redis. 基于终端指令的持久化存储 scrapy crawl xxoo - ...
Day 4-5 序列化 json & pickle &shelve
序列化: 序列化是指把内存里的数据类型转变成字符串,以使其能存储到硬盘或通过网络传输到远程,因为硬盘或网络传输时只能接受bytes. 反序列化: 把字符转成内存里的数据类型. 用于序列化的两个模块.他 ...
Python常用模块——json & pickle
序列化模块 1.什么是序列化-------将原本的字典,列表等对象转换成一个字符串的过程就叫做序列化 2.序列化的目的 1.以某种存储形式使自定义对象持久化 2.将对象从一个地方传递到另一个地方 3. ...
json pickle xml shelve configparser
json:# 是一种跨平台的数据格式也属于序列化的一种方式pickle和shevle 序列化后得到的数据只有python才可以解析通常企业开发不可能做一个单机程序都需要联网进行计算机间的交互 J ...

随机推荐

新手友好、轻量级的C#/.NET万能工具库
前言今天分享一个基于MIT License协议开源.免费.新手友好.轻量级的C#/.NET万能工具库.帮助类库(支持.NET和.NET Core,可以帮助开发者们减少常见重复功能方法查找,提高开发工 ...
初识BigDecimal
BigDecimal所创建的是对象,我们不能使用传统的+.-.*./等算术运算符直接对其对象进行数学运算,而必须调用其相对应的方法. 方法中的参数也必须是BigDecimal的对象. BigDecim ...
Win11环境Mecab日语分词和词性分析以及动态库DLL not found问题(Python3.10）
日语因为存在假名,会导致翻译软件进行翻译时机翻味道过重的问题,比如積ん読(つんどく)这个词,大多数软件会翻译成:堆积的读,但其实是明明买了书却不读,光放着的意思.有时候也需要单独查句子中的单词释义来理 ...
CentOS7部署后优化配置
1.安装必要的组件.升级 yum -y install wget vim cd /etc/yum.repos.d/ rm -rf /etc/yum.repos.d/*.repo wget http:/ ...
python脚本抢大麦网演唱会门票 ---保姆级教程 python脚本抢大麦网演唱会门票
python脚本抢大麦网演唱会门票流程: 1.下载并安装anaconda:https://repo.continuum.io/archive/ 下载对应linux/mac/windows版本 2.下 ...
gsamplerCubeArrayShadow isn't supported in textureGrad, textureLod or texture with bias
问题描述跑rust的Bevy示例程序运行3d的示例,cargo run --example 3d_shapes 发现报错: INFO bevy_render::renderer: AdapterI ...
【OpenVINO】使用 OpenVINO CSharp API 部署 PaddleOCR 项目介绍
前言: 在之前的项目中,我们已经使用 OpenVINOTM CSharp API 部署 PaddleOCR 全系列模型,但随着PaddleOCRv4版本发布以及OpenVINO CSharp AP ...
Programming Abstractions in C阅读笔记：p196
<Programming Abstractions in C>学习第63天,p196总结.涉及到编程之外的知识,依然是读起来很费劲,需要了解作者在书中提到的人物(Edouard Lucas ...
华为云分布式云原生UCS，助力MetaERP构建企业级高可用分布式业务
本文分享自华为云社区<华为云分布式云原生UCS,助力MetaERP构建企业级高可用分布式业务>,作者:云容器大未来. 引言华为云最近成为<Forrester Wave: Multi ...
新一代云原生可观测平台之CCE服务监控篇
本文分享自华为云社区<新一代云原生可观测平台之CCE服务监控篇>,作者: 云容器大未来. 在云原生容器化浪潮的当下,监控是确保业务稳定性最受关注的问题之一.那么,华为云CCE容器服务又是如 ...

python3使用json、pickle和sqlite3持久化存储字典对象