一、json模块（重点）

一种跨平台的数据格式

也属于序列化的一种方式

介绍模块之前，三个问题：

序列化是什么?

我们把对象(变量)从内存中变成可存储或传输的过程称之为序列化。

反序列化又是什么?

将硬盘上存储的中间格式数据在还原为内存中的数据结构

为什么要序列化?

1、持久保持状态

2、跨平台数据的交互

JSON是什么? java script object notation 就是对象表示法
var obj = {"name":"egon"}
对于我们开发而言 json就是一种通用的数据格式任何语言都能解析

js中的数据类型在python中数据类型的对应关系

{}                           字典

[]                           list

string ""                    str

int/float                 int/float

true/false                True/False

null                         None

json格式的语法规范
最外层通常是一个字典或列表
{} or []
只要你想写一个json格式的数据那么最外层直接写{}
字符串必须是双引号
你可以在里面套任意多的层次

json模块的核心功能
dump
dumps
load
loads
不带s: 封装了write 和 read

但多数实际开发中用dumps 和 loads 较多

import json

dic={'name':'alvin','age':23,'sex':'male'}

print(type(dic))#<class 'dict'>

j=json.dumps(dic)

print(type(j))#<class 'str'>

f=open('序列化对象','w')

f.write(j)  #-------------------等价于json.dump(dic,f)

f.close()

#-----------------------------反序列化<br>

import json

f=open('序列化对象')

data=json.loads(f.read())#  等价于data=json.load(f)

两个eg：

jsontext = """{

    "users": [{

            "name": "agon",

            "age":

        },

        {

            "name": "alex",

            "age": 57

        }

    ]

}"""

# res = json.loads(jsontext)

# print(res)

mydic = {

    "users": [{

        "name": "agon",

        "age":

    },

        {

            "name": "alex",

            "age":

        }

    ]

}

# with open("b.json","wt",encoding="utf-8") as f:

#     f.write(json.dumps(mydic))

# with open("b.json", "wt", encoding="utf-8") as f:

#     json.dump(mydic, f)

二、pickle模块

专用于python语言的序列化

pickle模块主要功能
dump
load
dumps
loads
dump是序列化
load反序列化
不带s的是帮你封装write read 更方便

load函数可以多次执行每次load 都是往后在读一个对象如果没有了就抛出异常Ran out of input。

eg：

import pickle

# 用户注册后得到的数据

name = "wwl"

password = ""

height = 1.8

hobby = ["吃","喝","赌","飘",{,,}]

# with open("userdb.txt","wt",encoding="utf-8") as f:

#     text = "|".join([name,password,str(height)])

#     f.write(text)

# pickle支持python中所有的数据类型

user = {"name":name,"password":password,"height":height,"hobby":hobby,"test":}

序列化的过程

# with open("userdb.pkl","ab") as f:

#     userbytes = pickle.dumps(user)

#     f.write(userbytes)

反序列化过程

# with open("userdb.pkl","rb") as f:

#     userbytes = f.read()

#     user = pickle.loads(userbytes)

#     print(user)

#     print(type(user))

#dump 直接序列化到文件

# with open("userdb.pkl","ab") as f:

#     pickle.dump(user,f)

#load 从文件反序列化

with open("userdb.pkl","rb") as f:

    user = pickle.load(f)

    print(user)

    print(pickle.load(f))

    print(pickle.load(f))

    print(pickle.load(f))

Conclusion：

json vs pickle:

json:

优点：跨语言、体积小

缺点：只能支持int\str\list\tuple\dict

Pickle:

优点：专为python设计，支持python所有的数据类型

缺点：只能在python中使用，存储数据占空间大

三、shelve模块

shelve模块也用于序列化

它于pickle不同之处在于不需要关心文件模式什么的直接把它当成一个字典来看待
它可以直接对数据进行修改而不用覆盖原来的数据
而pickle 你想要修改只能用wb模式来覆盖

序列化

import shelve

f = shelve.open('shelve_test')  # 打开一个文件

names = ["alex", "rain", "test"]

info = {'name':'alex','age':}

f["names"] = names  # 持久化列表

f['info_dic'] = info

f.close()

反序列化

import shelve

d = shelve.open('shelve_test'，,writeback=True)  # 打开一个文件

print(d['names'])

print(d['info_dic'])
d['names'].append('wwl')
d.close()

#del d['test'] #还可以删除

四、XML模块 (可扩展的标记语言)

也是一种通用的数据格式
之所用用它也是因为跨平台

xml是实现不同语言或程序之间进行数据交换的协议，跟json差不多，但json使用起来更简单，不过，古时候，在json还没诞生的黑暗年代，大家只能选择用xml呀，至今很多传统公司如金融行业的很多系统的接口还主要是xml。

例如:

<?xml version="1.0"?>

<data>

    <country name="Liechtenstein">

        <rank updated="yes">2</rank>

        <year>2008</year>

        <gdppc>141100</gdppc>

        <neighbor name="Austria" direction="E"/>

        <neighbor name="Switzerland" direction="W"/>

    </country>

    <country name="Singapore">

        <rank updated="yes">5</rank>

        <year>2011</year>

        <gdppc>59900</gdppc>

        <neighbor name="Malaysia" direction="N"/>

    </country>

    <country name="Panama">

        <rank updated="yes">69</rank>

        <year>2011</year>

        <gdppc>13600</gdppc>

        <neighbor name="Costa Rica" direction="W"/>

        <neighbor name="Colombia" direction="E"/>

    </country>

</data>

重点还是语法格式
一、任何的起始标签都必须有一个结束标签。
<> </>
二、可以采用另一种简化语法，可以在一个标签中同时表示起始和结束标
签。这种语法是在于符号之前紧跟一个斜线（/），XML
解析器会将其翻译成<百度百科词条></百度百科词条>。
例如<百度百科词条/>。

三、标签必须按合适的顺序进行行嵌套，所以结束标签必须按镜像顺序匹配
起始标签。这好比是将起始和结束标签看作是数学中的左右括号：在没有关闭所有
的内部括号之前，是不不能关闭外面的括号的。
四、所有的特性都必须有值。
五、所有的特性都必须在值的周围加上双引号。

一个标签的组成部分
<tagename 属性名称="属性值">文本内容
</tagname>

单标签的写法
<tagename 属性名称="属性值"/>

# 镜像关闭顺序实例

    <a>

        <b>

            <c>

            </c>

        </b>

    </a>

把朋友的信息写成xml

<studentinfo>

    <张三>

        <age>20</age>

        <gender>man</gender>

    </张三>

    <李四>

        <age>20</age>

        <gender>man</gender>

    </李四>

</studentinfo>

用法：

import xml.etree.ElementTree as ElementTree

# 解析d.xml

tree = ElementTree.parse("d.xml")

print(tree)

# 获取根标签

rootTree = tree.getroot()

# 三种获取标签的方式

# 获取所有人的年龄 iter是用于在全文范围获取标签

# for item in rootTree.iter("age"):

#     # 一个标签三个组成部分

#     print(item.tag) # 标签名称

#     print(item.attrib) # 标签的属性

#     print(item.text) # 文本内容

# 第二种 从当前标签的子标签中找到一个名称为age的标签  如果有多个 找到的是第一个

# print(rootTree.find("age").attrib)

# 第三种 从当前标签的子标签中找到所有名称为age的标签

# print(rootTree.findall("age"))

# 获取单个属性

stu = rootTree.find("stu")

print(stu.get("age"))

print(stu.get("name"))

# 删除子标签

rootTree.remove(stu)

# 添加子标签

# 要先创建一个子标签

newTag = ElementTree.Element("这是新标签",{"一个属性":"值"})

rootTree.append(newTag)

# 写入文件

tree.write("f.xml",encoding="utf-8")

练习：

import xml.etree.ElementTree as ElementTree

tree = ElementTree.parse("f.xml")

rootTree = tree.getroot()

users = []

for item in rootTree.iter("stu"):

    user = item.attrib

    print(user)

    gitem = item.find("girlfriend")

    user["girlfriend"] = gitem.attrib

    users.append(user)

print(users)

Conclusion:

xml也是一种中间格式也属于序列化方式之一
与json相比较
同样的数据 json会比xml 更小效率更高
xml 需要根据文档结构手动解析而 json 直接转对象

常用模块(json/pickle/shelve/XML)的更多相关文章

python模块--json \ pickle \ shelve \ XML模块
一.json模块之前学习过的eval内置方法可以将一个字符串转成一个python对象,不过eval方法时有局限性的,对于普通的数据类型,json.loads和eval都能用,但遇到特殊类型的时候,e ...
模块 - json/pickle/shelve/xml/configparser
序列化: 序列化是指把内存里的数据类型转变成字符串,以使其能存储到硬盘或通过网络传输到远程,因为硬盘或网络传输时只能接受bytes. 为什么要序列化: 有种办法可以直接把内存数据(eg:10个列表,3 ...
python 常用模块 time random os模块 sys模块 json & pickle shelve模块 xml模块 configparser hashlib subprocess logging re正则
python 常用模块 time random os模块 sys模块 json & pickle shelve模块 xml模块 configparser hashlib subprocess ...
python 全栈开发，Day25(复习,序列化模块json,pickle,shelve,hashlib模块)
一.复习反射必须会必须能看懂必须知道在哪儿用 hasattr getattr setattr delattr内置方法必须能看懂能用尽量用__len__ len(obj)的结果依赖于obj. ...
Python学习笔记——基础篇【第六周】——json & pickle & shelve & xml处理模块
json & pickle 模块(序列化) json和pickle都是序列化内存数据到文件 json和pickle的区别是: json是所有语言通用的,但是只能序列化最基本的数据类型(字符串. ...
python 序列化及其相关模块（json,pickle,shelve,xml）详解
什么是序列化对象? 我们把对象(变量)从内存中编程可存储或传输的过程称之为序列化,在python中称为pickle,其他语言称之为serialization ,marshalling ,flatter ...
Python day19 模块介绍3（sys,json,pickle,shelve,xml）
1.sys模块 import sys sys.path()#打印系统path sys.version()#解释程序版本信息 sys.platform()#系统平台 sys.exit(0)#退出程序 c ...
python序列化及其相关模块（json,pickle,shelve,xml）详解
什么是序列化对象? 我们把对象(变量)从内存中编程可存储或传输的过程称之为序列化,在python中称为pickle,其他语言称之为serialization ,marshalling ,flatter ...
Python全栈开发记录_第八篇（模块收尾工作 json & pickle & shelve & xml）
由于上一篇篇幅较大,留下的这一点内容就想在这里说一下,顺便有个小练习给大家一起玩玩,首先来学习json 和 pickle. 之前我们学习过用eval内置方法可以将一个字符串转成python对象,不过, ...

随机推荐

highcharts插件
详见官网:https://www.highcharts.com.cn/demo/highcharts 详细使用代码: <!DOCTYPE html> <html lang=" ...
restful的特点
1. 资源(Resources) REST的名称”表现层状态转化”中,省略了主语.”表现层”其实指的是”资源”(Resources)的”表现层”. 所谓”资源”,就是网络 ...
SpringMVC七种参数绑定简单介绍
a. 默认支持的类型: httpServletRequest, httpservletresponse, httpsession, model 看自己需要, 如果需要用就加 ...
使用SpringBoot的优势。
Spring Boot 让开发变得更简单 Spring Boot 对开发效率的提升是全方位的,我们可以简单做一下对比: 在没有使用 Spring Boot 之前我们开发一个 web 项目需要做哪些工作 ...
几张图看明白VAO、VBO、EBO的关系和代码顺序
0.详细教程可看https://learnopengl-cn.github.io/01%20Getting%20started/04%20Hello%20Triangle/ 1.可以简单地认为VAO的 ...
Linux(64) 下 Tomcat + java 环境搭建
查看 linux 系统位数 getconf LONG_BIT java JDK下载地址: http://download.oracle.com/otn-pub/java/jdk/8u181-b13/ ...
GoldenGate实时投递数据到大数据平台（2）- Cassandra
简介 GoldenGate是一款可以实时投递数据到大数据平台的软件,针对apache cassandra,经过简单配置,即可实现从关系型数据将增量数据实时投递到Cassandra,以下介绍配置过程. ...
巧用ELK快速实现网站流量监控可视化
前言本文可能不会详细记录每一步实现的过程,但一定程度上可以引领小伙伴走向更开阔的视野,串联每个环节,呈现予你不一样的效果. 业务规模 8个平台 100+台服务器 10+个集群分组微服务600+ 用 ...
QT多线程简单例子
在Qt中实现多线程,除了使用全局变量.还可以使用信号/槽机制. 以下例子使用信号/槽机制. 功能: 在主线程A界面上点击按钮,然后对应开起一个线程B.线程B往线程A发送一个字符串,线程A打印出来. 1 ...
P4577 [FJOI2018]领导集团问题
P4577 [FJOI2018]领导集团问题我们对整棵树进行dfs遍历,并用一个multiset维护对于每个点,它的子树可取的最大点集. 我们遍历到点$u$时: 不选点$u$,显然答案就为它的所有子 ...

常用模块(json/pickle/shelve/XML)