在Python的世界里,将一个对象以json格式进行序列化或反序列化一直是一个问题。Python标准库里面提供了json序列化的工具,我们可以简单的用json.dumps来将一个对象序列化。但是这种序列化仅支持python内置的基本类型,对于自定义的类,我们将得到Object of type A is not JSON serializable的错误。

有很多种方法可以用来支持这种序列化,这里有一个很长的关于这个问题的讨论。总结起来,基本上有两种还不错的思路:

  1. 利用标准库的接口:从python标准json库中的JSONDecoder继承,然后自定义实现一个default方法用来自定义序列化过程

  2. 利用第三方库实现:如jsonpickle jsonweb json-tricks

利用标准库的接口的问题在于,我们需要对每一个自定义类都实现一个JSONDecoder.default接口,难以实现代码复用。

利用第三方库,对我们的代码倒是没有任何侵入性,特别是jsonpickle,由于它是基于pickle标准序列化库实现,可以实现像pickle一样序列化任何对象,一行代码都不需要修改。

但是我们观察这类第三方库的输出的时候,会发现所有的这些类库都会在输出的json中增加一个特殊的标明对象类型的属性。这是为什么呢?Python是一门动态类型的语言,我们无法在对象还没有开始构建的时候知道对象的某一属性的类型信息,为了对反序列化提供支持,看起来确实是不得不这么做。

有人可能觉得这也无可厚非,似乎不影响使用。但是在跨语言通信的时候,这就成为了一个比较麻烦的问题。比如我们有一个Python实现的API,客户端发送了一个json请求过来,我们想在统一的一个地方将json反序列化为我们Python代码的对象。由于客户端不知道服务器端的类型信息,json请求里面就没法加入这样的类型信息,这也就导致这样的类库在反序列化的时候遇到问题。

能不能有一个相对完美的实现呢?先看一下我们理想的json序列化库的需求:

  1. 我们希望能简单的序列化任意自定义对象,只添加一行代码,或者不加入任何代码

  2. 我们希望序列化的结果不加入任何非预期的属性

  3. 我们希望能按照指定的类型进行反序列化,能自动处理嵌套的自定义类,只需要自定义类提供非常简单的支持,或者不需要提供任何支持

  4. 我们希望反序列化的时候能很好的处理属性不存在的情况,以便在我们加入某一属性的时候,可以设置默认值,使得旧版本的序列化结果可以正确的反序列化出来

如果有一个json库能支持上面的四点,那就基本是比较好用的库了。下面我们来尝试实现一下这个类库。

对于我们想要实现的几个需求,我们可以建立下面这样的测试来表达我们所期望的库的API设计:

class SerializableModelTest(unittest.TestCase):
def test_model_serializable(self):
class A(SerializableModel):
def __init__(self, a, b):
super().__init__()
self.a = a
self.b = b if b is not None else B(0)
@property
def id(self):
return self.a
def _deserialize_prop(self, name, deserialized):
if name == 'b':
self.b = B.deserialize(deserialized)
return
super()._deserialize_prop(name, deserialized)
class B(SerializableModel):
def __init__(self, b):
super().__init__()
self.b = b
self.assertEqual(json.dumps({'a': 1, 'b': {'b': 2}, 'long_attr': None}), A(1, B(2)).serialize())
self.assertEqual(json.dumps({'a': 1, 'b': None}), A(1, None).serialize())
self.assertEqual(A(1, B(2)), A.deserialize(json.dumps({'a': 1, 'b': {'b': 2}})))
self.assertEqual(A(1, None), A.deserialize(json.dumps({'a': 1, 'b': None})))
self.assertEqual(A(1, B(0)), A.deserialize(json.dumps({'a': 1})))

这里我们希望通过继承的方式来添加支持,这将在反序列化的时候提供一个好处。因为有了它我们就可以直接使用A.deserialize方法来反序列化,而不需要提供任何其他的反序列化函数参数,比如这样json.deserialize(serialized_str, A)

同时为了验证我们的框架不会将@property属性序列化或者反序列化,我们特意在类A中添加了这样一个属性。

由于在反序列化的时候,框架是无法知道某一个对象属性的类型信息,比如测试中的A.b,为了能正确的反序列化,我们需要提供一点简单的支持,这里我们在类A中覆盖实现了一个父类的方法_deserialize_prop对属性b的反序列化提供支持。

当我们要反序列化一个之前版本的序列化结果时,我们希望能正确的反序列化并使用我们提供的默认值作为最终的反序列化值。

如果能有一个类可以让上面的测试通过,相信那个类就是我们所需要的类了。这样的类可以实现为如下:

class ModelBase:
@staticmethod
def is_normal_prop(obj, key):
is_prop = isinstance(getattr(type(obj), key, None), property)
is_constant = re.match('^[A-Z_0-9]+$', key)
return not (key.startswith('__') or callable(getattr(obj, key)) or is_prop or is_constant)
@staticmethod
def is_basic_type(value):
return value is None or type(value) in [int, float, str, list, tuple, bool, dict]
def _serialize_prop(self, name):
value = getattr(self, name)
if isinstance(value, (tuple, list)):
try:
json.dumps(value)
return value
except Exception:
return [v._as_dict() for v in value]
return value
def _as_dict(self):
keys = dir(self)
props = {}
for key in keys:
if not ModelBase.is_normal_prop(self, key):
continue
value = self._serialize_prop(key)
if not (ModelBase.is_basic_type(value) or isinstance(value, ModelBase)):
raise Exception('unkown value to serialize to dict: key={}, value={}'.format(key, value))
props[key] = value if self.is_basic_type(value) else value._as_dict()
return props
def _short_prop(self, name):
value = getattr(self, name)
if isinstance(value, (tuple, list)):
try:
json.dumps(value)
return value
except Exception:
return [v._as_short_dict() for v in value]
return value
def _as_short_dict(self):
keys = dir(self)
props = {}
for key in keys:
if not ModelBase.is_normal_prop(self, key):
continue
value = self._short_prop(key)
if not (ModelBase.is_basic_type(value) or isinstance(value, ModelBase)):
raise Exception('unkown value to serialize to short dict: key={}, value={}'.format(key, value))
props[key] = value if self.is_basic_type(value) else value._as_short_dict()
return props
def serialize(self):
return json.dumps(self._as_dict(), ensure_ascii=False)
def _deserialize_prop(self, name, deserialized):
setattr(self, name, deserialized)
@classmethod
def deserialize(cls, json_encoded):
if json_encoded is None:
return None
import inspect
args = inspect.getfullargspec(cls)
args_without_self = args.args[1:]
obj = cls(*([None] * len(args_without_self)))
data = json.loads(json_encoded, encoding='utf8') if type(json_encoded) is str else json_encoded
keys = dir(obj)
for key in keys:
if not ModelBase.is_normal_prop(obj, key):
continue
if key in data:
obj._deserialize_prop(key, data[key])
return obj
def __str__(self):
return self.serialize()
def _prop_eq(self, name, value, value_other):
return value == value_other
def __eq__(self, other):
if other is None or other.__class__ is not self.__class__:
return False
keys = dir(self)
for key in keys:
if not ModelBase.is_normal_prop(self, key):
continue
value, value_other = getattr(self, key), getattr(other, key)
if not (ModelBase.is_basic_type(value) or isinstance(value, ModelBase)):
raise Exception('unsupported value to compare: key={}, value={}'.format(key, value))
if value is None and value_other is None:
continue
if (value is None and value_other is not None) or (value is not None and value_other is None):
return False
if not self._prop_eq(key, value, value_other):
return False
return True
def short_repr(self):
return json.dumps(self._as_short_dict(), ensure_ascii=False)

为了更进一步提供支持,我们将最终的类命名为ModelBase,因为通常我们要序列化或反序列化的对象都是我们需要特殊对待的对象,且我们通常称其为模型,我们一般也会将其放在一个单独models模块中。

作为一个模型的基类,我们还添加了一些常用的特性,比如:

  1. 支持标准的格式化接口__str__,这样我们在使用'{}'.format(a)的时候,就可以得到一个更易于理解的输出

  2. 提供了一个缩短的序列化方式,在我们有时候不想直接输出某一个特别长的属性的时候很有用

  3. 提供了基于属性值的比较方法

  4. 自定义类的属性可以为基础的Python类型,或者由基础Python类型构成的list tuple dict

在使用这个类的时候,当然也是有一些限制的,主要的限制如下:

  1. 当某一属性为自定义类的类型的时候,需要子类覆盖实现_deserialize_prop方法为反序列化过程提供支持

  2. 当某一属性为由自定义类构成的一个list tuple dict复杂对象时,需要子类覆盖实现_deserialize_prop方法为反序列化过程提供支持

  3. 简单属性必须为python内置的基础类型,比如如果某一属性的类型为numpy.float64,序列化反序列化将不能正常工作

虽然有上述限制,但是这正好要求我们在做模型设计的时候保持克制,不要将某一个对象设计得过于复杂。比如如果有属性为dict类型,我们可以将这个dict抽象为另一个自定义类型,然后用类型嵌套的方式来实现。

到这里这个基类就差不多可以支撑我们日常的开发需要了。当然对于这个简单的实现还有可能有其他的需求或者问题,大家如有发现,欢迎留言交流。

来源:华为云社区原创 作者:Bright Liao

#华为云·寻找黑马程序员# 如何实现一个优雅的Python的Json序列化库的更多相关文章

  1. #华为云·寻找黑马程序员#【代码重构之路】如何“消除”if/else

    1. 背景 if/else是高级编程语言中最基础的功能,虽然 if/else 是必须的,但滥用 if/else,特别是各种大量的if/else嵌套,会对代码的可读性.可维护性造成很大伤害,对于阅读代码 ...

  2. 大型情感剧集Selenium:1_介绍 #华为云·寻找黑马程序员#

    学习selenium能做什么? 很多书籍.文章中是这么定义selenium的: Selenium 是开源的自动化测试工具,它主要是用于Web 应用程序的自动化测试,不只局限于此,同时支持所有基于web ...

  3. python让你再也不为文章配图与素材发愁,让高清图片占满你的硬盘! #华为云·寻找黑马程序员#

    欢迎添加华为云小助手微信(微信号:HWCloud002 或 HWCloud003),输入关键字"加群",加入华为云线上技术讨论群:输入关键字"最新活动",获取华 ...

  4. 使用Python开发小说下载器,不再为下载小说而发愁 #华为云·寻找黑马程序员#

    需求分析 免费的小说网比较多,我看的比较多的是笔趣阁.这个网站基本收费的章节刚更新,它就能同步更新,简直不要太叼.既然要批量下载小说,肯定要分析这个网站了- 在搜索栏输入地址后,发送post请求获取数 ...

  5. 爬虫新宠requests_html 带你甄别2019虚假大学 #华为云·寻找黑马程序员#

    python模块学习建议 学习python模块,给大家个我自己不专业的建议: 养成习惯,遇到一个模块,先去github上看看开发者们关于它的说明,而不是直接百度看别人写了什么东西.也许后者可以让你很快 ...

  6. #华为云·寻找黑马程序员#微服务-你真的懂 Yaml 吗?

    在Java 的世界里,配置的事情都交给了 Properties,要追溯起来这个模块还是从古老的JDK1.0 就开始了的. "天哪,这可是20年前的东西了,我居然还在用 Properties. ...

  7. #华为云·寻找黑马程序员#【代码重构之路】使用Pattern的正确姿势

    1.问题 在浏览项目时,发现一段使用正则表达式的代码 这段代码,在循环里执行了Pattern.matches()方法进行正则匹配判断. 查看matches方法的源码,可以看到 每调用一次matches ...

  8. 三伏天里小试牛刀andriod 开发 #华为云·寻找黑马程序员#

    2019年07月,北京,三伏天,好热啊.越热自己还越懒得动换(肉身给的信号),但是做为产品经理/交互设计师的,总想着思考些什么(灵魂上给的信号),或者是学习些什么,更有利于将来的职业发展吧,哈哈哈.工 ...

  9. 使用jieba分析小说太古神王中,男主更爱谁?去文章中找答案吧!#华为云·寻找黑马程序员#

    欢迎添加华为云小助手微信(微信号:HWCloud002 或 HWCloud003),输入关键字"加群",加入华为云线上技术讨论群:输入关键字"最新活动",获取华 ...

随机推荐

  1. Redis过期--淘汰机制的解析和内存占用过高的解决方案

    echo编辑整理,欢迎转载,转载请声明文章来源.欢迎添加echo微信(微信号:t2421499075)交流学习. 百战不败,依不自称常胜,百败不颓,依能奋力前行.--这才是真正的堪称强大!!! Red ...

  2. JDBC报错:The server time zone value 'Öйú±ê׼ʱ¼ä' is unrecognized or represents more than one time zone

    报错原因:查阅资料发现这都是因为安装mysql的时候时区设置的不正确 mysql默认的是美国的时区,而我们中国大陆要比他们迟8小时,采用+8:00格式 解决方法: 1.修改MySQL的配置文件,MyS ...

  3. MyBatis --- 映射关系【一对一、一对多、多对多】,懒加载机制

    映射(多.一)对一的关联关系 1)若只想得到关联对象的id属性,不用关联数据表 2)若希望得到关联对象的其他属性,要关联其数据表 举例: 员工与部门的映射关系为:多对一 1.创建表 员工表 确定其外键 ...

  4. avtivmq(订阅写法)

    发布-订阅消息模式与点对点模式类似,只不过在session创建消息队列时,由session.createQuene()变为session.createTopic(). 消息发布者代码: 消息订阅者代码 ...

  5. maven聚合(依赖聚合)

    maven聚合工程 原文地址:http://juvenshun.iteye.com/blog/305865 http://blog.csdn.NET/woxueliuyun/article/detai ...

  6. pat 1011 World Cup Betting(20 分)

    1011 World Cup Betting(20 分) With the 2010 FIFA World Cup running, football fans the world over were ...

  7. hdu 1509 Windows Message Queue (优先队列)

    Windows Message QueueTime Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Oth ...

  8. 虚拟机和容器docker

    云计算中最主要的技术就是虚拟机,开源虚拟机已经kvm已经集成到Linux内核!针对虚拟机浪费资源(CPU.内存.存储等)较大的缺陷,google力推Docker容器和容器管理平台Kubernetes. ...

  9. 菜鸟手把手学Shiro之shiro授权流程

    一.首先我们从整体去看一下授权流程,然后再根据源码去分析授权流程.如下图: 流程如下: 1.首先调用 Subject.isPermitted*/hasRole*接口,其会委托给 SecurityMan ...

  10. 使用Java窗口程序执行输入的任何cmd命令

    利用Java窗口程序来执行用输入的任何命令 实现效果: Java桌面窗口,输入框.按钮,当输入框被输入命令的时候,点击按钮执行命令! 实现代码 package com.remote.remote.ag ...