Python中class内置方法__init__与__new__作用与区别探究
背景
最近尝试了解Django中ORM实现的原理,发现其用到了metaclass(元类)这一技术,进一步又涉及到Python class中有两个特殊内置方法__init__与__new__,决定先尝试探究一番两者的具体作用与区别。
PS: 本文中涉及的类均为Python3中默认的新式类,对应Python2中则为显式继承了object的class,因为未继承object基类的旧式类并没有这些内置方法。
__init__方法作用
凡是使用Python自定义过class就必然要和__init__方法打交道,因为class实例的初始化工作即由该函数负责,实例各属性的初始化代码一般都写在这里。事实上之前如果没有认真了解过class实例化的详细过程,会很容易误认为__init__函数就是class的构造函数,负责实例创建(内存分配)、属性初始化工作,但实际上__init__只是负责第二步的属性初始化工作,第一步的内存分配工作另有他人负责--也就是__new__函数。
__new__方法作用
__new__是一个内置staticmethod,其首个参数必须是type类型--要实例化的class本身,其负责为传入的class type分配内存、创建一个新实例并返回该实例,该返回值其实就是后续执行__init__函数的入参self,大体执行逻辑其实可以从Python的源码typeobject.c中定义的type_call函数看出来:
955 static PyObject *
956 type_call(PyTypeObject *type, PyObject *args, PyObject *kwds)
957 {
958 PyObject *obj;
959
960 if (type->tp_new == NULL) {
961 PyErr_Format(PyExc_TypeError,
962 "cannot create '%.100s' instances",
963 type->tp_name);
964 return NULL;
965 }
...
974 obj = type->tp_new(type, args, kwds); # 这里先执行tp_new分配内存、创建对象返回obj
975 obj = _Py_CheckFunctionResult((PyObject*)type, obj, NULL);
...
992 type = Py_TYPE(obj); # 这里获取obj的class类型,并判定有tp_init则执行该初始化函数
993 if (type->tp_init != NULL) {
994 int res = type->tp_init(obj, args, kwds);
995 if (res < 0) {
996 assert(PyErr_Occurred());
997 Py_DECREF(obj);
998 obj = NULL;
999 }
1000 else {
1001 assert(!PyErr_Occurred());
1002 }
1003 }
1004 return obj;
1005 }
执行代码class(*args, **kwargs) 时,其会先调用type_new函数分配内存创建实例并返回为obj,而后通过Py_TYPE(obj)获取其具体type,再进一步检查type->tp_init不为空则执行该初始化函数。
__init__ && __new__联系
上面已经明确__new__负责内存分配创建好实例,__init__负责实例属性的相关初始化工作,乍看上去对于实例属性的初始化代码完全可以也放在__new__之中,即__new__同时负责对象创建、属性初始化,省去多定义一个__init__函数的工作,那为什么要把这两个功能拆分开来呢?
stackoverflow上有一个回答感觉比较合理:
As to why they're separate (aside from simple historical reasons): __new__ methods require a bunch of boilerplate to get right (the initial object creation, and then remembering to return the object at the end). __init__ methods, by contrast, are dead simple, since you just set whatever attributes you need to set.
大意是__new__方法自定义要求保证实例创建、并且必须记得返回实例对象的一系列固定逻辑正确,而__init__方法相当简单只需要设置想要设置的属性即可,出错的可能性就很小了,绝大部分场景用户完全只需要更改__init__方法,用户无需感知__new__的相关逻辑。
另外对于一个实例理论上是可以通过多次调用__init__函数进行初始化的,但是任何实例都只可能被创建一次,因为每次调用__new__函数理论上都是创建一个新实例返回(特殊情况如单例模式则只返回首次创建的实例),而不会存在重新构造已有实例的情况。
针对__init__可被多次调用的情况,mutable和immutable对象会有不同的行为,因为immutable对象从语义上来说首次创建、初始化完成后就不可以修改了,所以后续再调用其__init__方法应该无任何效果才对,如下以list和tuple为例可以看出:
In [1]: a = [1, 2, 3]; print(id(a), a)
4590340288 [1, 2, 3]
# 对list实例重新初始化改变其取值为[4, 5]
In [2]: a.__init__([4, 5]); print(id(a), a)
4590340288 [4, 5]
In [3]: b = (1, 2, 3); print(id(b), b)
4590557296 (1, 2, 3)
# 对tuple实例尝试重新初始化并无任何效果,符合对immutable类型的行为预期
In [4]: b.__init__((4, 5)); print(id(b), b)
4590557296 (1, 2, 3)
这里可以看出将实例创建、初始化工作独立拆分后的一个好处是:要自定义immutable class时,就应该自定义该类的__new__方法,而非__init__方法,对于immutable class的定义更方便了。
使用__new__的场景
上面已经说过对于绝大部分场景自定义__init__函数初始化实例已经能cover住需求,完全不需要再自定义__new__函数,但是终归是有一些“高端”场景需要自定义__new__的,经过阅读多篇资料,这里大概总结出了两个主要场景举例如下。
定义、继承immutable class
之前已经说过__int__与__new__的拆分使immutable class的定义更加方便了,因为只需要自定义仅在创建时会调用一次的__new__方法即可保证后面任意调用其__init__方法也不会有副作用。
而如果是继承immutable class,要自定义对应immutable 实例的实例化过程,也只能通过自定义__new__来实现,更改__init__是没有用的,如下尝试定义一个PositiveTuple,其继承于tuple,但是会将输入数字全部转化为正数。
首先尝试自定义__init__的方法:
In [95]: class PositiveTuple(tuple):
...: def __init__(self, *args, **kwargs):
...: print('get in init one, self:', id(self), self)
...: # 直接通过索引赋值的方式会报: PositiveTuple' object does not support item assignment
...: # for i, x in enumerate(self):
...: # self[i] = abs(x)
...: # 只能尝试对self整体赋值
...: self = tuple(abs(x) for x in self)
...: print('get in init two, self:', id(self), self)
...:
In [96]: t = PositiveTuple([-3, -2, 5])
get in init one, self: 4590714416 (-3, -2, 5)
get in init two, self: 4610402176 (3, 2, 5)
In [97]: print(id(t), t)
4590714416 (-3, -2, 5)
可以看到虽然在__init__中重新对self进行了赋值,其实只是相当于新生成了一个tuple对象4610402176,t指向的依然是最开始生成好的实例4590714416。
如下为使用自定义__new__的方法:
In [128]: class PositiveTuple(tuple):
...: def __new__(cls, *args, **kwargs):
...: self = super().__new__(cls, *args, **kwargs)
...: print('get in init one, self:', id(self), self)
...: # 直接通过索引赋值的方式会报: PositiveTuple' object does not support item assignment
...: # for i, x in enumerate(self):
...: # self[i] = abs(x)
...: # 只能尝试对self整体赋值
...: self = tuple(abs(x) for x in self)
...: print('get in init two, self:', id(self), self)
...: return self
...:
...:
In [129]: t = PositiveTuple([-3, -2, 5])
get in init one, self: 4621148432 (-3, -2, 5)
get in init two, self: 4611736752 (3, 2, 5)
In [130]: print(id(t), t)
4611736752 (3, 2, 5)
可以看到一开始调用super.__new__时其实已经创建了一个实例4621148432,而后通过新生成一个全部转化为正数的tuple 4611736752赋值后返回,最终返回的实例t也就最终需要的全正数tuple。
使用metaclass
另一个使用__new__函数的场景是metaclass,这是一个号称99%的程序员都可以不用了解的“真高端”技术,也是Django中ORM实现的核心技术,目前本人也还在摸索、初学之中,这里推荐廖老师的一篇文章科普:https://www.liaoxuefeng.com/wiki/1016959663602400/1017592449371072 ,以后有机会再单独写一篇blog探究。
转载请注明出处,原文地址: https://www.cnblogs.com/AcAc-t/p/python_builtint_new_init_meaning.html
参考
https://stackoverflow.com/a/4859181/11153091
https://www.liaoxuefeng.com/wiki/1016959663602400/1017592449371072
https://xxhs-blog.readthedocs.io/zh_CN/latest/how_to_be_a_rich_man.html
https://blog.csdn.net/luoweifu/article/details/82732313
https://www.cnblogs.com/wdliu/p/6757511.html
Python中class内置方法__init__与__new__作用与区别探究的更多相关文章
- Python中的内置函数__init__()的理解
有点意思,本来我是学习java的.总所周知,java也有构造函数,而python在面向对象的概念中,也有构造函数.它就是 __init__(self) 方法. 其实类似于__init__()这种方法, ...
- python中字符串内置方法
字符串类型 作用:定义姓名.性别等 定义方式: s='lzs' #\n换行 \t缩进4个空格 \r回退上一个打印结果,覆盖上一个打印结果 加上一个\让后面的\变得无意义 内置方法: (优先掌握) 1. ...
- python中字典内置方法
- python常用数据类型内置方法介绍
熟练掌握python常用数据类型内置方法是每个初学者必须具备的内功. 下面介绍了python常用的集中数据类型及其方法,点开源代码,其中对主要方法都进行了中文注释. 一.整型 a = 100 a.xx ...
- Python 类的内置方法
#!/usr/bin/env python # -*- coding:utf-8 -*- # 作者:Presley # 邮箱:1209989516@qq.com # 时间:2018-11-04 # p ...
- Python反射和内置方法(双下方法)
Python反射和内置方法(双下方法) 一.反射 什么是反射 反射的概念是由Smith在1982年首次提出的,主要是指程序可以访问.检测和修改它本身状态或行为的一种能力(自省).这一概念的提出很快引发 ...
- python字符串常用内置方法
python字符串常用内置方法 定义: 字符串是一个有序的字符的集合,用与存储和表示基本的文本信息. python中引号中间包含的就是字符串. # s1='hello world' # s2=&quo ...
- python字符串处理内置方法一览表
python字符串处理内置方法一览表 序号 方法及描述 1 capitalize()将字符串的第一个字符转换为大写 2 center(width, fillchar) 返回一个指定的宽度 widt ...
- NO.4:自学python之路------内置方法、装饰器、迭代器
引言 是时候开始新的Python学习了,最近要考英语,可能不会周更,但是尽量吧. 正文 内置方法 Python提供给了使用者很多内置方法,可以便于编程使用.这里就来挑选其中大部分的内置方法进行解释其用 ...
随机推荐
- RabbitMQ消费者消失与 java OOM
原因: 下午先是收到钉钉告警有一个消费者系统任务积压, 当时以为就是有范围上量没有当回事,后来客服群开始反馈说有客户的数据没有生成.这个时候查看mq的后台,发现任务堆积数量还是很多. 这个时候登录一台 ...
- C# 给Word每一页设置不同文字水印
Word中设置水印时,可预设的文字或自定义文字设置为水印效果,但通常添加水印效果时,会对所有页面都设置成统一效果,如果需要对每一页或者某个页面设置不同的水印效果,则可以参考本文中的方法.下面,将以C# ...
- Element 2 组件源码剖析之布局容器
0x00 简介 前文分析过组件的 布局栅格化(Grid Layout) ,通过基础的 24 分栏,迅速简便地创建布局. 本文将介绍用于布局的容器组件,使用 Flexbox 功能将其所控制区域设定为特定 ...
- 从matlab的bwmorph函数的'majority'参数中扩展的一种二值图像边缘光滑的实时算法。
在matlab的图像处理工具箱中,有一系列关于Binary Images的处理函数,都是以字母bw开头的,其中以bwmorph函数选项最为丰富,一共有'bothat'.'branchpoints'.' ...
- Nginx 目录结构、Nginx服务控制命令
# Nginx目录结构 # 首先推荐一个查看目录结构的工具 tree # yum install -y tree # sudo apt-get install -y tree ubuntu # 查看n ...
- 从-99打造Sentinel高可用集群限流中间件
接上篇Sentinel集群限流探索,上次简单提到了集群限流的原理,然后用官方给的 demo 简单修改了一下,可以正常运行生效. 这一次需要更进一步,基于 Sentinel 实现内嵌式集群限流的高可用方 ...
- 6.8 NOI 模拟
\(T1\ edge\) 考虑\(O(q\times n\times \log n)\)的暴力 暴力二分,直接树上差分 #define Eternal_Battle ZXK #include<b ...
- 9. 利用Docker快速构建MGR | 深入浅出MGR
目录 1.安装Docker 2.拉取GreatSQL镜像,并创建容器 2.1 拉取镜像 2.2 创建新容器 2.3 容器管理 3.构建MGR集群 3.1 创建专用子网 3.2 创建3个新容器 3.3 ...
- WPF主窗体调用 User32的SetWindowPos 设置窗体置顶会导致与其他窗体抢夺焦点的问题
最近发现:自己开发的窗体应用,在二级弹窗或者提示框弹出的时候,交替点击窗体和窗体外(相当于窗体交替的获取焦点和失去焦点),都会导致其他的应用一闪一闪的. 经过排查,是由于该窗体由于部分因素考虑,用了 ...
- 构建数据湖上低延迟数据 Pipeline 的实践
T 摘要 · 云原生与数据湖是当今大数据领域最热的 2 个话题,本文着重从为什么传统数仓 无法满足业务需求? 为何需要建设数据湖?数据湖整体技术架构.Apache Hudi 存储模式与视图.如何解决冷 ...