Python数据模型及Pythonic编程

Python作为一种多范式语言，它的很多语言特性都能从其他语言上找到参照，但是Python依然形成了一套自己的“Python 风格”（Pythonic）。这种Pythonic风格完全体现在 Python 的数据模型上，而数据模型中的元接口（指那些名字以两个下划线开头，以两个下划线结尾的特殊方法，例如 __getitem__），就是编写地道的Python代码的秘密所在。这种基于元接口实现的设计模式，也叫鸭子类型（duck typing）。

鸭子类型指的是对象的类型无关紧要，只要实现了特定的接口即可。忽略对象的真正类型，转而关注对象有没有实现所需的方法、签名和语义。Python的数据模型都支持鸭子类型，鸭子类型也是地道Python编程鼓励的风格，所以如果觉得自己想创建新的抽象基类，先试着通过常规的鸭子类型来解决问题。

数据模型其实是对 Python 框架的描述，它规范了这门语言自身构建模块的接口，这些模块包括类、函数、序列、迭代器、上下文管理器等。

类

得益于 Python 数据模型，自定义类的行为可以像内置类型那样自然。实现如此自然的行为，靠的不是继承，而是元接口。Python给类设计了大量的元接口，具体请参看Python 语言参考手册中的“Data Model”章节。下面是一些类的元接口的展示。

"""

    >>> v1 = Vector2d(3, 4)

    通过元接口__iter__支持拆包

    >>> x, y = v1

    >>> x, y

    (3.0, 4.0)

    通过元接口__repr__支持字面量表示和repr函数

    >>> v1

    Vector2d(3.0, 4.0)

    >>> v1_clone = eval(repr(v1))

    >>> v1 == v1_clone

    True

    通过元接口__str__支持print函数

    >>> print(v1)

    (3.0, 4.0)

    通过元接口__bytes__支持bytes函数

    >>> octets = bytes(v1)

    >>> octets

    b'd\\x00\\x00\\x00\\x00\\x00\\x00\\x08@\\x00\\x00\\x00\\x00\\x00\\x00\\x10@'

    通过元接口__abs__支持abs函数

    >>> abs(v1)

    5.0

    通过元接口__bool__支持bool函数

    >>> bool(v1), bool(Vector2d(0, 0))

    (True, False)

    通过property支持可读属性

    >>> v1.x, v1.y

    (3.0, 4.0)

    >>> v1.x = 123

    Traceback (most recent call last):

      ...

    AttributeError: can't set attribute

    通过__hash__支持对象可散列，支持dict、set等函数

    >>> hash(v1)

    7

    >>> set(v1)

    {3.0, 4.0}

    >>> {v1: 'point1'}

    {Vector2d(3.0, 4.0): 'point1'}

"""

from array import array

import math

class Vector2d:

    typecode = 'd'

    def __init__(self, x, y):

        self.__x = float(x)

        self.__y = float(y)

    @property

    def x(self):

        return self.__x

    @property

    def y(self):

        return self.__y

    def __iter__(self):

        return (i for i in (self.x, self.y))

    def __repr__(self):

        class_name = type(self).__name__

        return '{}({!r}, {!r})'.format(class_name, *self)

    def __str__(self):

        return str(tuple(self))

    def __bytes__(self):

        return (bytes([ord(self.typecode)]) +

                bytes(array(self.typecode, self)))

    def __eq__(self, other):

        return tuple(self) == tuple(other)

    def __hash__(self):

        return hash(self.x) ^ hash(self.y)

    def __abs__(self):

        return math.hypot(self.x, self.y)

    def __bool__(self):

        return bool(abs(self))

函数

Python中一切皆对象，函数也不例外，而且Python中的函数还是一等对象。函数可以理解为一种可调用对象语法糖。

可调用对象的元接口是__call__。如果一个类定义了 __call__ 方法，那么它的实例可以作为函数调用。示例如下。

"""

>>> pickcard = Cards(range(52))

>>> pickcard()

51

>>> pickcard()

50

>>> callable(pickcard)

True

"""

class Cards:

    def __init__(self, items):

        self._items = list(items)

    def __call__(self):

        return self._items.pop()

序列

Python 的序列数据模型的元接口很多，但是对象只需要实现 __len__ 和 __getitem__ 两个方法，就能用在绝大部分期待序列的地方，如迭代，[]运算符、切片、for i in 等操作。示例如下：

"""

>>> poker = Poker()

支持len运算

>>> len(poker)

52

支持[]运算

>>> poker[0]

Card(rank='2', suit='spades')

>>> poker[-1]

Card(rank='A', suit='hearts')

支持切片运算

>>> poker[12::13]

[Card(rank='A', suit='spades'), Card(rank='A', suit='diamonds'), Card(rank='A', suit='clubs'), Card(rank='A', suit='hearts')]

支持 for i in 运算

>>> for card in poker: print(card)  # doctest: +ELLIPSIS

...

Card(rank='2', suit='spades')

Card(rank='3', suit='spades')

Card(rank='4', suit='spades')

...

支持 in 运算

>>> Card('7', 'hearts') in poker

True

"""

import collections

Card = collections.namedtuple('Card', ['rank', 'suit'])

class Poker:

    ranks = [str(n) for n in range(2, 11)] + list('JQKA')

    suits = 'spades diamonds clubs hearts'.split()

    def __init__(self):

        self._cards = [Card(rank, suit) for suit in self.suits

                                        for rank in self.ranks]

    def __len__(self):

        return len(self._cards)

    def __getitem__(self, position):

        return self._cards[position]

从测试用例上可以看出它具有序列所有特性，即便它是 object 的子类也无妨。因为它的行为像序列，那我们就可以说它是序列。

迭代

Python中，可迭代对象的元接口是__iter__。迭代器可以从可迭代的对象中获取，__iter__和__next__是它的2个主要的元接口。__iter__ 方法使对象支持迭代，__next__ 方法返回序列中的下一个元素。如果没有元素了，那么抛出 StopIteration 异常。

迭代器可以迭代，但是可迭代的对象不是迭代器，也一定不能是自身的迭代器。也就是说，可迭代的对象必须实现 __iter__ 方法，但不能实现 __next__ 方法。

只要实现__iter__接口的对象，就是迭代鸭子类型，自然就支持所有的迭代运算。示例如下：

"""

>>> s = Sentence('hello world')

>>> s

Sentence('hello world')

支持迭代list运算

>>> list(s)

['hello', 'world']

获取迭代器

>>> it = iter(s)

支持迭代器next运算

>>> next(it)

'hello'

>>> next(it)

'world'

>>> next(it)

Traceback (most recent call last):

  ...

StopIteration

支持迭代for运算

>>> for w in s: print(w)

hello

world

"""

import re

import reprlib

RE_WORD = re.compile('\w+')

class Sentence:

    def __init__(self, text):

        self.text = text

    def __repr__(self):

        return 'Sentence(%s)' % reprlib.repr(self.text)

    def __iter__(self):

        word_iter = RE_WORD.finditer(self.text)

        return SentenceIter(word_iter)  

class SentenceIter():

    def __init__(self, word_iter):

        self.word_iter = word_iter  

    def __next__(self):

        match = next(self.word_iter)

        return match.group()  

    def __iter__(self):

        return self

上面这个例子中，可迭代对象Sentence通过定义迭代器SentenceIter的方式实现。更Pythonic的做法是通过生成器yield来实现。下面是一个示例，能通过上面的所有测试用例，但代码更加精简。

RE_WORD = re.compile('\w+')

class Sentence:

    def __init__(self, text):

        self.text = text 

    def __repr__(self):

        return 'Sentence(%s)' % reprlib.repr(self.text)

    def __iter__(self):

        for match in RE_WORD.finditer(self.text):

            yield match.group()

上下文管理器

Python的with关键字是上下文管理器语法糖，上下文管理器协议包含 __enter__ 和 __exit__ 两个方法。with 语句开始运行时，会在上下文管理器对象上调用 __enter__ 方法。with 语句运行结束后，会在上下文管理器对象上调用 __exit__ 方法，以此扮演 finally 子句的角色。可以看出，上下文管理器简化了 try/finally 模式。下面是一个示例。

"""

ReversePrint对象的上下文管理，进入with块后，标准输出反序打印，

退出with块后，标准输出恢复正常状态。

>>> with ReversePrint() as what:

...      print('Hello world!')

!dlrow olleH

>>> print('Hello world!')

Hello world!

"""

class ReversePrint:

    def __enter__(self):

        import sys

        self.original_write = sys.stdout.write

        sys.stdout.write = self.reverse_write

        return 'JABBERWOCKY'

    def reverse_write(self, text):

        self.original_write(text[::-1])

    def __exit__(self, exc_type, exc_value, traceback):

        import sys

        sys.stdout.write = self.original_write

        if exc_type is ZeroDivisionError:

            print('Please DO NOT divide by zero!')

            return True

Python数据模型及Pythonic编程的更多相关文章

如何像Python高手(Pythonista)一样编程
最近在网上看到一篇介绍Pythonic编程的文章:Code Like a Pythonista: Idiomatic Python,其实作者在2006的PyCon会议后就写了这篇文章,写这篇文章的主要 ...
第1章 Python数据模型
#<流畅的Python>读书笔记 # 第一部分序幕 # 第1章 Python数据模型 # 魔术方法(magic method)是特殊方法的昵称.于是乎,特殊方法也叫双下方法(dunder ...
python高级（一）—— python数据模型(特殊方法)
本文主要内容 collections.namedtuple __getitem__ 和 __len__ __repr__和__str__ __abs__.__add__和__mul__ __bool_ ...
[转]如何像Python高手(Pythonista)一样编程
本文转自:http://xianglong.me/article/how-to-code-like-a-pythonista-idiomatic-python 最近在网上看到一篇介绍Pythonic编 ...
python高级之网络编程
python高级之网络编程本节内容网络通信概念 socket编程 socket模块一些方法聊天socket实现远程执行命令及上传文件 socketserver及其源码分析 1.网络通信概念说 ...
【循序渐进学Python】15.网络编程
Python 内置封装了很多常见的网络协议的库,因此Python成为了一个强大的网络编程工具,这里是对Python的网络方面编程的一个简单描述. 1. 常用的网络设计模块在标准库中有很多网络设计相关 ...
Python Decorator 和函数式编程
看到一篇翻译不错的文章,原文链接: Python Decorator 和函数式编程
Python基础：函数式编程
一.概述 Python是一门多范式的编程语言,它同时支持过程式.面向对象和函数式的编程范式.因此,在Python中提供了很多符合函数式编程风格的特性和工具. 以下是对 Python中的函数式编程 ...
用 eric6 与 PyQt5 实现python的极速GUI编程（系列01）--Hello world!
[题记] 我是一个菜鸟,这个系列是我的学习笔记. PyQt5 出来有一段时间了, PyQt5 较之 PyQt4 有一些变化,而网上流传的几乎都是 PyQt4 的教程,照搬的话大多会出错. eric6 ...

随机推荐

【bzoj 2159】Crash 的文明世界
Description Crash小朋友最近迷上了一款游戏——文明5(Civilization V).在这个游戏中,玩家可以建立和发展自己的国家,通过外交和别的国家交流,或是通过战争征服别的国家.现在 ...
junit测试
/**ssm框架测试service**/ import com.alibaba.fastjson.JSON; import com.raycloud.waimai.customer.center.po ...
【1】学习C++时，一些零散知识点01
1.编程理念学习从学习完C后,接触了C++,最重要的便是编程理念的转变.C缩重视的是结构化编程,面对一个较大的程序,就将他分解成小型.便于管理的任务,如果分解后的任务还是偏难过大的话,那将这个任务继 ...
vue路由--网站导航功能
1.首先需要按照Vue router支持 npm install vue-router然后需要在项目中引入: import Vue from 'vue' import VueRouter from ' ...
（三）ORB特征匹配
ORBSLAM2匹配方法流程在基于特征点的视觉SLAM系统中,特征匹配是数据关联最重要的方法.特征匹配为后端优化提供初值信息,也为前端提供较好的里程计信息,可见,若特征匹配出现问题,则整个视觉SLA ...
Spring框架-AOP详细学习[转载]
参考博客:https://blog.csdn.net/qq_22583741/article/details/79589910#4-%E4%BE%9D%E8%B5%96%E6%B3%A8%E5%85% ...
kafka单机安装和启动
1.下载并解压到/usr/local/src目录下 2.运行kafka需要使用Zookeeper,先启动Zookeeper,如果没有Zookeeper,可以使用kafka自带打包和配置好的Zookee ...
SpringMVC整合Thymeleaf3
(1).pom添加相关依赖 <dependency> <groupId>org.thymeleaf</groupId> <artifactId>thym ...
Web前端-关于jQuerry
jQuery-The write less,do more,jacascript library 非常方便的js库,封装了许多有用的功能. 1.jq与js对象之间的转换 <script> ...
Bootstrap-datepicker3官方文档中文翻译---Markup/标记（原文链接 http://bootstrap-datepicker.readthedocs.io/en/latest/index.html）
Markup/标记下面是已经支持的标签的例子.这些标签本身不会提供DatePicker控件:你需要在标签上实例化Datepicker. input/输入框最简单的例子: input获得焦点 (使用 ...

Python数据模型及Pythonic编程

类

函数

序列

迭代

上下文管理器

Python数据模型及Pythonic编程的更多相关文章

随机推荐

热门专题