从range和xrange的性能对比到yield关键字（中）

上节提出了range和xrange的效率问题，这节我们来探究其中的原因

yield的使用

我们看下面的程序：

#coding: utf-8

def test():

    print 4

    print 2

    print 5

if __name__ == '__main__':

    test()

这段代码的运行结果当然是没有任何疑问的。

但是如果我将代码修改一下：

#coding: utf-8

def test():

    yield 4

    yield 2

    yield 5

if __name__ == '__main__':

    print test()

运行结果有些奇怪：

<generator object test at 0xb71f1144>

我们尝试这样使用：

if __name__ == '__main__':

    for i in test():

        print i

结果却出人意料：

wing@ubuntu:~/Documents/py|⇒  python 17.py

4

2

5

这是什么原因呢？这里看起来，test()好像一个集合，里面存储了4，2，5，所以我们才能够依次遍历。

实际上，原因并非如此。

当一个函数中含有yield时，这个函数就不再是一个普通的函数，而是一个可迭代的对象（实际上叫做生成器，不过现在不必关心概念）。

同样，执行该函数时，不再是马上执行其中的语句，而是生成一个可迭代对象。当执行迭代的时候，才真正运行其中的代码。

当函数体执行到yield时，便退出这个函数，此时yield具有return的功能。但是这里的关键是，当下次执行这个函数时，并不是从头开始执行，而是从上次yield退出的位置继续执行。

尝试下面的代码：

#coding: utf-8

def test():

    yield 4

    yield 2

    yield 5

if __name__ == '__main__':

    t = test()

    it = iter(t)

    print it.next()

    print it.next()

    print it.next()

    print it.next()

运行结果为：

wing@ubuntu:~/Documents/py|⇒  python 17.py

4

2

5

Traceback (most recent call last):

  File "17.py", line 14, in <module>

    print it.next()

StopIteration

从这里的结果可以看出，test()语句没有执行代码段，而是生成了一个可以迭代的对象。

我们甚至可以得出结论，每当执行一次next，就向后执行到下一个yield语句，或者所有的语句执行完毕。

range的实现

我们尝试实现range：

#coding: utf-8

def _range(value):

    i = 0

    result = []

    while i < value:

        result.append(i)

        i += 1

    return result

if __name__ == '__main__':

    for i in _range(4):

        print i

range的逻辑比较简单，就是生成一个列表。

xrange的模拟实现

我们根据前面的结论，猜测xrange是一个含有yield的函数，于是：

#coding: utf-8

def _xrange(value):

    i = 0

    while i < value:

        yield i

        i += 1

if __name__ == '__main__':

    for i in _xrange(4):

        print i

运行一下，结果和我们预期一致。

当然，实际的xrange比我们这里编写的更加复杂，但是基本原理是一致的。

为何xrange比range高效？

答案很明显了，range是一次性生成所有的数据，而xrange，内部使用了yield关键字，每次只运行其中一部分，这样从头到尾都没有占用大量的内存和时间。所以效率较高。

我们再次比较性能，这次比较的是我们自己编写的版本：

#coding: utf-8

import sys

from time import time

def _range(value):

    i = 0

    result = []

    while i < value:

        result.append(i)

        i += 1

    return result

def _xrange(value):

    i = 0

    while i < value:

        yield i

        i += 1

def count_time(func):

    def wrapped(*args, **kargs):

        begin_time = time()

        result = func(*args, **kargs)

        end_time = time()

        cost_time = end_time - begin_time

        print '%s called cost time : %s ms' %(func.__name__, float(cost_time)*1000)

        return result

    return wrapped

@count_time

def test1(length):

    for i in _range(length):

        pass

@count_time

def test2(length):

    for i in _xrange(length):

        pass

if __name__ == '__main__':

    length = int(sys.argv[1])

    test1(length)

    test2(length)

运行结果为：

wing@ubuntu:~/Documents/py|⇒  python 19.py 1000

test1 called cost time : 0.116109848022 ms

test2 called cost time : 0.0619888305664 ms

wing@ubuntu:~/Documents/py|⇒  python 19.py 10000

test1 called cost time : 2.39086151123 ms

test2 called cost time : 0.566959381104 ms

wing@ubuntu:~/Documents/py|⇒  python 19.py 100000

test1 called cost time : 15.5799388885 ms

test2 called cost time : 6.41298294067 ms

wing@ubuntu:~/Documents/py|⇒  python 19.py 1000000

test1 called cost time : 130.295038223 ms

test2 called cost time : 65.4468536377 ms

wing@ubuntu:~/Documents/py|⇒  python 19.py 10000000

test1 called cost time : 13238.3038998 ms

test2 called cost time : 652.212142944 ms

显然，使用yield的版本更加高效。

下文，我们探究生成器。

从range和xrange的性能对比到yield关键字（中）的更多相关文章

从range和xrange的性能对比到yield关键字（上）
使用xrange 当我们获取某个数量的循环时,我们惯用的手法是for循环和range函数,例如: for i in range(10): print i 这里range(10)生成了一个长度为10 ...
WPF DataGrid与ListView性能对比与场景选择
开门见山的说性能对比: 在Demo中,DataGrid与ListView默认开启虚拟化(可以理解为动态渲染,类似懒加载只渲染屏幕可以看见的地方) DataGrid渲染10列50行随机字符280ms ...
[Python]range与xrange用法对比
[整理内容]具体如下: 先来看如下示例:>>>x=xrange(0,8)>>> print xxrange(8)>>>print x[0]0> ...
实验比较python中的range和xrange
1 结论: 全用xrange,除非你需要使用返回的列表 2 实验一:性能对比实验环境:win7 ,64位系统 python2.7 import time StartTime=time.time() ...
Python从题目中学习：range()和xrange()
近期给公司培训Python,好好啃了啃书本,查了查资料,总结一些知识点. --------------------------------------------------------------- ...
python 中range与xrange的区别
先来看看range与xrange的用法介绍 help(range)Help on built-in function range in module __builtin__: range(...) r ...
range和xrange的区别详解
两种用法介绍如下:1.range([start], stop[, step])返回等差数列.构建等差数列,起点是start,终点是stop,但不包含stop,公差是step.start和step是可选 ...
Suspend to RAM和Suspend to Idle分析，以及在HiKey上性能对比【转】
转自:https://www.cnblogs.com/arnoldlu/p/6253665.html 测试环境:AOSP 7.1.1+Kernel 4.4.17 HW:HiKey Ubuntu 14. ...
range与xrange的区别
一.Python中range()与xrange()有什么区别 range([start,] stop[, step]),根据start与stop指定的范围以及step设定的步长,生成一个序列 rang ...

随机推荐

poj 2060 Taxi Cab Scheme (二分匹配)
Taxi Cab Scheme Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 5710 Accepted: 2393 D ...
（引用） unittest测试驱动之执行测试(三)
转载:http://www.wtoutiao.com/p/ydeoyY.html 在unittest的模块中,提供了TestRunner类来进行运行测试用例,在实际的应用中,经常使用的是TextTes ...
mORMot使用基础
mORMot 名称来自Marmot,对,土拨鼠,俗称旱獭,是一种生活在高寒山区的动物.多数都在白天活动,喜群居,善掘土,所挖地道深达数米,内有铺草的居室,非常舒适.通常洞穴都会有两个以上的入口,以策安 ...
XmlSerializer 对象的Xml序列化和反序列化，XMLROOT别名设置
这篇随笔对应的.Net命名空间是System.Xml.Serialization:文中的示例代码需要引用这个命名空间. 为什么要做序列化和反序列化? .Net程序执行时,对象都驻留在内存中:内存中 ...
linux里添加locate命令
在linux里使用和find一样的功能例如 find -name xx 可以yum install mlocate 然后 updatedb 再使用locate xx 来查找xx文件
java线程详解（一）
1,相关概念简介 (1)进程:是一个正在执行的程序.每一个进程执行都有一个执行的顺序,该顺序就是一个执行路径,或者叫一个控制单元.用于分配空间. (2)线程:就是进程中一个独立的控制单元,线程在控制着 ...
IE9或以上的浏览器flash值为空时，导致domready不触发
在前些时间开发中遇到一个问题当flash值<param name="movie" value=""/>为空时,IE版本>=9不会触发domre ...
python基础整理笔记（五）
一. python中正则表达式的一些查漏补缺 1. 给括号里分组的表达式加上别名:以便之后通过groupdict方法来方便地获取. 2. 将之前取名为"name"的分组所获得的 ...
haskell中的monad
monad本意是单子.在haskell中,第一个接触的基本都是IO action,通过把IO动作包装起来我们能很方便的与现实世界进行数据交换.但其实monad的用途不止如此,monad还能讲一系列操作 ...
项目学习——电力系统底层架构ssh
电力系统底层架构1.建立web工程创建数据库导入向对应的jar包2. 持久层: (1)在cn.itcast.elec.domain中创建持久化类ElecText @SuppressWarnings ...

从range和xrange的性能对比到yield关键字（中）

从range和xrange的性能对比到yield关键字（中）的更多相关文章

随机推荐

热门专题