上个月,学习群里的 S 同学问了个题目,大意可理解为列表降维 ,例子如下:

oldlist = [[1, 2, 3], [4, 5]]

# 想得到结果:
newlist = [1, 2, 3, 4, 5]

原始数据是一个二维列表,目的是获取该列表中所有元素的具体值。从抽象一点的角度来理解,也可看作是列表解压或者列表降维。

这个问题并不难,但是,怎么写才比较优雅呢?

# 方法一,粗暴拼接法:
newlist = oldlist[0] + oldlist[1]

这种方法简单粗暴,需要拼接什么内容,就取出来直接拼接。然而,如果原列表有很多子列表,则这个方法就会变得繁琐了。

我们把原问题升级一下:一个二维列表包含 n 个一维列表元素,如何优雅地把这些子列表拼成一个新的一维列表?

方法一的做法需要写 n 个对象,以及 n - 1 次拼接操作。当然不可行。下面看看方法二:

# 方法二,列表推导式:
newlist = [i for j in range(len(oldlist)) for i in oldlist[j]]

这个表达式中出现了两个 for 语句,在第一个 for 语句中,我们先取出原列表的长度,然后构造 range 对象,此时 j 的取值范围是 [0, n-1] 的闭区间。

在第二个 for 语句中,oldlist[j] 指的正是原列表的第 j 个子列表,for i in oldlist[j] 则会遍历取出 j 子列表的元素,由于 j 取值的区间正对应于原列表的全部索引值,所以,最终达到解题目的。

这种方法足够优雅了,而且理解也并不难。

然而,我们是否就能满足于此了呢?有没有其它奇技淫巧,哦不,是其它高级方法呢?F 同学贡献了一个思路:

# 方法三,巧用sum:
newlist = sum(oldlist,[])

说实话,这个方法令我大感意外!sum() 函数不是用于求和的么?怎么竟然有此用法?

这个写法利用了什么原理呢?由于我开始时不知道 sum() 函数可以接收两个参数,不清楚它们是怎么用于计算的,所以一度很困惑。但是,当我知道 sum() 的完整用法时,我恍然大悟。

接下来也不卖关子了,直接揭晓吧。

语法: sum(iterable[, start]) ,sum() 函数的第一个参数是可迭代对象,如列表、元组或集合等,第二个参数是起始值,默认为 0 。其用途是以 start 值为基础,再与可迭代对象的所有元素相“加”。

在上例中,执行效果是 oldlist 中的子列表逐一与第二个参数相加,而列表的加法相当于 extend 操作,所以最终结果是由 [] 扩充成的列表。

这里有两个关键点:sum() 函数允许带两个参数,且第二个参数才是起点。 可能 sum() 函数用于数值求和比较多,然而用于作列表的求和,就有奇效。它比列表推导式更加优雅简洁!

至此,前面的升级版问题就得到了很好的回答。简单回顾一下,s 同学最初的问题可以用三种方法实现,第一种方法中规中矩,第二种方法正道进阶,而第三种方法旁门左道(没有贬义,只是说它出人意料,却效果奇佳)。

这道并不算难的问题,在众人的讨论与分享后,竟还引出了很有价值的学习内容。前不久,同样是群内的一个问题,也产生了同样的学习效果,详见《Python进阶:如何将字符串常量转为变量?》。

我从中得到了一个启示:应该多角度地思考问题,设法寻求更优解,同时,基础知识应掌握牢固,并灵活贯通起来。

学无止境,这里我还想再开拓一下思路,看看能发现些什么。

1、如果原列表的元素除了列表,还有其它类型的元素,怎么把同类的元素归并在一起呢?

2、如果是一个三维或更高维的列表,怎么更好地把它们压缩成一维列表呢?

3、sum() 函数还有什么知识要点呢?

前两个问题增加了复杂度,解决起来似乎没有“灵丹妙药”了,只能用笨方法分别拆解,逐一解压。

第三个思考题是关于 sum() 函数本身的用法,我们看看官方文档是怎么说的:

The iterable’s items are normally numbers, and the start value is not allowed to be a string.

For some use cases, there are good alternatives to sum(). The preferred, fast way to concatenate a sequence of strings is by calling ''.join(sequence). To add floating point values with extended precision, see math.fsum(). To concatenate a series of iterables, consider using itertools.chain().

sum() 的第二个参数不允许是字符串。如果用了,会报错:

TypeError: sum() can't sum strings [use ''.join(seq) instead]

为什么不建议使用 sum() 来拼接字符串呢?哈哈,文档中建议使用 join() 方法,因为它更快。为了不给我们使用慢的方法,它竟特别限定不允许 sum() 的第二个参数是字符串。

文档还建议,在某些使用场景时,不要用 sum() ,例如当以扩展精度对浮点数求和时,推荐使用 math.fsum() ;当要拼接一系列的可迭代对象时,应考虑使用 itertools.chain()

浮点数的计算是个难题,我曾转载过一篇《如何在 Python 里面精确四舍五入?》,对此有精彩分析。而itertools.chain() 可以将不同类型的可迭代对象串联成一个更大的迭代器,这在旧文《Python进阶:设计模式之迭代器模式》中也有论及。

不经意间,sum() 函数的注意事项,竟把 Python 其它的进阶内容都联系起来了。小小的函数,竟成为学习之路上的一个枢纽。

前段时间,我还写过 range() 、locals() 和 eval() 等内置函数,也是通过一个问题点,而关联出多个知识点, 获益良多。这些内置函数/类的魔力可真不小啊。

本文到此结束,希望对你有所帮助。

友情提示: 本公众号内有限时抽奖活动,送出 Python 书籍 15 本,书目有《Python数据分析与挖掘实战》、《Python语言程序设计》《自学Python编程基础、科学计算及数据分析》《实用机器学习》、《Python程序员面试算法宝典》,活动结束时间为本月 20 日 18 点 ,赶快来抽奖啦!详情请戳:抽奖送书

公众号【Python猫】, 专注Python技术、数据科学和深度学习,力图创造一个有趣又有用的学习分享平台。本号连载优质的系列文章,有喵星哲学猫系列、Python进阶系列、好书推荐系列、优质英文推荐与翻译等等,欢迎关注哦。PS:后台回复“爱学习”,免费获得一份学习大礼包。

如何给列表降维?sum()函数的妙用的更多相关文章

  1. sum() 函数性能堪忧,列表降维有何良方?

    本文原创并首发于公众号[Python猫],未经授权,请勿转载. 原文地址:https://mp.weixin.qq.com/s/mK1nav2vKykZaKw_TY-rtw Python 的内置函数 ...

  2. CSS技巧-rgba函数的妙用

    先简单介绍一下: rgba()函数是平时开发中经常遇到的,这篇文章也做了一个比较详细的解读以及一系列的应用. 对它的工作原理做一番分析:就是具有一定透明度的盒子: 还比较了rgba()函数和不透明度属 ...

  3. 关于SQL语句中SUM函数返回NULL的解决办法

    SUM 是SQL语句中的标准求和函数,如果没有符合条件的记录,那么SUM函数会返回NULL. 但多数情况下,我们希望如果没有符合条件记录的情况下,我们希望它返回0,而不是NULL,那么我们可以使用例如 ...

  4. Oracle的over子函数的妙用

    摘要 oracle的over 子函数可实现按指定的字段分组排序,对于相同分组字段的结果集进行排序,其中PARTITION BY 为分组字段,ORDER BY 指定排序字段这对统计分析这类问题意想不到的 ...

  5. Python sum() 函数

    Python sum() 函数  Python 内置函数 描述 sum() 方法对系列进行求和计算. 语法 以下是 sum() 方法的语法: sum(iterable[, start]) 参数 ite ...

  6. sql 中sum函数返回null的解决方案

    SUM 是SQL语句中的标准求和函数,如果没有符合条件的记录,那么SUM函数会返回NULL. 但多数情况下,我们希望如果没有符合条件记录的情况下,我们希望它返回0,而不是NULL,那么我们可以使用例如 ...

  7. python 运行sum函数的使用

    sum(iterable[, start]) ,iterable为可迭代对象,如: sum([ ], start) , #iterable为list列表. sum(( ), start ) , #it ...

  8. python 中的sum( )函数 与 numpy中的 sum( )的区别

    一. python sum函数 描述: sum() 对序列进行求和 用法: sum(iterable[, start]) iterable:可迭代对象,例如,列表,元组,集合. start:指定相加的 ...

  9. 可变参数列表与printf()函数的实现

    问题 当我们刚开始学习C语言的时候,就接触到printf()函数,可是当时"道行"不深或许不够细心留意,又或者我们理所当然地认为库函数规定这样就是这样,没有发现这个函数与普通的函数 ...

随机推荐

  1. SpringCloud实战-Ribbon客户端负载均衡

    前面我们已经完成了注册中心和服务提供者两个基础组件.接着介绍使用Spring Cloud Ribbon在客户端负载均衡的调用服务. ribbon 是一个客户端负载均衡器,可以简单的理解成类似于 ngi ...

  2. Django REST framework+Vue 打造生鲜超市(七)

    目录 生鲜超市(一)    生鲜超市(二)    生鲜超市(三) 生鲜超市(四)    生鲜超市(五)    生鲜超市(六) 生鲜超市(七)    生鲜超市(八)    生鲜超市(九) 生鲜超市(十) ...

  3. Django中使用富文本编辑器Uedit

    Uedit是百度一款非常好用的富文本编辑器 一.安装及基本配置 官方GitHub(有详细的安装使用教程):https://github.com/zhangfisher/DjangoUeditor 1. ...

  4. C# DataGridView绑定List对象时,利用BindingList来实现增删查改

    当DataGridView的DataSource是DataTable的时候,DataTable的数据改变时,DataGridView的数据会随之改变,无需重新绑定到DataGridView.  当Da ...

  5. VC++中字符串编码处理的一些相关问题

    前言 什么是tchar? 百度百科对其的定义如下": 因为C++支持两种字符串,即常规的ANSI编码(使用""包裹)和Unicode编码(使用L""包 ...

  6. 十八、Hadoop学记笔记————Hbase架构

    Hbase结构图: Client,Zookeeper,Hmaster和HRegionServer相互交互协调,各个组件作用如下: 这几个组件在实际使用过程中操作如下所示: Region定位,先读取zo ...

  7. 静态资源压缩(GZIP) 专题

    1.开GZIP有什么好处?答:Gzip开启以后会将输出到用户浏览器的数据进行压缩的处理,这样就会减小通过网络传输的数据量,提高浏览的速度.Tips:如果网站的用户分布比较分散,并且静态文件过大,可以将 ...

  8. Can I use MyBatis to generate Dynamic SQL without executing it?

    Although MyBatis was designed to execute the query after it builds it, you can make use of it's conf ...

  9. PHP 7.3 我们将迎来灵活的 heredoc 和 nowdoc 句法结构

    php.net RFC 频道已经公布了 PHP 7.3 的 Heredoc 和 Nowdoc 语法更新,此次更新专注于代码可读性: Heredoc 和 Nowdoc 有非常严格的语法,有些时候这令很多 ...

  10. Spark2.1.0——Spark初体验

    学习一个工具的最好途径,就是使用它.这就好比<极品飞车>玩得好的同学,未必真的会开车,要学习车的驾驶技能,就必须用手触摸方向盘.用脚感受刹车与油门的力道.在IT领域,在深入了解一个系统的原 ...