哈喽大家好,我是咸鱼。

今天咸鱼列出了一些大家在初学 Python 的时候容易踩的一些坑,看看你有没有中招过。

原文:https://www.bitecode.dev/p/unexpected-python-traps-for-beginners

不明显的字符串拼接

Python 在词法分析的时候会把多个字符串自动拼接起来。

data = "very""lazy"
print(data) # verylazy

这个特性可以让我们在声明一个长字符串的时候可以分成多行来写,这样看起来比较优雅。

msg = (
"I want this to be on a single line when it prints "
"but I want it to be broken into several lines in "
"the code"
) print(msg)
# I want this to be on a single line when it prints but I want it to be broken into several lines in the code
msg ="I want this to be on a single line when it prints " \
"but I want it to be broken into several lines in " \
"the code" print(msg)
# I want this to be on a single line when it prints but I want it to be broken into several lines in the code

但初学者往往会忽略这一点,他们在使用包含字符串的列表时把分隔符漏掉,造成了意想不到的字符串拼接。

比如说他们想要声明一个包含域名的列表host。

host = [
"localhost",
"bitecode.dev",
"www.bitecode.dev"
] print(host) # ['localhost', 'bitecode.dev', 'www.bitecode.dev']

但是写成了下面这样。

host = [
"localhost",
"127.0.0.1",
"bitecode.dev" # 这里把逗号忘掉了
"www.bitecode.dev"
] print(host) # ['localhost', 'bitecode.devwww.bitecode.dev']

这是有效的代码,不会触发语法错误,但是解析的时候会把 "bitecode.dev""www.bitecode.dev" 拼接在一起,变成 'bitecode.devwww.bitecode.dev'

sorted() 和 .sort() 傻傻分不清

在 Python 中,大多数函数或方法都会返回一个值。比如说我们要对一个列表里面的内容进行排序,可以使用 sorted() 方法。

# sorted() 方法会返回一个排序后的新列表
numbers = [4, 2, 3]
sorted_numbers = sorted(numbers)
print(sorted_numbers) # [2, 3, 4]

我们也可以用列表自带的 .sort() 方法来排序,需要注意的是: .sort() 直接对原有列表进行排序,不会返回任何值。

# .sort() 方法直接对原列表进行排序
numbers = [4, 2, 3]
numbers.sort()
print(numbers) # [2, 3, 4]

但是初学者很容易把 sorted() 的用法用在 .sort() 上,结果发现怎么返回了一个 None。

numbers = [4, 2, 3]
sorted_numbers = numbers.sort()
print(sorted_numbers) # None

list.sort() 修改原列表,它不会返回任何内容。当 Python 可调用对象不返回任何内容时,会得到 None

或者把 .sort() 的用法用在了 sorted() 上。

numbers = [4, 2, 3]
sorted(numbers)
print(numbers) # [4, 2, 3]

不要乱加尾随逗号

我们在创建一个空元组的时候可以用下面的两种方法:

t1 = ()
t2 = tuple()
print(type(t1))
print(type(t2))

在 Python 中,虽然元组通常都是使用一对小括号将元素包围起来的,但是小括号不是必须的,只要将各元素用逗号隔开,Python 就会将其视为元组。

t1 = 1,
print(t1) # (1,)
print(type(t1)) # <class 'tuple'>

所以如果在数据后面多加了一个逗号,就会产生一些问题。

比如说下面是一个列表:

colors = [
'red',
'blue',
'green',
]
print(colors) # ['red', 'blue', 'green']

如果不小心加了一个尾随逗号,列表就变成了元组。

colors = [
'red',
'blue',
'green',
],
print(colors) # (['red', 'blue', 'green'],)

在 python 中,包含一个元素的元组必须有逗号,比如下面是包含一个列表的元组:

colors = [
'red',
'blue',
'green',
],

这是列表:

colors = ([
'red',
'blue',
'green',
])

可怕的 is

在 python 中, is 和 == 都是用来比较 python 对象的,区别是:

  • is 比较需要对象的值和内存地址都相等
  • == 比较只需要对象的值相等就行了

事实上,这两者的实际使用要远远复杂的多。

比如说下面的 a 和 b 是两个不同的对象,a is b 应该返回 False,但是却返回了 True。

a = 4
b = 4 print(a == b) # True
print(a is b) # True

在 python 中,由于小整数池和缓存机制,使用 is 来比较对象往往会出现意想不到的结果。

关于小整数池和缓存机制可以看我这篇文章:

《Python 中 is 和 == 的区别》

奇怪的引用

在Python中,如果 * 运算符用于数字与非数字型数据(列表、字符串、元组等)的结合,它将重复非数字型数据。

print("0" * 3) # '000'
print((0,) * 3) # (0, 0, 0)

在创建一个多个列表元素的元组时候,如果使用下面的代码:

t1 = ([0],) * 3
print(t1) # ([0], [0], [0])

会带来意想不到的问题:我们对元组中的第一个列表元素中的数据进行算数运算(自增 1)

t1[0][0] += 1
print(t1) # ([1], [1], [1])

我们发现元组中的所有列表元素内的数据都自增 1 了,我们不是只对第一个列表元素进行自增的吗?

实际上,当我们执行 t1 = ([0],) * 3 的时候,不会创建一个包含三个列表组成的元组,而是创建一个包含 3 个 引用的元组,每个引用都指向同一个列表。

元组中的每个元素都是对同一个可变对象(列表)的引用,所以当我们修改其中的元素时,另外的对象也会跟着发生变化。

正确的方法应该是:

t2 = ([0], [0], [0])
# 或者 t2 = tuple([0] for _ in range(3))
t2[0][0] += 1
print(t2) # ([1], [0], [0])

在 python 的其他地方中也有这种类似的坑:

def a_bugged_function(reused_list=[]):
reused_list.append("woops")
return reused_list print(a_bugged_function()) # ['woops']
print(a_bugged_function()) # ['woops', 'woops']
print(a_bugged_function()) # ['woops', 'woops', 'woops']

可以看到,reused_list 在函数定义中被初始化为一个空列表 [],然后每次函数调用时都使用这个默认的空列表。

在第一次调用 a_bugged_function() 后,列表变成了 ['woops']。然后,在第二次和第三次调用中,它分别继续被修改,导致输出的结果为:

['woops']
['woops', 'woops']
['woops', 'woops', 'woops']

这是因为在函数定义中,如果将可变对象(例如列表)作为默认参数,会导致该对象在函数调用时被共享和修改:每次调用函数时,使用的都是同一个列表对象的引用。

为了避免这种情况,常见的做法是使用不可变对象(如 None)作为默认值,并在函数内部根据需要创建新的可变对象。

def a_fixed_function(reused_list=None):
if reused_list is None:
reused_list = []
reused_list.append("woops")
return reused_list print(a_fixed_function())
print(a_fixed_function())
print(a_fixed_function())

Python 初学者容易踩的坑的更多相关文章

  1. Python网络编程踩的坑

    错误:socket.error: [Errno 10013] 原因:端口号被占用 解决:换其他的端口号或者将其他应用的端口号关闭 错误:File "D:/pyworkspace/homewo ...

  2. python绘图踩的坑

    踩的坑 pyecharts安装地图包 pip install echarts-countries-pypkg 报错Unknown or unsupported command 'install' 这可 ...

  3. python——pyinstaller踩的坑 UnicodeDecodeError

    程序本身运行没任何毛病,奈何用pyinstaller -w xx.py的时候提示——UnicodeDecodeError: 'ascii' codec can't decode byte 0xb3 i ...

  4. 关于python数据序列化的那些坑

    -----世界上本来没那么多坑,python更新到3以后坑就多了 无论哪一门语言开发,都离不了数据储存与解析,除了跨平台性极好的xml和json之外,python要提到的还有自身最常用pickle模块 ...

  5. Python初学者之网络爬虫(二)

    声明:本文内容和涉及到的代码仅限于个人学习,任何人不得作为商业用途.转载请附上此文章地址 本篇文章Python初学者之网络爬虫的继续,最新代码已提交到https://github.com/octans ...

  6. 从零开始学 Java - Spring 支持 CORS 请求踩的坑

    谁没掉进过几个大坑 记得好久之前,总能时不时在某个地方看到一些标语,往往都是上面一个伟人的头像,然后不管是不是他说的话,下面总是有看起来很政治正确且没卵用的屁话,我活到目前为止,最令我笑的肚子痛得是下 ...

  7. webuploader插件,我踩得坑

    我在目前的公司做的项目要么是原生写法去做项目,要么就是vue+webpack做项目,但是vue这部分只是用了模板template,vue其他的都没用. 有一个项目需要做上传图片的功能,老大扔给我一个插 ...

  8. 谈谈调用腾讯云【OCR-通用印刷体识别】Api踩的坑

    一.写在前面 最近做项目需要用到识别图片中文字的功能,本来用的Tesseract这个写的,不过效果不是很理想. 随后上网搜了一下OCR接口,就准备使用腾讯云.百度的OCR接口试一下效果.不过这个腾讯云 ...

  9. Asp.Net Core中使用Swagger,你不得不踩的坑

    很久不来写blog了,换了新工作后很累,很忙.每天常态化加班到21点,偶尔还会到凌晨,加班很累,但这段时间,也确实学到了不少知识,今天这篇文章和大家分享一下:Asp.Net Core中使用Swagge ...

  10. Python初学者的一些编程技巧

    #####################喜欢就多多关注哦######################### Python初学者的一些编程技巧   交换变量  ? 1 2 3 4 5 6 7 8 9 ...

随机推荐

  1. ElasticSearch安装、插件介绍及Kibana的安装与使用详解

    ElasticSearch安装.插件介绍及Kibana的安装与使用详解 1.安装 ElasticSearch 1.1 安装 JDK 环境 因为 ElasticSearch 是用 Java 语言编写的, ...

  2. 环境调试bug【二】无法加载源“<string>”: Source unavailable

    1.无法加载源"<string>": Source unavailable. 网上解决方法: 总结来说就两种: debugStdLib: true 添加到 launch ...

  3. 19.6 Boost Asio 文本压缩传输

    Base64是一种二进制到文本的编码方案,用于将二进制数据转换为ASCII字符串格式.它通过将二进制数据流转换为一系列64个字符来工作,这些字符都可以安全地传输到设计用于处理文本数据的系统中. 如下代 ...

  4. 小知识:RMAN基于某个具体时间点的恢复示例

    最近帮忙基于某个时间点恢复一个库,说是备份和归档是全的. 好多年没做过这类事情了,不过这算是最基本的DBA技能,下面给出RMAN基于某个具体时间点的恢复示例脚本: run{ allocate chan ...

  5. delphi 里 多用TArray 而不是 array of

    今天写代码发现个bug,是delphi 编译器 核心层面的: unit ddx.att; interface uses System.Generics.Collections, System.Rtti ...

  6. TPCH-PostgreSQL生成数据集并导入数据表

    1.数据集下载 TPC-H数据集: https://github.com/gregrahn/tpch-kit 2.解压安装 unzip  tpch-kit-master.zip cd tpch-kit ...

  7. Python-集合的基本操作(set)

    1. 前言 python中的集合和数学里的类似也是用于存放不重复的元素,它有可变集合(set)和不可变集合(feozenset)两种,集合的所有元素都放在一对大括号"{}"里(列表 ...

  8. Asp-Net-Core学习笔记:3.使用SignalR实时通信框架开发聊天室

    SignalR牛刀小试 在MVP杨老师的博客里看到这么个东西,我还以为是NetCore3才推出的新玩意,原来是已经有很多年的历史了,那看来还是比较成熟的一个技术了. 简介 SignalR是一个.NET ...

  9. C# 二十年语法变迁之 C# 8参考

    C# 二十年语法变迁之 C# 8参考 自从 C# 于 2000 年推出以来,该语言的规模已经大大增加,我不确定任何人是否有可能在任何时候都对每一种语言特性都有深入的了解.因此,我想写一系列快速参考文章 ...

  10. NC16576 [NOIP2012]摆花

    题目链接 题目 题目描述 小明的花店新开张,为了吸引顾客,他想在花店的门口摆上一排花,共m 盆.通过调查顾客的喜好,小明列出了顾客最喜欢的n 种花,从1 到n 标号.为了在门口展出更多种花,规定第i ...