Python代码阅读(第21篇):将变量名称转换为蛇式命名风格
Python 代码阅读合集介绍:为什么不推荐Python初学者直接看项目源码
本篇阅读的代码实现将变量名称转换为蛇式命名风格(snake case)的功能。
本篇阅读的代码片段来自于30-seconds-of-python。
snake
from re import sub
def snake(s):
return '_'.join(
sub('([A-Z][a-z]+)', r' \1',
sub('([A-Z]+)', r' \1',
s.replace('-', ' '))).split()).lower()
# EXAMPLES
snake('camelCase') # 'camel_case'
snake('some text') # 'some_text'
snake('some-mixed_string With spaces_underscores-and-hyphens') # 'some_mixed_string_with_spaces_underscores_and_hyphens'
snake('AllThe-small Things') # "all_the_small_things"
snake
函数使用正则表达式将字符串变形、分解成单词,并加上_
作为分隔符组合起来。函数主要使用了re
模块的sub
、str.replace
、str.split
、str.lower
和str.join
。在正式分析snake
函数的逻辑之前,先介绍下其中使用到的其他函数的作用。
str.replace(old, new[, count])
返回字符串的副本,其中出现的所有子字符串old
都将被替换为new
如果给出了可选参数count
,则只替换前count
次出现。
str.split(sep=None, maxsplit=-1)
返回一个由字符串内单词组成的列表,使用sep
作为分隔字符串。 如果给出了maxsplit
,则最多进行maxsplit
次拆分(因此,列表最多会有maxsplit+1
个元素)。 如果maxsplit
未指定或为-1
,则不限制拆分次数(进行所有可能的拆分)。
如果sep
未指定或为None
,则会应用另一种拆分算法:连续的空格会被视为单个分隔符,开头和结尾如果包含空格的话,将不会拆分出空字符串。 因此,使用None
拆分空字符串或仅包含空格的字符串将返回 []
。
>>> '1 2 3'.split()
['1', '2', '3']
>>> '1 2 3'.split(maxsplit=1)
['1', '2 3']
>>> ' 1 2 3 '.split()
['1', '2', '3']
str.join(iterable)
返回一个由iterable
中的字符串拼接而成的字符串。
str.lower()
返回原字符串的副本,其所有区分大小写的字符均转换为小写。
re.sub(pattern, repl, string, count=0, flags=0)
返回通过使用repl
替换在string
最左边非重叠出现的pattern
而获得的字符串。 如果样式没有找到,则不加改变地返回string
。repl
可以是字符串或函数。 向后引用像是\6
会用样式中第6
组所匹配到的子字符串来替换。 例如下面的例子中第一组匹配到的是myfun
,所以在替换的时候,\1
使用myfun
替换,所以在结果中\npy_
后面接着的是myfun
。
带有'r'
前缀的字符串是原始字符串,反斜杠不必做任何特殊处理。 因此r”\n”
表示包含'\'
和'n'
两个字符的字符串,而"\n"
则表示只包含一个换行符的字符串。
>>> re.sub(r'def\s+([a-zA-Z_][a-zA-Z_0-9]*)\s*\(\s*\):',
... r'static PyObject*\npy_\1(void)\n{',
... 'def myfunc():')
'static PyObject*\npy_myfunc(void)\n{'
snake
执行逻辑
首先分析一下snake
函数最里面的sub
函数。先看下输入参数。
string
是s.replace('-', ' ')
将待转换的字符串中的'-'
使用' '
替换。
pattern
是'([A-Z]+)'
,其中(...)
表示他是一个组合,匹配括号内的正则表达式,并在匹配完成之后,组合的内容可以被获取,并可以在之后用\number
转义序列进行再次匹配或使用,例如上个例子中的\1
。'([A-Z]+)'
的组合表示要匹配一个或多个大写字母,并尽可能匹配出最长的子字符串。
repl
是r' \1'
,代表使用组合匹配出来的字符串前增加一个空格,替换匹配出来的字符串。例如'abcDEF'
经过匹配和替换将变成'abc DEF'
。sub('([A-Z]+)', r' \1', 'abcDEF') # 'abc DEF'
因此,snake
函数最里面的sub
函数的输出是将原始字符串中的'-'
使用' '
替换,再匹配字符串中的一个或多个连续的大些字母,在前面增加一个空格。例如原始字符串是'abc-abcDEF-ABc'
经过第一个sub
函数转换后变成'abc abc DEF ABc'
(注意'ABc'
前面有两个空格)。
接下来再分析一下第二层的sub
函数。还是先看一下输入参数。
string
是上个sub
的输出,在前面的例子中,是'abc abc DEF ABc'
(注意'ABc'
前面有两个空格)。
pattern
是'([A-Z][a-z]+)'
。它也是一个组合,表示要匹配一个大写字母后面跟着一个或多个小写字母的形式,并尽可能匹配出最长的子字符串。
repl
还是r' \1'
,代表使用组合匹配出来的字符串前增加一个空格,替换匹配出来的字符串。
因此,第二层sub
的输出是简单的匹配一个大写字母后面跟着一个或多个小写字母的形式,在前面加一个空格。继续使用前面的例子,这层的输入字符串是'abc abc DEF ABc'
(注意'ABc'
前面有两个空格),输出是'abc abc DEF A Bc'
(注意'A'
前面有两个空格)。
然后snake
函数将第二层sub
输出的字符串使用str.split
函数分成字符串列表。再将得到的字符串列表使用'-'
作为分隔符组合起来。最后使用str.lower
将组合后的字符串转换成小写。延续上面的例子,最终输出的字符串为:'abc_abc_def_a_bc'
Python代码阅读(第21篇):将变量名称转换为蛇式命名风格的更多相关文章
- Python代码阅读(第8篇):列表元素逻辑判断
Python 代码阅读合集介绍:为什么不推荐Python初学者直接看项目源码 本篇阅读的三份代码的功能分别是判断列表中的元素是否都符合给定的条件:判断列表中是否存在符合给定的条件的元素:以及判断列表中 ...
- Python代码阅读(第11篇):展开嵌套列表
Python 代码阅读合集介绍:为什么不推荐Python初学者直接看项目源码 本篇阅读的代码实现了展开嵌套列表的功能,将一个嵌套的list展开成一个一维list(不改变原有列表的顺序). 本篇阅读的代 ...
- Python代码阅读(第12篇):初始化二维数组
Python 代码阅读合集介绍:为什么不推荐Python初学者直接看项目源码 本篇阅读的代码实现了二维数组的初始化功能,根据给定的宽高初始化二维数组. 本篇阅读的代码片段来自于30-seconds-o ...
- Python 基础【第八篇】变量
1.变量定义: 给数据进行命名,数据的名字就叫做变量 2.变量格式: [变量名] = [值] 注:变量名命名需要满足下面两条准则 准则一:标示符开头不能为数字.不能包含空格.特殊字符准则二:标示符不能 ...
- Python代码阅读(第2篇):数字转化成列表
本篇阅读的代码实现了将输入的数字转化成一个列表,输入数字中的每一位按照从左到右的顺序成为列表中的一项. 本篇阅读的代码片段来自于30-seconds-of-python. digitize def d ...
- Python代码阅读(第1篇):列表映射后的平均值
本篇阅读的代码实现了将列表进行映射,并求取映射后的平均值. 本篇阅读的代码片段来自于30-seconds-of-python. average_by def average_by(lst, fn=la ...
- Python代码阅读(第10篇):随机打乱列表元素
本篇阅读的代码实现了随机打乱列表元素的功能,将原有列表乱序排列,并返回一个新的列表(不改变原有列表的顺序). 本篇阅读的代码片段来自于30-seconds-of-python. shuffle fro ...
- SourceInsight支持Python代码阅读
这个话题,很简单,主要是要有一个插件Python.CLF,这个文件可以从我的GitHub上下载.然后,参照下面的图片显示的步骤,就很快搞定! 具体的步骤,看下面的三张图片,顺序编号了,从1到9,对照着 ...
- Python 代码风格
1 原则 在开始讨论Python社区所采用的具体标准或是由其他人推荐的建议之前,考虑一些总体原则非常重要. 请记住可读性标准的目标是提升可读性.这些规则存在的目的就是为了帮助人读写代码,而不是相反. ...
随机推荐
- Photoshop 各混合模式 RGB 是如何计算的
原文链接:https://www.jb51.net/photoshop/249182.html 1.正常模式(Normal) 默认模式,显示混合色图层的像素,没有进行任何的图层混合.这意味着基色图层( ...
- 基于ECDHE的TLS握手流程
<!doctype html>3.3 基于ECDHE的TLS握手流程 html { overflow-x: initial !important } :root { --bg-color: ...
- IPv4掩码与掩码位数的转换
1. 根据掩码获取掩码的位数 int mask2len(unsigned int mask) { /*eg: 255.255.255.0 255.0.255.255.0*/ int bit=0,len ...
- git 提交本地项目
在新文件夹中] 1.右键 git bash here,执行 2.git init 生成.git文件,存在则跳过 依次执行 1.git add . 2.git commit -m "提交信息& ...
- TypeScript 中装饰器的理解?应用场景?
一.是什么 装饰器是一种特殊类型的声明,它能够被附加到类声明,方法, 访问符,属性或参数上 是一种在不改变原类和使用继承的情况下,动态地扩展对象功能 同样的,本质也不是什么高大上的结构,就是一个普通的 ...
- find用法 以及和exec xargs 的组合使用
1.查找当前目录下所有的txt的文件 [root@master1 ~]# find . -name "*.txt" -type f ./a.txt ./b.txt 2.exec 结 ...
- 洛谷P1019——单词接龙(DFS暴力搜索)
https://www.luogu.org/problem/show?pid=1019#sub 题目描述 单词接龙是一个与我们经常玩的成语接龙相类似的游戏,现在我们已知一组单词,且给定一个开头的字母, ...
- java中链表和数组的区别?
综述:数组是线性结构,可以直接索引,即要去第i个元素,a[i]即可.链表也是线性结构,要取第i个元素,只需用指针往后遍历i次就可.貌似链表比数组还要麻烦些,而且效率低些. 想到这些相同处中的一些细微的 ...
- 深入学习Composer原理(一)
Composer作为PHP的包管理工具,为PHPer们提供了丰富的类库,并且让PHP重焕新生,避免被时代淘汰的悲剧.可以说,Composer和PHP7是现在PHP开发者的标配,如果你还没用过Compo ...
- Jmeter系列(18)- 八大组件
说明 取样器(Sampler):不与其他元件发⽣交互的作⽤的元件 逻辑控制器(Logic Controller):只对其⼦节点的sampler有效,⽽其他元件需要与sampler等元件交互 前置处理器 ...