Python 代码阅读合集介绍:为什么不推荐Python初学者直接看项目源码

本篇阅读的代码实现将变量名称转换为蛇式命名风格(snake case)的功能。

本篇阅读的代码片段来自于30-seconds-of-python

snake

from re import sub

def snake(s):
return '_'.join(
sub('([A-Z][a-z]+)', r' \1',
sub('([A-Z]+)', r' \1',
s.replace('-', ' '))).split()).lower() # EXAMPLES
snake('camelCase') # 'camel_case'
snake('some text') # 'some_text'
snake('some-mixed_string With spaces_underscores-and-hyphens') # 'some_mixed_string_with_spaces_underscores_and_hyphens'
snake('AllThe-small Things') # "all_the_small_things"

snake函数使用正则表达式将字符串变形、分解成单词,并加上_作为分隔符组合起来。函数主要使用了re模块的substr.replacestr.splitstr.lowerstr.join。在正式分析snake函数的逻辑之前,先介绍下其中使用到的其他函数的作用。

str.replace(old, new[, count])

返回字符串的副本,其中出现的所有子字符串old都将被替换为new 如果给出了可选参数count,则只替换前count次出现。

str.split(sep=None, maxsplit=-1)

返回一个由字符串内单词组成的列表,使用sep作为分隔字符串。 如果给出了maxsplit,则最多进行maxsplit次拆分(因此,列表最多会有maxsplit+1个元素)。 如果maxsplit未指定或为-1,则不限制拆分次数(进行所有可能的拆分)。

如果sep未指定或为None,则会应用另一种拆分算法:连续的空格会被视为单个分隔符,开头和结尾如果包含空格的话,将不会拆分出空字符串。 因此,使用None拆分空字符串或仅包含空格的字符串将返回 []

>>> '1 2 3'.split()
['1', '2', '3']
>>> '1 2 3'.split(maxsplit=1)
['1', '2 3']
>>> ' 1 2 3 '.split()
['1', '2', '3']

str.join(iterable)

返回一个由iterable中的字符串拼接而成的字符串。

str.lower()

返回原字符串的副本,其所有区分大小写的字符均转换为小写。

re.sub(pattern, repl, string, count=0, flags=0)

返回通过使用repl替换在string最左边非重叠出现的pattern而获得的字符串。 如果样式没有找到,则不加改变地返回stringrepl可以是字符串或函数。 向后引用像是\6会用样式中第6组所匹配到的子字符串来替换。 例如下面的例子中第一组匹配到的是myfun,所以在替换的时候,\1使用myfun替换,所以在结果中\npy_后面接着的是myfun

带有'r'前缀的字符串是原始字符串,反斜杠不必做任何特殊处理。 因此r”\n”表示包含'\''n'两个字符的字符串,而"\n"则表示只包含一个换行符的字符串。

>>> re.sub(r'def\s+([a-zA-Z_][a-zA-Z_0-9]*)\s*\(\s*\):',
... r'static PyObject*\npy_\1(void)\n{',
... 'def myfunc():')
'static PyObject*\npy_myfunc(void)\n{'

snake执行逻辑

首先分析一下snake函数最里面的sub函数。先看下输入参数。

strings.replace('-', ' ')将待转换的字符串中的'-'使用' '替换。

pattern'([A-Z]+)',其中(...)表示他是一个组合,匹配括号内的正则表达式,并在匹配完成之后,组合的内容可以被获取,并可以在之后用\number转义序列进行再次匹配或使用,例如上个例子中的\1'([A-Z]+)'的组合表示要匹配一个或多个大写字母,并尽可能匹配出最长的子字符串。

replr' \1',代表使用组合匹配出来的字符串前增加一个空格,替换匹配出来的字符串。例如'abcDEF'经过匹配和替换将变成'abc DEF'sub('([A-Z]+)', r' \1', 'abcDEF') # 'abc DEF'

因此,snake函数最里面的sub函数的输出是将原始字符串中的'-'使用' '替换,再匹配字符串中的一个或多个连续的大些字母,在前面增加一个空格。例如原始字符串是'abc-abcDEF-ABc'经过第一个sub函数转换后变成'abc abc DEF ABc'(注意'ABc'前面有两个空格)。

接下来再分析一下第二层的sub函数。还是先看一下输入参数。

string是上个sub的输出,在前面的例子中,是'abc abc DEF ABc'(注意'ABc'前面有两个空格)。

pattern'([A-Z][a-z]+)'。它也是一个组合,表示要匹配一个大写字母后面跟着一个或多个小写字母的形式,并尽可能匹配出最长的子字符串。

repl还是r' \1',代表使用组合匹配出来的字符串前增加一个空格,替换匹配出来的字符串。

因此,第二层sub的输出是简单的匹配一个大写字母后面跟着一个或多个小写字母的形式,在前面加一个空格。继续使用前面的例子,这层的输入字符串是'abc abc DEF ABc'(注意'ABc'前面有两个空格),输出是'abc abc DEF A Bc'(注意'A'前面有两个空格)。

然后snake函数将第二层sub输出的字符串使用str.split函数分成字符串列表。再将得到的字符串列表使用'-'作为分隔符组合起来。最后使用str.lower将组合后的字符串转换成小写。延续上面的例子,最终输出的字符串为:'abc_abc_def_a_bc'

Python代码阅读(第21篇):将变量名称转换为蛇式命名风格的更多相关文章

  1. Python 基础【第八篇】变量

    1.变量定义: 给数据进行命名,数据的名字就叫做变量 2.变量格式: [变量名] = [值] 注:变量名命名需要满足下面两条准则 准则一:标示符开头不能为数字.不能包含空格.特殊字符准则二:标示符不能 ...

  2. Python代码阅读(第2篇):数字转化成列表

    本篇阅读的代码实现了将输入的数字转化成一个列表,输入数字中的每一位按照从左到右的顺序成为列表中的一项. 本篇阅读的代码片段来自于30-seconds-of-python. digitize def d ...

  3. Python代码阅读(第1篇):列表映射后的平均值

    本篇阅读的代码实现了将列表进行映射,并求取映射后的平均值. 本篇阅读的代码片段来自于30-seconds-of-python. average_by def average_by(lst, fn=la ...

  4. SourceInsight支持Python代码阅读

    这个话题,很简单,主要是要有一个插件Python.CLF,这个文件可以从我的GitHub上下载.然后,参照下面的图片显示的步骤,就很快搞定! 具体的步骤,看下面的三张图片,顺序编号了,从1到9,对照着 ...

  5. Python 代码风格

    1 原则 在开始讨论Python社区所采用的具体标准或是由其他人推荐的建议之前,考虑一些总体原则非常重要. 请记住可读性标准的目标是提升可读性.这些规则存在的目的就是为了帮助人读写代码,而不是相反. ...

  6. python代码风格-PEP8

    转载自http://www.douban.com/note/134971609/ Python 的代码风格由 PEP 8 描述.这个文档描述了 Python 编程风格的方方面面.在遵守这个文档的条件下 ...

  7. 【转】python代码风格-PEP8

    转载自http://www.douban.com/note/134971609/ Python 的代码风格由 PEP 8 描述.这个文档描述了 Python 编程风格的方方面面.在遵守这个文档的条件下 ...

  8. python 代码检测工具

    对于我这种习惯了 Java 这种编译型语言,在使用 Python 这种动态语言的时候,发现错误经常只能在执行的时候发现,总感觉有点不放心. 而且有一些错误由于隐藏的比较深,只有特定逻辑才会触发,往往导 ...

  9. 21行python代码实现拼写检查器

    引入 大家在使用谷歌或者百度搜索时,输入搜索内容时,谷歌总是能提供很好的拼写检查,比方你输入 speling,谷歌会立即返回 spelling. 前几天,看到http://norvig.com/spe ...

  10. 交互模式下测试python代码及变量的四则运算

    在交互模式下,python代码可以立即执行,所以这很方便我们进行代码测试 1.命令窗口,输入python (如果没配置环境变量则需带python安装目录的绝对路径) >>> 这个就是 ...

随机推荐

  1. Candies---hdu3159(spfa+差分约束)

    题目链接:http://poj.org/problem?id=3159 题意:有n个小孩,m个关系格式是A B C 表示小孩 B 的糖果数最多比小孩A多C个,相当于B-A<=C; 有m个这样的关 ...

  2. PostgreSQL数据库中跨库访问解决方案

    PostgreSQL跨库访问有3种方法:Schema,dblink,postgres_fdw. 方法A:在PG上建立不同SCHEMA,将数据和存储过程分别放到不同的schema上,经过权限管理后进行访 ...

  3. bzoj 3626 [LNOI2014]LCA(离线处理+树链剖分,线段树)

    3626: [LNOI2014]LCA Time Limit: 10 Sec  Memory Limit: 128 MBSubmit: 1272  Solved: 451[Submit][Status ...

  4. 微信下载APK

    腾讯应用宝 微信屏蔽了来源不是腾讯的APK function isWeixin() { var ua = navigator.userAgent.toLowerCase() if(ua.match(/ ...

  5. Spring MVC 笔记 —— Spring MVC 文件上传

    文件上传 配置MultipartResolver <bean id="multipartResolver" class="org.springframework.w ...

  6. C#面试题记录

    最怕的就是面试,每每到找工作的时候感觉压力山大,每次都要提前刷点题目去面对.所以这里自己对以后需要了解的知识做一个记录,方便自己随时的补充和深入了解,也给现在的自己留下一点点的印记,给未来留下一点回忆 ...

  7. Ubuntu 16.04 上安装 MySQL 5.7 教程

    介绍 MySQL 是一种开源数据库管理系统,通常作为流行的LAMP(Linux,Apache,MySQL,PHP / Python / Perl)堆栈的一部分安装.它使用关系数据库和SQL(结构化查询 ...

  8. Man方法

    Main方法相当一个主线程,JVM会自动寻找class文件中的main方法并执行(请思考tomcat加载java web项目启动的线程数和每次tomcat服务器接收到请求,是不是要发起一个线程去处理) ...

  9. turtle库基础练习

    1.画一组同切圆 import turtle turtle.circle(10) turtle.circle(20) turtle.circle(30) turtle.circle(40) turtl ...

  10. css table 布局 与 JavaScript 指定区域打印功能

      <!DOCTYPE html> <html lang="en"><head> <meta http-equiv="conte ...