python笔记之常用模块用法分析 内置模块(不用import就可以直接使用) 常用内置函数 help(obj) 在线帮助, obj可是任何类型 callable(obj) 查看一个obj是不是可以像函数一样调用 repr(obj) 得到obj的表示字符串,可以利用这个字符串eval重建该对象的一个拷贝 eval_r(str) 表示合法的python表达式,返回这个表达式 dir(obj) 查看obj的name space中可见的name hasattr(obj,name) 查看一个obj的na…
正则表达式是处理字符串的强大工具,它有自己特定的语法结构,有了它,实现字符串的检索,替换,匹配验证都不在话下. 当然,对于爬虫来说,有了它,从HTML里提取想要的信息就非常方便了. 先看一下常用的匹配规则: \w:匹配字母.数字及下划线 \W:匹配不是字母.数字及下划线 \s:匹配任意空白字符,等价于[\t\n\r\f] \S:匹配任意非空字符 \d:匹配任意数字,等价于[0-9] \D:匹配任意飞数字的字符 \A:匹配字符串开头 \Z:匹配字符串结尾,如果存在换行,只匹配到换行前得结束字字符串…
Python的正则表达式(re模块) 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. Python使用re模块提供了正则表达式处理的能力.如果对正则表达式忘记的一干二净的话,可以花费几分钟时间在网上概览一下正则表达式基础,也可以参考我之前的笔记:https://www.cnblogs.com/yinzhengjie/p/11112046.html. 一.常量 多行模式: re.M re.MULTILINE 单行模式: re.S re.DOTAL 忽略大小写: re.I re.I…
python中os模块用法 python之模块之shutil模块 -------------------------------os模块-------------------------------------- import os 1).path = os.getcwd():获取当前路径 2).os.listdir(path) :列出当前目录下的所有文件和文件夹 3).os.path.split(path):函数返回路径的目录名和文件名,其中path形如'C:\\Python25\\abc.t…
大家好,从今天起早起Python将持续更新由小甜同学从初学者的角度学习Python的笔记,其特点就是全文大多由新手易理解的代码与注释及动态演示.刚入门的读者千万不要错过! 很多人学习python,不知道从何学起. 很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手. 很多已经做案例的人,却不知道如何去学习更加高深的知识. 那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码! QQ群:1097524789…
python的正则表达式 python使用re模块提供了正则表达式处理的能力: 常量 re.M re.MULTILINE 多行模式 re.S re.DOTALL 单行模式 re.I re.IGNORECASE 忽略大小写 re.X re.VERBOSE 忽略表达式中的空白字符 使用|位或运算开启多种选项#示例:n = re.match('b',s,re.M) 编译 re.compile(pattern,flags=0) 设定flags,编译模式,返回正则表达式对象regex: pattern就是…
正则是处理字符串最常用的方法,我们编码中到处可见正则的身影. 正则大同小异,python 中的正则跟其他语言相比略有差异: 1.替换字符串时,替换的字符串可以是一个函数 2.split 函数可以指定分割次数,这会导致有个坑 3.前项界定的表达式必须定长 下面详细描述下 re 模块的使用方法,其实,注意上面提到的三点差异就好 1.match 说明: re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回 None. 语法: re.match(pat…
在python中,通过内嵌集成re模块,程序媛们可以直接调用来实现正则匹配. 其中,re.findall() 函数可以遍历匹配,可以获取字符串中所有匹配的字符串,返回一个列表. 在python源代码中,展示如下: 搜索string,返回一个顺序访问每一个匹配结果(Match对象)的迭代器.找到 RE 匹配的所有子串,并把它们作为一个迭代器返回. def findall(pattern, string, flags=0): 第一个参数,正则表达式 第二个参数,搜索的是那些字符串 第三个参数,匹配的…
一.什么是正则表达式(Regular Expression) 正则表达式本身是一种小型的.高度专业化的编程语言,它内嵌在Python中,并通过 re(regular expression)模块实现.使用这个小型语言,你可以为想要匹配的相应字符串集指定规则. 二.正则表达式的元字符 1. 什么是元字符 元字符是一些在正则表达式中有特殊用途.不代表它本身字符意义的一组字符. 2. Python中的元字符 (1).  :匹配除“\n”之外的任何单个字符.要匹配包括 '\n' 在内的任何字符,请使用像"…
目录 正则解说 中文字符集 re模块常用方法 1.正则解说 数量词的贪婪模式与非贪婪模式 正则表达式通常用于在文本中查找匹配的字符串.Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字符:非贪婪的则相反,总是尝试匹配尽可能少的字符.例如:正则表达式"ab*"如果用于查找"abbbc",将找到"abbb".而如果使用非贪婪的数量词"ab*?",将找到"a". 一般字符…