Python_Mix*re模块,元字符,量词】的更多相关文章

模块: 模块就是一组功能的集合,你要和某个东西打交道,而这个东西本身和Python没有关系,这个东西本身就存在,Python提供了一个功能的集合,专门负责和这个东西打交道. 模块的类型: 内置模块 不需要我们自己安装的 解释器自带的 第三方模块 需要我们自己安装的模块 自定义模块 我们自己写的模块 re模块: 在Python中使用正则表达式 正则表达式: 是一种独立的规则,独立的语言,只和字符串打交道 功能: 从大段的文字中找到符合规则的内容 比如说爬虫,从网页的字符串中获取你想要的数据 日志分…
#元字符在re模块中有特殊意义的字符,有:^ $. * + {} [] () | \ ^$ #表示开头结尾,注意:[^]表示取反 . #点,表示任意一个字符,包括空格(一个空白字符),\t(换行符).但是不能匹配\n(换行符) * #表示前一个字符出现次数任意次,包括零次 + #表示前一个字符出现一次以上 {N,M} #表示前一个字符出现N-M次 ? #表示前面一个字母出现0或1次 [patten1,patten2] #表示匹配patten1或patten2,中间不需要分割符 #[]还可以取消元…
os.path.basename(path)返回path最后的文件名,如何path以/或\结尾,那么就会返回空值,即os.path.split(path)的第一个元素 ret = os.path.basename('D:/sylar/s15/day19/4.os模块.py') print(ret) #返回path最后的文件名 结果为: 4.os模块.py os.path.split(path)把路径分成两段 import os s= os.path.split(r'C:\Users\Mi\Pyc…
random模块 作用: 生成随机数(整数,小数,从列表中随机抽值,打乱列表顺序) 常用函数: random.random( )生成随机小数 random.uniform( )取一个范围之间的小数 random.randint( )生成随机整数 random.range( )生成随机整数,可以设定步长 random.choice( )随机选择一个并返回 random.sample( )随机选择多个,返回的函数为函数的第二个参数 random.shuffle( )打乱列表顺序 time模块(时间模…
re模块import re 基础方法 findall:匹配所有 ,每一项都是列表中的一个元素,返回的是列表 search只匹配从左到右的第一个,得到的不是直接的结果,而是一个变量,通过这个变量的group方法来获取结果,如果没有匹配到,会返回None,使用group会报错. match:从头开始匹配,相当于search中的正则表达式加上一个^ 字符串处理的扩展: 切割: split 返回列表,按照正则规则切割,默认匹配到的内容会被切掉. import re ret = re.split('\d+…
Linux平台上被广泛使用的正则表达式库PCRE - Perl-compatible regular expressions,从其名字即可知道,PCRE提供的是一套与Perl中相兼容的正则表达式. 元字符(Meta-character) '\' : 在任何元字符前面加上反斜线,就会使它失去元字符的特殊作用.例如/3\.1415/这个模式里没有通配符 '^' : 匹配行首:在字符集中它是脱字符,表示求补集 '$' : 匹配行尾(或结尾处新行之前字符) '.' : 除新行(newline)外的任一字…
Linux平台上被广泛使用的正则表达式库PCRE - Perl-compatible regular expressions,从其名字即可知道,PCRE提供的是一套与Perl中相兼容的正则表达式. 元字符(Meta-character) '\' : 在任何元字符前面加上反斜线,就会使它失去元字符的特殊作用.例如/3\.1415/这个模式里没有通配符 '^' : 匹配行首:在字符集中它是脱字符,表示求补集 '$' : 匹配行尾(或结尾处新行之前字符) '.' : 除新行(newline)外的任一字…
摘要:正则表达式 re模块 一.正则表达式:只和字符串打交道,是一种用来约束字符串的规则 1.应用场景: 1,判断某一个字符串是否符合规则:注册页-判断手机号.身份证号 是否合法 注册某个账号的时候,需要验证你填写的手机号码是否正确. 邮箱地址是否正确.身份证号是否正确等 2,将符合规则的内容从一个庞大的字符串体系当中提取出来:爬虫.日志分析 访问一个网页,这个网页的源代码对于pyhon来说是一串字符串, 使用正则表达式可以从一大段的文字(字符串)当中提取你想要的数据 2.字符组 字符组 :是元…
一.元字符 字符组是元字符中的一个.在字符组中所有的字符都可以匹配任意一个字符位置上能出现的内容,如果在字符串中有任意一个字符是字符组中的内容,那么就是匹配上的项. [0-9]   [a-z]    [A-Z] ascii编码小的值,指向一个大的值 # \d表示匹配一个数字  [0-9] 元字符: \w word匹配字母和数字.下划线 \d digit \s space \n next \t tab \W \D \S ^开始 $结尾 \b 匹配边界 [] [^] 字符组相关的 | 或() 分组…
目录 模块 1 模块基础知识 2 random 返回随机生成的一个实数 3 hashlib 摘要算法模块 Hmac算法 4 time /datetime 时间模块 5 getpass 密码不显示(只能在终端运行) 6 sys 解释器相关模块 7 os 操作系统相关 8 shtil 高级的 文件.文件夹.压缩包 处理模块 9 json / pickle 序列化 10 importlib 根据字符串的形式导入模块. 11 collections 加强版数据结构 12 logging 日志模块 13…