内容梗概:
1. 正则表达式
2. re模块的使⽤
3. 一堆练习
正则表达式是对字符串串操作的一种逻辑公式. 我们一般使用正则表达式对字符串进行匹配和过滤.
使用正则的优缺点:
优点: 灵活,功能性强,逻辑性强.
缺点: 上手难.一旦上手,会爱上这个东西
正则表达式由普通字符和元字符组成. 普通字符包含大小写字母,数字.\
在匹配普通字符的时候我们直接写就可以了
元字符(重点): 元字符才是正则表达式的灵魂. 元字符中的内容太多了了, 在这⾥里里我们只介绍⼀一些常⽤用的.
1. 字符组
字符组很简单⽤用[]括起来. 在[]中出现的内容会被匹配. 例例如:[abc] 匹配a或b或c
如果字符组中的内容过多还可以使⽤用- , 例例如: [a-z] 匹配a到z之间的所有字⺟母 [0-9]
匹配所有阿拉伯数字
2. 简单元字符
.常用的基本的元字符
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线
\s 匹配任意的空⽩白符
\d 匹配数字
\n 匹配一个换⾏行行符
\t 匹配一个制表符
\b 匹配一个单词的结尾
^ 匹配字符串的开始
$ 匹配字符串的结尾
\W 匹配非字母或数字或下划线
\D 匹配非数字
\S 匹配非空白符
a|b 匹配字符a或字符b
() 匹配括号内的表达式,也表示一个组
[...] 匹配字符组中的字符
[^...] 匹配除了字符组中字符的所有字符 3. 量词
我们到目前匹配的所有内容都是单一文字符号. 那如何一次性匹配很多个字符呢,
常用量词
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更更多次
{n,m} 重复n到m次 4. 惰性匹配和贪婪匹配
在量词中的*, +,{} 都属于贪婪匹配. 就是尽可能多的匹配到结果.
str: 麻花藤昨天让英雄联盟关服了了
reg: 麻花藤.*
此时匹配的是整句句话 在使⽤用.*后⾯面如果加了? 则是尽可能的少匹配. 表⽰示惰性匹配
str: 麻花藤昨天让英雄联盟关服了了
reg: 麻花藤.*?
此时匹配的是 麻花藤 2. re模块
re模块是python提供的一套关于处理理正则表达式的模块. 核心功能有四个:
1.re.findall()
2.re.finditer()
3.re.search()
4.re.match()
import re
lis = re.findall("\w+","alex is a bitch")
print(lis)
lis = re.finditer("\w+","alex is a bitch")
for el in lis:
print(el.group())
a = re.search("e","alex is a bitch").group()
print(a) c = re.match("alex","alex is a bitch").group()
print(c) 注意的点:
lis = re.findall("www.(baidu|oldboy).com", "www.baidu.com")
print(lis) #结果为baidu lis = re.findall("www.(?:baidu|oldboy).com", "www.baidu.com")
print(lis) #结果为"www.baidu.com" 5.其他模块
lis = re.split("(is)","alex is abs sb and a big sb")
print(lis) lis = re.sub("sb","goodman","alex is abs sb and a big sb")
print(lis) lis = re.subn("sb","goodman","alex is abs sb and a big sb")
# print(lis) 特别注意:compile 爬虫的时候用的会比较多,要掌握用法
obj = re.compile("sb")
lis = obj.sub("goodman","alex is a sb and a big sb")
print(lis) obj = re.compile("sb")
# lis = obj.split("alex is a sb and a big sb")
# print(lis) obj = re.compile(r"alex(?P<ID>\d+)a")
lis = obj.search("alex250a260sb300anda125big852sb")
print(lis.group())
print(lis.group("ID"))

python基础之正则表达式 re模块的更多相关文章

  1. 十七. Python基础(17)--正则表达式

    十七. Python基础(17)--正则表达式 1 ● 正则表达式 定义: Regular expressions are sets of symbols that you can use to cr ...

  2. Python基础之 正则表达式指南

    本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例.本文的内容不包括如何编写高效的正则表达式.如何优化正则表达式,这些主题请查看其他教程 ...

  3. Python基础(十)-模块

    模块初识 一般把不同功能代码放到不同py文件,一个py文件就是一个模块 三种模块库: 1.Python标准库 2.第三方库 3.自定义库 导入模块:import 库名 (Python解释器只认识执行文 ...

  4. python基础(10)--模块

    模块(module) 模块,用一坨代码实现了某个功能的代码集合 类似于函数式编程和面向过程编程,函数式编程则完成一个功能,其他代码用来调用即可,提供了代码的重用性和代码间的耦合.而对于一个复杂的功能来 ...

  5. Python基础(12)--模块

    本文地址:http://www.cnblogs.com/archimedes/p/python-modules.html,转载请注明源地址. 模块简介 如果你退出 Python 解释器重新进入,以前创 ...

  6. python基础之正则表达式

    正则表达式语法 正则表达式 (或 RE) 指定一组字符串匹配它;在此模块中的功能让您检查一下,如果一个特定的字符串匹配给定的正则表达式 (或给定的正则表达式匹配特定的字符串,可归结为同一件事). 正则 ...

  7. python基础之正则表达式。

    简介 就其本质而言,正则表达式是内嵌在python内,由re模块实现,小型的专业化语言,最后由c写的匹配引擎执行.正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来 ...

  8. 第六章:Python基础の反射与常用模块解密

    本课主题 反射 Mapping 介绍和操作实战 模块介绍和操作实战 random 模块 time 和 datetime 模块 logging 模块 sys 模块 os 模块 hashlib 模块 re ...

  9. python记录_day23 正则表达式 re模块

    一. 正则表达式 使用python的re模块之前应该对正则表达式有一定的了解 正则表达式是对字符串操作的一种逻辑公式.我们一般使用正则表达式对字符串进行匹配和过滤. 正则的优缺点: 优点:灵活, 功能 ...

随机推荐

  1. mysql的数据类型- 特别是表示日期/时间的数据类型: 参考: http://www.cnblogs.com/bukudekong/archive/2011/06/27/2091590.html

    通常认为: 日期 就是 年-月-日: 时间就是: 小时:分钟:秒 要严格区分"日期"和 "时间"的 说法. 日期就是日期, 时间就是时间, 两者是不同的!! 日 ...

  2. shell编程中的 三种结构: 条件if/选择结构case/循环for/while/until等结构 和 函数的用法

    shell 函数的使用 (md中, 列表本身是有格式的, 他要产生缩进, 其次,列表项和列表项之间, 可以留有一个空行, 是合法的, 允许的) shell函数,就是 就相当于一个命令来看待和处理的, ...

  3. 黄金连分数|2013年蓝桥杯B组题解析第四题-fishers

    黄金连分数 黄金分割数0.61803... 是个无理数,这个常数十分重要,在许多工程问题中会出现.有时需要把这个数字求得很精确. 对于某些精密工程,常数的精度很重要.也许你听说过哈勃太空望远镜,它首次 ...

  4. Connections in Galaxy War (逆向并查集)题解

    Connections in Galaxy War In order to strengthen the defense ability, many stars in galaxy allied to ...

  5. IDEA 入门

    IDEA初步使用 IntelliJ IDEA 使用教程(2019图文版) -- 从入门到上瘾 IntelliJ IDEA 设置代码提示或自动补全的快捷键 (Alt+/) IntelliJ IDEA 配 ...

  6. python 之 模块

    在python模块,是一个python文件,以.py结尾,包含了python对象定义 和python语句 通过import语句 ,语法 import module1[,module2,module3, ...

  7. 集合03_Map

    Map集合总览 保存映射关系key-value键值对,键唯一,值可以重复,Map和Set的实现类相似 Entry是Map的内部类 Map接口中常用的方法: void clear() Set keySe ...

  8. 用dbms_scheduler创建job

    以前一般使用dbms_job来创建job,oracle10g以后推荐使用dbms_scheduler来创建定时任务,dbms_scheduler功能更为强大.一个创建job的例子: begin sys ...

  9. 使用MapperScannerConfigurer简化MyBatis配置

    MyBatis的一大亮点就是可以不用DAO的实现类.如果没有实现类,Spring如何为Service注入DAO的实例呢?MyBatis-Spring提供了一个MapperFactoryBean,可以将 ...

  10. js 字符串加密解密

    Welcome to jzzy.com