Python_Mix*re模块,元字符,量词
模块:
- 模块就是一组功能的集合,你要和某个东西打交道,而这个东西本身和Python没有关系,这个东西本身就存在,Python提供了一个功能的集合,专门负责和这个东西打交道.
- 模块的类型:
- 内置模块 不需要我们自己安装的 解释器自带的
- 第三方模块 需要我们自己安装的模块
- 自定义模块 我们自己写的模块
- re模块:
- 在Python中使用正则表达式
- 正则表达式:
- 是一种独立的规则,独立的语言,只和字符串打交道
- 功能:
- 从大段的文字中找到符合规则的内容
- 比如说爬虫,从网页的字符串中获取你想要的数据
- 日志分析.提取日志中你想要获取的数据
- 判断某个字符串是否完全符合规则
- 表单验证:手机号,qq号.邮箱,银行卡,身份证号.密码
- 从大段的文字中找到符合规则的内容
- 规则:
- 规则 字符串 从字符串中找到符合规则的内容
- 字符组[ ]写在括号中的内容,都出现在下面的某一个字符的位置上且都是符合规则的
- [0-9]匹配数字
- [a-z]匹配小写字母
- [A-Z]匹配大写字母
- [a-zA-Z]匹配大小写字母
- [a-zA-Z0-9]匹配大小写字母+数字
- [a-zA-Z0-9_]匹配数字字母下滑线
- 元字符
- 贪婪匹配/惰性匹配:默认贪婪/量词?惰性匹配
- 和转义字母相关的元字符
- \w匹配数字字母下滑线 关键字(word) 如[a-zA-Z0-9_]
- \d匹配所有数字 关键字(digit) 如[0-9]
- \s匹配所有的空白符 \n回车(换行符),\t制表符(Tab),空格
- \W,\D,\S是上面三个元字符的反义
- [\s\S][\d\D][\w\W]是三组全集 意思是匹配所有字符
- \b表示单词的边界
- ^和$
- ^是匹配一个字符串的开始
- $是匹配一个字符串的结束
- . 表示匹配除了换行符之外的所有字符
- [ ]只要出现在中括号内的内容都可以被匹配
- [^]只要不出现在中括号中的内容都可以被匹配(有一些有特殊意义的元字符进入字符组中会恢复它本来的意义: . | [ ] ( ) )
- a|b 或 符合a规则的或者b规则的都可以被匹配
- 如果a规则是b规则的一部分,且a规则比b规则要苛刻/长,就把a规则写在前面(将更复杂的\更长的规则写在最前面)
- ( ) 分组 表示给几个字符加上量词约束的需求的时候,就给这些量词分在一个组
- 量词:
- {n}表示这个量词之前的字符出现n次
- {n,}表示这个量词之前的字符至少出现n次
- {n,m}表示这个量词之前的字符出现n-m次
- ? 表示匹配量词之前的字符出现0次或者1次 表示可有可无
- + 表示匹配量词之前的字符出现1次或者多次
- * 表示匹配量词之前的字符出现0次或者多次
- 正则表达式:
- 在Python中使用正则表达式
Python_Mix*re模块,元字符,量词的更多相关文章
- re模块元字符
#元字符在re模块中有特殊意义的字符,有:^ $. * + {} [] () | \ ^$ #表示开头结尾,注意:[^]表示取反 . #点,表示任意一个字符,包括空格(一个空白字符),\t(换行符). ...
- Python_Mix*OS模块,序列化模块种的json,pickle
os.path.basename(path)返回path最后的文件名,如何path以/或\结尾,那么就会返回空值,即os.path.split(path)的第一个元素 ret = os.path.ba ...
- Python_Mix*random模块,time模块,sys模块,os模块
random模块 作用: 生成随机数(整数,小数,从列表中随机抽值,打乱列表顺序) 常用函数: random.random( )生成随机小数 random.uniform( )取一个范围之间的小数 r ...
- Python_Mix*re模块基础方法,进阶,正则表达式的使用
re模块import re 基础方法 findall:匹配所有 ,每一项都是列表中的一个元素,返回的是列表 search只匹配从左到右的第一个,得到的不是直接的结果,而是一个变量,通过这个变量的gro ...
- <摘录>perl正则表达式中的元字符、转义字符、量词及匹配方式
Linux平台上被广泛使用的正则表达式库PCRE - Perl-compatible regular expressions,从其名字即可知道,PCRE提供的是一套与Perl中相兼容的正则表达式. 元 ...
- 【Perl】perl正则表达式中的元字符、转义字符、量词及匹配方式
Linux平台上被广泛使用的正则表达式库PCRE - Perl-compatible regular expressions,从其名字即可知道,PCRE提供的是一套与Perl中相兼容的正则表达式. 元 ...
- python之正则表达式和re模块一
摘要:正则表达式 re模块 一.正则表达式:只和字符串打交道,是一种用来约束字符串的规则 1.应用场景: 1,判断某一个字符串是否符合规则:注册页-判断手机号.身份证号 是否合法 注册某个账号的时候, ...
- 基础的正则表达式与re模块(2)
一.元字符 字符组是元字符中的一个.在字符组中所有的字符都可以匹配任意一个字符位置上能出现的内容,如果在字符串中有任意一个字符是字符组中的内容,那么就是匹配上的项. [0-9] [a-z] ...
- 分分钟钟学会Python - 模块
目录 模块 1 模块基础知识 2 random 返回随机生成的一个实数 3 hashlib 摘要算法模块 Hmac算法 4 time /datetime 时间模块 5 getpass 密码不显示(只能 ...
随机推荐
- JZ2440学习笔记之内存设备
通过OM[1:0]选择启动的设备: OM[1:0]=00,地址0对应的是Internal 4K RAM,且Nand的前4K会被复制到这里,得到执行: OM[1:0]=01,地址0对应的是Nor Fla ...
- php高精度计算问题
从事金融行业,资金运算频繁,这里说下我遇到的坑....稍不留神,用户资金可能损失几十万,甚至更可怕......直接上实例吧: javascript 0.1 + 0.2 为啥不等于 0.3 ? (正确结 ...
- 使用kubesql进行kubernetes资源查询
kubesql kubesql(https://github.com/xuxinkun/kubesql)是我最近开发的一个使用sql查询kubernetes资源的工具.诸如node,pod等kuber ...
- SpringBoot Tomcat启动报错
中间的桥梁就是下面这个依赖 <dependency> <groupId>org.slf4j</groupId> <artifactId>jcl-over ...
- SPOJ 375 QTREE - Query on a tree
思路 注意本题只能用C,不能用C++ 其他的都和上一题一样 代码 #include <stdio.h> #include <string.h> #define MAXN 100 ...
- Git 帮助
Git 配置 配置 git config --global user.name "..." git config --global user.email "...&quo ...
- Java基础之数组(一)
数组的定义 数组是相同类型数据的有序集合.数组描述的是相同类型的若干个数据,按照 一定的先后次序排列组合而成.其中,每一个数据称作一个元素,每个元素可以通过一个索引(下标)来访问它们.数组的三个基本特 ...
- 解决 scapy “NameError: global name 'wrpcap' is not defined” 错误
解决 scapy "NameError: global name 'wrpcap' is not defined" 错误 通过 scapy 编写发包脚本时遇到如下错误: Trace ...
- Python的几个爬虫代码整理(网易云、微信、淘宝、今日头条)
整理了一下网易云歌曲评论抓取.分析好友信息抓取.淘宝宝贝抓取.今日头条美图抓取的一些代码 抓取网易云评论 进入歌曲界面: http://music.163.com/#/song?id=45318582 ...
- SQL Server 第四章 存储过程(Procedure),触发器(Trigger),数据完整性(Data Integrity)
use electric go --变量 --局部变量的声明格式 --declare @局部变量名 数据类型 --局部变量赋值 declare @littlepage int )) ) select ...