python学习Day25--正则表达式1
【知识点】
# 所有模块要经历的两个步骤:
① 要操作的概念本身:正则表达式 时间
② 使用模块取操作它:re time
1、正则表达式:一种匹配字符串的规则
# 正则表达式能做什么?可以定制一个规则来确认某一个字符串是否符合规则,从大段的字符串中找到符合规则的内容
# 程序领域:
① 登录注册页的表单验证
② 爬虫:把这个网页下载下来,从里面提取一些信息,找到想要的所有信息,做到数据分析
③ 自动化开发
# 正则表达式是一种独立的语法,和python没有关系
# 一个正则表达式学习的小工具:http://tool.chinaz.com/regex/
2、正则表达式的语法
(1)元字符
① 字符组[ ] 在一个字符的位置上能出现的内容(比如[1bc] ,一个位置上可以是1,b,c三者中任意一个)
【注意1】字符组的理解1:[1-9]表示1到9,下面出现1~9的数字均标记(匹配1个)
【注意2】字符组的理解2:[1-9][A-Z][a-z]表示第一个必须是数字,第二个必须是大写字母,第三个必须是小写字母,并且三个在一起。(匹配3个)
【注意3】字符组理解3:[1-9A-Za-z]表示第一个位置可以是1~9,也可以是A~Z和a~z,因此以下全匹配。(匹配1个)
② 元字符:
\d == [0-9]——表示匹配一个字符,匹配的是一个数字
\w == [0-9a-zA-Z]——表示匹配一个数字、字母、下划线
\s == [\n \t ]——表示匹配任意的空白符,包括回车、空格和制表符tab
\n —— 匹配回车
\t —— 匹配制表符
\D ——匹配非数字
\W ——匹配非数字字母下划线
\S ——匹配非空白符
【注意】[\d\D]——表示匹配全局(所有),还有[\w\W]、[\s\S]
★非常重要的两个:
^ ——匹配字符串的开始
$ ——匹配字符串的结尾
比如,严格匹配一个手机号,多输入少输入都不行,就在前加^,后加$。
a|b——表示a或b,在一个位置上可以出现a或b。(abc|ab——表示匹配abc或ab,但长的要放在前面)
[^abc]——表示匹配除了abc以外的任意字符
. ——表示匹配除了换行符以外的任意字符
(2)量词
\d{3} ——表示前面匹配的数字重复三次
\d\d{3} ——表示第一个只匹配一个数字,第二个匹配三次,最后是四个数字
\d{3,} ——表示至少匹配数字三次(尽量多的匹配——贪婪匹配)
\d{3,5} ——表示至少匹配数字三次,最多匹配五次(尽量多匹配)
\d? ——表示匹配数字零次或一次(相当于没有匹配上也算成功)(\d\.?\d——结果可以有:2.3 23)
\d+——表示匹配数字一次或者多次
\d* ——表示匹配数字零次或多次(\d\.?\d*——结果可以有:2 2.22 2.3457767)
(3)* + ? { }
【注意】 特殊用法:
① 在量词后跟了一个? ——表示取消了贪婪模式,变成非贪婪模式
李.{1,3}?和 李连营和 (惰性匹配 回溯算法)
② 最常用: .*x 匹配任意字符直到找到一个x
(4)分组()与或 | [^]
# 小数或者整数的正则表达式——\d+(\.\d+)?
参考资料:https://www.cnblogs.com/Eva-J/articles/7228075.html
时间:2020-02-19 14:23:58
python学习Day25--正则表达式1的更多相关文章
- python学习day25 正则表达式
4.30-25 正则表达式与re模块 re模块本身是用来操作正则表达式,与正则本身没有关系 正则表达式是指一规则,匹配字符串的规则 1.正则表达式regex 正则表达式regex是指一规则,匹配字符串 ...
- [Python学习笔记]正则表达式总结
常用缩写字符及其含义表格查询 缩写字符分类 含义 \d 0-9的任意数字 \D 除0-9的数字以外的任何字符 \w 任何字母.数字或下划线字符(可以认为是匹配"单词"字符) \W ...
- Python学习 之 正则表达式
1.简单的正则表达式 import re s=r'abc' re.findall(s,"aaaaaaaaaaaaaaa") #结果为[] re.findall(s,"ab ...
- Python学习笔记——正则表达式入门
# 本文对正则知识不做详细解释,仅作入门级的正则知识目录. 正则表达式的强大早有耳闻,大一时参加一次选拔考试,题目就是用做个HTML解析器,正则的优势表现得淋漓尽致.题外话不多讲,直接上干货: 1. ...
- Python学习--16 正则表达式
正则表达式是一种描述性的语言,用来匹配字符串.凡是符合规则的字符串,我们认为就是匹配了. 正则表达式并非Python独有的,它与语言无关.很多语言都支持正则表达式. 我们经常用正则表达式来匹配电子邮件 ...
- python学习日记(正则表达式)
定义 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. re 模块使 Pyth ...
- python学习笔记----正则表达式
正则: regular expression 常用的场景: #正则的包 >>> import re #match:开头匹配,匹配到,返回一个匹配对象,否则返回None >> ...
- python学习笔记——正则表达式regex
1 概述 1.1 定义 本质是由一系列字符和特殊符号组成的字串,用来表示一定规则的某一类字符串. 1.2 特点 正则表达式是一个独立的技术,其在多种编程语言中使用. 在python语言中的正则表达式模 ...
- Python学习 :正则表达式
正则表达式 python 使用正则表达式(re)来进行匹配引擎搜索 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符.及这些特定字符的组合,组成一个“规则字符串” 关于正则表达式 ...
- python 学习总结----正则表达式
正则表达式 应用场景 - 特定规律字符串的查找,切割,替换 - 邮箱格式:URl,IP地址等的校验 - 爬虫项目中,特定内容的提取 使用原则 - 只要使用字符串等函数能解决的问题,就不要使用正则 - ...
随机推荐
- asp.net使用wsdl文件调用接口,以及调用SSL接口报错“根据验证过程 远程证书无效”的处理
1.调用wsdl接口,首先需要将wsdl文件转换为cs文件: 进入VS 开发人员命令提示行,输入如下命令: c:/Program Files/Microsoft Visual Studio 8/VC& ...
- npm解决node-sass安装失败
npm装包一直都很成功,直到我遇见了node-sass这个包 我一直报这样的错误 npm ERR! code ELIFECYCLE npm ERR! errno 1 npm ERR! node-sas ...
- jdk之java.lang.Integer源码理解
基本数据类型的包装类java.lang.Integer是我们频繁使用的一个系统类,那么通过一个示例反应出的几个问题来深入理解一下此类的源码. 需求:实现Integer类型的两个数值交换. packag ...
- 需要再次删除清空部署才能用rancher部署成功的是docker有问题
需要再次删除清空部署才能用rancher部署成功的是docker有问题 待办 可以解释为什么一定要用特定的docker版本
- 【Python】【爬虫】爬取酷狗音乐网络红歌榜
原理:我的上篇博客 import requests import time from bs4 import BeautifulSoup def get_html(url): ''' 获得 HTML ' ...
- DOM的方法和属性
HTML DOM 方法是我们可以在节点(HTML 元素)上执行的动作. HTML DOM 属性是我们可以在节点(HTML 元素)设置和修改的值. 编程接口 可通过 JavaScript (以及其他编程 ...
- MinGW编译dll并引用
记得某位神仙曾经说过:一个项目不使用dll简直是一场灾难.(滑稽) 这篇文章以A+B/A-B为范例,来介绍如何在MinGW下编译dll并引用. 首先你要安装MinGW,并配置好环境变量(不配置环境变量 ...
- vue工程 使用滚动组件 vue2-better-scroll 实现上拉加载 下拉刷新
vue2-better-scroll 关于具体安装&使用过程 请移步api文档 已经很详细了 而且超清晰明了. https://cnpmjs.org/package/vue2-better-s ...
- c++面向对象 之 基础 类修饰符 构造函数 友元函数
1,类和对象 定义一个类,本质上是定义一个数据类型的蓝图.这实际上并没有定义任何数据,但它定义了类的名称意味着什么,也就是说,它定义了类的对象包括了什么,以及可以在这个对象上执行哪些操作. 类定义格式 ...
- Python 多任务(进程) day1(1)
进程和程序的关系: 通俗来讲程序是死的不变的,进程是活的改变的.一个程序在没运行之前是程序,运行之后是进程 程序是一种电脑能识别的2进制代码,当你一直运行程序的时候,会出现多个进程(相当于菜谱和菜,照 ...