day21 re模块

引入方式

 import re


方法

　　.findall() 　　
　　　　　　　　找所有的，返回所有的结果然后放在列表中

 ret = re.findall("[a-z]+","yangtuo tiancan shiye ")

 print(ret) # ['yangtuo', 'tiancan', 'shiye']

　　.finditer()　　
　　　　　　　　返回一个迭代器 ,更节省内存，一次一次返回

 ret = re.finditer("\d","dahka5hdka4546465h")

 print(ret)                  　　  # <callable_iterator object at 0x0000000002061EF0>

 print(next(ret).group())         #

 print(next(ret).group())         #

 print([i.group() for i in ret])  # ['5', '4', '6', '4', '6', '5']

　　.search()　　
　　　　　　　　从前往后找到一个就返回一个对象，调用group才可以拿到结果

 ret = re.search("a","yangtuo is tiancai")

 print(ret.group())    # a

　　　　　　　　找不到返回None，无法调用group，会报错

 ret = re.search("[0-9]+","yangtuo is tiancai")

 print(ret)            # None

 print(ret.group())    # AttributeError: 'NoneType' object has no attribute 'group'

　　　　　　　　为了避免上面的这种报错，可以利用if判断，从而打断if循环不报错，非常常用的方式

 ret = re.search("j","yangtuo is tiancai")

 if ret:

     print(ret.group())　　# 无结果但是不会报错了

　　
　　.match()　　
　　　　　　必须从头开始匹配，比如下面的字符串，y，ya都能匹配上。但是a就不行
　　　　　　用法和search一样，返回对象，必须用group输出，空报错，可if避免

 ret = re.match("[a-z]+","yangtuo is tiancai")

 print(ret.group())    # yangtuo

 ret = re.match("a","yangtuo is tiancai")

 print(ret.group())    # AttributeError: 'NoneType' object has no attribute 'group'

　　　
　　.split()
　　　　　　按照正则关系分割，不是很常用

 ret = re.split("[ab]","abcd")

 # 先按a分割得到 " " 和"bcd"，再按b分割得到 " "," ","cd"

 print(ret) # ['', '', 'cd']

　　　　
　　.sub()
　　　　　　按照正则对字符串替换
　　　　　　将数字替换成H 替换两次

 ret = re.sub("\d","H","shah4546shdah123",2)

 print(ret) # shahHH46shdah123

　　　　
　　.subn()
　　　　　　按照正则对字符串替换，并且返回结果和替换了几次用元祖形式
　　　　　　将数字替换成H 替换两次

 ret = re.subn("\d","H","shah4546shdah123",2)

 print(ret) # ('shahHH46shdah123', 2)

　　　　
　　.compile()
　　　　　　　　同一个正则规则需要被用很多次的时候可以使用此命令重复调用
　　　　　　　　将正则表达式编译成一个对象，调用对象使用更简单

 obj = re.compile("\d{3}")

 ret = obj.search("hsdhabsh153lhslk86")

 ret1 = obj.search("hsdh46897=lhslk86")

 print(ret.group())    #

 print(ret1.group())    #


特殊场景分析

　　

findall的优先级查询

 import re　　　　

 ret = re.findall('www.(baidu|oldboy).com', 'www.oldboy.com')

 print(ret)     # ['oldboy']

 # 这是因为findall会优先把匹配结果组里内容返回,如果想要匹配真实想要的结果,取消权限即可

 ret = re.findall('www.(?:baidu|oldboy).com', 'www.oldboy.com')

 print(ret) # ['www.oldboy.com']

　　

split的优先级查询
　　　　在匹配部分加上（）之后所切出的结果是不同的，
　　　　没有（）的没有保留所匹配的项，但是有（）的却能够保留了匹配的项，
　　　　这个在某些需要保留匹配部分的使用过程是非常重要的。

 ret=re.split("\d+","eva3egon4yuan")

 print(ret) # ['eva', 'egon', 'yuan']

 ret=re.split("(\d+)","eva3egon4yuan")

 print(ret) # ['eva', '3', 'egon', '4', 'yuan']

　

分组的命名和引用
　　　　组名的方式命名（？P<组名>）
　　　　组名的引用（？P=组名）

 ret = re.search("<(?P<tag_name>\w+)>\w+</(?P=tag_name)>","<h1>hello</h1>")

 print(ret.group("tag_name"))    　　# h1

 print(ret.group())                 # <h1>hello</h1>

　　　　也可以直接分组，然后用\1引用第一个组，组的索引是从1开始不是从0开始

 ret = re.search(r"<(\w+)>\w+</\1>","<h1>hello</h1>")

 print(ret.group(1))               # h1

 print(ret.group())                # <h1>hello</h1>

匹配小数整数

 # 40.35被当做40和35两个来取了

 ret=re.findall(r"\d+","1-2*(60+(-40.35/5)-(-4*3))")

 print(ret) #['1', '2', '60', '40', '35', '5', '4', '3']

　　利用|的工作原理从左到右最长匹配，将长的匹配项先写就可以
　　注意将 . 进行转义 \.
　　可以分组将分组的内容优先显示，但是无匹配的选项会用空表示出来，很蛋疼
　　可以使用remove进行空选项的移除 顺便这次稍微升级一下吧负号一起取到了

 ret=re.findall(r"-?\d+\.\d*|(-?\d+)","1-2*(60+(-40.35/5)-(-4*3))")

 print(ret) #['1', '-2', '60', '', '5', '-4', '3']

 ret.remove("")

 print(ret) #['1', '-2', '60', '5', '-4', '3']

示例：
　　
　　获取手机号匹配方式对比

　　
　　普通的方式实现

 while True:

     phone_number = input('please input your phone number ： ')

     if len(phone_number) == 11 \

             and phone_number.isdigit()\

             and (phone_number.startswith('') \

             or phone_number.startswith('') \

             or phone_number.startswith('') \

             or phone_number.startswith('')):

         print('是合法的手机号码')

     else:

         print('不是合法的手机号码')

　　re 实现

 # 正则实例

 import re

 phone_number = input('please input your phone number ： ')

 if re.match('^(13|14|15|18)[0-9]{9}$',phone_number):

         print('是合法的手机号码')

 else:

         print('不是合法的手机号码')

day21 re模块的更多相关文章

day21:正则函数&模块和包(import)
正则函数 1.search 通过正则匹配出第一个对象返回,通过group取出对象中的值 # search 通过正则匹配出第一个对象返回,通过group取出对象中的值 strvar = "1 ...
day21、模块
模块: 模块,用一砣代码实现了某个功能的代码集合.不同功能,放置在不同模块中,模块就是一个.py文件.避免函数重复写代码.对于相同功能的代码.只需要调用该模块或者该模块里面的函数就可以.增加灵活性,和 ...
day21 xml模块 ATM+购物车
1. xml模块 <father name="jack"> # 属性的值必须加双引号 <son> 标签的关闭顺序,与开启顺序相反, 最先开启的最后关闭,最后 ...
常用模块(random,os,json,pickle,shelve)
常用模块(random,os,json,pickle,shelve) random import random print(random.random()) # 0-1之间的小数 print(rand ...
Python全栈day21（调用模块路径BASEDIR的正确方法）
正常写python程序会有一个可执行的bin.py文件,假如这个文件需要导入my_module里面定义的模块,应该怎么设置sys.path 文件夹目录结构如下,因为bin不在与my_module同级目 ...
day21——面向对象初识、结构、从类名研究类、从对象研究类、logging模块进阶版
day21 面向对象的初识面向对象第一个优点: 对相似功能的函数,同一个业务下的函数进行归类,分类. 想要学习面向对象必须站在一个上帝的角度去分析考虑问题. 类: 具有相同属性和功能的一类事物. 对 ...
day21.模块和包
博客整理来源:http://www.cnblogs.com/Eva-J/articles/7292109.html 模块 1.什么是模块常见的场景:一个模块就是一个包含了python定义和声明的文件 ...
day21 python之模块和包
一模块 1 什么是模块? 常见的场景:一个模块就是一个包含了python定义和声明的文件,文件名就是模块名字加上.py的后缀. 但其实import加载的模块分为四个通用类别: 1 使用python编 ...
day21 模块异常处理
常用模块:http://www.cnblogs.com/Eva-J/articles/7228075.html 今日概要: #time # —— 时间:时间戳字符串结构化时间 #collectio ...

随机推荐

[03] Spring "Hello World"
0.写在前面的话本篇以一个简单的示例,描述了Spring通过容器对于Java类的装载和获取.在以下我们可以看到,有一个Java类Coder,我们全程并没有手动调用new来进行实例化,而是从Sprin ...
3.1《想成为黑客，不知道这些命令行可不行》(Learn Enough Command Line to Be Dangerous)——下载文件
首先,为了不手动创建一个长文件(这太麻烦了),我们将使用强大的curl(有时也写作"cURL")工具从网上下载一个文件,这个命令可以让命令行与URL交互.尽管这不是Unix核心命令 ...
React-引入图片的方法
方法一: import imgURL from '../../images/logo.png'; <img src={imgURL} alt="1"/> 方法二: &l ...
.NET Core 3.0 跟踪
Preview1: https://blogs.msdn.microsoft.com/dotnet/2018/12/04/announcing-net-core-3-preview-1-and-ope ...
npm install报错 npm ERR! enoent ENOENT: no such file or directory
在npm之后出现如下错误: $ npm install npm WARN checkPermissions Missing write access to /Users/lucas/code/js/v ...
从Stampery到Chronicled，区块链公证业务的实践
Stampery就是这样一家利用比特币区块链技术代替公证人的创业公司,能为所有的敏感文件提供具有法律约束力的证明.可以用Stampery证明任何文件,它能很好地保护知识产权,证明遗嘱.宣誓.合同.家庭 ...
Canary机制的绕过
目标程序下载提取码:8ypi 1.检查程序开启了哪些安全保护机制 Canary与NX开启了 Canary机制简介 64位的canary机制,会在函数头部添加: mov rax,QWORD PTR f ...
springcloud 笔记
官方教程 http://projects.spring.io/spring-cloud/ guide https://github.com/spring-guides 伪官方教程 https://sp ...
《Linux内核设计与实现》课本第四章学习总结
进程调度 4.1 多任务多任务操作系统就是能同时并发的交互执行多个进程的操作系统. 多任务系统分为两种: 抢占式多任务:Linux提供了抢占式的多任务模式,由调度程序来决定什么时候停止一个进程的运行 ...
网络：LVS负载均衡原理
LB集群的架构和原理很简单,就是当用户的请求过来时,会直接分发到Director Server上,然后它把用户的请求根据设置好的调度算法,智能均衡地分发到后端真正服务器(real server)上.为 ...

day21 re模块

day21 re模块的更多相关文章

随机推荐

热门专题