python基础学习1-正则表达式
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import re
print(re.findall('alex','yyyyabbblalexrrreooox')) # ”.“ 通配符 匹配除开”\“以外的其他字符
print(re.findall('al.x','yyyyaalqxbbblalexrrreooox')) #”^“ 在启始位置匹配:
print(re.findall('^al','alyyyyaalqxbbblalexrrreooox')) #”$“ 在结束位置匹配:
print(re.findall('oo.$','alyyyyaalqxbbblalexrrreooox')) #”*“ 表示重复 在出现的位置表示对"前一个"字符可以匹配0到多个字符:
print(re.findall('al.*a','alyyyyaalqxbbblalexrrreooox')) #”+“ 表示重复 在出现的位置表示对"前一个"字符可以匹配1到多个字符:
print(re.findall('al.+x','alyyyyaalqxbbblalexrrreooox')) #”?“ 表示重复 在出现的位置表示对"前一个"字符可以匹配0到1个字符:
print(re.findall('al.?x','alyyyyaalqxbbblalexrrreooox')) #”{}“ 表示重复 在出现的位置表示对"前一个"字符可以匹配指定范围个字符:
print(re.findall('al.{1,3}x','alyyyyaalqxbbblalexrrreooox')) #”[]“ 表示重复 在出现的位置表示可以匹配指定字符出现请 :
print(re.findall('a[a-z]d','acd'))#a开头 中间出现a-z中任意一个字符 d结尾 都可以匹配 例如 "abd','acd'
#在[]中出现的元字符 都没有特殊功效只能匹配成一般字符 除开 ”-“表示范围 "^"表示 非 "\d" 表示 数字
print(re.findall('a[^f]d','acd')) #a开头 中间出现非f d结尾 都可以匹配 例如 "abd','acd'
print(re.findall('a[\d]d','acd')) #a开头 中间出现数字 d结尾 都可以匹配 例如 "a1d','a5d' """
\ 反斜杠后边跟元字符去除特殊功能
反斜杠后边跟普通字符实现特殊功能
\d 匹配十进制数字 相当于[0-9]
\D 匹配任何非数字字符 相当于[^0-9]
\s 匹配任何空白字符 相当于[\t\n\r\f\v]
\S 匹配任何非空白字符 相当于[^\t\n\r\f\v]
\w 匹配任何字母数字字符 相当于[a-zA-Z0-9_]
\W 匹配任何非字母数字字符 相当于[^a-zA-Z0-9_]
\b 匹配一个单词后面的空格 """ #正则表达式的 函数 #match : re.match(pattern,string,flags=0) 只匹配启始位置 并且只匹配一次 找到后退出
r =re.match('com','comwww.runcomoob')
print(r.group())#输出匹配到的字符
print(r.span())#输出匹配到字符的位置信息 启始位置 和终止位置(0,3) #search : 和match的区别是search匹配任意位置 并且只匹配一次找到后退出
rs = re.search('com','www.runcomoob')
print(rs.group())#输出匹配到的字符
print(rs.span())#输出匹配到字符的位置信息 启始位置 和终止位置(7,10) #findall: 和上面两个函数方法的 是查询出所有匹配的字符串
ra = re.findall('com','comwww.runcomoob')
print(ra) #findditer: 匹配方法和 findall一样就是返回值 是返回的一个列表
rr = re.finditer('com','comwww.runcomoob')
for item in rr:
print(item.group())
print(item.span()) #sub 安装匹配的字符串替换内容 参数1-需要匹配的字符串格式 2-替换后内容 3-需要替换的原字符串
rsu= re.sub('g.t','have','Y get A,I got B ,I gut C')#返回替换后的字符串
print(rsu)
rsu1 = re.sub('g.t','have','Y get A,I got B ,I gut C',2)#返回替换后的字符串 指定最大替换次数2
print(rsu1) #subn 安装匹配的字符串替换内容 参数1-需要匹配的字符串格式 2-替换后内容 3-需要替换的原字符串 返回值多了 返回替换成功次数
rn= re.subn('g.t','have','Y get A,I got B ,I gut C')#返回替换后的字符串
print(rn) #splite 按照匹配的格式分拆
rp = re.split('\d+','one1tow2tree3four4')
print(rp) #compile 把正则表达式编译成一个对象 便于多次调用
text = "JGood is a handsome boy, he is cool, clever, and so on..."
regex = re.compile(r'\w*oo\w*')#创建正则表达式对象 regex
print(regex.findall(text)) #查询所有包含'oo'的单词 # r 转意字符
r5=re.search(r'\\com','adddss\com').group() #匹配‘\com'
print(r5) #------正则分组::去已经提取到的数据中在提取指定数据
ors="hasaabc dfuojqw halaabc m098u29341"
ra1 = re.findall('h(\w+)a(ab)c',ors)#默认提取到两个 'halaabc','hasaabc' 在把其中括号括起来的'as','al' 取出来分别和后面'ab'
# 组一个值 [('as','ab'),('al','ab')]
print(ra1) #match 和 search 分组方式一样
origin ="has dfuojqw1m098u29341"
r= re.match("h\w+",origin) #一般正则匹配未分组
r=re.match("h(\w+)",origin)#匹配后分组 显示('as',)
r =re.match("h(?P<name>\w+)",origin)#匹配后分组,并把分组结果保存在字典中 key为name print(r.group())
print(r.groups())
print(r.groupdict()) #splite orr = "hello alex bcd alex lge alex acd 19"
rs = re.split('(alex)',orr,1) #分组后 把匹配值 也显示出来['hello ', 'alex', ' bcd alex lge alex acd 19']
rrs = re.split('alex',orr,1)# 未分组,只才分['hello ', ' bcd alex lge alex acd 19']
print(rrs)
print(rs)
python基础学习1-正则表达式的更多相关文章
- python基础学习笔记——正则表达式
1.什么是正则? 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法.或者说:正则就是用来描述一类事物的规则.(在Python中)它内嵌在Python中,并通过 r ...
- Day1 Python基础学习
一.编程语言分类 1.简介 机器语言:站在计算机的角度,说计算机能听懂的语言,那就是直接用二进制编程,直接操作硬件 汇编语言:站在计算机的角度,简写的英文标识符取代二进制去编写程序,本质仍然是直接操作 ...
- 0003.5-20180422-自动化第四章-python基础学习笔记--脚本
0003.5-20180422-自动化第四章-python基础学习笔记--脚本 1-shopping """ v = [ {"name": " ...
- Day1 Python基础学习——概述、基本数据类型、流程控制
一.Python基础学习 一.编程语言分类 1.简介 机器语言:站在计算机的角度,说计算机能听懂的语言,那就是直接用二进制编程,直接操作硬件 汇编语言:站在计算机的角度,简写的英文标识符取代二进制去编 ...
- Python 基础学习 总结篇
Python 基础学习总结 先附上所有的章节: Python学习(一)安装.环境配置及IDE推荐 Python学习(二)Python 简介 Python学习(三)流程控制 Python学习(四)数据结 ...
- (一)python基础学习
根据廖雪峰老师的python教程写一些学习总结! Python基础学习 1.使用list和tuple (1)list Python内置的一种数据类型是列表:list.list是一种有序的集合,可以随时 ...
- python基础学习(起步)
目录 python基础学习(起步) 变量 常量 变量的内存管理 python垃圾回收机制 变量的其他赋值方式 今日编程小题 本人能力有限,若有偏颇之处请读者大大不吝赐教! 祝大家每天都在成长! pyt ...
- python基础之坑爹正则表达式
python基础之坑爹正则表达式 概述 re模块就是python语言中的正则表达式,拆出来单独写一条blog是因为正则表达式本身就是比较庞大的知识,写具体些让自己以后方便查找. IP: ^(25[0- ...
- Python基础学习二
Python基础学习二 1.编码 utf-8编码:自动将英文保存为1个字符,中文3个字符.ASCll编码被囊括在内. unicode:将所有字符保存为2给字符,容纳了世界上所有的编码. 2.字符串内置 ...
- Python基础学习一
Python基础学习一 1.变量与常量 变量名:大小写英文.数字.下划线的组合,数字不能开头 常量名:习惯上常量用大写字母命名,例如"PI" 2.多行输出 转义符:反斜杠(),如果 ...
随机推荐
- .NET 2.0 参考源码索引
http://www.projky.com/dotnet/2.0/Microsoft/CSharp/csharpcodeprovider.cs.htmlhttp://www.projky.com/do ...
- 引用js文件
在子模板里引用js文件的时候,需要把相应的.js文件放到static目录下,如引用static/jQuery/index.js文件: {% extends "base.html" ...
- 配置nginx官网yum源
由于yum源中没有我们想要的nginx,那么我们就需要创建一个“/etc/yum.repos.d/nginx.repo”的文件,其实就是新增一个yum源 二.添加nginx.repo 文件: [roo ...
- phpcas 整合 ecms的问题
如果有ecms整合phpCAS经验的小伙伴可以给我留言,有偿付费 需求是:ecms登录自动跳转到CAS认证(已完成),认证后直接跳转到帝国cms系统中,并保持帝国cms系统权限等都和以前一样 正常使用 ...
- 设计一套砝码要求能称量出1 ~ 100g之间的任意重量,请问至少需要多少个砝码?以及每个砝码各自的重量是多少?
解析: 1g => 1g 2g => 1g 1g => 1 ~ 2g之间的重量 => 1g 2g => 1 ~ 3g之间的重量 4g => 1g 2g 1g =&g ...
- tomcat 开启远程debug
修改 tomcat 目录下 /bin/catelina.sh # execution immediately after startup. Default is ...
- TensorFlow函数(九)tf.add_to_collection()、tf.get_collection() 和 tf.add_n()
tf.add_to_collection(name, value) 此函数将元素添加到列表中 参数: name:列表名.如果不存在,创建一个新的列表 value:元素 tf.get_collectio ...
- Day11 Java内部类
什么是内部类? 内部类是指在一个外部类的内部再定义一个类.内部类作为外部类的一个成员,并且依附于外部类而存在的.内部类可为静态,可用protected和private修饰(而外部类只能使用public ...
- ZOJ 4103 浙江省第16届大学生程序设计竞赛 D题 Traveler 构造
这个题,正赛的时候也没有过,不过其实已经有了正确的解法,可惜时间不多了,就没有去尝试. 题意是有n个点,i点能通向i-1,然后i和i*2.i*2+1互通. 请你构造一种路径从1能走完所有点,并且不重复 ...
- 创建ROS工程結構
图像化显示目录工程结构:tree $ sudo apt install tree 1.创建ROS工作空间 $ mkdir -p catkin_ws/src # Create mutil-level d ...