python正则表达式-re模块的爱恨情仇
利用python的re模块,使用正则表达式对字符串进行处理
# 编辑者:闫龙
import re
restr = "abccgccc123def456ghi789jgkl186000"
#re中的方法:
res=re.findall("abc",restr)
#获得匹配到的字符,并转化为列表['abc']
res=re.finditer("abc",restr)
next(res).group()
#获得匹配到的字符,并转成一个迭代器<callable_iterator object at 0x00000187BFA43DD8> res = re.search("abc",restr)
res.group()
#获得匹配结果对象,<_sre.SRE_Match object; span=(0, 3), match='abc'>
#只匹配一个结果
#通过group方法从对象中拿到结果
#否则None res = re.match("abc",restr)
res.group()
#获得匹配对象,<_sre.SRE_Match object; span=(0, 3), match='abc'>
#只匹配一个结果,而且匹配结果必须是开头
#通过group方法从对象中拿到结果
#否则None res = re.split("\d+",restr)
#获得匹配结果作为列表
#按照匹配字符拆分列表['abccccc', 'def', 'ghi', 'jkl', '']
res = re.split("\d+",restr,2)
#指定分割次数,只分两次
# ['abccccc', 'def', 'ghi789jkl186000'] res = re.sub("g","egonSomeBody",restr)
#sub用来将匹配的结果替换为新的字符串
#abccegonSomeBodyccc123def456egonSomeBodyhi789jegonSomeBodykl186000
res = re.sub("g","egonSomeBody",restr,1)
#指定替换次数,只替换第一个匹配结果
#abccegonSomeBodyccc123def456ghi789jgkl186000 res = re.compile("\d+")
res.findall(restr)
#保存正则表达式,直接调用给字符串
#['123', '456', '789', '186000']
print(res)
"""--------------------------------------------------------------------------------------------"""
#正则元字符
restr = "abccccc123def456ghi789jkl186000"
# . 通配符代表除了\n换行符之外的所有字符
res = re.findall(".",restr)
#['a', 'b', 'c', 'c', 'c', 'c', 'c', '1', '2', '3', 'd', 'e', 'f', '4', '5', '6', 'g', 'h', 'i', '7', '8', '9', 'j', 'k', 'l', '1', '8', '6', '0', '0', '0']
#任意字符匹配 #^以什么字符开头的字符串
res = re.findall("^abc.",restr)
#['abcc'] 以abc任意字符开头的匹配字符串 #$以什么字符结尾的字符串
res = re.findall("00$",restr)
#['00']以00结尾的匹配字符串 #+重复一个或多个字符
res = re.findall("c+",restr)
#['ccccc'] 重复c一个或多个匹配的字符串 #*重复0个或多个字符
res = re.findall("c*",restr)
#['', '', 'ccccc', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
#重复c,0个或多个匹配的字符串,所有""全部都是0个c的 #? 重复0个或1个字符
res = re.findall("c?",restr)
#['', '', 'c', 'c', 'c', 'c', 'c', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
#重复c,0个或1个匹配的字符串 #{}重复自定义次数
res = re.findall("c{2,3}",restr)
#['ccc', 'cc'] 匹配c,2个或者3个的字符串 #[]自定义出现的字符
restr = "abccccc123def456ghi666gai789jkl186000"
res = re.findall("g[ha]i",restr)
#['ghi', 'gai'] 匹配gh或ai的字符串
res = re.findall("[0-9]+",restr)
#['123', '456', '666', '789', '186000']匹配符合数字的字符串一个或多个
res = re.findall("[a-z]+",restr)
#['abccccc', 'def', 'ghi', 'gai', 'jkl']匹配符合字母的字符串一个或多个 #()分组字符串
res = re.findall("(ab)|(gh)",restr)
#[('ab', ''), ('', 'gh')]匹配(ab)或者(gh)的字符串 # | 或
res = re.findall("g|h",restr)
#['g', 'h', 'g']匹配g或者h的字符串 # \ 转义符,应用于将特殊符号转义,或将普通字符转义
#如\d就是全部数字,\.就是一个普通的点儿
#以上为元字符的介绍和使用方法 """---------------------------------------------------------------------------------------"""
#\d 匹配十进制数字,等同于[0-9]
res = re.findall("\d",restr)
#['1', '2', '3', '4', '5', '6', '7', '8', '9', '1', '8', '6', '0', '0', '0']
#所有匹配为十进制数字的字符串 #\D匹配非数字,等同于[^0-9]
restr = "abc1234"
res = re.findall("\D",restr)
#['a', 'b', 'c']匹配所有非数字字符 #\s 匹配空白字符,相当于[\t\r\n\f\v]
restr = "abc 1\t2\n34"
res = re.findall("\s",restr)
#[' ', '\t', '\n']匹配所有空格字符 #\S 匹配非空白字符,相当于[^\t\r\n\f\v]
restr = "abc 1\t2\n34"
res = re.findall("\S",restr)
#['a', 'b', 'c', '1', '2', '3', '4']匹配所有非空格字符 #\w 匹配字母和数字,相当于[a-Z0-9]
restr = "aZc-1(2;3.4"
res = re.findall("\w",restr)
#['a', 'Z', 'c', '1', '2', '3', '4']匹配所有字母和数字 #\W匹配非字母和非数字,相当于[^a-Z0-9]
restr = "aZc-1(2;3.4\n"
res = re.findall("\W",restr)
#['-', '(', ';', '.', '\n']匹配所有字母和数字 #\b 匹配一个特殊字符边界,相当于 空格,&,# 等
restr = "aZc-1 2& 3#4"
res = re.findall("\\b3",restr)
#['3']匹配3之前的边界 #特殊知识点:\\ 双反斜杠转义
restr = "hell\o"
res = re.findall("l\\\\o",restr)
#['l\\o'] 匹配l\o成功,这里要说明的是四个\是因为第一次是由python解释器翻译得到\\
#第二步是由正则解释,\\为转义后的\
python正则表达式-re模块的爱恨情仇的更多相关文章
- 注解:大话AOP与Android的爱恨情仇
转载:大话AOP与Android的爱恨情仇 1. AOP与OOP的区别 平时我接触多的就是OOP(Object Oriented Programming面向对象).AOP(Aspect Oriente ...
- pytorch和tensorflow的爱恨情仇之基本数据类型
自己一直以来都是使用的pytorch,最近打算好好的看下tensorflow,新开一个系列:pytorch和tensorflow的爱恨情仇(相爱相杀...) 无论学习什么框架或者是什么编程语言,最基础 ...
- Menu与ActionBar的爱恨情仇
最近在开发一款音乐播放器,在开发过程中遇到了一点小麻烦,通过android API搞清楚了Menu与ActionBar的爱恨情仇,写了个小Demo祭奠一下那些年我们陷进去的坑,有不对的地方请大神们批评 ...
- web移动端fixed布局和input等表单的爱恨情仇 - 终极BUG,完美解决
[问题]移动端开发,ios下当fixed属性和输入框input(这里不限于input,只要可以调用移动端输入法的都包括,如:textarea.HTML5中contenteditable等),同时存在的 ...
- python正则表达式Re模块备忘录
title: python正则表达式Re模块备忘录 date: 2019/1/31 18:17:08 toc: true --- python正则表达式Re模块备忘录 备忘录 python中的数量词为 ...
- Python面试题之Python正则表达式re模块
一.Python正则表达式re模块简介 正则表达式,是一门相对通用的语言.简单说就是:用一系列的规则语法,去匹配,查找,替换等操作字符串,以达到对应的目的:此套规则,就是所谓的正则表达式.各个语言都有 ...
- 除了love和hate,还能怎么表达那些年的“爱恨情仇”?
实用英语 帮你全面提高英语水平 关注 童鞋们每次刷美剧的时候,相信都会被CP感满满的男女主角虐得体无完肤吧. 可是,一到我们自己表达爱意或者恨意的时候,却苦于词穷,只会用love, like, hat ...
- 对json的爱恨情仇
本文回想了对json的爱恨情仇. C++有风险,使用需慎重. 本文相关代码在:http://download.csdn.net/detail/baihacker/7862785 当中的測试数据不在里面 ...
- String、StringBuilder、StringBuffer的爱恨情仇
第三阶段 JAVA常见对象的学习 StringBuffer和StringBuilder类 (一) StringBuffer类的概述 (1) 基本概述 下文以StringBuffer为例 前面我们用字符 ...
随机推荐
- [转帖]go 的goroutine 以及 channel 的简介.
进程,线程的概念在操作系统的书上已经有详细的介绍.进程是内存资源管理和cpu调度的执行单元.为了有效利用多核处理器的优势,将进程进一步细分,允许一个进程里存在多个线程,这多个线程还是共享同一片内存空间 ...
- 给表格控件DBGrid加上记录序号的列
DBGrid使用起来还是很方便的,但就是没有显示记录序号的功能,必须自己加,参照老外给的解决方案如下: 方案1: 1- 在DBGrid建一个第一列 (列的名字起“NO”) 2- 在DBGrid事件 D ...
- ajax发送post请求遇到的坑
前端小白的我. 用django-rest-framework写好了一个接口.如下,就接收两个字符串参数. 前端写了一个简单的提交post请求到这个接口,如下 浏览器提交请求后,一直提示 400 Bad ...
- hbase batch批处理
hbase的put(List<Put> puts),delete(List<Delete> deletes),get(List<Get> gets)都是基于batc ...
- loj2540 「PKUWC2018」随机算法 【状压dp】
题目链接 loj2540 题解 有一个朴素三进制状压\(dp\),考虑当前点三种状态:没考虑过,被选入集合,被排除 就有了\(O(n3^{n})\)的转移 但这样不优,我们考虑优化状态 设\(f[i] ...
- linux内核分析 第八周读书笔记
第四章 进程调度 4.1 多任务 1.多任务操作系统就是能同时并发的交互执行多个进程的操作系统. 2.多任务操作系统使多个进程处于堵塞或者睡眠状态,实际不被投入执行,这些任务尽管位于内存,但是并不处于 ...
- QNX下进程间通信
https://blog.csdn.net/dh314552189/article/details/87879016 server.cpp #include <stdlib.h> #inc ...
- 左值与右值,左值引用与右值引用(C++11)
右值引用是解决语义支持提出的 这篇文章要介绍的内容和标题一致,关于C++ 11中的这几个特性网上介绍的文章很多,看了一些之后想把几个比较关键的点总结记录一下,文章比较长.给出了很多代码示例,都是编译运 ...
- aapt命令说明
这里借用一下百度百科,我比较懒 1.列出apk包的内容 aapt l[ist] [-v] [-a] <你的应用> -v 以table形式列出来 -a 详细列出内容 例如:aapt l &l ...
- 【Asp.net入门4-01】基本开发工具