python中的re模块和正则表达式基础

1.正则匹配基础知识

（1）通配符.

.只匹配一个字符

>>> re.findall("p.ckname","piiickname-pockname")

['pockname']

如果要匹配.等特殊字符，要使用注意字符\

>>> re.findall("p.ckname","pickname--p.ckname")

['pickname', 'p.ckname']

>>> re.findall("p\.ckname","pickname--p.ckname")

['p.ckname']

（2）字符集[]，只能匹配单个字符，匹配多个见（4）

[a-z] 可以匹配a-z之间任意一个字符

[a-zA-Z0-9]匹配a-z，A-Z，0-9的任意一个字符

[^p]反转匹配，可以匹配除了p的一个字符串，注意是使用[ ]括起来的，和（5）区分出来

#例子

>>> re.findall("p[a-z]ckname","piickname-pockname")

['pockname']

>>> re.findall("p[a-z]*ckname","piickname-pockname")

['piickname', 'pockname']

>>> re.findall("p[^o]ckname","pickname-pockname")
['pickname'] @反转匹配

(3)选择符 | 相当于或

>>> re.findall("name|test","pickname-testpy")
['name', 'test']

(4)可选项，注意（）的使用

()?子模式出现0次或者1次

()*子模式出现0次或者多次

()+子模式出现1次或者多次

(){m,n}子模式出现m-n次

在这个模式下注意一下findall和search的结果

>>> aa=re.search("(name){2}","myname--mynamename--my")

>>> print aa.group()

namename

>>> re.findall("my(name){2}","myname--mynamename--my")

['name'] 这里匹配不到namename，需要进一步理解re的几个函数区别

举个例子r'(http://)?(www\.)?baidu\.com'

匹配结果：http://www.baidu.com

http://baidu.com

www.baidu.com

baidu.com

(5)开头和结尾

^只想在字符串的开头匹配http ^http

$只想在字符串的结尾匹配http http$

这里要区分下不以http开头的string怎么写呢？

[^http]要写在[ ]里面

2.re模块

re.compile()

可以把正则表达式编译成一个正则表达式对象。可以把那些经常使用的正则表达式编译成正则表达式对象，这样可以提高一定的效率。

text="hello,meixiaoer!"

pa=re.compile('h')

pa.match(text)

pa.findall（text）

pa.search(text)

结果：<_sre.SRE_Match object at 0x01ADF100>

['h']

<_sre.SRE_Match object at 0x01A6EDE8>

re.match（）

尝试从字符串的开始匹配一个模式，只匹配一个！

re.match('h',text) 结果是<_sre.SRE_Match object at 0x01ADF090>

re.match('e',text) 结果是none

要是想打印出匹配字符可以这样

m=re.match('h',text)

print m.group(0) 结果是h

re.search() 只匹配一个！

函数会在字符串内查找模式匹配,直到找到第一个匹配然后返回，未匹配返回none

>>> re.search('e',text)
<_sre.SRE_Match object at 0x01ADF100>

打印元素

>>> m=re.search('e',text)
>>> print m.group(0)
e

因为只匹配第一个元素，所以第二个元素会报错

>>> m=re.search('e',text)
>>> print m.group()
IndexError: no such group

re.findall()查找多有符合的元素，匹配所有，返回列表

>>> re.findall("name","name-myname-yourname")

['name', 'name', 'name']

>>> re.findall("^name","name-myname-yourname")

['name'] 因为^name正则表达式是从开始匹配的，可以理解下

另一个例子更清楚的看清三个函数的区别

#只有findall可以查找所有的

f=re.findall('[0-9]','2fff4')

print f #['2','4'] 返回结果是列表

s=re.serach('[0-9]','fff45')//查找第一个符合的以后就停止查找了

print s.group() #

m=re.match('[0-9]','fff45') //从第一个字符开始匹配，符合以后就停止查询

print m.group() #None

m=re.match('[0-9]','1fff45')

print m.group() #

###########一些常用的使用场景#################

#使用()进行分组

#不使用()，表示表达式是一个组，就要使用group(0)

m=re.match(r'\d{3}-\d{3,8}','010-12345')

print m.group(0) #010-12345,ps特殊符号一遍要使用\-但是-这里不使用也可以

#如果使用(),表示表达式是有n个组的，所以要使用groups()

m=re.match(r'(\d{3})-(\d{3,8})','010-12345')

print m.groups()#('010', '12345')

print m.group(0)#010-12345  默认组0，组0包含整个字符串

print m.group(1)#010        组1包含第一个（）内的正则

print m.group(2)#123456     组2包含第二个（）内的正则

2. 分割字符应用　　

p=re.compile(r'd+')

p.split('one1two22three333four')    #['one', 'two', 'three', 'four']

两种方法，先compile后，就不用每次都运行compile了

ss="hello,what,is,,,,,,your,,name"

import re

sss=re.split('[,]+',ss)

print sss

#等同于

pa=re.compile('[,]+')

aaa=pa.split(ss)

print aaa

3替换应用，最突出的就是和组结合使用

re.sub()

4贪婪匹配

将贪婪比配转换成非贪婪模式？,这里注意？的位置啊

ss='*mili*is*great*'

#贪婪模式

pa=re.compile(r'\*(.+)\*')

print pa.match(ss).group(0)

#*mili*is*great* 世界只想匹配*mili*，贪婪尽可能多的东西匹配

#非贪婪模式，匹配到就停止
pa1=re.compile(r'\*(.+?)\*')    #这里注意下？的位置啊(.+)?这个?指的是0次或者1次，不一样的

print pa1.match(ss).group(0)

#*mili*

5 re.sub替换，模式替换

#替换re.sub强大之处就在于替换中使用组号，默认整个字符创是group(0),\1第一个()group(1)

#re.sub(pa,repl,string,count=0) 用repl替换pa匹配的地方

print help(re.sub)

ss='hello, *world*'

pa=re.compile(r'\*([^\*]+)\*') #匹配不以*开头的字符串，^需要[^]使用

print re.sub(pa,'hahahaha',ss)

#hello, hahahaha

pa1=re.compile(r'\*([^\*]+)\*')

print re.sub(pa,r'<h1>\1</h1>',ss)

#\1第一个()group(1)

hello, <h1>world</h1>

python中的re模块和正则表达式基础的更多相关文章

python 中的re模块，正则表达式
一.re模块 re模块中常用的方法. match: 默认从字符串开头开始匹配,re.match('fun', 'funny') 可以匹配出来 'fun' match(pattern, string, ...
Python中的re模块--正则表达式
Python中的re模块--正则表达式使用match从字符串开头匹配以匹配国内手机号为例,通常手机号为11位,以1开头.大概是这样13509094747,(这个号码是我随便写的,请不要拨打),我们 ...
常用正则表达式与python中的re模块
正则表达式是一种通用的字符串匹配技术,不会因为编程语言不一样而发生变化. 部分常用正则表达式规则介绍: . 匹配任意的一个字符串,除了\n * 匹配任意字符串0次或者任意次 \w 匹配字母.数字.下划 ...
Python中的random模块，来自于Capricorn的实验室
Python中的random模块用于生成随机数.下面介绍一下random模块中最常用的几个函数. random.random random.random()用于生成一个0到1的随机符点数: 0 < ...
Python中的logging模块
http://python.jobbole.com/86887/ 最近修改了项目里的logging相关功能,用到了python标准库里的logging模块,在此做一些记录.主要是从官方文档和stack ...
Python中的random模块
Python中的random模块用于生成随机数.下面介绍一下random模块中最常用的几个函数. random.random random.random()用于生成一个0到1的随机符点数: 0 < ...
浅析Python中的struct模块
最近在学习python网络编程这一块,在写简单的socket通信代码时,遇到了struct这个模块的使用,当时不太清楚这到底有和作用,后来查阅了相关资料大概了解了,在这里做一下简单的总结. 了解c语言 ...
python中的StringIO模块
python中的StringIO模块标签:python StringIO 此模块主要用于在内存缓冲区中读写数据.模块是用类编写的,只有一个StringIO类,所以它的可用方法都在类中.此类中的大部分 ...
python中的select模块
介绍: Python中的select模块专注于I/O多路复用,提供了select poll epoll三个方法(其中后两个在Linux中可用,windows仅支持select),另外也提供了kqu ...

随机推荐

生JS实现jQuery的ready方法呢？下面是其中之一的做法：
function ready(fn){ if(document.addEventListener){ //标准浏览器 document.addEventListener('DOMConten ...
java反射之Class.getMethod与getDeclaredMethods()区别
Class对象的getMethods和getDeclaredMethods都是获取类对象的方法.但是又有所不同.废话不多说, 先看demo package com.westward; public c ...
QQ2013登录报文简单分析（不可用于非法用途）
[NO.1 2013-05-08 00:31:16 046 SEND 115字节]02 31 03 08 25 27 B5 88 6F 91 D2 03 00 00 00 0101 01 00 00 ...
POJ 1573 Robot Motion 模拟难度:0
#define ONLINE_JUDGE #include<cstdio> #include <cstring> #include <algorithm> usin ...
hdu 4638 Group
http://acm.hdu.edu.cn/showproblem.php?pid=4638 问题其实就是求[L,R]中有多少个连续的段若每一个人都是一个段那么[L,R]中每一个朋友关系就会减少一 ...
一模 (1) day1
第一题:(水题) 题目大意:求出n个 X% (X是小于等于2位的整数) 的乘积,去掉末尾的0: 解题过程: 1.直接把整数乘好,然后确定小数点的位置,去掉多余的0 输出即可. 第二题:(搜索题) ...
常州培训 day1 解题报告
第一题:(骗分容易,AC难.) 题目大意: 给出一个字符串,找出满足条件A的区间的个数.A:字符A,B,C的出现次数相同. 都出现0次也算,区间的长度可以是0(就是只有一个数).30% |S| ≤ 1 ...
soap
sudo apt-get update apt-get install php-soapphp-config --configure-options --enable-soap php -i | gr ...
NOIP 2013 提高组 day1 T2 火柴排队归并逆序对
描述涵涵有两盒火柴,每盒装有 n 根火柴,每根火柴都有一个高度.现在将每盒中的火柴各自排成一列,同一列火柴的高度互不相同,两列火柴之间的距离定义为:∑i=1n(ai−bi)2∑i=1n(ai−bi) ...
Codeforces Round #327 (Div. 2)-Wizards' Duel
题意: 在一条长度为l的走廊,两个人站在走廊的左右两端分别以p,q的速度走来,问他们相遇时离左端的距离是多少? 思路: 非常简单的暴力题,不解释. 代码如下: #include <iostrea ...

python中的re模块和正则表达式基础

python中的re模块和正则表达式基础的更多相关文章

随机推荐

热门专题