字符串函数replace:

    #string.replace:
#字符串的replace方法:替换子串,不改变原来的字符串
s = "broad road"
#打印出来会发现不单单是road被替换了,broad也变了
#这是因为broad也包含road,replace方法
print s.replace('road', 'rd.')

原始字符串 r'string':

    #原始字符串:只要在普通字符串前加上 r 就可以
#这样做是表明这个字符串中的所有字符都不转义,避免反斜线灾难
print r'this is a \t\n string'
#原始字符串在正则表达式中很重要

Python正则表达式:

   #Python的正则包
#$:匹配字符串末尾的,相对应的匹配字符串开头的是 ^
s = 'broad road'
#re.sub(pattern, str1, str2):将str2中符合pattern的串替换为str1
print re.sub('road$', 'rd.', s)
#但如果末尾是broad呢,很遗憾,也会被替换
s = 'broad broad'
print re.sub('road$', 'rd.', s) #\b:单词的边界必须在这里
#这样不论road出现在哪里,只要是整个的单词就会匹配
s = 'broad road room1'
print re.sub(r'\broad\b', 'rd.', s)

re.search(pattern, string): pattern正则表达式 string 要匹配的字符

    import re
#re.search(pattern, string):re包重要的函数
#pattern:正则 string:要匹配的字符串
#返回值:不能匹配返回None 匹配成功返回一堆描述,反正不是None,根据一切皆对象姑且称之为'匹配成功对象'
#^匹配开始,$匹配结束 ?匹配0个或1个M
pattern = '^M?M?M?$'
print re.search(pattern, 'M')
print re.search(pattern, 'MMMM') #|匹配前后两个表达式,先匹配左边的表达式,一旦成功匹配就不去匹配右边的表达式。
#记住(A|B|C)含义是:精确匹配ABC中的一个,匹配一个后便不再匹配其他的了
#如果不加括号,则其作用范围就是整个正则表达式
pattern = '^M?M?M?(CM|CD|D?C?C?C?)$'
print re.search(pattern, 'MCM')
print re.search(pattern, 'MCMC') #{m}匹配前面字符m次
#{m, n}匹配前面的字符m次至n次,m n都可以为0
pattern = '^M{0,3}$'
print re.search(pattern, 'M')
print re.search(pattern, 'MMMM')

松散正则表达式: re.VERBOSE 、 re.compile().search().groups()

    #松散正则表达式re.VERBOSE
#1忽略空白:比如空格制表符回车等,也就是说可以在表达式的任意地方添加任意多的空白。
#2忽略注释:这样就可以在合适的位置加上注释提高可读性。
pattern = """
^ #在这里匹配开始
M{0,3} #匹配0-3个M
(CM|CD|D?C?C?C?) #匹配xxx
$ #在这里匹配结束
"""
#使用松散正则,要给search一个re.VERBOSE表明这是一个松散正则
print re.search(pattern, 'MCM')
print re.search(pattern, 'MCM', re.VERBOSE)
print re.search(pattern, 'MCMC', re.VERBOSE)
#如果要在松散正则中匹配空白而不是被忽略掉,就要用转移字符来做
pattern = """
ab\ cd
"""
#这表示要在b和c之间匹配一个空格
print re.search(pattern, 'ab cd', re.VERBOSE) #compile 和 groups 简单使用
   #re.compile():接受一个正则表达式返回一个正则对象
pattern = re.compile(r'^(\d{3})-(\d{3})-(\d{4})$')
#正则对象的search()方法匹配同re.search()类似,接受一个正则表达式,匹配失败返回None,成功返回'匹配成功对象'
   #'匹配成功对象'.gourps()返回一个tuple,元素对应于前面正则表达式中的组。一个小括号即使一个组
   #匹配成功返回的'匹配成功对象'才能调用groups,因为匹配失败返回None,是没有groups()函数的
print pattern.search('800-555-1212').groups()

devi into python 笔记(六)正则表达式 原始字符串的更多相关文章

  1. Python:笔记(6)——正则表达式

    Python:笔记(6)——正则表达式 re模块 re模块用于在字符串中执行基于正则表达式模式的匹配和替换. 使用原始字符串 正则表达式使用 \ 对特殊字符进行转义,比如,为了匹配字符串 ‘pytho ...

  2. devi into python 笔记(七)locals与globals 字典格式化字符串 字符集

    locals()与globals(): """ locals:局部命名空间 globals:全局命名空间 都是以dictionary的形式保存的,变量名是键,变量值是值 ...

  3. devi into python 笔记(四)python的类

    import 与 from ... import ...: #types只是一个包,FunctionType只是这个包里的一个函数.这里用它来演示 import types #如果要用Function ...

  4. devi into python 笔记(三)callable getattr lambda表达式

    常用的函数:callable():如果所给参数是可调用的,返回True 不可调用返回Fasle.这里指的是否能调用说的是方法.类方法等有doc string的东西,一个单纯的字符串等就不算了. imp ...

  5. devi into python 笔记(二)元组 变量声明 和列表解析

    元组tuple: 类似list,只是tuple是不可变的list.类似java的String都是不可改变的.注意:tuple没有方法(有待考证),不可以像list那样那个list.pop 或者list ...

  6. python笔记03:使用字符串

    3.1 基本字符串操作: 所有的标准序列操作(索引,分片,乘法,判断成员资格,求长度,取最小值,取最大值)对于字符串同样有效.但是,请记住:字符串都是不可变的 3.2 字符串格式化:精简版 字符串格式 ...

  7. 在Python中使用正则表达式去掉字符串里的html标签

    有时候会获得一些带html标签的字符串,需要把html标签去掉,获得干净的字符串,这时候可以使用正则表达式. 代码如下: import re htmeString = '''<ul id=&qu ...

  8. python笔记(2)--字符串

    一.创建字符串 使用 '' , "" , ''' 和 """ 来创建字符串 var1 = 'hello, world' var2 = "ja ...

  9. devi into python 笔记(五)异常 文件操作 sys os glob模块简单实用

    异常: Java异常: try catch块处理异常,throw引发异常. Python异常: try except块处理异常,raise引发异常. 异常如果不主动处理,则会交给Python中的缺省处 ...

随机推荐

  1. (转)C++设计模式——观察者模式

    转自:http://www.jellythink.com/archives/359 前言 之前做了一个性能测试的项目,就是需要对现在的产品进行性能测试,获得测试数据,然后书写测试报告,并提出合理化的改 ...

  2. System V 消息队列

    3.1 概述 消息队列结构: struct msqid_ds { struct ipc_perm msg_perm; //权限结构 struct msg *msg_first; //队列中第一个消息 ...

  3. 给定任意一个字符串,使用 for in 语句来统计字符出现的个数

    //找出字符串中的数字 var str = 'haj123sdk54hask33dkhalsd879'; /*function findNum(str){ var arr = []; var tmp ...

  4. [C#]Task异步操作

    1.代码示例 using System; using System.Threading; using System.Threading.Tasks; namespace ConsoleApplicat ...

  5. (转载)与OpenDialog相关的一个问题

    OpenDialog的一个问题 有一个功能要求就是[每次打开文件的对话框的默认路径是上一次保存文件的路径],本来这个就是设置OpenDialog控件的InitialDir属性就行了,但是第一次打开的时 ...

  6. iOS 一些struct类型的NSLog输出格式-b

    我们经常会输出一些坐标尺寸信息之类的,比如view的frame,是CGRect类型的,用frame.oringial.x 和frame.size.width来做NSLog参数好麻烦,还好苹果对这些常用 ...

  7. servlet 默认是线程安全的吗?

    由于Servlet默认是以多线程模式执行的,所以,在编写代码时需要非常细致地考虑多线程的安全问题.然而,很多人编写Servlet程序时并没 有注意到多线程安全的问题,这往往造成编写的程序在少量用户访问 ...

  8. django开发总结:

    一,关于setting目录中的“DEBUG” DEBUG=False 把DEBUG从True改成False后就会出现(必需指定404和500错语页面,如上图的目录结构)找不到页面的错误.原因是DEBU ...

  9. 【BZOJ 2333 】[SCOI2011]棘手的操作(离线+线段树)

    2333: [SCOI2011]棘手的操作 Description 有N个节点,标号从1到N,这N个节点一开始相互不连通.第i个节点的初始权值为a[i],接下来有如下一些操作: U x y: 加一条边 ...

  10. Winform的多线程问题

    http://blog.csdn.net/Maths_bai/article/details/6000744