python正则表达式知识预备

正则表达式使用反斜杠" \ "来代表特殊形式或用作转义字符,这里跟Python的语法冲突,因此,Python用" \\\\ "表示正则表达式中的" \ ",因为正则表达式中如果要匹配" \ ",需要用\来转义,变成" \\ ",而Python语法中又需要对字符串中每一个\进行转义,所以就变成了" \\\\ "。

上面的写法是不是觉得很麻烦,为了使正则表达式具有更好的可读性,Python特别设计了原始字符串(raw string),需要提醒你的是,在写文件路径的时候就不要使用raw string了,这里存在陷阱。raw string就是用'r'作为字符串的前缀,如 r"\n":表示两个字符"\"和"n",而不是换行符了。Python中写正则表达式时推荐使用这种形式。

问题:如何匹配到‘\com’

# r9 = re.search('\\\\', 'www.run\comoob')
# print(r9) #匹配到‘\’ '\\\\' python 将其翻译为'\\' re 模块将其编译为'\'

上面太麻烦了,明显不符合实际操作,看下面的:

r10 = re.search(r'\\com', 'www.run\comoob')   #加r , 表示python 不翻译,re 翻译
print(r10)
#f = open("c:\abc.txt")   #错误  应该是f = open("c:\\abc.txt")
r7 = re.search(r'\\com', 'www.run\comoob') #注意:匹配到'\com' 翻译到屏幕是'\\com'
print(r7)

学习正则表达式

接下来系统学习正则表达式,文章有点长,希望不懂的同学可以耐心看下去,我会多举例的

先大致看下,后面会举例:

字符:

  . 匹配除换行符以外的任意字符
  \w 匹配字母或数字或下划线或汉字
  \s 匹配任意的空白符
  \d 匹配数字
  \b 匹配单词的开始或结束
  ^ 匹配字符串的开始
  $ 匹配字符串的结束

次数:

  * 重复零次或更多次
  + 重复一次或更多次
  ? 重复零次或一次
  {n} 重复n次
  {n,} 重复n次或更多次
  {n,m} 重复n到m次

正则表达式本身就是小型编程语言,使用之前肯定要先导入啦,下面实例默认都是导入的。

一、了解findout,及字符
   1. findout  把匹配结果通过列表返回
r =re.findall('zcl', 'fzclfjfrijzclfeizcfj')
print(r) #['zcl', 'zcl']
   2.   .  匹配到除换行符以外的任一个字符
r1 =re.findall('z.l', 'fzolfjfrijzclfeizcfj')
print(r1) #['zol', 'zcl']
r1 =re.findall('z.l', 'fz\nlfjfrijzclfeizcfj')
print(r1) #['zcl']

3.  ^ (shift+6)区配到以 xx字符开头

r2 =re.findall('^z.l', 'fz\nlfjfrijzclfeizcfj')
print(r2) #[]
r3 =re.findall('^z.l', 'zcllfz\nlfjfrijzclfeizcfj')
print(r3) #['zcl']

4.   $ 匹配到以xx结束的字符

r4 =re.findall('z.l$', 'zcllfz\nlfjfrijzclfeizcfj')
print(r4) #[]
r5 =re.findall('z.l$', 'zcllfz\nlfjfrijzclfeizcfjzcl')
print(r5) #['zcl']

  5.   * 区配*前面的字符0到多次

     +  重复一次或更多次
r6 =re.findall('z.*l', 'zcgfchthllfz\nlfjfrijzclfeizcfjzcl')
print(r6) #['zcgfchthll', 'zclfeizcfjzcl'] r7 =re.findall('z.+l', 'zcgfchthfz\nlfjfrijzcfeizcfjzc')
print(r7) #[]

  6.  {n} 重复n次

   {n,m}  重复n到m次
  {n,} 重复n次或更多次
r8 = re.findall('zc{3}l', 'zccclgfchthfz\nlfjfrijzcfeizcfjzc')
print(r8) #['zcccl']

  7. [bc] 匹配b或c

r9 = re.findall('a[bd]c', 'dfjabdcdjfabcdf')
print(r9)

  8. [a-z] 匹配a至z任意一个

r9 = re.findall('a[a-z]c', 'dfjabdcdjfatcdf')
print(r9) #['atc']
  9. [] 里面仍有功能有三个:  [a-z]   [\d]区配数字  [^] 非  
r10 = re.findall('a[^f]d', "afd")
print(r10) #[]
r11 = re.findall('a[^f]d', "ard")
print(r11) #['ard']
r12 = re.findall(r'a\df', "a8f")
print(r12) #['a8f']

欢迎转发!
This is zcl‘s article! Thanks for your support!
文章出处:http://www.cnblogs.com/0zcl
作者:zcl



python之(re)正则表达式上的更多相关文章

  1. Python高手之路【五】python基础之正则表达式

    下图列出了Python支持的正则表达式元字符和语法: 字符点:匹配任意一个字符 import re st = 'python' result = re.findall('p.t',st) print( ...

  2. python基础之正则表达式

    正则表达式语法 正则表达式 (或 RE) 指定一组字符串匹配它;在此模块中的功能让您检查一下,如果一个特定的字符串匹配给定的正则表达式 (或给定的正则表达式匹配特定的字符串,可归结为同一件事). 正则 ...

  3. Python::re 模块 -- 在Python中使用正则表达式

    前言 这篇文章,并不是对正则表达式的介绍,而是对Python中如何结合re模块使用正则表达式的介绍.文章的侧重点是如何使用re模块在Python语言中使用正则表达式,对于Python表达式的语法和详细 ...

  4. python的re正则表达式模块学习

    python中re模块的用法   Python 的 re 模块(Regular Expression 正则表达式)提供各种正则表达式的匹配操作,在文本解析.复杂字符串分析和信息提取时是一个非常有用的工 ...

  5. Python基础之 正则表达式指南

    本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例.本文的内容不包括如何编写高效的正则表达式.如何优化正则表达式,这些主题请查看其他教程 ...

  6. 使用python爬取MedSci上的期刊信息

    使用python爬取medsci上的期刊信息,通过设定条件,然后获取相应的期刊的的影响因子排名,期刊名称,英文全称和影响因子.主要过程如下: 首先,通过分析网站http://www.medsci.cn ...

  7. Python系列之正则表达式详解

    Python 正则表达式模块 (re) 简介 Python 的 re 模块(Regular Expression 正则表达式)提供各种正则表达式的匹配操作,和 Perl 脚本的正则表达式功能类似,使用 ...

  8. 【转载】Python中的正则表达式教程

    本文http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 正则表达式经常被用到,而自己总是记不全,转载一份完整的以备不时之需. 1. ...

  9. Python中的正则表达式教程

    本文http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 正则表达式经常被用到,而自己总是记不全,转载一份完整的以备不时之需. 1. ...

随机推荐

  1. 谈谈JIT编译器和本机影像生成器(NGen.exe)

    前言 在看<CLR>的时候,作者在开篇的时候提到了NGen.exe,前面一节执行程序集的代码中提到:程序或方法执行前会执行MSCorEE.dll中的JIT函数把要执行方法的IL转换成本地的 ...

  2. 关于在用curl函数post网页数据时,遇上表单提交 type为submit 类型而且没有name和id时可能遇到的问题及其解决方法

    curl函数库实现爬网页内容的链接在 http://www.cnblogs.com/linguanh/p/4292316.html 下面这个是没有name和id 标识的 <input type= ...

  3. 设置SharePoint Server 2013 的匿名访问

    默认情况下,SharePoint Server 2013 是关闭匿名访问的,但是某些环境下我们又需要将这个匿名访问对全员开放,怎么操作更加安全与便捷,对于一个崭新的环境我们可以这样操作. 首先在当前需 ...

  4. CSS3中惊艳的gradient

    以前曾经记录过linear-gradient(线性渐变)和 radial-gradient(径向渐变)的语法. 可以参考<CSS3中border-radius.box-shadow与gradie ...

  5. objective-c 语法快速过(8)

    Block(oc 的数据类型,很常用,本质是c结构体) 类似内联函数,从源代码层看,有函数的结构,而在编译后,却不具备函数的性质.编译时,类似宏替换,使用函数体替换调用处的函数名 Block封装了一段 ...

  6. hibernate笔记--cascade级联以及inverse属性

    cascade : 不管是单向多对一还是一对多,或者是双向的一对多关系,在一的一端映射文件中有一个set标签,在多的一端有many-to-one标签,拿前几篇笔记里讲的Grade和Student举例, ...

  7. 【面试】shuffle函数的实现

    一.前言 有位同学面试的时候被问到shuffle函数的实现,他之后问我,我知道这个函数怎么用,知道是对数组(或集合)中的元素按随机顺序重新排列.但是没有深入研究这个是怎么实现的.现在直接进入JDK源码 ...

  8. Angularjs学习笔记9_JSON和JSONP

    说到AJAX就会不可避免的面临两个问题,第一个是AJAX以何种格式来交换数据?第二个是跨域的需求如何解决?数据可以用自定义字符串或者用XML来描述,跨域可以通过服务器端代理来解决.最被推崇或者说首选的 ...

  9. 自己封装的一个LoadRes组件

    这两周一直太忙,没有好好处理上上上周遇到的一个让我加班到凌晨的问题,这个问题是判断flash的加载. 之前的思路是让flash的人在制作flash的时候,加入了一个回调方法,该方法再会回调我页面的方法 ...

  10. 单片机DA转换实现正弦波

    使用的是查表法: 1.c文件: #include "reg52.h" #include <intrins.h> #include <i2c.h> #defi ...