目的:把数字后面不为abc的字符串找出来

如1ab符合要求,2abc不符合要求

 str = '1ab'
out = re.match(r'\d+(?!abc)',str) str1 = '1abc'
out1 = re.match(r'\d+(?!abc)',str1) print('out:',out)
print('out1:',out1)
#
#out: <_sre.SRE_Match object; span=(0, 1), match='1'>
#out1: None
#

如果把(?!abc)改为[^abc],效果如下:

 str = '1ab'
out3 = re.match(r'\d+[^abc]',str) str1 = '1abc'
out4 = re.match(r'\d+[^abc]',str1) print('out:',out3)
print('out1:',out4) #
#out3: None
#out4: None

总结:

(?!abc)是把abc当做一个整体进行匹配,字符串中不存在abc才能成功,abc作为一个整体进行匹配

[^abc]只要字符串中存在a/b/c中的任一个即匹配不成功,字符串中不能出现a/b/c中的任一个

------------------------------------------------------------------

更新:

之前没有注意到(?!abc)方式匹配字符串不消耗字符串内容这句话,导致如果字符串中间排除一个子字符串时会出现错误。

更新关于这部分的理解

(?=...)  # 匹配字符串,且紧挨着匹配的字符串之后的字符等于...,才算匹配成功,且不消耗字符串内容

(?!...)  # 匹配字符串,且紧挨着匹配的字符串之后的字符不等于...,才算匹配成功,且不消耗字符串内容

(?<=...) # 匹配字符串,且紧挨着匹配的字符串之前的字符等于...,才算匹配成功,且不消耗字符串内容

(?<!...) # 匹配字符串,且紧挨着匹配的字符串之前的字符不等于...,才算匹配成功,且不消耗字符串内容

具体理解:

(?=...)为例

 reg = re.compile('A(?=BC)')
reg.search('ABC')
reg.search('ABCDE') # 输出:
# <_sre.SRE_Match object; span=(0, 1), match='A'>
# <_sre.SRE_Match object; span=(0, 1), match='A'>
 reg_1 = re.compile('A(?=BC)D')
print(reg_1.search('ABCD')) # 输出
# None

 reg = re.compile('A(?=BC)')

reg.search('ABC')

  在这种情况下,匹配一个字符,这个字符包含'A',且'A'后面的字符为'BC',字符串'ABCD'符合规律

 但是,

reg_1 = re.compile('A(?=BC)D')
reg_1.search('ABCD')
就会出现问题,因为(?=...)括号内的表达式不消耗字符,也就是说匹配完字符串中的'A'之后,会判断A之后的字符是否是'BC',匹配成功后正则表达式会继续匹配字符串中'A'之后的字符是否是'D'
但是,在字符串中'A'之后是'B'就会出现匹配失败,返回None.
https://blog.csdn.net/lxcnn/article/details/4304651 在这个链接中,解释比较清楚.
在正则匹配过程中,各个子表达式会依次取得控制权,对字符串进行匹配.
比如例子中的
reg_1 = re.compile('A(?=BC)D')
1.'A(?=BC)D' 中,表达式'A'首先取得控制权,从字符串'ABCD'的开始位置('A'之前)进行匹配;
  匹配成功,控制权交给下一个正则子表达式(?=BC),匹配位置移动到字符串'ABCD'中的'A'之后('B'之前)
2.正则子表达式(?=BC)取得控制权,对当前匹配位置的右侧字符进行匹配,判断是否等于(?=BC)中的'BC'(即'A'后的'BC');
  匹配成功,控制权交给下一个正则子表达式'D',但是,因为(?=...)表达式不消耗字符,也就是说这个表达式是零宽度的,因此匹配位置不会往后移动.匹配位置依然在'A'之后.
3.正则子表达式'D'取得控制权,对当前位置('A'之后'B'之前)的右侧字符进行匹配,判断'A'之后的字符是否等于'D'.
  字符串'ABCD'中,'A'之后为'B',匹配失败
4.进行下一轮匹配,又回到表达式'A'取得控制权,开始匹配位置不再是字符串首位置,此时从字符串'ABCD'中的'A'之后'B'之前的位置开始匹配,重复1~3步骤,不断移动匹配位置进匹配 整个正则表达式匹配过程明了了. 不消耗字符串的意思就是这个子表达式为零宽度的,在匹配结束后不会向后移动匹配位置

 

 

python3 正则匹配[^abc]和(?!abc)的区别(把多个字符作为一个整体匹配排除)的更多相关文章

  1. 正则匹配中 ^ $ 和 \b 的区别

    正则匹配中 ^ $ 和 \b 的区别     ^和$分别代表字符串的开始和结束,因此^\d$只能匹配包含一个数字的字符串\b代表单词边界,其前后必须是不同类型的字符,可以组成单词的字符为一种类型,不可 ...

  2. Python3正则匹配re.split,re.finditer及re.findall函数用法详解

    这篇文章主要介绍了Python3正则匹配re.split,re.finditer及re.findall函数用法,结合实例形式详细分析了正则匹配re.split,re.finditer及re.finda ...

  3. 转转转---js正则表达exec与match的区别说明

    正则表达式对象有两个定义方式:: 1.第一种定义: new RegExp(pattern, attributes);如var reg = new RegExp("abc",&quo ...

  4. 【转载】python3.0与2.x之间的区别

    python3.0与2.x之间的区别: 1.性能 Py3.0运行pystone benchmark的速度比Py2.5慢30%.Guido认为Py3.0有极大的优化空间,在字符串和整形操作上可以取得很好 ...

  5. python3.0与2.x之间的区别

    python3.0与2.x之间的区别: 1.性能 Py3.0运行pystone benchmark的速度比Py2.5慢30%.Guido认为Py3.0有极大的优化空间,在字符串和整形操作上可以取得很好 ...

  6. js进阶正则表达式10-分组-多行匹配-正则对象的属性(小括号作用:分组,将小括号里面的东西看成一个整体,因为量词只对前一个字符有效)(多行匹配:m)(属性使用:reg.global)

    js进阶正则表达式10-分组-多行匹配-正则对象的属性(小括号作用:分组,将小括号里面的东西看成一个整体,因为量词只对前一个字符有效)(多行匹配:m)(属性使用:reg.global) 一.总结 1. ...

  7. Python3正则去掉HTML标签

    Python3正则去掉HTML标签 1.引用一段代码 import re html = '<pre class="line mt-10 q-content" accuse=& ...

  8. servlet匹配路径时/和/*的区别(转)

    本文转自https://blog.csdn.net/rongxiang111/article/details/53008829 一.<url-pattern>/</url-patte ...

  9. jquery[siblings]取得一个包含匹配的元素集合中每一个元素的所有唯一同辈元素的元素集合

    取得一个包含匹配的元素集合中每一个元素的所有唯一同辈元素的元素集合,用于筛选同辈元素的表达式 $("#pageList").click(function(){ $(this).pa ...

随机推荐

  1. Oracle创建用户角色

    正在维护一个CS结构的应用,每次创建应用的用户时都需要创建对应的数据库schema,并且需要赋予其相应的对象权限和角色.操作很不方便,所以专门创建了一个角色,过程如下: 1.创建角色 SQL> ...

  2. Java高级特性 第7节 多线程

    一.进程与线程的概念 1. 进程 进程是应用程序的执行实例,有独立的内存空间和系统资源. 如上图,标红色的是一个Office Word进程. 进程的特点: 动态性:进程是动态的创建和消亡: 并发性:操 ...

  3. char* 与 string 互转

    因为c#强调安全性,每次意图将string的地址赋给指针时,系统都要报错,原因是系统无法计算字符串的空间和地址,这里不多bb,使用IntPtr类(using Runtime.InteropServic ...

  4. bootstrap顶部导航遮挡下面内容的解决办法

    使用bootstrap设置顶部导航,并将导航栏固定,代码如下: <nav class="navbar navbar-expand-lg navbar-light bg-light fi ...

  5. [踩坑系列]URLEncode 中对 空格的编码有 “+”和“%20”两种

    URL中的空格有时候被编码成%20,有时候被编码成加号+,曾经迷糊过一段时间,后来查了下资料才搞明白. 一个URL的基本组成部分包括协议(scheme),域名,端口号,路径和查询字符串(路径参数和锚点 ...

  6. IMDG

    将内存作为首要存储介质不是什么新鲜事儿,在对主存的使用上,内存数据网格(In Memory Data Grid,IMDG)与IMDB类似,但二者在架构上完全不同.IMDG特性可以总结为以下几点: 数据 ...

  7. CentOS7.3安装Go运行和开发环境

    https://blog.csdn.net/warnerwu/article/details/73825105

  8. 无法生成core dump文件的几个原因

    1. 进程无写权限(如目录不可写.存在同名的非regular文件(目录或符号链接)等) 2. 存在同名文件且有多个hard link 3. 文件系统空间不足 4. 指定目录不存在 5. 进程的RLIM ...

  9. rocketmq (一)运行原理以及使用问题

    使用消息中间件可以解决高并发,那是因为消息中间件可以将消息缓存到队列之中. 但是 当消息 过多的时候,几万,几十万...消息中间件也可能会宕机,所以我们可以对消息中间件进行集群,在之前的activem ...

  10. Hbase常见错误解决方法

    Hbase常见错误解决方法 原文转载至:https://www.jianshu.com/p/5fd74812c56c   我是通过maven管理的依赖,直接修改maven依赖中hbase的版本就可以了 ...