python re.findall 使用

 import re

 #\w 匹配字母数字及下划线
print(re.findall('\w','hello alan _god !@^&#^$^!*&(*')) #\W 匹配非字母数字下划线
print(re.findall('\W','hello alan _god !#@!#$(#*'))
#\s 匹配空白字符
print(re.findall('\s',"alan and god *& YUN CHINA"))
#\S 匹配非空白字符
print(re.findall('\S',"alan and god *& YUN CHINA"))
#d\ 数字与 D\ 非数字
print(re.findall('\d',"2018年9月8日16:54:30alan and god *& YUN CHINA1949"))
print(re.findall('\D',"20182018年9月8日16:54:20alan and god *& YUN CHINA1949")) #\A 匹配字符串开始
print(re.findall('\ACH',"CH2018年9月8日16:54:30alan and god *& YUN CHINA1949"))
#\Z 匹配字符串结束
print(re.findall('Z\Z',"20182018年9月8日16:54:20alan and god *& YUN CHINA1949ZZ")) #^ 字符串开头 与 $字符串结尾 print(re.findall('^a',"alan and god *& YUN CHINA"))
print(re.findall('NA$','alan and god *& YUN CHINA'))
#. 匹配任意
print(re.findall('an.','alan and angod *& YUN CHINA'))
print(re.findall('a.a','a a alan and a&a ata aa')) #* 匹配0或多个
print(re.findall('an*','a a alan and god anSB anang *& YUN CHINA'))
print(re.findall('an*','alan and a&a ata a a')) #? 匹配0或1------------------------
print(re.findall('ag?','age avg agre amg a'))
print(re.findall('agg?','aggge avgagg aggre amg ag')) #匹配所有包含小数在内的数字
print(re.findall('\d+.?\d*','123adf 1.33663fsdf13fsdf1fsdf3')) #.*默认为贪婪匹配
print(re.findall('a.*d','adss andgod930 axds9kidg')) #.*?为非贪婪匹配
print(re.findall('a.*?d','andgod930 axds9kidg ad aa')) #+ 1或多
print(re.findall('and+','andgod930 axds9kidg an and anddd andddSSS')) #{n,m} >=n,<m
print(re.findall('an{2}','andgod930 axds9kidg an annd anndd anddd andddSSS'))
print(re.findall('an{1,3}','andgod930 axds9kidg an annd anndd anddd andddSSS'))
print(re.findall('ab{1,}','abbb abs a ab bb'))
print(re.findall('ab{0,}','abbb abs a ab bb abb')) #[]内的都为普通字符了,且如果-没有被转意的话,应该放到[]的开头或结尾
print(re.findall('a[1*-]b','a1b a*b a-b asb aab allb a--b')) #[]内的^代表的意思是取反
print(re.findall('a[^1*-]b','a1b a*b a-b a=b')) #[]内的0-9 之间匹配 0到9 之间的整数
print(re.findall('a[0-9]b','a1b a*b a-b a=b a0b a00b ')) #[]内的a-z 之间匹配 小写字母
print(re.findall('a[a-z]b','a1b a*b A-D a-b a=b aeb aAb abb acb azb')) #[]内的A-Z 之间匹配 大写字母
print(re.findall('[A-Z]','a1b a*b A-D a-b a=b aeb aAb abb acb azb')) #[]内的a-z 或者 A-Z 之间匹配 大写字母 与小写字母
print(re.findall('a[a-zA-Z]b','a1b a*b a-b a=b aeb aEb aab aAb aZb azb')) #\ 与 \ 与 \\ #对于正则来说a\\c确实可以匹配到a\c,但是在python解释器读取a\\c时,会发生转义,然后交给re去执行,所以抛出异常
print(re.findall('a\\c','a\c'))
#r代表告诉解释器使用rawstring,即原生字符串,把我们正则内的所有符号都当普通字符处理,不要转义
print(re.findall(r'a\\c','a\c a\\c a c ac'))
#和上面的结果一样
print(re.findall('a\\\\c','a\c a\\c ')) #() 分組
print(re.findall('ab+','ababab123 abc abd')) #匹配到末尾的ab123中的ab
print(re.findall('(ab)+123','abab123 abc123 abb123 aa1234 ab1234')) #findall的结果不是匹配的全部内容,而是组内的内容,?:可以让结果为匹配的全部内容
print(re.findall('(?:ab)+123','ababab123 abc123 abb123 aa1234 ab1234')) print(re.findall('href="(.*?)"','<a href="http://www.baidu.com">百度</a> <a href="http://www.google.com">go</a> <a href="http://www.yunhua.com">go</a>')) print(re.findall('href="(?:.*?)"','<a href="http://www.baidu.com">百度</a> <a href="http://www.google.com">go</a> <a href="http://www.yunhua.com">go</a>'))

python re.findall 使用的更多相关文章

  1. 关于Python正则表达式findall函数问题详解

    关于Python正则表达式 findall函数问题详解 在写正则表达式的时候总会遇到不少的问题, 特别是在表达式有多个元组的时候.下面看下re模块下的findall()函数和多个表达式元组相遇的时候会 ...

  2. python正则表达式findall的使用

    文章来源与:http://www.cnblogs.com/zjltt/p/6955965.html 正则表达式 正则表达式本身是一种小型的.高度专业化的编程语言,而在python中,通过内嵌集成re模 ...

  3. python正则表达式--findall、finditer方法

    findall方法 相比其他方法,findall方法有些特殊.它的作用是查找字符串中所有能匹配的字符串,并以结果存于列表中,然后返回该列表 注意: match 和 search 是匹配一次 finda ...

  4. python使用findall正则匹配出所有符合条件的字符串

    # -*- coding:utf-8 -*- import re mystr="qqq key:www.baidu.com<br>key:www.tengxun.com<b ...

  5. python re.findall(rule,data),根据左右边界取值url中参数的值

    import re ''' 取值postid,左边界"postid=",右边界"&" ''' url="http://wwww.baidu.c ...

  6. python 正则表达式findall

    re.findall("匹配规则", "要匹配的字符串") 以列表形式返回匹配到的字符串 https://www.cnblogs.com/gufengchen/ ...

  7. Python re.findall函数不能匹配但是notepad++能匹配

    我使用同样的表达式匹配同样的网页源码,在notepad++里面不能直接使用,需要将内容都弄到同一行中. 但是我使用 requests.get(self.url).content.decode('UTF ...

  8. Learning Python 008 正则表达式-002 findall()方法

    Python 正则表达式 - findall()方法 重点 findall()方法的使用 - 程序讲解 简单的符号的使用 正则表达式的库文件是re,先导入库文件: import re .的使用举例 # ...

  9. python正则表达式一[转]

    原文:http://blog.jobbole.com/74844/ 作为一个概念而言,正则表达式对于Python来说并不是独有的.但是,Python中的正则表达式在实际使用过程中还是有一些细小的差别. ...

随机推荐

  1. Sqli labs系列-less-5&6 报错注入法(上)

    在我一系列常规的测试后发现,第五关和第六关,是属于报错注入的关卡,两关的区别是一个是单引号一个是双引号...当然我是看了源码的.... 基于报错注入的方法,我早就忘的差不多了,,,我记的我最后一次基于 ...

  2. sequel 远程连接 MySQL 连接错误Can't connect to MySQL server on (61)

    Mac sequel Pro链接时报错Can’t connect to MySQL server on ‘xx.xx.xx.xx’ (61). PS. win版Navicat 报错Can’t conn ...

  3. 【Tomcat】2.配置Tomcat服务器端口和HTTPS

    1.修改XML配置文件 找到Tomcat安装目录下的conf文件夹,打开server.xml文件(可以用笔记本打开) 其中有几行代码如下 <Server port="8005" ...

  4. Android_开发片段(Part 1)

    1.maven环境配置时也跟java类似,进行我的电脑环境的设置,cmd查询:mvn -version 2.在新建AVD时,要注意AVD的版本(API),版本太低或者太高,经常不能运行项目或者在运行项 ...

  5. #include <utility>

    #include <utility>这个头文件是什么用法 utility头文件定义了一个pair类型,是标准库的一部分,其原型为:template<class _Ty1, class ...

  6. 如何用python读写CSV 格式文件

    工作中经常会碰到读写CSV文件的情况.记录下,方便自己以后查询并与大家一起分享: 写CSV文件方法一: import csv          #导入CSV with open("D:\eg ...

  7. NetworkComms V3 序列化器之Protobuf.net和 JSONSerializer

    NetworkComms v3版本中,默认使用的是protobuf.net序列化器. 即当您没有指定序列化的时候,系统自动使用默认的protobuf.net序列化器. 当然我们也可以自己指定序列化器 ...

  8. Java对象toString()方法

    对象的字符串表示以可读格式包含有关对象状态的信息.Object类的toString()方法表示字符串中类的对象.Object类提供了toString()方法的默认实现. 它返回一个以下格式的字符串: ...

  9. UVA11572_Unique Snowflakes

    超级经典的题目,扫描区间,滑动窗口 对这题目的最大感受就是,单独看这个题目,其实不难,但是很多我感觉挺难或者没做出来的题目,都是由这些若干个经典的算法组合而成的 滑动窗口便是一个典型的例子!!!!遇到 ...

  10. Struct和Union的sizeof计算

    struct 结构体的大小不是简单的成员相加,要考虑存储空间的字节对齐 1.空结构体的大小为1 2.含有static的结构体在计算大小时不算上static变量,因为static存储在全局数据空间,而s ...