python re.findall 使用
python re.findall 使用
import re #\w 匹配字母数字及下划线
print(re.findall('\w','hello alan _god !@^&#^$^!*&(*')) #\W 匹配非字母数字下划线
print(re.findall('\W','hello alan _god !#@!#$(#*'))
#\s 匹配空白字符
print(re.findall('\s',"alan and god *& YUN CHINA"))
#\S 匹配非空白字符
print(re.findall('\S',"alan and god *& YUN CHINA"))
#d\ 数字与 D\ 非数字
print(re.findall('\d',"2018年9月8日16:54:30alan and god *& YUN CHINA1949"))
print(re.findall('\D',"20182018年9月8日16:54:20alan and god *& YUN CHINA1949")) #\A 匹配字符串开始
print(re.findall('\ACH',"CH2018年9月8日16:54:30alan and god *& YUN CHINA1949"))
#\Z 匹配字符串结束
print(re.findall('Z\Z',"20182018年9月8日16:54:20alan and god *& YUN CHINA1949ZZ")) #^ 字符串开头 与 $字符串结尾 print(re.findall('^a',"alan and god *& YUN CHINA"))
print(re.findall('NA$','alan and god *& YUN CHINA'))
#. 匹配任意
print(re.findall('an.','alan and angod *& YUN CHINA'))
print(re.findall('a.a','a a alan and a&a ata aa')) #* 匹配0或多个
print(re.findall('an*','a a alan and god anSB anang *& YUN CHINA'))
print(re.findall('an*','alan and a&a ata a a')) #? 匹配0或1------------------------
print(re.findall('ag?','age avg agre amg a'))
print(re.findall('agg?','aggge avgagg aggre amg ag')) #匹配所有包含小数在内的数字
print(re.findall('\d+.?\d*','123adf 1.33663fsdf13fsdf1fsdf3')) #.*默认为贪婪匹配
print(re.findall('a.*d','adss andgod930 axds9kidg')) #.*?为非贪婪匹配
print(re.findall('a.*?d','andgod930 axds9kidg ad aa')) #+ 1或多
print(re.findall('and+','andgod930 axds9kidg an and anddd andddSSS')) #{n,m} >=n,<m
print(re.findall('an{2}','andgod930 axds9kidg an annd anndd anddd andddSSS'))
print(re.findall('an{1,3}','andgod930 axds9kidg an annd anndd anddd andddSSS'))
print(re.findall('ab{1,}','abbb abs a ab bb'))
print(re.findall('ab{0,}','abbb abs a ab bb abb')) #[]内的都为普通字符了,且如果-没有被转意的话,应该放到[]的开头或结尾
print(re.findall('a[1*-]b','a1b a*b a-b asb aab allb a--b')) #[]内的^代表的意思是取反
print(re.findall('a[^1*-]b','a1b a*b a-b a=b')) #[]内的0-9 之间匹配 0到9 之间的整数
print(re.findall('a[0-9]b','a1b a*b a-b a=b a0b a00b ')) #[]内的a-z 之间匹配 小写字母
print(re.findall('a[a-z]b','a1b a*b A-D a-b a=b aeb aAb abb acb azb')) #[]内的A-Z 之间匹配 大写字母
print(re.findall('[A-Z]','a1b a*b A-D a-b a=b aeb aAb abb acb azb')) #[]内的a-z 或者 A-Z 之间匹配 大写字母 与小写字母
print(re.findall('a[a-zA-Z]b','a1b a*b a-b a=b aeb aEb aab aAb aZb azb')) #\ 与 \ 与 \\ #对于正则来说a\\c确实可以匹配到a\c,但是在python解释器读取a\\c时,会发生转义,然后交给re去执行,所以抛出异常
print(re.findall('a\\c','a\c'))
#r代表告诉解释器使用rawstring,即原生字符串,把我们正则内的所有符号都当普通字符处理,不要转义
print(re.findall(r'a\\c','a\c a\\c a c ac'))
#和上面的结果一样
print(re.findall('a\\\\c','a\c a\\c ')) #() 分組
print(re.findall('ab+','ababab123 abc abd')) #匹配到末尾的ab123中的ab
print(re.findall('(ab)+123','abab123 abc123 abb123 aa1234 ab1234')) #findall的结果不是匹配的全部内容,而是组内的内容,?:可以让结果为匹配的全部内容
print(re.findall('(?:ab)+123','ababab123 abc123 abb123 aa1234 ab1234')) print(re.findall('href="(.*?)"','<a href="http://www.baidu.com">百度</a> <a href="http://www.google.com">go</a> <a href="http://www.yunhua.com">go</a>')) print(re.findall('href="(?:.*?)"','<a href="http://www.baidu.com">百度</a> <a href="http://www.google.com">go</a> <a href="http://www.yunhua.com">go</a>'))
python re.findall 使用的更多相关文章
- 关于Python正则表达式findall函数问题详解
关于Python正则表达式 findall函数问题详解 在写正则表达式的时候总会遇到不少的问题, 特别是在表达式有多个元组的时候.下面看下re模块下的findall()函数和多个表达式元组相遇的时候会 ...
- python正则表达式findall的使用
文章来源与:http://www.cnblogs.com/zjltt/p/6955965.html 正则表达式 正则表达式本身是一种小型的.高度专业化的编程语言,而在python中,通过内嵌集成re模 ...
- python正则表达式--findall、finditer方法
findall方法 相比其他方法,findall方法有些特殊.它的作用是查找字符串中所有能匹配的字符串,并以结果存于列表中,然后返回该列表 注意: match 和 search 是匹配一次 finda ...
- python使用findall正则匹配出所有符合条件的字符串
# -*- coding:utf-8 -*- import re mystr="qqq key:www.baidu.com<br>key:www.tengxun.com<b ...
- python re.findall(rule,data),根据左右边界取值url中参数的值
import re ''' 取值postid,左边界"postid=",右边界"&" ''' url="http://wwww.baidu.c ...
- python 正则表达式findall
re.findall("匹配规则", "要匹配的字符串") 以列表形式返回匹配到的字符串 https://www.cnblogs.com/gufengchen/ ...
- Python re.findall函数不能匹配但是notepad++能匹配
我使用同样的表达式匹配同样的网页源码,在notepad++里面不能直接使用,需要将内容都弄到同一行中. 但是我使用 requests.get(self.url).content.decode('UTF ...
- Learning Python 008 正则表达式-002 findall()方法
Python 正则表达式 - findall()方法 重点 findall()方法的使用 - 程序讲解 简单的符号的使用 正则表达式的库文件是re,先导入库文件: import re .的使用举例 # ...
- python正则表达式一[转]
原文:http://blog.jobbole.com/74844/ 作为一个概念而言,正则表达式对于Python来说并不是独有的.但是,Python中的正则表达式在实际使用过程中还是有一些细小的差别. ...
随机推荐
- [jzoj5840]Miner 题解(欧拉路)
首先考虑第一问.每个联通块的情况是相对独立的,所以可以分别求每个联通块的答案.无向图中存在欧拉路的条件是奇点数为0或2,那么合法方案肯定是tp到一个奇点,通过一条欧拉路到另一个奇点,再tp到另一个奇点 ...
- linux(centos6) 常用操作
目录 一.开机关机 1.Linux centos重启命令: 2.Linux centos关机命令: 二.图形界面与命令界面的切换 1.修改/etc/inittab文件,文件中,最后一行id:5:ini ...
- lambda(),map(),filter()
Lambda 函数 Lambda 函数是一种比较小的匿名函数.Python 函数通常使用 def a_function_name() 样式来定义,但对于 lambda 函数,我们根本没为它命名.这是因 ...
- python调用tushare获取沪深A股票资金流向数据
接口:moneyflow 描述:获取沪深A股票资金流向数据,分析大单小单成交情况,用于判别资金动向 限量:单次最大提取4000行记录,总量不限制 积分:用户需要至少1500积分才可以调取,基础积分有流 ...
- Hibernate4教程六(2):基本实现原理
整体流程 1:通过configuration来读cfg.xml文件 2:得到SessionFactory 工厂 3:通过SessionFactory 工厂来创建Session实例 4:通过Sessio ...
- 理解EntityFramework两个核心类型的职责 DbSet和D'bContext
DbSet与DbContext是多对一的关系DbSet是实体对象的集合,提供了实现CRUD的相应方法DbContext封装与数据库和数据模型相关的功能,依据数据实体状态创建SQL命令,将数据更改保存到 ...
- Android Studio在Ubuntu下离线安装Gradle
更新android studio3.0后又要升级gradle了,估计又要很长时间,晚上临走前跟开始更新下载,第二天一早发现又卡了,吐血. 在某CSDN下载gradle-4.1-all.zip,直接手动 ...
- 使用truelicense实现用于JAVA工程license机制(包括license生成和验证)
开发的软件产品在交付使用的时候,往往会授权一段时间的试用期,这个时候license就派上用场了.不同于在代码中直接加上时间约束,需要重新授权的时候使用license可以避免修改源码,改动部署,授权方直 ...
- git的一些简单用法
1.工作区暂存区和仓库区 工作区 对于添加.修改.删除文件的操作,都发生在工作区中 暂存区 暂存区指将工作区中的操作完成小阶段的存储,是版本库的一部分 仓库区 仓库区表示个人开发的一个小阶段的完成 仓 ...
- position: absolute 如果不设置left, right, top, bottom会在什么位置
一般我们设置position: absolute都会一起设置left/right/top/bottom, 但是如果不设置, 布局会是什么样子的呢? 直接上图 1.一个大盒子中4个小盒子, 正常文档流布 ...