python re.findall 使用
python re.findall 使用
import re #\w 匹配字母数字及下划线
print(re.findall('\w','hello alan _god !@^&#^$^!*&(*')) #\W 匹配非字母数字下划线
print(re.findall('\W','hello alan _god !#@!#$(#*'))
#\s 匹配空白字符
print(re.findall('\s',"alan and god *& YUN CHINA"))
#\S 匹配非空白字符
print(re.findall('\S',"alan and god *& YUN CHINA"))
#d\ 数字与 D\ 非数字
print(re.findall('\d',"2018年9月8日16:54:30alan and god *& YUN CHINA1949"))
print(re.findall('\D',"20182018年9月8日16:54:20alan and god *& YUN CHINA1949")) #\A 匹配字符串开始
print(re.findall('\ACH',"CH2018年9月8日16:54:30alan and god *& YUN CHINA1949"))
#\Z 匹配字符串结束
print(re.findall('Z\Z',"20182018年9月8日16:54:20alan and god *& YUN CHINA1949ZZ")) #^ 字符串开头 与 $字符串结尾 print(re.findall('^a',"alan and god *& YUN CHINA"))
print(re.findall('NA$','alan and god *& YUN CHINA'))
#. 匹配任意
print(re.findall('an.','alan and angod *& YUN CHINA'))
print(re.findall('a.a','a a alan and a&a ata aa')) #* 匹配0或多个
print(re.findall('an*','a a alan and god anSB anang *& YUN CHINA'))
print(re.findall('an*','alan and a&a ata a a')) #? 匹配0或1------------------------
print(re.findall('ag?','age avg agre amg a'))
print(re.findall('agg?','aggge avgagg aggre amg ag')) #匹配所有包含小数在内的数字
print(re.findall('\d+.?\d*','123adf 1.33663fsdf13fsdf1fsdf3')) #.*默认为贪婪匹配
print(re.findall('a.*d','adss andgod930 axds9kidg')) #.*?为非贪婪匹配
print(re.findall('a.*?d','andgod930 axds9kidg ad aa')) #+ 1或多
print(re.findall('and+','andgod930 axds9kidg an and anddd andddSSS')) #{n,m} >=n,<m
print(re.findall('an{2}','andgod930 axds9kidg an annd anndd anddd andddSSS'))
print(re.findall('an{1,3}','andgod930 axds9kidg an annd anndd anddd andddSSS'))
print(re.findall('ab{1,}','abbb abs a ab bb'))
print(re.findall('ab{0,}','abbb abs a ab bb abb')) #[]内的都为普通字符了,且如果-没有被转意的话,应该放到[]的开头或结尾
print(re.findall('a[1*-]b','a1b a*b a-b asb aab allb a--b')) #[]内的^代表的意思是取反
print(re.findall('a[^1*-]b','a1b a*b a-b a=b')) #[]内的0-9 之间匹配 0到9 之间的整数
print(re.findall('a[0-9]b','a1b a*b a-b a=b a0b a00b ')) #[]内的a-z 之间匹配 小写字母
print(re.findall('a[a-z]b','a1b a*b A-D a-b a=b aeb aAb abb acb azb')) #[]内的A-Z 之间匹配 大写字母
print(re.findall('[A-Z]','a1b a*b A-D a-b a=b aeb aAb abb acb azb')) #[]内的a-z 或者 A-Z 之间匹配 大写字母 与小写字母
print(re.findall('a[a-zA-Z]b','a1b a*b a-b a=b aeb aEb aab aAb aZb azb')) #\ 与 \ 与 \\ #对于正则来说a\\c确实可以匹配到a\c,但是在python解释器读取a\\c时,会发生转义,然后交给re去执行,所以抛出异常
print(re.findall('a\\c','a\c'))
#r代表告诉解释器使用rawstring,即原生字符串,把我们正则内的所有符号都当普通字符处理,不要转义
print(re.findall(r'a\\c','a\c a\\c a c ac'))
#和上面的结果一样
print(re.findall('a\\\\c','a\c a\\c ')) #() 分組
print(re.findall('ab+','ababab123 abc abd')) #匹配到末尾的ab123中的ab
print(re.findall('(ab)+123','abab123 abc123 abb123 aa1234 ab1234')) #findall的结果不是匹配的全部内容,而是组内的内容,?:可以让结果为匹配的全部内容
print(re.findall('(?:ab)+123','ababab123 abc123 abb123 aa1234 ab1234')) print(re.findall('href="(.*?)"','<a href="http://www.baidu.com">百度</a> <a href="http://www.google.com">go</a> <a href="http://www.yunhua.com">go</a>')) print(re.findall('href="(?:.*?)"','<a href="http://www.baidu.com">百度</a> <a href="http://www.google.com">go</a> <a href="http://www.yunhua.com">go</a>'))
python re.findall 使用的更多相关文章
- 关于Python正则表达式findall函数问题详解
关于Python正则表达式 findall函数问题详解 在写正则表达式的时候总会遇到不少的问题, 特别是在表达式有多个元组的时候.下面看下re模块下的findall()函数和多个表达式元组相遇的时候会 ...
- python正则表达式findall的使用
文章来源与:http://www.cnblogs.com/zjltt/p/6955965.html 正则表达式 正则表达式本身是一种小型的.高度专业化的编程语言,而在python中,通过内嵌集成re模 ...
- python正则表达式--findall、finditer方法
findall方法 相比其他方法,findall方法有些特殊.它的作用是查找字符串中所有能匹配的字符串,并以结果存于列表中,然后返回该列表 注意: match 和 search 是匹配一次 finda ...
- python使用findall正则匹配出所有符合条件的字符串
# -*- coding:utf-8 -*- import re mystr="qqq key:www.baidu.com<br>key:www.tengxun.com<b ...
- python re.findall(rule,data),根据左右边界取值url中参数的值
import re ''' 取值postid,左边界"postid=",右边界"&" ''' url="http://wwww.baidu.c ...
- python 正则表达式findall
re.findall("匹配规则", "要匹配的字符串") 以列表形式返回匹配到的字符串 https://www.cnblogs.com/gufengchen/ ...
- Python re.findall函数不能匹配但是notepad++能匹配
我使用同样的表达式匹配同样的网页源码,在notepad++里面不能直接使用,需要将内容都弄到同一行中. 但是我使用 requests.get(self.url).content.decode('UTF ...
- Learning Python 008 正则表达式-002 findall()方法
Python 正则表达式 - findall()方法 重点 findall()方法的使用 - 程序讲解 简单的符号的使用 正则表达式的库文件是re,先导入库文件: import re .的使用举例 # ...
- python正则表达式一[转]
原文:http://blog.jobbole.com/74844/ 作为一个概念而言,正则表达式对于Python来说并不是独有的.但是,Python中的正则表达式在实际使用过程中还是有一些细小的差别. ...
随机推荐
- centos6 sersync2使用
接收端rsyncd搭建 http://www.cnblogs.com/hanxiaohui/p/8675409.html 推送端sersync2使用 安装 源码包D:\share\src\sersyn ...
- sequel 远程连接 MySQL 连接错误Can't connect to MySQL server on (61)
Mac sequel Pro链接时报错Can’t connect to MySQL server on ‘xx.xx.xx.xx’ (61). PS. win版Navicat 报错Can’t conn ...
- Python3中 if __name__=='__main__'是个什么意思
在python前期学习中或者在学flask中,if_name_ = ="_main_"经常出现在我们的眼帘中,我们经常会问,这个是个什么玩意儿,它是干什么的? 我们知道,if 语句 ...
- python 去除字符串两端字符串
转载:http://blog.sina.com.cn/s/blog_940224600100w8l0.html Python中的strip用于去除字符串的首位字符,同理,lstrip用于去除左边的字符 ...
- python 模拟双色球输出
编写Python函数:完成一个双色球彩票的模拟生成过程, 其中前六个为红色球,数字范围1-33,不可重复.最后一个为蓝色球 1-16. import random #red_nums是采集红色球的数字 ...
- redis zset 介绍
$key = 'key'; //新增 zadd($key,分数,标识) //删除某个标识 zrem($key,标识) //查询某个标识的排名(从0开始的 所有在输出的时候要加一) zrevrank($ ...
- 在doker上的python安装及环境部署
python环境部署 我们今天学习的内容是如何将Django项目部署到linux服务器上,我们部署的linux系统是centos7首先,我们先在linux上搭建我们的Python3环境: 在这里首先强 ...
- Scrapy框架: settings.py设置
# -*- coding: utf-8 -*- # Scrapy settings for maitian project # # For simplicity, this file contains ...
- 10个艰难的Java面试题与答案
10个最难回答的Java面试题 这是我收集的10个较难回答的 Java 面试题.这些问题主要来自 Java 核心部分 ,不涉及 Java EE 相关问题.这些问题都是容易在各种 Java 面试中被问到 ...
- python图像特征提取
这里使用的是python 3.5 .opencv_python-3.4.0+contrib,特征提取的代码如下: import cv2 img = cv2.imread("feature.j ...