python正则表达式手记

----------re模块进行正则的使用----------

#result=re.match(正则表达式，要匹配的字符串)：使用正则对字符串进行过滤从前面开始匹配
#result.group()：将获得到的数据取出
#result=re.search(正则表达式，要匹配的字符串)：使用正则对字符串进行过滤从后面开始匹配
#result==None：判断正则表达式是否获取到内容，如果为True，则没有获取到内容
#re.search(r'\d+','my hight 177 cm').group()：使用正则读字符串进行过滤从找到符合要求的字符开始匹配。
#re.findall(r'\d+','my hight 177 cm my weight 100 kg')：获取字符串中所有符合正则条件的数据信息，并保存到一个列表中
#re.sub(r'\d+','100','my high 177 cm')：获取字符串中所有符合正则条件的数据信息，并使用第二个位置上的数据信息对其进行数据的替换操作
第二个位置可以配合函数进行处理，return返回值为str类型
#re.split(r':| ','address:beijing xxx@126.com')：根据正则表示式提供的规则对字符串进行有效的切割操作。并将结果存储到对应的列表中

----------正则表达式单字符匹配----------

.：匹配任意字符
[]：匹配[]中列举的字符
\d：匹配任意一个数字
\D：匹配非数字，即不是数字
\s；匹配空吧即空格、tab键
\S：匹配非空白
\w：匹配单词字符，字母、数字、下划线
\W：匹配非单词字符，字母、数字、下划线

----------正则表达式多个字符匹配----------
*：匹配前一个字符出现0次或者无限次，即可有可无
+：匹配前一个字符出现1次或者无限次，即只有有1次
?：匹配前一个字符出现1次或者0次，即要么有1次，要么没有
{m}：匹配前一个字符出现m次
{m,n}：匹配前一个字符出现从m到n次

---------匹配开头结尾----------
^：匹配字符串开头
$：匹配字符串结尾
\：转义

---------匹配分组----------
|：匹配左右任意一个表达式
()：将括号中字符作为一个分组
\<num>：引用分组num匹配到的字符串
(?P<name>)：分组起别名
(?P=name)：引用别名为name分组匹配到的字符串

---------附:正则表达式的练习题---------

1、匹配网址

有一批网址：

http://www.interoem.com/messageinfo.asp?id=35
http://3995503.com/class/class09/news_show.asp?id=14
http://lib.wzmc.edu.cn/news/onews.asp?id=769
http://www.zy-ls.com/alfx.asp?newsid=377&id=6
http://www.fincm.com/newslist.asp?id=415

需要正则后为：

http://www.interoem.com/
http://3995503.com/
http://lib.wzmc.edu.cn/
http://www.zy-ls.com/
http://www.fincm.com/

代码实现：

 def testFirst():

     #要进行处理的数据

     strHtml='http://www.interoem.com/messageinfo.asp?id=35 http://3995503.com/class/class09/news_show.asp?id=14 http://lib.wzmc.edu.cn/news/onews.asp?id=769 http://www.zy-ls.com/alfx.asp?newsid=377&id=6 http://www.fincm.com/newslist.asp?id=415'

     #strHtml='http://www.interoem.com/messageinfo.asp?id=35'

     print("转化前对应的数据：%s"%strHtml)

     #进程正在表达式处理

     result=re.findall("(http://.*?\.(com|cn)/)",strHtml)

     #测试

     #result = re.match("http://.*\.(com|cn)/",strHtml).group()

     #创建一个变量，进行结果的存储

     strResult=''

     #变量结果

     for item in result:

         strResult+=item[0]+" "

     #打印出结果

     print ("转化后对应的数据：%s"%strResult)

testOne

2、匹配所有合法的Python标识符

实现代码：

 #引用对应的包

 import re

 import keyword

 #2. 匹配所有合法的Python标识符

 def testFive():

     #获取到python中关键字的列表

     keyList=keyword.kwlist

     strKey="("+'|'.join(keyList)+")"

     #获取待处理的数据

     strTitle="int main str wfwfwfwfdsfstr andand ifwhile"

     #打印待处理的数据

     print("处理前的数据：%s"%strTitle)

     #进行正则的处理

     result=re.findall(strKey,strTitle)

     #打印处理后的数据

     print ("处理后的数据：%s"%str(result))

testTwo

3、匹配合法的ip地址

代码实现：

 引用包

 import re

 #3. 匹配合法的ip地址

 def testSex():

     #接受用户输入的ip地址

     strTitle=raw_input("请输入要进行判断的ip地址：")

     strRe=''

     strRe+='([1-9]{1,2}|1[0-9]{2}|2[0-4][0-9]|25[0-5])'#第一位

     strRe+='\.'

     strRe+='([1-9]?[0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])'#第二位

     strRe+='\.'

     strRe+='([1-9]?[0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])'#第三位

     strRe+='\.'

     strRe+='([1-9]?[0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])$'#第四位

     #进行ip是否合法的判断

     result=re.match(strRe,strTitle)

     if result==None:

         print("匹配失败！")

     else:

         print("匹配成功！")

testThree

python正则表达式手记的更多相关文章

Python 正则表达式入门（中级篇）
Python 正则表达式入门(中级篇) 初级篇链接:http://www.cnblogs.com/chuxiuhong/p/5885073.html 上一篇我们说在这一篇里,我们会介绍子表达式,向前向 ...
Python正则表达式中的re.S
title: Python正则表达式中的re.S date: 2014-12-21 09:55:54 categories: [Python] tags: [正则表达式,python] --- 在Py ...
Python 正则表达式入门（初级篇）
Python 正则表达式入门(初级篇) 本文主要为没有使用正则表达式经验的新手入门所写. 转载请写明出处引子首先说正则表达式是什么? 正则表达式,又称正规表示式.正规表示法.正规表达式.规则表达 ...
python正则表达式re
Python正则表达式: re 正则表达式的元字符有. ^ $ * ? { [ ] | ( )．表示任意字符［］用来匹配一个指定的字符类别,所谓的字符类别就是你想匹配的一个字符集,对于字符集中的字符可 ...
Python正则表达式详解
我用双手成就你的梦想 python正则表达式 ^ 匹配开始 $ 匹配行尾 . 匹配出换行符以外的任何单个字符,使用-m选项允许其匹配换行符也是如此 [...] 匹配括号内任何当个字符(也有或的意思) ...
比较详细Python正则表达式操作指南(re使用)
比较详细Python正则表达式操作指南(re使用) Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式.Python 1.5之前版本则是通过 regex 模块提供 E ...
Python正则表达式学习摘要及资料
摘要在正则表达式中,如果直接给出字符,就是精确匹配. {m,n}? 对于前一个字符重复 m 到 n 次,并且取尽可能少的情况在字符串'aaaaaa'中,a{2,4} 会匹配 4 个 a,但 a{2 ...
python正则表达式小例几则
会用到的语法正则字符释义举例 + 前面元素至少出现一次 ab+:ab.abbbb 等 * 前面元素出现0次或多次 ab*:a.ab.abb 等 ? 匹配前面的一次或0次 Ab?: A.Ab 等 ...
Python 正则表达式-OK
Python正则表达式入门一. 正则表达式基础 1.1. 简单介绍正则表达式并不是Python的一部分. 正则表达式是用于处理字符串的强大工具, 拥有自己独特的语法以及一个独立的处理引擎, 效率上 ...

随机推荐

博弈论之Nim游戏
Nim游戏是组合游戏(Combinatorial Games)的一种,属于“Impartial Combinatorial Games”(以下简称ICG). 通常的Nim游戏的定义是这样的:有若干堆石 ...
MySQL系列（三）---索引
MySQL系列(三)---索引前言:如果有疏忽或理解不当的地方,请指正. 目录 MySQL系列(一):基础知识大总结 MySQL系列(二):MySQL事务 MySQL系列(三):索引什么是索引如 ...
Python操作文件和目录
Python操作文件和目录读写文件比较简单,有一点特别注意就好了 windows下Python默认打开的文件以gbk解码,而一般我们的文件是utf-8编码的,所以如果文本含有中文,就会出现异常或者乱 ...
微信客户端+微信公众平台+新浪云SAE+Arduino+WS100(控制LED)
第一步:准备 1.智能手机微信客户端或微信电脑版 2.注册微信公众平台 https://mp.weixin.qq.com 3.注册新浪账号 http://www.sinacloud.com 4.拥有一 ...
JavaNIO深入学习
NIO是Jdk中非常重要的一个组成部分,基于它的Netty开源框架可以很方便的开发高性能.高可靠性的网络服务器和客户端程序.本文将就其核心基础类型Channel, Buffer, Selector进行 ...
python--DenyHttp项目（1）--socket编程：服务器端进阶版socketServer
在网上看到了SocketServer模块,于是Server端简化: #coding:utf-8 import socketserver class MyTCPHandler(socketserver. ...
Linux操作系统-命令-aptitude install unzip
如果linux系统没有自带unzip,请执行aptitude install unzip以安装. 使用到这条Linux命令的场景是: 当我把Jmeter的压缩包(xxx.zip)拷贝到远程的Linux ...
初识webview
一.什么是webview 原生APP开发中有一个webview的组件(Android中是webview,iOS7以下有UIWebview,7以上有WKWebview),这个组件可以加载Html文件 ...
Hadoop之HelloWorld
Hadoop开始: 1. 下载最新的发行版,解压到你喜欢的路径. 2. 配置,Hadoop的配置文件位于-/hadoop/conf/ 目录下.这里我先只配置了core-site.xml文件. < ...
python第一篇-------python介绍
一.python介绍 python的创始人为吉多·范罗苏姆(Guido van Rossum).1989年的圣诞节期间,Guido开始写Python语言的编译器.Python这个名字,来自Guido所 ...

python正则表达式手记

python正则表达式手记的更多相关文章

随机推荐

热门专题