python正则表达式解析(re)

正则表达式的使用方法主要有4种： re.search(进行正则匹配)， re.match(从头开始匹配) re.findall(找出所有符合条件的字符列表) re.split(根据条件进行切分) re.sub(根据条件进行替换)

匹配规则里的符号

# . 可以被当作任意字符, re.M 忽略开头的换行符

res = re.match('^c.+\d', 'cheng123ronghua', flags=re.M)

print(res)

# ^ 匹配当前字符串的开头， ^c表示已c开头，a$以a为结尾

res = re.search('^c[a-z]+a$', 'cdasda')

print(res.group())

# $ 表示结尾

res = re.search('r[a-zA-Z]+a$', 'cheng321ronGHua123aronghua')

print(res.group())

# * 表示匹配0个或者多个

print(re.findall('ab*', 'alexabbtomab'))

# ['a', 'abb', 'ab']

# + 表示匹配一个或者多个

print(re.findall('x\d+a', 'alex123abc'))

# ['x123a']

# ? 匹配0个或者一个

print(re.findall('宋惠乔?', '宋惠 宋惠乔'))

# ['宋惠', '宋惠乔']

# {1,3} 匹配一个到三个之间

print(re.findall('[0-9]{1,3}', 'alex123alex1alex12'))

# ['123', '1', '12']

# | 进行或操作的匹配,匹配其中一个即可

print(re.search('abc|ABC', 'abcABCCD').group())

# abc

# 将需要匹配的字母进行统一的保存

string = re.search('(abc){2}(\|\|=){2}', '123abcabc||=||=')

print(string.group())

# abcabc||=||=

# \A 表示以什么开头, 相当于上面的^

print(re.search('\Aa.+b\Z', 'a123b').group())

# a123b

# \Z 表示以什么结尾，相当于上面的$

print(re.search('b.+d\Z', '11b23d').group())

# b23d

# \D 匹配非数字

print(re.search('\D+', '123$-a').group())

# $-a

# \w 匹配数字或者字母

print(re.search('\w+o\w+', 'the old tsoms').group())

# tsoms

# \W 匹配非数字或者字母

print(re.search('\W+', 'abc123%-%-%abc').group())

# %-%-%

# \s 匹配空包字符 \n\r\t

print(re.findall('\s+', 'sd \r\n sd'))

# [' \r\n ']

# (?P<>[]+) 进行分组构造字典

A = re.search('(?P<id>[0-9]+)(?P<name>[a-z]+)', '123alex')

print(A.groupdict())

# {'id': '123', 'name': 'alex'}

# re.split() 进行数据切分

print(re.split('[ ]+', '123  123 12'))

# ['123', '123', '12']

# re.sub 表示将数字进行替换|

print(re.sub('[0-9]+', '|', 'acv1dae2dasd3ads'))

# acv|dae|dasd|ads

# 进行反斜杠匹配 r'\\'

print(re.split(r'\\', r'abc\123'))

# ['abc', '123']

# re.I 忽略大小写

print(re.search('[a-z]+', 'abcA', re.I).group())

# abcA

# re.M 忽略开头的\n

print(re.search('^d123', '\nd123456', flags=re.M).group())

# d123

# re.S 匹配所有的字符串,包括换行符

print(re.findall(r'd.+s', 'd123\n\rs123', flags=re.S))

# ['d123\n\rs']

这里编写了一个简单的计算器

import re

s = '1-2*((60-30 +(9-2*5/3+7/3*99/4*2998+10*568/14)*(-40 / 5))-(-4*3)/(16-3*2))'

s = s.replace(' ', '')

print(eval(s))

def get_grap(string):

    x = re.compile('\([^()]+\)').search(string)

    if x == None:

        return string

    else:

        return x.group()

def cal(x):

    if '*' in x:

        return float(x.split('*')[0]) * float(x.split('*')[1])

    else:

        return float(x.split('/')[0]) / float(x.split('/')[1])

def cal_sum(x):

    if '+' in x :

        return float(x.split('+')[0]) + float(x.split('+')[1])

    elif '-' in x:

        return float(x.split('-')[0]) - float(x.split('-')[1])

def cal_grap(x):

    # 找出其中的乘和除

    while True:

        y = re.compile('\d+(\.\d+)?[*/]-?\d+(\.\d+)?').search(x)

        if y == None:

            break

        y = y.group()

        x = x.replace(y, str(cal(y)))

    #找出其中的加减操作

    while True:

        if re.search('[+][-]', x) != None:

             x = re.sub('[+][-]', '-', x)

        elif re.search('[-][-]', x) != None:

             x = re.sub('[-][-]', '+', x)

        y = re.compile('-?\d+(\.\d+)?[+\-]\d+(\.\d+)?').search(x)

        if y == None:

            break

        y = y.group()

        x = x.replace(y, str(cal_sum(y)))

    return x

while True:

    if re.compile('\d+(\.\d+)?').search(s) != None:

        if re.compile('\d+(\.\d+)?').search(s).group() == s:

            break

    x = get_grap(s)

    if re.search('\(.+\)', x) != None:

        all = cal_grap(x)[1:-1]

    else:

        all = cal_grap(x)

    s = s.replace(x, all)

print(s)

python正则表达式解析(re)的更多相关文章

Python 正则表达式解析HTML
比较详细Python正则表达式操作指南(re使用)
比较详细Python正则表达式操作指南(re使用) Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式.Python 1.5之前版本则是通过 regex 模块提供 E ...
Python正则表达式学习摘要及资料
摘要在正则表达式中,如果直接给出字符,就是精确匹配. {m,n}? 对于前一个字符重复 m 到 n 次,并且取尽可能少的情况在字符串'aaaaaa'中,a{2,4} 会匹配 4 个 a,但 a{2 ...
python高效解析日志入库
python脚本解析日志文件入库一般有三个重要的步骤:读文件.解析文件.入库.在这三个方面下功夫,可确保我们获得最优的性能(这里不讨论并发) 1 读文件:一次读一行,磁盘IO太多,效率低下:一次性读如 ...
Python网页解析
续上篇文章,网页抓取到手之后就是解析网页了. 在Python中解析网页的库不少,我最开始使用的是BeautifulSoup,貌似这个也是Python中最知名的HTML解析库.它主要的特点就是容错性很好 ...
Python天天美味(15) - Python正则表达式操作指南(re使用)(转)
http://www.cnblogs.com/coderzh/archive/2008/05/06/1185755.html 简介 Python 自1.5版本起增加了re 模块,它提供 Perl 风格 ...
【repost】Python正则表达式
星光海豚 python正则表达式详解正则表达式是一个很强大的字符串处理工具,几乎任何关于字符串的操作都可以使用正则表达式来完成,作为一个爬虫工作者,每天和字符串打交道,正则表达式更是不可或缺的技 ...
python 正则表达式中反斜杠(\)的麻烦和陷阱
这里是一点小心得:由于下面两个原因,在正则表达式中使用反斜杠就会产生了一个双重转换的问题. (1).python自身处理字符串时,反斜杠是用于转义字符 (2).正则表达式也使用反斜杠来转义字符 ...
python正则表达式一[转]
原文:http://blog.jobbole.com/74844/ 作为一个概念而言,正则表达式对于Python来说并不是独有的.但是,Python中的正则表达式在实际使用过程中还是有一些细小的差别. ...

随机推荐

Flutter-动画-实践篇
一.了解AnimatedWidget 通常我们给一个Widget添加动画的时候都需要监听Animation的addListener()方法,并在这个方法里面不停的调用setState()方法通知Wei ...
Troubleshooting: Cannot Run on an Android Device
同事在他的开发环境中,在IDE中直接在手机上运行Android项目,结果出现这个错误,无法在手机上安装. 产生这个问题的原因,一般就是签名不对,这种情况,删除手机上装过的同名应用,就可以解决.当然,你 ...
centos redis自启动
#!/bin/sh # chkconfig: 2345 90 10 # description: Redis is a persistent key-value database # Simple R ...
（十一）设置关闭多核cpu的核
echo 0 > /sys/devices/system/cpu/cpu3/online 查看当前有哪些核心 cat /sys/devices/system/cpu/online
论文笔记：Unsupervised Domain Adaptation by Backpropagation
14年9月份挂出来的文章,基本思想就是用对抗训练的方法来学习domain invariant的特征表示.方法也很只管,在网络的某一层特征之后接一个判别网络,负责预测特征所属的domain,而后特征提取 ...
身份证js正则
/* 根据[中华人民共和国国家标准 GB 11643-1999]中有关公民身份号码的规定,公民身份号码是特征组合码,由十七位数字本体码和一位数字校验码组成.排列顺序从左至右依次为:六位数字地址码,八位 ...
Networker软件安装
BZOJ1030 [JSOI2007]文本生成器[DP+AC自动机]
我学到现在才是初三学弟的水平..哭这里相当于求长度为$m$的,字符集$\{A...Z\}$的且不包含任一模式串的文本串个数.这是一个典型的AC自动机匹配计数问题. 设$f_{i,j}$表示在AC自动 ...
SiteMesh的简单使用
简介: SiteMesh是一个网页布局和修饰的框架,利用它可以将网页的内容和页面结构分离,以达到页面结构共享的目的. 它能通过创建一个包装对象,也就是装饰来包裹的对象.尽管它是由Java语言来实现的, ...
maven打断点报错

python正则表达式解析(re)

python正则表达式解析(re)的更多相关文章

随机推荐

热门专题