写作时间:2018/12/17

作者:永远的码农(博客园)




一.正则表达式简介:

正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。

正则表达式是对字符串(包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是一种文本模式,模式描述在搜索文本时要匹配的一个或多个字符串。

 二.python正则表达式中的特殊字符以及转义字符的用法

     特殊字符                                                      描述                                                     
      ^ 表示匹配的字符必须在最前面
      $ 与^类似,匹配最末的字符
      * 匹配*前面的字符0次或n次
      + 匹配+前面的字符1次或n次
      ? 匹配?前面的字符0次或1次
      . 匹配除了\n外的所有字符
     (x) 匹配x并且记录匹配的值
     x|y 匹配x或者y
     {n} n是正整数,匹配前面的n个字符
     {n,} 匹配前面至少n个字符
     {n,m} 匹配前面至少n个至多m个字符
     [xyz] 匹配列表中列出的任一字符,可以用连字符 - 指出字符范围
     [b] 匹配一个空格
     b 匹配一个单词的分界线,比如一个空格
     B 匹配一个单词的非分界线
   转义字符                                                     描述                             
    \d 匹配数字,即0-9
    \D 匹配非数字
    \s 匹配空白,比如空格,tab
    \S 匹配非空白
    \w 匹配非特殊字符,即a-z、A-Z、0-9、_、汉字
    \W 匹配特殊字符,即非字母、非数字、非汉字、非_

 

 

 

 

 

初级正则表达式常见使用:

1.匹配有效的正整数

 正则表达式:  [1-9]+[0-9]*

典例: 找出一个文本文件中所有有效的正整数(00123这样的视为无效,12300视为有效)

先创建一个文本文件new.txt,内容如下:

aaddccbbee 0012300 45600 78909
abcd1234efgh 12340 ghijkl
12 34 056 780 0099
12340056aabbcc00
 import re
file = open("new.txt")
for line in file:
list = re.findall("[1-9]+[0-9]*",line)
print("findall()返回列表为:",list)
for num in list:
print(num)
执行结果:
findall()返回列表为: ['', '', '']
12300
45600
78909
findall()返回列表为: ['', '']
1234
12340
findall()返回列表为: ['', '', '', '', '']
12
34
56
780
99
findall()返回列表为: ['']
12340056

2.匹配有效的负整数

正则表达式: -[1-9]+[0-9]*

3.匹配有效的整数

正则表达式: -?[1-9]+[0-9]*|0

4.匹配浮点数

正则表达式: -?[0-9]+\.[0-9]+

典例: 找出文本文件new.txt中的所有浮点数

文本文件内容如下:

aaddccbbee 456 078 -7780 9.99654
abcd1234efgh -12340 ghijkl 33.0
12 -34 056 780 0099 -2 0 2.23 -3.8
12340056aabbcc0.123
 import re
file = open("new.txt")
for line in file:
list = re.findall("-?[0-9]+\.[0-9]+",line)
print("findall()返回列表为:",list)
for num in list:
print(num)
执行结果:
findall()返回列表为: ['9.99654']
9.99654
findall()返回列表为: ['33.0']
33.0
findall()返回列表为: ['2.23', '-3.8']
2.23
-3.8
findall()返回列表为: ['0.123']
0.123

5.匹配由数字、26个英文字母组成的字符串

正则表达式: [0-9a-zA-Z]+

高级正则表达式常见使用:

1.输入用户名只能是汉字,且字数位于3~10之间

正则表达式: ^[\u4e00-\u9fa5]{3,10}$

典例:验证用户输入名是否满足如上要求

 import re
input = input("请输入用户名:")
if re.match("^[\u4e00-\u9fa5]{0,}$",input):
print("用户名有效")
else:
print("用户名无效")
测试效果:
请输入用户名:王老二
用户名有效
请输入用户名:张三
用户名无效
请输入用户名:lyj来了喔
用户名无效

2.输入密码开头必须是英文字母,其他部分只能是数字,下划线_或字母,且长度为6~12位

正则表达式: [a-zA-Z]{1}[a-zA-Z0-9_]{5,11}

3.电子邮箱验证

正则表达式: ^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$

 正则表达式并不是唯一的,不同的正则表达式可以达到相同的匹配要求......

若您觉得对您有帮助,不妨点个赞

python初学者日记02(正则表达式)的更多相关文章

  1. python初学者日记01(字符串操作方法)

    时间:2018/12/16 作者:永远的码农(博客园) 环境: win10,pycharm2018,python3.7.1 1.1  基础操作(交互输入输出) input = input(" ...

  2. Python学习日记之正则表达式re模块

    用在线网页测试正则表达式时,JavaScript不支持 零宽度正回顾后发断言 (?<=exp)测试时一直匹配失败 但re模块是支持 (?<=exp) 的 终于脱坑

  3. python学习日记(正则表达式)

    定义 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. re 模块使 Pyth ...

  4. python字符串转义与正则表达式特殊字符转义

    最近在自学python,字符串和正则表达式的特殊字符转义有点混淆,做个笔记简单总结一下. 1.普通字符串转义 在字符串中使用特殊字符时,要用反斜杠(\)转义字符.例如:'Let\'s go!',这里对 ...

  5. python爬虫之re正则表达式库

    python爬虫之re正则表达式库 正则表达式是用来简洁表达一组字符串的表达式. 编译:将符合正则表达式语法的字符串转换成正则表达式特征 操作符 说明 实例 . 表示任何单个字符 [ ] 字符集,对单 ...

  6. python学习日记(基础数据类型及其方法01)

    数字 int 主要是用于计算的,常用的方法有一种 #既十进制数值用二进制表示时,最少使用的位数i = 3#3的ASCII为:0000 0011,即两位 s = i.bit_length() print ...

  7. python 初学者

    明确学习目标,不急于求成 当下是一个喧嚣.浮躁的时代.我们总是被生活中大量涌现的热点所吸引,几乎没有深度阅读和思考的时间和机会.我始终认为,学习是需要沉下心来慢慢钻研的,是长 期的:同时,学习不应该被 ...

  8. Python初学者之网络爬虫(二)

    声明:本文内容和涉及到的代码仅限于个人学习,任何人不得作为商业用途.转载请附上此文章地址 本篇文章Python初学者之网络爬虫的继续,最新代码已提交到https://github.com/octans ...

  9. Python标准库01 正则表达式(re包)

    python正则表达式基础 简单介绍 正则表达式并不是python的一部分.正则表达式是用于处理字符串的强大工具,拥有自己独特的语法及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大 ...

随机推荐

  1. Django—XSS及CSRF

    一.XSS 跨站脚本攻击(Cross Site Scripting),为不和层叠样式表(Cascading Style Sheets, CSS)的缩写混淆,故将跨站脚本攻击缩写为XSS.恶意攻击者往W ...

  2. CentOS 7运维管理笔记(7)----Apache 基于端口的虚拟主机配置

    如果一台服务器只有一个IP或需要通过不同的端口访问不同的虚拟主机,可以使用基于端口的虚拟主机配置. (1) 在虚拟机的CentOS7服务器上配置 eth0:4 为192.168.1.214: (2) ...

  3. 任务十:Flexbox 布局练习

    任务目的 学习如何flex进行布局,学习如何根据屏幕宽度调整布局策略. 任务描述 需要实现的效果如效果图(点击打开)所示,调整浏览器宽度查看响应式效果,红色的文字是说明,不需要写在 HTML 中. 任 ...

  4. 第三篇:jvm之垃圾回收器

    一.Serial收集器 新生代收集器,在垃圾回收时,必须暂停其他所有的工作线程.即Stop-The-World. 评价:老而无用,食之无味,弃之可惜. 二.ParNew收集器 新生代收集器,seria ...

  5. 关于IE8下media query兼容的解决方案探讨

    在国内IE8至少还占有20%的市场份额,所以在做网站时,必须得为这部分用户特殊兼容考虑. 一方面IE8上面很多css3定义的标签不能使用,另外一方面javascript的addEventListene ...

  6. java、C语言实现数组模拟栈

    java: public class ArrayStack { private int[] data; private int top; private int size; public ArrayS ...

  7. pt-query-digest(percona toolkit)小解

    pt-query-digest可以通过logs, processlist, 和tcpdump来分析MySQL的查询相关信息,基本语法如下: pt-query-digest [OPTIONS] [FIL ...

  8. ComboBox赋值ItemsSource数据源的时候会触发SelectionChanged改变事件的解决办法

    我用的方法是设置开关 bool flag = false;//默认开关关闭(全局变量) flag = false;在赋值数据源之前设置关闭box.ItemsSource = lstProperty;/ ...

  9. Linux:301重定向 —— 将不带www的重定向到带www的

    仓鼠又要手把手教啦 1.先看看自己有没有解析域名(带www和不带www的是两种域名形式!!) 位置:阿里云->域名->解析 2.进入解析,带www的说明你已经解析了www.ljjpm.co ...

  10. 网站渗透常用到的Python小脚本

    0×00渗透的很多时候,找到的工具并不适用,自己码代码才是王道,下面三个程序都是渗透时在网络上找不到合适工具,自己辛苦开发的,短小使用,求欣赏,求好评. 0×01记录root密码小工具 root.py ...