re模块、hashlib模块

一.re模块

1.什么是正则？

正则就是用一系列具有特殊含义的字符组成一套规则，该规则用来描述具有某一特征的字符串，
正则就是用来去一个大的字符串中匹配出符合规则的子字符串

2.为何要用正则？

用户注册，爬虫程序

3.常用方法：

import re

print(re.findall('\w','Aah123 +-_'))

#['A', 'a', 'h', '1', '2', '3', '_']

print(re.findall('\w9\w','Aa9h123 aaa9c+-_'))

# ['a9h','a9c']

print(re.findall('\W','Aah123 +-_'))

#[' ', '+', '-']

print(re.findall('\s','Aah\t12\n3 +-_'))

#['\t', '\n', ' ']

print(re.findall('\S','Aah\t12\n3 +-_'))

#['A', 'a', 'h', '1', '2', '3', '+', '-', '_']

print(re.findall('\d','Aah\t12\n3 +-_'))

#['1', '2', '3']

print(re.findall('\D','Aah\t12\n3 +-_'))

#['A', 'a', 'h', '\t', '\n', ' ', '+', '-', '_']

print(re.findall('\t','Aah\t12\n3 +-_'))

#['\t']

print(re.findall('\n','Aah\t12\n3 +-_'))

#['\n']

# ^: 仅从头开始匹配

print(re.findall('^alex','alex is alex is alex'))

#['alex']

# $: 仅从尾部开始匹配

print(re.findall('alex$',' alex is alex is alex'))

['alex']

# .: 代表匹配一个字符,该字符可以是除换行符之外任意字符 #如果后面跟上re.DOTALL就是可以匹配全部任意的字符

print(re.findall('a.c','a a1c aaac a c asfdsaf a\nc',re.DOTALL))

# ['a1c','aac','a c','a\nc']

# []:代表匹配一个字符,这一个字符是来自于我们自定义的范围，[]内的上尖号表示的是取反

print(re.findall('a[0-9]c','a,c a a1c a9c aaac a c asfdsaf a\nc',re.DOTALL))

print(re.findall('a[a-zA-Z]c','a,c aAc a1c a9c aaac a c asfdsaf a\nc',re.DOTALL))

print(re.findall('a[a-zA-Z]c','a,c aAc a1c a9c aaac a c asfdsaf a\nc',re.DOTALL))

print(re.findall('a[+*/-]c','a,c a+c a-c a*c a/c aAc a1c a9c aaac a c asfdsaf a\nc',re.DOTALL))

print(re.findall('a[+*\-/]c','a,c a+c a-c a*c a/c aAc a1c a9c aaac ac asfdsaf a\nc',re.DOTALL))

print(re.findall('a[^0-9]c','a,c a a1c a9c aaac a c asfdsaf a\nc',re.DOTALL))

# 重复匹配

# ?:代表左边那一个字符出现0次到1次

print(re.findall('ab?','a ab abb abbbb a123b a123bbbb'))

# ['a','ab','ab','ab','a','a']

# *: 代表左边那一个字符出现0次到无穷次

print(re.findall('ab*','a ab abb abbbb a123b a123bbbb'))

# ['a','ab','abb','abbbb','a','a']

# +: 代表左边那一个字符出现1次到无穷次

print(re.findall('ab+','a ab abb abbbb a123b a123bbbb'))

# ['ab','abb','abbbb']

# {n,m}:代表左边那一个字符出现n次到m次

print(re.findall('ab{1,3}','a ab abb abbbb a123b a123bbbb'))

# ['ab', 'abb', 'abbb']

print(re.findall('ab{1,}','a ab abb abbbb a123b a123bbbb'))

print(re.findall('ab+','a ab abb abbbb a123b a123bbbb'))

print(re.findall('ab{0,}','a ab abb abbbb a123b a123bbbb'))

print(re.findall('ab*','a ab abb abbbb a123b a123bbbb'))

print(re.findall('ab{3}','a ab abb abbbb a123b a123bbbb'))

# .*: 匹配任意0个到无穷个字符,贪婪匹配

print(re.findall('a.*c','a123213123asdfasdfc123123123123+-0)((c123123'))

#.*?:匹配任意0个到无穷个字符,非贪婪匹配

print(re.findall('a.*?c','a123213123asdfasdfc123123123123+-0)((c123123'))

#|:或者

print(re.findall('companies|company','Too many companies have gone bankrupt,c and the next one is my company'))

#忽略大小写

print(re.findall('alex','my name is alex Alex is dsb aLex ALeX',re.I))

msg="""

my name is egon

asdfsadfadfsadf egon

123123123123123egon

"""

print(re.findall('egon$',msg,re.M)) #my name is egon\nasdfsadfadfsadf egon\n123123123123123egon'

#\# print(re.findall('a\\c','a\c')) #对于正则来说a\\c确实可以匹配到a\c,但是在python解释器读取a\\c时，会发生转义，然后交给re去执行，所以抛出异常

print(re.findall(r'a\\c','a\c')) #r代表告诉解释器使用rawstring，即原生字符串，把我们正则内的所有符号都当普通字符处理，不要转义

print(re.findall('a\\\\c','a\c')) #同上面的意思一样，和上面的结果一样都是['a\\c']

#():分组

print(re.findall('ab+','ababab123')) #['ab', 'ab', 'ab']

print(re.findall('(ab)+123','ababab123')) #['ab']，匹配到末尾的ab123中的ab

print(re.findall('(?:ab)+123','ababab123')) #findall的结果不是匹配的全部内容，而是组内的内容,?:可以让结果为匹配的全部内容

print(re.findall('href="(.*?)"','<a href="http://www.baidu.com">点击</a>'))#['http://www.baidu.com']

print(re.findall('href="(?:.*?)"','<a href="http://www.baidu.com">点击</a>'))#['href="http://www.baidu.com"']

#['1', '2', '60', '-40.35', '5', '-4', '3']取出其中的数字

msg="1-2*(60+(-40.35/5)-(-40*3))"

print(re.findall('\D?(-?\d+\.?\d*)',msg))

re模块的其他方法：

res=re.search() #只匹配成功一次，就结束，res.group() 取其中的分组，如果不写，就全取，如果写参数，就只取参数所对应的那个组

res=re.match() #只从开头进行匹配，相当于在search中的正则表达式中加上尖号

# res=re.findall('(href)="(.*?)"','<p>动感视频</p><a href="https://www.douniwan.com/1.mp4">逗你玩呢</a><a href="https://www.xxx.com/2.mp4">葫芦娃</a>')

# print(res)

# res=re.search('(href)="(.*?)"','<p>动感视频</p><a href="https://www.douniwan.com/1.mp4">逗你玩呢</a><a href="https://www.xxx.com/2.mp4">葫芦娃</a>')

# print(res)

# print(res.group(0))

# print(res.group(1))

# print(res.group(2))

# res=re.match('abc','123abc') ## res=re.search('^abc','123abc')

# print(res)

# print(re.findall('alex','alex is alex is alex'))

# print(re.search('alex','alex is alex is alex'))

# print(re.match('alex','alex is alex is alex'))

# pattern=re.compile('alex')

# print(pattern.findall('alex is alex is alex'))

# print(pattern.search('alex is alex is alex'))

# print(pattern.match('alex is alex is alex'))

二.hashlib模块

1.什么是hash?

hash是一种算法，该算法接受一系列的数据，经过运算会得到一个hash值。

hash值具备三大特性：

1.传入的内容一样，得到的hash值一定一样，换句话说hash值一样，内容就一样。

2.如果采用的hash算法固定，无论传入的内容多大，hash值的长度是固定的。

3.hash值不可逆，就是说不能通过hash值逆推出内容。

2.为何要用hash？

特性1+2=>文件完整性的校验

特性3=>用于加密

import hashlib

m=hashlib.md5()

m.update('你好'.encode('utf-8'))

m.update('hello'.encode('utf-8'))

print(m.hexdigest()) #65c83c71cb3b2e2882f99358430679c3

m1=hashlib.md5()

m1.update('你好hello'.encode('utf-8'))

print(m1.hexdigest()) #65c83c71cb3b2e2882f99358430679c3

print(len(m1.hexdigest())) #

m2=hashlib.sha512()

m2.update(b'asdfassssssssssssssssssssssssssss')

print(m2.hexdigest())

print(len(m2.hexdigest()))

re模块、hashlib模块的更多相关文章

Python第十一天异常处理 glob模块和shlex模块打开外部程序和subprocess模块 subprocess类 Pipe管道 operator模块 sorted函数 os模块 hashlib模块 platform模块 csv模块
Python第十一天异常处理 glob模块和shlex模块打开外部程序和subprocess模块 subprocess类 Pipe管道 operator模块 sorted函 ...
Python进阶(九)----json模块, pickle模块, os模块,sys模块,hashlib模块
Python进阶----json模块, pickle模块, os模块,sys模块,hashlib模块一丶序列化模块什么是序列化: 将一种数据结构,转换成一个特殊的序列(特殊字符串,用于网络传输 ...
4-20模块序列化模块 hashlib模块
1,模块,py文件就是模块,py之所以好用就是模块多. 2,模块的分类: 1,内置模块,python 安装时自带的模块 2,扩展模块,别人写好的,需要安装之后,可以直接使用.itchat微信模块, b ...
python模块: hashlib模块, configparse模块, logging模块,collections模块
一. hashlib模块 Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等. 摘要算法又称哈希算法.散列算法.它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用 ...
python模块——hashlib模块（简单文件摘要算法实现）
#!/usr/bin/env python # -*- coding:utf-8 -*- __author__ = "loki" # Usage: hashlib模块 import ...
Python3 os模块&sys模块&hashlib模块
''' os模块非常重要的模块 ''' import os # print(os.getcwd()) # 获取当前工作目录 # os.chdir(r'路径名') # 改变当前工作目录 # print ...
0420模块序列化模块 hashlib模块
复习:内置方法 __len__ len(obj)的结果依赖于obj.__len__()的结果,计算对象的长度__hash__ hash(obj)的结果依赖于obj.__hash__()的结果,计算对象 ...
day13 函数模块之序列化 random 模块 os模块 sys模块 hashlib模块 collections模块
json import json dic = {'k1':'v1','k2':'v2','k3':'v3'} str_dic = json.dumps(dic) #序列化:将一个字典转换成一个字符串 ...
python day 8: re模块补充，导入模块,hashlib模块，字符串格式化，模块知识拾遗，requests模块初识
目录 python day 8 1. re模块补充 2. import模块导入 3. os模块 4. hashlib模块 5. 字符串格式:百分号法与format方法 6. 模块知识拾遗 7. req ...
python笔记7 logging模块 hashlib模块异常处理 datetime模块 shutil模块 xml模块（了解)
logging模块日志就是记录一些信息,方便查询或者辅助开发记录文件,显示屏幕低配日志, 只能写入文件或者屏幕输出屏幕输出 import logging logging.debug('调试模式 ...

随机推荐

SQLmap超详细文档和实例演示
第一部分,使用文档的说明 Options(选项): -h, -–help 显示此帮助消息并退出 -hh 显示更多帮助信息并退出 –-version 显示程序的版本号并退出 -v VERBOSE 详细级 ...
hdu4612 卡cin e-DCC缩点
/* 给定无向图,求加入一条边后最少剩下多少桥 */ #include<bits/stdc++.h> using namespace std; #define maxn 200005 #d ...
CentOS7+mysql（yum）
1.现在centos上默认是没有yum源的,yum安装的是 MariaDB.所以我们需要自己先配置yum源.配置yum源步骤如下: 下载yum源:wget 'https://dev.mysql.com ...
rsync注意事项
1.sudo rsync -zavP --exclude=/.git/ --exclude=.env --exclude=web/index.php --password-file=/usr/loc ...
Ubuntu下安装kate编辑器
Ubuntu下安装kate编辑器 Ubuntu 下安装kate编辑器 #sudo apt-get install kate 安装kconsole #sudo apt-get install kco ...
sqlserver text类型字段错误 net.sourceforge.jtds.jdbc.ClobImpl@66fa192的解决方法
1. SqlServer数据库中text/ntext字段,在用jtds1.2驱动时,会出现用getString()取不到值的问题,toString()也不行. 昨天查了下帮助可以通过简单的配置解决.即 ...
excel 中怎么让两列姓名相同排序（转）
如图,A列B列不动,C列和D列行值不变,以A列姓名为主让C列姓名和A列相同姓名的对齐(行),D行跟着C行不变. 在E1输入公式=MATCH(C1,A:A,0)然后下拉,接著选中C,D,E列,以E列为标 ...
SQL Server表关联
表关联:Hash.Nested Loops.Merge.这是实际算法,不是T-SQL中的inner/left/right/full/cross join.优化器会把这些T-SQL写法转换成上面的3种算 ...
Caused by: java.net.ConnectException: Connection refused: master/192.168.3.129:7077
1:启动Spark Shell,spark-shell是Spark自带的交互式Shell程序,方便用户进行交互式编程,用户可以在该命令行下用scala编写spark程序. 启动Spark Shell, ...
tomcat启动成功但是访问方面都是404
1.开发环境与错误情况开发环境是jdk1.7+maven+git+spring MVC+spring+mybatis+mysql. 楼主做小例子的时候发现,tomcat成功启动,但是访问主页,页面提 ...

re模块、hashlib模块

一.re模块

二.hashlib模块

re模块、hashlib模块的更多相关文章

随机推荐

热门专题