内容梗概: 1. 正则表达式 2. re模块的使⽤ 3. 一堆练习正则表达式是对字符串串操作的一种逻辑公式. 我们一般使用正则表达式对字符串进行匹配和过滤.使用正则的优缺点: 优点: 灵活,功能性强,逻辑性强. 缺点: 上手难.一旦上手,会爱上这个东西正则表达式由普通字符和元字符组成. 普通字符包含大小写字母,数字.\在匹配普通字符的时候我们直接写就可以了元字符(重点): 元字符才是正则表达式的灵魂. 元字符中的内容太多了了, 在这⾥里里我们只介绍⼀一些常⽤用的.1. 字符组 字符组很简单⽤用[…
十七. Python基础(17)--正则表达式 1 ● 正则表达式 定义: Regular expressions are sets of symbols that you can use to create searches for finding and replacing patterns of text. 零宽断言(zero width assertion): 零宽断言--不是去匹配字符串文本,而是去匹配位置(开头, 结尾也是位置). 常见的: ① 起始位置^(单行)和/A(多行), ②…
Java基础七-正则表达式 一.定义: 特定的符号的组合 二.作用: 用于操作字符串数据 三.优缺点 简化代码,但是阅读性差 四.引入 4.1 问题 判断一个号码是否是QQ号? 不是零开头 6-15位 只含有数字 4.2 代码 int len = qq.length(); if(len>=5 && len<=15){ if(!qq.startsWith("0")){ try { long l = Long.parseLong(qq); System.out.…
第一周学习笔记: 一.Python介绍      1.Python的创始人为吉多·范罗苏姆.1989年的圣诞节期间,吉多·范罗苏姆为了在阿姆斯特丹打发时间,决心开发一个新的脚本解释程序,作为ABC语言的一种继承.  最新的TIOBE排行榜,Python赶超PHP占据第五, Python崇尚优美.清晰.简单,是一个优秀并广泛使用的语言. 2.Python主要应用领域:云计算.WEB开发.科学运算.人工智能.系统运维.金融.图形GUI. 3.Python是一门动态解释性的强类型定义语言. 4.Pyt…
本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例.本文的内容不包括如何编写高效的正则表达式.如何优化正则表达式,这些主题请查看其他教程. 注意:本文基于Python2.4完成:如果看到不明白的词汇请记得百度谷歌或维基,whatever. 尊重作者的劳动,转载请注明作者及原文地址 >.<html 1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分.正则表达式是用于处理字符串的强大工具,拥有自己独特的语法…
模块初识 一般把不同功能代码放到不同py文件,一个py文件就是一个模块 三种模块库: 1.Python标准库 2.第三方库 3.自定义库 导入模块:import 库名 (Python解释器只认识执行文件的路径(sys.path),导入自定义库时也只会从执行文件的路径开始找) 两个效果:1.先执行模块所有代码 2.引入变量名 引入多个模块:import a,b,c 在调用模块下方法时,不建议 from a import *  (全部引入)这么写可能会与自己当前定义的函数冲突 包: 用来组织模块,避…
模块(module) 模块,用一坨代码实现了某个功能的代码集合 类似于函数式编程和面向过程编程,函数式编程则完成一个功能,其他代码用来调用即可,提供了代码的重用性和代码间的耦合.而对于一个复杂的功能来说,可能需要多个函数才能完成(函数又可以再不同的.py文件中),n个.py文件组成的戴安集合就称为模块 使用模块有什么好处? 最大的好处是大大提高了代码的可维护性. 其次,编写代码不必从零开始.当一个模块编写完毕,就可以被其他地方引用.我们在编写程序的时候,也经常引用其他模块,包括Python内置的…
本文地址:http://www.cnblogs.com/archimedes/p/python-modules.html,转载请注明源地址. 模块简介 如果你退出 Python 解释器重新进入,以前创建的一切定义(变量和函数)就全部丢失了.因此,如果你想写一些长久保存的程序,最好使用一个文本编辑器来编写程序,把保存好的文件输入解释器.我们称之为创建一个脚本.程序变得更长一些了,你可能为了方便维护而把它分离成几个文件.你也可能想要在几个程序中都使用一个常用的函数,但是不想把它的定义复制到每一个程序…
正则表达式语法 正则表达式 (或 RE) 指定一组字符串匹配它;在此模块中的功能让您检查一下,如果一个特定的字符串匹配给定的正则表达式 (或给定的正则表达式匹配特定的字符串,可归结为同一件事). 正则表达式可以连接到形式新的正则表达式; 如果A 和 B 两个都是正则表达式, 那么 AB i也是正则表达式. 本模块提供了类似于那些在 Perl 中找到的正则表达式匹配操作. 两个模式和字符串被搜索可以是Unicode字符串以及8位串.然而,Unicode字符串和8位串不能混用:也就是说,你不能匹配一…
简介 就其本质而言,正则表达式是内嵌在python内,由re模块实现,小型的专业化语言,最后由c写的匹配引擎执行.正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串.将匹配的子串做替换或者从某个串中取出符合某个条件的子串等. 正则的字符分为普通字符和元字符,普通字符比如“aaa”等,元字符是 . ^ $ * + ? () [] {} | \ 这里它们都有特殊的含义 判断一个字符串或者字符是否在另一个字符串内,如果是以列表形式返回这个这…
本课主题 反射 Mapping 介绍和操作实战 模块介绍和操作实战 random 模块 time 和 datetime 模块 logging 模块 sys 模块 os 模块 hashlib 模块 re 模块 本周作业 反射 Mapping 介绍和操作实战 反射是利用字符串的形式去对象 (模块) 中操作 (寻找/检查/删除/设置) 成员,以後看其他源碼的時候會經常看到反射,最有代表性的就是 Tornado 和 Django 框架 案例例子 假设创建了一个common.py,程序里有3个功能,比如网…
一. 正则表达式 使用python的re模块之前应该对正则表达式有一定的了解 正则表达式是对字符串操作的一种逻辑公式.我们一般使用正则表达式对字符串进行匹配和过滤. 正则的优缺点: 优点:灵活, 功能性强, 逻辑性强. 缺点:上手难,但一旦学会这东西非常好用 # 正则表达的组成:普通字符.元字符.限定符 普通字符不用说的,就是常用的字母,数字,汉字这些 ##贪婪匹配 .*    点星 表示尽可能多的匹配 ## 惰性匹配 .*?  点星问号 尽可能少的匹配 ##  转义 对 “\” 进行转义可以用…
很多程序都有记录日志的需求,并且日志中包含的信息既有正常的程序访问日志,还可能有错误.警告等信息输出,python的logging模块提供了标准的日志接口,你可以通过它存储各种格式的日志,主要用于输出运行日志,可以设置输出日志的等级.日志保存路径.日志文件回滚等: 使用logging的优势: a)你可以控制消息的级别,过滤掉那些并不重要的消息. b)你可决定输出到什么地方,以及怎么输出.有许多的重要性别级可供选择,debug.info.warning.error 以及 critical.通过赋予…
下图列出了Python支持的正则表达式元字符和语法: 字符点:匹配任意一个字符 import re st = 'python' result = re.findall('p.t',st) print(result) 字符^:匹配以什么开头 import re st = 'python' result = re.findall('^py',st) print(result) 字符$:匹配以什么结尾 import re st = 'python' result = re.findall('n$',s…
随机数参与的应用场景大家一定不会陌生,比如密码加盐时会在原密码上关联一串随机数,蒙特卡洛算法会通过随机数采样等等.Python内置的random模块提供了生成随机数的方法,使用这些方法时需要导入random模块. import random 下面介绍下Python内置的random模块的几种生成随机数的方法. 1.random.random() 随机生成 0 到 1 之间的浮点数[0.0, 1.0) . print("random: ", random.random()) #rando…
Python 函数 函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段. 函数能提高应用的模块性,和代码的重复利用率.你已经知道Python提供了许多内建函数,比如print().但你也可以自己创建函数,这被叫做用户自定义函数. 定义一个函数 你可以定义一个由自己想要功能的函数,以下是简单的规则: 函数代码块以 def 关键词开头,后接函数标识符名称和圆括号(). 任何传入参数和自变量必须放在圆括号中间.圆括号之间可以用于定义参数. 函数的第一行语句可以选择性地使用文档字符串—用于…
一,介绍 正则表达式(RE)是一种小型的,高度专业化的编程语言,在python中它内嵌在python中,并通过re模块实现.正则表达式模式被编译成一系列的字节码,然后由C编写的匹配引擎执行. 字符匹配(普通字符,元字符): 1 普通字符:大多数字符和字母都会和自身匹配              >>> re.findall('alex','yuanaleSxalexwupeiqi')                      ['alex'] 2 元字符:. ^ $ * + ? { }…
正则表达式 就其本质而言,正则表达式(或 re)是一种小型的.高度专业化的编程语言,(在Python中)它内嵌在Python中,并通过 re 模块实现.正则表达式模式被编译成一系列的字节码,然后由用 C 编写的匹配引擎执行. 字符匹配(普通字符,元字符): 1 普通字符(完全匹配):大多数字符和字母都会和自身匹配 1 >>> import re 2 >>> res='hello world good morning' 3 >>> re.findall(…
1.正则表达式 正则表达式:是字符串的规则,只是检测字符串是否符合条件的规则而已 1.检测某一段字符串是否符合规则 2.将符合规则的匹配出来re模块:是用来操作正则表达式的 2.正则表达式组成 字符组:[] 一个字符组描述的是一个位置上的字符规则,但是不能从大到小来规定范围,字符组内所有的范围都是ascii来排序的,字符组更灵活一点 [0-9] 匹配一个数字范围 [a-z] 匹配一个小写字母 [A-Z] 匹配一个大写字母 [A-Za-z0-9] 匹配英文字母和大小写 左边必须是ascii最小的…
正则表达式爬虫应用(校花网) 1 import requests 2 import re 3 import json 4 #定义函数返回网页的字符串信息 5 def getPage_str(url): 6 page_string=requests.get(url) 7 return page_string.text 8 9 hua_dic={} 10 def run_re(url): #爬取名字.学校和喜爱的人数 11 hua_str=getPage_str(url) 12 hua_list=r…
import os """ 通过文件的路径去打开文件 相对路径:相对当前的工作路径去定位文件位置 .:代表当前路径 ..:代表上一级路径(父级路径) 绝对路径:相对于电脑的根目录来进行定位 绝对路径:相对于电脑的根目录来进行定位(windows下面就是根目录) 电脑放在别的电脑还可以继续使用,需要用到OS模块 通过OS模块处理绝对路径 通过OS模块构造文件的绝对路径 os.path.dirname:获取路径的父级目录 os.path.join方法:做路径拼接 os其他方法:…
python正则表达式 引入一个强大的匹配功能来匹配字符串 import re 正则表达式的表示类型raw string类型(原生字符串类型) r'sa\\/sad/asd'用r转为raw string类型字符串类型,string类型,所以当正则表达式中出现<转义符>建议使用raw string 正则表达式方法 import re#导入模块 test = "oihAdoiahsd213ihf(*TY(&GHW" match 从一个字符串的开始位置起匹配正则,返回ma…
re 正则表示式 正则表达式(或 RE)是一种小型的.高度专业化的编程语言,(在Python中)它内嵌在Python中,并通过 re 模块实现.正则表达式模式被编译成一系列的字节码,然后由用 C 编写的匹配引擎执行. 一.正则表达式的作用1.给字符串进行模糊匹配,2.对象就是字符串 二.字符匹配(普通字符,元字符)1.普通字符:数字字符和英文字母和自身匹配2.元字符:. ^ $ * + ? {} [] () | \re.方法("规则","匹配的字符串"). 匹配任意…
正则表达式 一简介:就其本质而言,正则表达式(或RE)是一种小型的.高度专业化的标称语言,(在Python中)它内嵌在Python中,并通过re模块实现.正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行. 先导入后执行:import re 二.字符匹配: 字符匹配(普通字符,元字符):普通字符:大多数字符和字母都会和自身匹配 >>> re.findall('alex','yuanaleSxalexwupeiqi') ['alex'] 2元字符:. ^ $ * + ? {…
第一章 快速改造:基础知识 01:整除.乘方 (Python3.0之前 如2.7版本) >>> 1/2 ==>0 1/2整除,普通除法: 解决办法1: 1.0/2.0  ==>0.5 解决办法2:from _future_ import division 1/2  ==>0.5 // 表示整除 >>>1//2 ==>0 浮点数//浮点数,结果依然是整除结果 >>>1.0//2.0 ==>0.0 实际操作截图: ** 表示乘…
参考博客:https://www.cnblogs.com/tina-python/p/5508402.html 这里说一下python的re模块即正则表达式模块,先列出其中涉及到的各种字符和模式等: 一.字符: 二.re.sub(pattern , repl , string)格式说明: pattern:即正则化的格式,一般是 :   r'.....'   : string: 源字符串: repl:我们用repl字符串来替换使用pattern在string匹配到的部分: 同时,该函数返回的也是匹…
一. python简介 1. python 具有丰富强大的库,常被称为胶水语言,能够把用其他语言制作的各种模块很轻松地联结在一起 2. python强制使用空白符(white space)作为语句缩进. 3. 可以使用 py2exe等包转换成系统能够执行的文件. 4. Python的瓶颈不在于自身语言的运行时间,在于一些网络速度等外在因素的影响. 二. Python库 1. python版本 常用的有2.7和3.5两个版本,这两个版本不完全兼容.但就目前Windows的环境而言,Python2.…
一.正则表达式re python中re模块提供了正则表达式相关操作 字符: . 匹配除换行符以外的任意字符 \w 匹配字母或数字或下划线或汉字 \s 匹配任意的空白符 \d 匹配数字 \b 匹配单词的开始或结束 ^ 匹配字符串的开始 $ 匹配字符串的结束 次数: * 重复零次或更多次 + 重复一次或更多次 ? 重复零次或一次 {n} 重复n次 {n,} 重复n次或更多次 {n,m} 重复n到m次 模式 描述 ^ 匹配字符串的开头 $ 匹配字符串的末尾. . 匹配任意字符,除了换行符,当re.DO…
1. 模块 在python中一个文件可以被看成一个独立模块,而包对应着文件夹,模块把python代码分成一些有组织的代码段,通过导入的方式实现代码重用. 1.1 模块搜索路径 导入模块时,是按照sys.path变量的值搜索模块,sys.path的值是包含每一个独立路径的列表,包含当前目录.python安装目录.PYTHONPATH环境变量,搜索顺序按照路径在列表中的顺序(一般当前目录优先级最高). >>> import sys >>> sys.path ['', 'E:…
一.内存管理 1.垃圾回收机制 不能被程序访问到的数据,就称之为垃圾. 1.1.引用计数 引用计数是用来记录值的内存地址被记录的次数的. 每一次对值地址的引用都使该值的引用计数+1:每一次对值地址的释放都使其引用计数-1:当一个值的引用计数为0时,就会被系统的垃圾回收机制回收. 1.2.循环导入: # 循环引用,内存泄漏 ls1 = [666] ls2 = [888] ls1.append(ls2) ls2.append(ls1) print(ls1) # [666, [888, [...]]]…