5.15 struct模块

  1. pack 能够把所有的数字都固定的转换成4字节

5.16 dis

  1. dis.dis 查看计算机指令

5.16 正则表达式

  1. 基础

    1. 正则表达式概念: 是一种规则(元字符,量词)

      正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。

    2. re 模块和正则表达式的关系

    re 模块本身只是用来操作正则表达式,和正则表达式一点关系都没有

    1. 应用;

    匹配字符串

    表单验证

    爬虫

  2. [ ] 字符组

    • 本身是哪一个字符,就匹配字符串中哪一个字符

    • 字符组[字符1字符2],一个字符组就代表匹配一个字符,只要这个字符出现在字符串中,那么久说明这个字符能匹配上

    • 字符中还可以使用范围

    • 所有的范围都必须遵循ascii码从小到大来指定

  3. 元字符

    1. \ 转义符 可以转义所有

      \ d (digit) 能匹配所有0-9之间的数字

      \w (word) 能匹配大小写字母,数字,下划线

      \s (space) 能匹配 空白 空格 换行符 制表符

      \ t (table) 只能匹配制表符

      \ n (next) 只能匹配换行符

    1. \D 表示除 数字所有

      \W 表示除 大小写字母,数字,下划线 的所有

      \S 表示除 空白 空格 换行符 制表符 的所有

    1. [\d\D] [\w\W] [\s\S] 能表示一切字符

      . 表示除换行符之外的任意内容

    1. [ ] 字符组只要在中括号内的所有字符都符合规则的字符

      [ ^ ] 字符组只要在中括号内的所有字符都不符合规则的字符

    2. ^ 表示一个字符,只匹配一个开头

      $ 表示一个字符的结束

      ^abc$ 表示约束以a开头,c结尾

    3. | 或 表示两个规则哟重叠的部分,总是长的在前面,短的在后面

      () 分组 表示给一部分正则规定为一组,| 这个符号的作用域就可以缩小了

  4. 量词

    1. { n } 表示只能出现n次

      { n, } 表示至少出现n次

      { n,m } 表示至少出现n次,至多出现m次

    2. ? 表示匹配0次或者1次,可有可无但是又只能有1个

      + 表示匹配一次或者多次

      * 表示匹配0次或者多次,可有可无但是有可以有多个

  5. 默认贪婪匹配:总是会在符合量词条件的范围为尽量多的匹配

    非贪婪匹配(惰性匹配):总是会匹配符合条件范围内尽量小的字符串

    元字符 量词 ?x 表示元字符规则在量词范围内匹配,一遇到x就会停止

    . * ? x 表示匹配任意的内容多次遇到X就会立即停止

    1. 元字符

    2. 元字符量词

    3. 元字符量词?

    4. \d+?x .*?x 爬虫

5.17 异常处理

  1. 基本格式

    try:
       pass
    except Exception as e:
       pass
    • 练习

      try:
         v = []
         v[11111] # IndexError
      except ValueError as e:
         pass
      except IndexError as e:
         pass
      except Exception as e:
         print(e) # e是Exception类的对象,中有一个错误信息。
      finally:
         print('最后无论对错都会执行')
      # 练习一
      import requests

      try:
      ret = requests.get('http://www.google.com')
      print(ret.text)
      except Exception as e:
      print('请求异常') # 练习二
      def func(a):
      try:
      return a.strip()
      except Exception as e:
      pass
      return False

      v = func('alex')
      if not v:
      print('函数执行失败')
      else:
      print('结果是',v)
    • 练习题

      # 1. 写函数,函数接受一个列表,请将列表中的元素每个都 +100
      def func(arg):
      result = []
      for item in arg:
      if item.isdecimal():
      result.append(int(item) + 100)
      return result

      # 2. 写函数去,接受一个列表。列表中都是url,请访问每个地址并获取结果。
      import requests
      def func(url_list):
      result = []
      try:
      for url in url_list:
      response = requests.get(url)
      result.append(response.text)
      except Exception as e:
      pass
      return result

      def func2(url_list):
      result = []
      for url in url_list:
      try:
      response = requests.get(url)
      result.append(response.text)
      except Exception as e:
      pass
      return result

      func(['http://www.baidu.com','http://www.google.com','http://www.bing.com'])
  1. 主动触发异常

    try:
       int('123')
       raise Exception('阿萨大大是阿斯蒂') # 代码中主动抛出异常
    except Exception as e:
       print(e)
       
       
    # 实例
    def func():
       result = True
       try:
           with open('x.log',mode='r',encoding='utf-8') as f:
               data = f.read()
           if 'alex' not in data:
               raise Exception()
       except Exception as e:
           result = False
       return result
  2. 自定义异常

    # 实例一
    class MyException(Exception):
       pass

    try:
       raise MyException('asdf')
    except MyException as e:
       print(e)
       
    # 实例二
    class MyException(Exception):
       def __init__(self,message):
           super().__init__()
           self.message = message

    try:
       raise MyException('asdf')
    except MyException as e:
       print(e.message)

    总结

    函数高级 5*

    • 嵌套

    • 装饰器

    模块分类和定义 4*

    • 内置模块

      • os

      • sys

      • ...

    • 第三方

      • requests

      • xlrd

    • 自定义模块

      • 文件

      • 文件夹 + init.py【包】

    导入模块

    • sys.path

    • 导入

      • import

      • from xx.xxx import xx

第五章 模块之 struct、dis、正则表达式、异常处理的更多相关文章

  1. 第五章 模块之 logging、copy、re

    5.12 logging 日志模块 报警等级 CRITICAL = 50 # 最高FATAL = CRITICALERROR = 40WARNING = 30WARN = WARNINGINFO = ...

  2. Python学习系列----第五章 模块

    5.1 如何引入模块 在Python中用关键字import来引入某个模块,比如要引用模块math,就可以在文件最开始的地方用import math来引入.在调用math模块中的函数时,必须这样引用: ...

  3. 第五章 模块之random 、hashlib、time /datetime

    5.2 random 返回随机生成的一个实数 random.randint() 返回随机生成的一个实数 import random #调用模块​def get_random_code(length=6 ...

  4. 第五章 模块之 shtil 、 json / pickle、importlib、collections

    5.8 shtil 高级的 文件.文件夹.压缩包 处理模块 shutil.rmtree 删除目录 import shutilshutil.rmtree(path) shutil.move 重命名:移动 ...

  5. 第五章 模块之 getpass、sys、os

    5.5 getpass 密码不显示(只能在终端运行) 密码不显示(只能在终端运行) import getpass​pwd = getpass.getpass('请输入密码:')if pwd == '1 ...

  6. 进击的Python【第五章】:Python的高级应用(二)常用模块

    Python的高级应用(二)常用模块学习 本章学习要点: Python模块的定义 time &datetime模块 random模块 os模块 sys模块 shutil模块 ConfigPar ...

  7. Python第五章__模块介绍,常用内置模块

    Python第五章__模块介绍,常用内置模块 欢迎加入Linux_Python学习群  群号:478616847 目录: 模块与导入介绍 包的介绍 time &datetime模块 rando ...

  8. 简学Python第五章__模块介绍,常用内置模块

    Python第五章__模块介绍,常用内置模块 欢迎加入Linux_Python学习群  群号:478616847 目录: 模块与导入介绍 包的介绍 time &datetime模块 rando ...

  9. python爬虫主要就是五个模块:爬虫启动入口模块,URL管理器存放已经爬虫的URL和待爬虫URL列表,html下载器,html解析器,html输出器 同时可以掌握到urllib2的使用、bs4(BeautifulSoup)页面解析器、re正则表达式、urlparse、python基础知识回顾(set集合操作)等相关内容。

    本次python爬虫百步百科,里面详细分析了爬虫的步骤,对每一步代码都有详细的注释说明,可通过本案例掌握python爬虫的特点: 1.爬虫调度入口(crawler_main.py) # coding: ...

随机推荐

  1. 范仁义html+css课程---1、html基本结构

    范仁义html+css课程---1.html基本结构 一.总结 一句话总结: html标签中包含head标签和body标签,head标签里面主要写用户不可见的内容,比如字符集编码,body标签里面主要 ...

  2. WINDOWS和LINUX相互传文件WINSCP

    WINDOWS和LINUX相互传文件WINSCP 下载并安装WINSCP程序. 左边是WINDOWS文件目录,右边是LINUX目录,选中文件,鼠标拖曳就可以传文件,非常方便.

  3. ntpd服务

    yum -y install ntp 服务器端 [root@ip-172-31-6-148~]# vim /etc/ntp.conf ...# Use public servers from thep ...

  4. flutter PopupMenuButton弹出式菜单列表

    import 'package:flutter/material.dart'; class PopupMenuButtonDemo extends StatefulWidget { @override ...

  5. ubuntu 防火墙打开关闭

    1.查看防火墙状态 sudo ufw status 2.打开防火墙 sudo ufw enable 3.关闭防火墙 sudo ufw disable

  6. declaration of 'int ret' shadows a parameter

    定义的变量名称重复, 例如: int look_up_max(int m, int n) {   int m; //... return m; }

  7. dapperHelper

    public class DapperHelper { /// 数据库连接名 private static string _connection = string.Empty; /// 获取连接名 p ...

  8. Spring cloud微服务安全实战-6-7jwt改造总结

    限流的改造. 同样注意,不要声明成Spring的Bean 在上面声明Rateliiter 如果能获取到权限继续往下走,没权限就返回,to many request的错误信息. 加到过滤器链上 加载Sp ...

  9. 查看所使用的Linux系统是32位还是64 位的方法

    方法一:getconf LONG_BIT # getconf LONG_BIT 1 1 我的Linux是32位!!! 方法二:arch # arch 1 1 显示 i686 就是32位,显示 x86_ ...

  10. 【微信开发】微信小程序通过经纬度计算两地距离php代码实现

    需求: 要求做个根据用户当前位置获取周围商家地址,并且按照由近到远排序, 方法一: 代码层实现 封装方法: /** * @desc 根据两点间的经纬度计算距离 * @param float $lat ...