Python编程系列---获取请求报文行中的URL的几种方法总结

在浏览器访问web服务器的时候,服务器收到的是一个请求报文,大概GET请求的格式大概如下:

先随便拿到一个请求报文,蓝色即为我们要获取的

GET /index.html HTTP/1.1
Host: www.baidu.com
Connection: keep-alive
Cache-Control: max-age=0
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3528.4 Safari/537.36
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8

方法一:使用正则表达式中的match方法

 import re

 request = """GET /index.html HTTP/1.1

 Host: www.baidu.com

 Connection: keep-alive

 Cache-Control: max-age=0

 Upgrade-Insecure-Requests: 1

 User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3528.4 Safari/537.36

 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8

 Accept-Encoding: gzip, deflate, br

 Accept-Language: zh-CN,zh;q=0.9,en;q=0.8

 """

 # 将上面的请求报文以行的形式分割返回一个列表

 request_lines = request.splitlines()

 # 方法一:使用正则表达式中的match方法

 #      [^/]+ 不以/开头的至少一个字符 匹配到/之前

 #      (/[^ ]*) 以分组来匹配第一个字符是/,然后不以空格开始的0到多个字符,也就是空格之前

 #      最后通过匹配可以拿到 请求的路径名  比如:index.html

 ret = re.match(r"[^/]+(/[^ ]*)", request_lines[0])

 print("使用正则表达式中的match方法结果为:",ret.group(1))

 结果如下:

 使用正则表达式中的match方法结果为: /index.html

 Process finished with exit code 0

方法二:使用正则表达式中的spilt方法

 import re

 1 request = """GET /index.html HTTP/1.1

 Host: www.baidu.com

 Connection: keep-alive

 Cache-Control: max-age=0

 Upgrade-Insecure-Requests: 1

 User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3528.4 Safari/537.36

 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8

 Accept-Encoding: gzip, deflate, br

 Accept-Language: zh-CN,zh;q=0.9,en;q=0.8

 """

 # 将上面的请求报文以行的形式分割返回一个列表

 request_lines = request.splitlines()

 # 方法二:使用正则表达式中的spilt方法

 ret2 = re.split(" ",request_lines[0])

 print("使用正则表达式中的spilt方法的结果为:",ret2[1])

 结果如下:

 使用正则表达式中的spilt方法的结果为: /index.html

 Process finished with exit code 0

方法三:使用字符串分割的方法

 request = """GET /index.html HTTP/1.1

 Host: www.baidu.com

 Connection: keep-alive

 Cache-Control: max-age=0

 Upgrade-Insecure-Requests: 1

 User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3528.4 Safari/537.36

 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8

 Accept-Encoding: gzip, deflate, br

 Accept-Language: zh-CN,zh;q=0.9,en;q=0.8

 """

 # 将上面的请求报文以行的形式分割返回一个列表

 request_lines = request.splitlines()

 # 方法三:使用字符串分割的方法

 str = request_lines[0].split() # 或者.spilt(" ",2)

 url_str = str[1]

 print("使用字符串spilt分割的方法:",url_str)

 结果如下:

 使用字符串spilt分割的方法: /index.html

 Process finished with exit code 0

如果你和我有共同爱好,我们可以加个好友一起交流哈!

Python编程系列---获取请求报文行中的URL的几种方法总结的更多相关文章

shell编程系列16--文本处理三剑客之awk模式匹配的两种方法
shell编程系列16--文本处理三剑客之awk模式匹配的两种方法 awk的工作模式第一种模式匹配:RegExp 第二种模式匹配:关系运算匹配用法格式对照表语法格式含义 RegExp 按正则表 ...
VS编程，WPF单独更改TextBlock中部分文字格式的一种方法
原文:VS编程,WPF单独更改TextBlock中部分文字格式的一种方法版权声明:我不生产代码,我只是代码的搬运工. https://blog.csdn.net/qq_43307934/articl ...
Openerp 中打开 URL 的三种方法
来自:http://shine-it.net/index.php/topic,8013.0.html 最近总结了,Openerp 中打开 URL 的三种方法: 一.在form view 添加 < ...
python中执行shell的两种方法总结
这篇文章主要介绍了python中执行shell的两种方法,有两种方法可以在Python中执行SHELL程序,方法一是使用Python的commands包,方法二则是使用subprocess包,这两个包 ...
php获取数组中重复数据的两种方法
分享下php获取数组中重复数据的两种方法. 1,利用php提供的函数,array_unique和array_diff_assoc来实现 <?php function FetchRepeatMem ...
WPF编程，C#中对话框自动关闭的一种方法。
原文:WPF编程,C#中对话框自动关闭的一种方法. 版权声明:我不生产代码,我只是代码的搬运工. https://blog.csdn.net/qq_43307934/article/details/8 ...
从加载DLL的中获取放置于Resources文件夹中资源字典的几种方法
原文:从加载DLL的中获取放置于Resources文件夹中资源字典的几种方法主程序为 Main_Test.exe 被加载的DLL 为 Load_Test.dll 此DLL 中有一个文件夹Re ...
转 mysql mysql命令行中执行sql的几种方式总结
https://www.jb51.net/article/96394.htm 1.直接输入sql执行 MySQL> select now(); +---------------------+ | ...
JS基础入门篇（三）—使用JS获取页面中某个元素的4种方法以及之间的差别（一）
1.使用JS获取页面中某个元素的4种方法 1.通过id名获取元素 document.getElementById("id名"); 2.通过class名获取元素 document.g ...

随机推荐

41 (OC)* OC的理解与动态特性
1:动态类型(Dynamic typing),动态绑定(Dynamic binding)和动态加载(Dynamic loading). 动态类型:即运行时再决定对象的类型.简单说就是id类型.id类型 ...
【linux】【Zookeeper】Centos7安装Zookeeper-3.5.5
一 .下载zookeeper wget http://mirror.bit.edu.cn/apache/zookeeper/zookeeper-3.5.5/apache-zookeeper-3.5.5 ...
Tomcat启动报错java.lang.ClassNotFoundException: javax.el.ExpressionFactory
严重: Context initialization failedorg.springframework.beans.factory.BeanCreationException: Error crea ...
[AspNetCore 3.0] 在RazorPages/MVC 中使用 Blazor (Razor组件)
开发环境 Vs2019 16.3.1 dotnetcore 3.0 一.开始新建webapp项目 dotnet new webapp -o projectname 或Vs 中新建项目选择 Web应用 ...
手把手教你Pytest+Allure2.X定制报告详细教程，给自己的项目量身打造一套测试报告-02（非常详细，非常实用）
简介前边一篇文章是分享如何搭建pytest+Allure的环境,从而生成一份精美的.让人耳目一新的测试报告,但是有的小伙伴或者童鞋们可能会问,我能不能按照自己的想法为我的项目测试结果量身打造一份属于 ...
Cisco交换机基本使用命令
作者:小啊博 QQ:762641008 转载请声明URL:https://www.cnblogs.com/-bobo/ 一.进入命令行 switch> ...
idea设置方法或常量字段上浮显示对应的注释内容
1.进入idea中,如下图进入设置如图勾选并设置显示延迟时间打开文件进行鼠标移动测试可以看到鼠标移动到字段常量或方法上时显示了对应的注释类容
java跬步积累
1.eclipse自动生成get/set方法快捷键 alt+shift+s +r 2.eclipse自动生成等号左边快捷键将光标移到:号右边,然后按Ctrl+1 3.补全代码快捷键 Alt+/ 4. ...
C#2匿名方法中的捕获变量
乍一接触"匿名方法中的捕获变量"这一术语可能会优点蒙,那什么是"匿名方法中的捕获变量"呢?在章节未开始之前,我们先定义一个委托:public delegate ...
at,crontab例行性任务
at:仅执行一次就结束的调度命令 at [-mldvc] TIME -m:当at的工作完成后,即使没有输出信息,也会以email的方式通知用户工作已完成 -l:相当于atq,列出系统上所有该用户的at ...