（一）urllib.parse：分解url

urllib.parse模块提供了一些函数，可以管理URL以及组成部分

1.解析

from urllib.parse import urlparse

'''
urlparse函数的返回值是一个ParseResult对象，其相当于一个包含6个元素的tuple
'''
url = "https://www.baidu.com/s?wd=古明地觉"
parsed = urlparse(url)
print(parsed)  # ParseResult(scheme='https', netloc='www.baidu.com', path='/s', params='', query='wd=古明地觉', fragment='')

# parsed相当于一个namedtuple
print(parsed.scheme)  # https

# urlsplit函数可以替换urlparse，但行为稍有不同，因为它不会从url分解参数
from urllib.parse import urlsplit
parsed = urlsplit(url)
# 由于没有分解参数，所以结果是5个，不是6个，因为少了params
print(parsed)  # SplitResult(scheme='https', netloc='www.baidu.com', path='/s', query='wd=古明地觉', fragment='')

# urldefrag
from urllib.parse import urldefrag
url = "https://www.baidu.com/s?wd=satori"
parsed = urldefrag(url)
print(parsed)  # DefragResult(url='https://www.baidu.com/s?wd=satori', fragment='')

2.反解析

from urllib.parse import urlparse

'''
个人觉得没啥用
'''
url = "https://www.baidu.com"
parsed = urlparse(url)
print(parsed)  # ParseResult(scheme='https', netloc='www.baidu.com', path='', params='', query='', fragment='')
# 对urlparse或urlsplit返回的对象调用geturl方法，可以得到原来的url
print(parsed.geturl())  # https://www.baidu.com

3.连接

from urllib.parse import urljoin

'''
https://www.baidu.com/img/1.jpg
但有的图片是，/img/1.jpg，主域名被自动省略了
'''
url1 = "https://www.baidu.com/img/1.jpg"
url2 = "/img/1.jpg"

print(urljoin("https://www.baidu.com", url1))  # https://www.baidu.com/img/1.jpg
print(urljoin("https://www.baidu.com", url2))  # https://www.baidu.com/img/1.jpg
# 会自动进行组合，如果包含主域名，那么会忽略。不包含，会和主域名拼接在一起

4.解码查询参数

from urllib.parse import urlencode

query_args = {"wd": "satori", "age": 16}
print(urlencode(query_args))  # wd=satori&age=16

（二）urllib.request:网络资源访问

略，建议使用第三方库requests

（三）urllib.robotparser:Internet蜘蛛访问控制

略

（四）base64：用ASCII编码二进制数据

base64模块包含一些函数可以将二进制数据转换为适合使用纯文本协议传输的ASCII的一个子集。Base64、Base32、Base16、Base85编码将8位字节转换为ASCII可打印字符范围内的字符，留出更多的位来表示数据，保证与只支持ASCII数据的系统兼容，如SMTP。base(进制)值对应各编码中使用的字母表长度。这些原始编码还有一些url安全的变形，其使用的字母表稍有不同

import base64

s = bytes("古明地觉", encoding="utf-8")
encode_data = base64.b64encode(s)
print(encode_data)  # b'5Y+k5piO5Zyw6KeJ'

bytes_s = base64.b64decode(encode_data)
print(bytes_s)  # b'\xe5\x8f\xa4\xe6\x98\x8e\xe5\x9c\xb0\xe8\xa7\x89'
print(str(bytes_s, encoding="utf-8"))  # 古明地觉

# 对于url来说，一些特殊符号要转义，所以可以使用另一个函数
url = bytes("www.baidu.com/s?wd=古明地觉", encoding="utf-8")
encode_data = base64.urlsafe_b64encode(url)
print(encode_data)  # b'd3d3LmJhaWR1LmNvbS9zP3dkPeWPpOaYjuWcsOiniQ=='
bytes_url = base64.urlsafe_b64decode(encode_data)
print(str(bytes_url, encoding="utf-8"))  # www.baidu.com/s?wd=古明地觉

（五）http.server：实现web服务器的基类

略

（六）http.cookies：HTTP cookie

略

（七）webbrowser：显示web页面

webbrowser模块包含一些函数，可以在交互式的浏览器应用中打开url。它提供了一个可用浏览器的注册表，因为系统上可能有多个可用的浏览器

import webbrowser

# 要在浏览器中打开新的页面，可以使用open函数
webbrowser.open("")

# 如果想使用一个新的窗口，可以使用open_new，否则会在已经打开的浏览器中新建标签页
# 但如果没有打开浏览器，那么这个函数和open是类似的
webbrowser.open_new("")

# 新建标签页
webbrowser.open_new_tab("")

# 使用特定的浏览器
b = webbrowser.get("")
b.open("")

（八）uuid：全局唯一标识符

1.uuid1：IEEE 802 MAC地址

import uuid

'''
UUID1值使用主机的MAC地址计算。uuid模块使用getnode函数来获取当前系统的MAC值
'''
print(uuid.getnode())  # 70561824630575
# 如果一个系统有多个网卡，那么相应地便会有多个MAC地址，并且可能返回其中任意一个值

# 要为一个主机(由其MAC地址标识)生成一个UUID，需要使用uuid1函数。节点标识符参数是可选的。如果没有设置这个域，那么便会使用getnode返回的值
u = uuid.uuid1()
print(u)
print(type(u))
print(f"bytes:{u.bytes}")
print(f"hex:{u.hex}")
print(f"int:{u.int}")
r'''
3e5fc450-51f7-11e9-ad5d-402cf47de72f
<class 'uuid.UUID'>
bytes:b'>_\xc4PQ\xf7\x11\xe9\xad]@,\xf4}\xe7/'
hex:3e5fc45051f711e9ad5d402cf47de72f
int:82909385656127884677084089467799463727
'''

2.UUID 3和5：基于名字的值

import uuid

'''
有些情况下可能需要根据名字创建UUID值，而不是根据随机值或基于时间的值来创建。
UUID 3和5规范使用密码散列值（分别使用MD5和SHA-1），将特定于命名空间的种子值与名字相结合。
'''
hostnames = ["www.baidu.com", "www.google.com"]
for name in hostnames:
    print(name)
    print("     md5 : ", uuid.uuid3(uuid.NAMESPACE_DNS, name))
    print("     sha1: ", uuid.uuid5(uuid.NAMESPACE_DNS, name))
    print()
'''
www.baidu.com
     md5 :  21aa3105-dfd8-3bca-ab6b-64ea70ff0847
     sha1:  41b0ac12-a668-57f8-9471-4bc149b12778

www.google.com
     md5 :  de87628d-5377-3ba7-b31b-cde1cc8d423f
     sha1:  488416f4-fcaf-5027-8c63-0105cfa213ea
'''

3.uuid4：随机值

import uuid

'''
一般情况下我们使用uuid4
'''
for _ in range(3):
    print(uuid.uuid4())
'''
03f6defd-db47-43fc-9a27-da8ffaeb55f6
d61a41e2-476e-42b0-b089-5e3b62a44956
1912cd31-2a53-4abc-8250-d27b4ac7da2f
'''

# 注意目前得到的都只是一个UUID对象，可以转化成字符串
u = uuid.uuid4()
print(u)  # 9c0cf417-46bc-402a-bbab-f964f867976e
print(type(u))  # <class 'uuid.UUID'>
print(type(str(u)))  # <class 'str'>

（九）json：JavaScript对象记法

略

13.Python3标准库--互联网的更多相关文章

python3标准库总结
Python3标准库操作系统接口 os模块提供了不少与操作系统相关联的函数. ? 1 2 3 4 5 6 >>> import os >>> os.getcwd( ...
Python3 标准库
Python3标准库更详尽:http://blog.csdn.net/jurbo/article/details/52334345 文本 string:通用字符串操作 re:正则表达式操作 diff ...
python023 Python3 标准库概览
Python3 标准库概览操作系统接口 os模块提供了不少与操作系统相关联的函数. >>> import os >>> os.getcwd() # 返回当前的工作 ...
8.Python3标准库--数据持久存储与交换
''' 持久存储数据以便长期使用包括两个方面:在对象的内存中表示和存储格式之间来回转换数据,以及处理转换后数据的存储区. 标准库包含很多模块可以处理不同情况下的这两个方面有两个模块可以将对象转换为一 ...
7.Python3标准库--文件系统
''' Python的标准库中包含大量工具,可以处理文件系统中的文件,构造和解析文件名,还可以检查文件内容. 处理文件的第一步是要确定处理的文件的名字.Python将文件名表示为简单的字符串,另外还提 ...
1.Python3标准库--前戏
Python有一个很大的优势便是在于其拥有丰富的第三方库,可以解决很多很多问题.其实Python的标准库也是非常丰富的,今后我将介绍一下Python的标准库. 这个教程使用的书籍就叫做<Pyth ...
比较两个文件的异同Python3 标准库difflib 实现
比较两个文件的异同Python3 标准库difflib 实现对于要比较两个文件特别是配置文件的差异,这种需求很常见,如果用眼睛看,真是眼睛疼. 可以使用linux命令行工具diff a_file b ...
3.Python3标准库--数据结构
(一)enum:枚举类型 import enum ''' enum模块定义了一个提供迭代和比较功能的枚举类型.可以用这个为值创建明确定义的符号,而不是使用字面量整数或字符串 ''' 1.创建枚举 im ...
9.Python3标准库--数据压缩与归档
''' 尽管现代计算机系统的存储能力日益增长,但生成数据的增长是永无休止的. 无损(lossless)压缩算法以压缩或解压缩数据花费的时间来换取存储数据所需要的空间,以弥补存储能力的不足. Pytho ...

随机推荐

DAVY的神龙帕夫——读者的心灵故事|十二橄榄枝的传说
再次听Puff的时候我想起了Davy. 文理分班后我坐到了他后面.Davy天生一头黄毛,黑头发”not even one”.上课时他若不是肆无忌惮地舒开四肢呼呼大睡,便是如受惊一般伸长他的细脖子,直挺 ...
Omeed 线段树
目录题面题解代码题面 2.12 - - - 题解大概还是挺妙的? 首先基础分和连击分互不干扰,所以可以分开统计. 基础分的统计比较简单,等于: \[A \sum_{i = l}^{r} p_ ...
【BZOJ4767】两双手（动态规划，容斥）
[BZOJ4767]两双手(动态规划,容斥) 题面 BZOJ 题解发现走法只有两种,并且两维坐标都要走到对应的位置去. 显然对于每个确定的点,最多只有一种固定的跳跃次数能够到达这个点. 首先对于每个 ...
AtCoder Regular Contest 086 E - Smuggling Marbles（树形迭屁）
好强的题. 方案不好算,改成算概率,注意因为是模意义下的概率所以直接乘法逆元就好不要傻傻地开double. 设$f[i][d][0]$为第i个节点离d层的球球走到第i个点时第i个点没有球的概率, $f ...
laravel5.1 关联模型保存的方法(使用associate方法)
模型定义 class User { public function customer() { return $this->hasOne('Customer'); } } class Custom ...
限制SSH远程登录用户仅能只读访问Linux中指定的目录
资料参考:http://os.51cto.com/art/201703/534895.htm 背景需求: 在TOMCAT服务器上建立一个普通帐号log_user,只能查看TOMCAT日志,不能删改任何 ...
HTML5笔记-加强版
新增的语法结构表单验证 1.新的页面结构以及宽松的语法规范:<!doctype html> <meta charset=“utf-8”/> 2.新的结构化元素:语义化标签: ...
① 设计模式的艺术-07.适配器（Adapter）模式
什么是适配器模式? 将一个类的接口转换成客户希望的另外一个接口.Adapter模式使得原本由于接口不兼容而不能一起工作的那些类可以在一起工作. 模式中的角色目标接口(Target):客户所期待的接口 ...
使用CSS3创建文字颜色渐变(CSS3 Text Gradient)
考虑一下,如何在网页中达到类似以下文字渐变的效果? 传统的实现中,是用一副透明渐变的图片覆盖在文字上.具体实现方式可参考 http://www.qianduan.net/css-gradient-te ...
Map集合的两种取出方式
Map集合有两种取出方式, 1.keySet:将Map中的键存入Set集合,利用set的迭代器来处理所有的键举例代码如下: import java.util.*; class Test { publ ...

13.Python3标准库--互联网

（一）urllib.parse：分解url

urllib.parse模块提供了一些函数，可以管理URL以及组成部分

1.解析

2.反解析

3.连接

4.解码查询参数

（二）urllib.request:网络资源访问

略，建议使用第三方库requests

（三）urllib.robotparser:Internet蜘蛛访问控制

略

（四）base64：用ASCII编码二进制数据

（五）http.server：实现web服务器的基类

略

（六）http.cookies：HTTP cookie

略

（七）webbrowser：显示web页面

webbrowser模块包含一些函数，可以在交互式的浏览器应用中打开url。它提供了一个可用浏览器的注册表，因为系统上可能有多个可用的浏览器

（八）uuid：全局唯一标识符

1.uuid1：IEEE 802 MAC地址

2.UUID 3和5：基于名字的值

3.uuid4：随机值

（九）json：JavaScript对象记法

略

13.Python3标准库--互联网的更多相关文章

随机推荐

热门专题