使用 urllib 解析 URL 链接

urllib 库还提供了 parse 模块，它定义了处理 URL 的标准接口，例如实现 URL 各部分的抽取、合并以及链接转换，常用的方法如下：

In []: from urllib.parse import urlparse, urlunparse, urlsplit, urlunsplit, urljoin, parse_qs, parse_qsl, quote, unquote

//urlparse()用于对一个URL进行分段

In []: urlparse("http://www.baidu.com/index.html;user?id=5#comment")

Out[]: ParseResult(scheme='http', netloc='www.baidu.com', path='/index.html', params='user', query='id=5', fragment='comment')

//urlunparse()用于构造一个URL

In []: urlunparse(['http', 'www.baidu.com', '/index.html', 'user', 'id=5', 'comment'])

Out[]: 'http://www.baidu.com/index.html;user?id=5#comment'

//urlsplit() 与 urlparse() 用法一致，但只运回5个结果，params 会合并到 path 中

In []: urlsplit("http://www.baidu.com/index.html;user?id=5#comment")

Out[]: SplitResult(scheme='http', netloc='www.baidu.com', path='/index.html;user', query='id=5', fragment='comment')

//urlunsplit() 与 urlunparse() 用法一致，但传入的长度必须是5个

In []: urlunsplit(['http', 'www.baidu.com', '/index.html', 'id=5', 'comment'])

Out[]: 'http://www.baidu.com/index.html?id=5#comment'

//urljoin()用于生成链接，第一个参数是基础URL，第二个参数相对URL，连结两个参数生成一个新的链接

In []: urljoin('http://www.baidu.com/', 'FAQ.html')

Out[]: 'http://www.baidu.com/FAQ.html'      

//urlencode()用于序列化GET请求参数，通常用来构造请求链接

In []: base_url = "http://www.baidu.com"

In []: params = {'name': 'Tom', 'age': }

In []: base_url + urlencode(params)

Out[]: 'http://www.baidu.comname=Tom&age=18'

//parse_qs()用于反序列化GET请求参数

In []: query = "name=Tom&age=18"

In []: parse_qs(query)

Out[]: {'name': ['Tom'], 'age': ['']}

//parse_qsl()用于将参数转化为元组组成的列表

In []: query = "name=Tom&age=18"

In []: parse_qsl(query)

Out[]: [('name', 'Tom'), ('age', '')]

//quote()用于对URL进行编码，将内容转化为URL编码的格式

In []: "http://www.baidu.com/" + quote("你好")

Out[]: 'http://www.baidu.com/%E4%BD%A0%E5%A5%BD'

//unquote()用于对URL进行解码

In []: unquote("http://www.baidu.com/%E4%BD%A0%E5%A5%BD")

Out[]: 'http://www.baidu.com/你好'

使用 urllib 解析 URL 链接的更多相关文章

js篇-解析url链接里面的参数名和参数值
项目背景是,链接为:https://paladin.pingan.com.cn/jf/?appId=PA00200000000_01_APP&id=123456#/fundRank 要求拿到: ...
Python 的 urllib.parse 库解析 URL
Python 中的 urllib.parse 模块提供了很多解析和组建 URL 的函数. 解析url urlparse() 函数可以将 URL 解析成 ParseResult 对象.对象中包含了六 ...
iOS解析新浪微博的@##以及URL链接并展示
最近在做一个跟微博相关的应用.其中涉及到了对微博中@.##以及URL链接的解析与展示.分享一下个人处理的方式,希望对需要的人有所帮助. 最终的展现效果: 首先,第一步是你得从纯文本中找到它们.毫无疑问 ...
URL链接后面的参数解析，与decode编码解码；页面刷新回到顶部jquery
function request() { var urlStr = location.search; ) { theRequest = []; return; } urlStr = urlStr.su ...
Python 网络爬虫 009 (编程) 通过正则表达式来获取一个网页中的所有的URL链接，并下载这些URL链接的源代码
通过正则表达式来获取一个网页中的所有的 URL链接,并下载这些 URL链接的源代码使用的系统:Windows 10 64位 Python 语言版本:Python 2.7.10 V 使用的编程 ...
详解Node解析URL网址
前提给大家声明一下,我操作的环境是Mac终端下操作的.(前提是你先要下载好node.js) 说道URL 恐怕都不陌生,但是要说URL,就必须先说下URI URI是统一资源标识符,是一个用于标识某一互 ...
PHP的学习--解析URL
PHP中有两个方法可以用来解析URL,分别是parse_url和parse_str. parse_url 解析 URL,返回其组成部分 mixed parse_url ( string $url [, ...
django反向解析URL和URL命名空间
django反向解析URL和URL命名空间首先明确几个概念: 1.在html页面上的内容特别是向用户展示的url地址,比如常见的超链接,图片链接等,最好能动态生成,而不要固定. 2.一个django ...
python模块之HTMLParser抓页面上的所有URL链接
# -*- coding: utf-8 -*- #python 27 #xiaodeng #python模块之HTMLParser抓页面上的所有URL链接 import urllib #MyParse ...

随机推荐

路由策略和策略路由 & route-map
今天,这个专题应用下route-map,在这个之前,有很多内容需要掌握,不是简单的制定一个路由图就可以了. -------- 本次专题理论的东西居多,但是不是复制黏贴,是加上自己的理解思想. 第一个要 ...
使用Photoshop画一个圆锥体
一.准备工作软件环境:PhotoshopCS6 实验目的:通过运用变换和选区工具,画出一个圆锥体二.实验步骤 1,新建文件 2,前景色设置为黑色,并进行填充(快捷键 Alt+Delete) 3,创 ...
SpringBoot系列九：SpringBoot服务整合（整合邮件服务、定时调度、Actuator监控）
声明:本文来源于MLDN培训视频的课堂笔记,写在这里只是为了方便查阅. 1.概念:SpringBoot 服务整合 2.背景在进行项目开发的时候经常会遇见以下的几个问题:需要进行邮件发送.定时的任务调 ...
Spring JDBC SimpleJdbcInsert类示例
org.springframework.jdbc.core.SimpleJdbcInsert类是一个多线程,可重用的对象,为将数据插入表提供了易用的功能.它提供元数据处理以简化构建基本insert语句 ...
详细分析Java中断机制[转]
1. 引言当我们点击某个杀毒软件的取消按钮来停止查杀病毒时,当我们在控制台敲入quit命令以结束某个后台服务时……都需要通过一个线程去取消另一个线程正在执行的任务.Java没有提供一种安全直接的方法 ...
Http请求的工具
1.火狐的插件 HttpRequester 安装方法:火狐浏览器的最右上角的菜单,打开附件组件 ,搜索:HttpRequester,重启火狐浏览器.在菜单栏的工具下可以看到 HttpRequester ...
MATLAB出现：错误使用 xlsread (line 251)
背景: matlab 2015b和Excel2003 方法: 改Excel的Com加载项步骤: 1 2 3 4
/文件和目录权限chmod /更改所有者和所属组chown/umask/隐藏权限lsattr/chattr
2.14 文件和目录权限chmod 2.15 更改所有者和所属组chown2.16 umask2.17 隐藏权限lsattr/chattr 文件和目录权限chmod 文件权限: r 4 ...
$(this).bind("change",itemno_change);
如果是onchange 会出错,超过3个可能就无效.
js如何获取asp.net服务器端控件的值(label,textbox,dropdownlist,radiobuttonlist等)
js如何获取asp.net服务器端控件的值(label,textbox,dropdownlist,radiobuttonlist等) 欢迎访问原稿:http://hi.baidu.com/2wixia ...

使用 urllib 解析 URL 链接

使用 urllib 解析 URL 链接的更多相关文章

随机推荐

热门专题