python 中使用 urllib2 伪造 http 报头的2个方法

方法1、

#!/usr/bin/python

# -*- coding: utf-8 -*-

#encoding=utf-8

#Filename:urllib2-header.py

import urllib2

import sys

#抓取网页内容-发送报头-1

url= "http://www.jb51.net"

send_headers = {

'Host':'www.jb51.net',

'User-Agent':'Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0',

'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',

'Connection':'keep-alive'

}

req = urllib2.Request(url,headers=send_headers)

r = urllib2.urlopen(req)

html = r.read() #返回网页内容

receive_header = r.info() #返回的报头信息

# sys.getfilesystemencoding()

html = html.decode('utf-8','replace').encode(sys.getfilesystemencoding()) #转码:避免输出出现乱码

print receive_header

# print '####################################'

print html

方法2、

#!/usr/bin/python

# -*- coding: utf-8 -*-

#encoding=utf-8

#Filename:urllib2-header.py

import urllib2

import sys

url = 'http://www.jb51.net'

req = urllib2.Request(url)

req.add_header('Referer','http://www.jb51.net/')

req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0')

r = urllib2.urlopen(req)

html = r.read()

receive_header = r.info()

html = html.decode('utf-8').encode(sys.getfilesystemencoding())

print receive_header

print '#####################################'

print html

python 中使用 urllib2 伪造 http 报头的2个方法的更多相关文章

python中使用urllib2伪造HTTP报头的2个方法
在采集网页信息的时候,经常需要伪造报头来实现采集脚本的有效执行下面,我们将使用urllib2的header部分伪造报头来实现采集信息方法1. ? 1 2 3 4 5 6 7 8 9 10 11 1 ...
python中urllib, urllib2,urllib3, httplib,httplib2, request的区别
permike原文python中urllib, urllib2,urllib3, httplib,httplib2, request的区别若只使用python3.X, 下面可以不看了, 记住有个ur ...
在python中创建列表的最佳和/或最快方法
在python中,据我所知,至少有3到4种方法来创建和初始化给定大小的列表: 简单循环append: my_list = [] for i in range(50): my_list.append(0 ...
为什么Python中称__lt__、__gt__等为“富比较”方法
Python中基类object提供了一系列可以用于实现同类对象进行"比较"的方法,可以用于同类对象的不同实例进行比较,包括__lt__.__gt__.__le__.__ge__._ ...
第14.12节 Python中使用BeautifulSoup解析http报文：使用select方法快速定位内容
一. 引言在<第14.10节 Python中使用BeautifulSoup解析http报文:html标签相关属性的访问>和<第14.11节 Python中使用BeautifulSo ...
python中 urllib, urllib2, httplib, httplib2 几个库的区别
转载摘要: 只用 python3, 只用 urllib 若只使用python3.X, 下面可以不看了, 记住有个urllib的库就行了 python2.X 有这些库名可用: urllib, urll ...
Python中的urllib2模块解析
Name urllib2 - An extensible library for opening URLs using a variety of protocols 1. Description Th ...
python中List添加、删除元素的几种方法
一.python中List添加元素的几种方法 List 是 Python 中常用的数据类型,它一个有序集合,即其中的元素始终保持着初始时的定义的顺序(除非你对它们进行排序或其他修改操作).在Pytho ...
Python中各种括号的区别、用途及使用方法
python语言最常见的括号有三种,分别是:小括号( ).中括号[ ]和大括号也叫做花括号{ }.其作用也各不相同,分别用来代表不同的python基本内置数据类型. python中的小括号( ):代表 ...

随机推荐

退出telnet 命令
很多时候 telnet 完就无法退出了,ctrl+c 有时也无法退出后来找到了正确的命令 ctrl+] 然后在telnet 命令行输入 quit 就可以退出了
第1章WCF简介（WCF全面解析读书笔记2）
第1章 WCF简介面向服务架构(SOA)是近年来备受业界关注的一个主题,它代表了软件架构的一种方向.顺应SOA发展潮流,微软于2006年年底推出了一种新的分布式通信框架Windows Communi ...
使用火狐浏览器访问双向认证的k8s api
首先不能在火狐里对要访问的网址添加例外打开选项->高级->查看证书->证书机构->导入.先择服务端ca.crt后根据提示导入证书生成p12文件 openssl pkcs ...
Apache Hive （七）Hive的DDL操作
转自:https://www.cnblogs.com/qingyunzong/p/8723271.html 库操作 1.创建库语法结构 CREATE (DATABASE|SCHEMA) [IF NO ...
java基础之日期时间工具类
package zy.test; import java.sql.Timestamp; import java.text.ParseException; import java.text.ParseP ...
【HDU1542】Atlantis
题意给出n个矩形的左下角和右上角的坐标,计算总的面积(相交部分只算一次). 分析线段树扫描线的模板题. 将每个矩形都拆成上下两条线段,然后从下网上扫,当遇到底边时就加上这个区间,遇到顶边时,就减去 ...
JVM类加载机制详解
引言如下图所示,JVM类加载机制分为五个部分:加载,验证,准备,解析,初始化,下面我们就分别来看一下这五个过程. 加载在加载阶段,虚拟机需要完成以下三件事情: 1)通过一个类的全限定名来获取定义此 ...
NPOI读写Excel sheet操作
QueryInfo dataInfo = new QueryInfo(); dataInfo.CustomSQL = $@" select t1.name name,t1.url url f ...
SQL高性能分页
分页的场景就不多说了,无处不在. 方法一:利用row_number() with C as ( select ROW_NUMBER() over(order by orderdate,orderid) ...
访问SAP的RFC
.NET 环境Xp(sp3) vs2010, win2003 EN 32bit(sp2)winform,webform 引用sapnco.dll,sapnco_utils.dll(自动引用)配置文件需 ...

python 中使用 urllib2 伪造 http 报头的2个方法

python 中使用 urllib2 伪造 http 报头的2个方法的更多相关文章

随机推荐

热门专题