Requests库入门实例

爬虫入门5个实例

实例1：京东商品页面的爬取

import requests

def getHTMLText(url):

    try:

        r = requests.get(url,timeout = 30)

        r.raise_for_status()

        r.encoding = r.apparent_encoding

        return r.text

    except:

        return "Something Wrong!!!"

url = "https://item.jd.com/27528447148.html"

print(getHTMLText(url)[:1000])

实例2：亚马逊商品页面的爬取

import requests

kv = {'user-agent':'Mozilla/5.0'}

def getHTMLText(url):

    try:

        r = requests.get(url,timeout = 30,headers = kv)

        r.raise_for_status()

        r.encoding = r.apparent_encoding

        return r.text

    except:

        return "Something Wrong!!!"

url = "https://www.amazon.cn/dp/B0083DP0CY/ref=cngwdyfloorv2_recs_0/460-1382173-5298568?pf_rd_m=A1AJ19PSB66TGU&pf_rd_s=desktop-2&pf_rd_r=07R056YCCZREBTBFN41G&pf_rd_r=07R056YCCZREBTBFN41G&pf_rd_t=36701&pf_rd_p=d2aa3428-dc2b-4cfe-bca6-5e3a33f2342e&pf_rd_p=d2aa3428-dc2b-4cfe-bca6-5e3a33f2342e&pf_rd_i=desktop"

print(getHTMLText(url)[1000:2000])

实例3：百度搜索关键字提交

import requests

keyword = "Python"

kv = {'wd':keyword}

def getHTMLText(url):

    try:

        r = requests.get(url,timeout = 30,params = kv)

        r.raise_for_status()

        r.encoding = r.apparent_encoding

        return r.text

    except:

        return "Something Wrong!!!"

url = "http://www.baidu.com/s"

print(getHTMLText(url)[1000:2000])

实例4：网络图片的爬取和存储

import requests

import os

url = "https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1546773451861&di=7cd06f87b97e5a337e6e60a2986098dd&imgtype=jpg&src=http%3A%2F%2Fimg0.imgtn.bdimg.com%2Fit%2Fu%3D78010880%2C3063559069%26fm%3D214%26gp%3D0.jpg"

root = "D://pics//"

path = root + url.split('%')[-1]

try:

    if not os.path.exists(root):

        os.mkdir(root)

    if not os.path.exists(path):

        r = requests.get(url)

        with open(path,'wb') as f:

            f.write(r.content)

            f.close()

            print("Saved!")

    else:

        print("Already Exists")

except:

    print("Something Wrong!!!")

实例5：IP地址归属地的自动查询

import requests

def getHTMLText(url):

    try:

        r = requests.get(url,timeout = 30)

        r.raise_for_status()

        r.encoding = r.apparent_encoding

        return r.text

    except:

        return "Something Wrong!!!"

url = "http://m.ip138.com/ip.asp?ip="

ip = "202.204.80.112"

urls = url + ip

print(getHTMLText(urls)[-500:])

Requests库入门实例的更多相关文章

Requests库主要方法解析以及Requests库入门需要掌握的框架
Requests库主要方法解析以及Requests库入门 1.requests.request(method,url,**kwargs) **kwargs:控制访问的参数,均为可选项 params:字 ...
requests库入门-16-Session和Cookie
分类专栏: Python接口自动化测试之requests库入门作者 | Anthony_tester ,300w+访问量博主,Oracle测试开发工程师. 地址 | https://blog.csd ...
Python Requests库入门——应用实例-百度、360搜索关键词提交
百度的关键词接口: http://www.baidu.com/s?wd=keyword 360的关键词接口: http://www.so.com/s?q=keyword keyword就是需要查找的关 ...
第一天 Requests库入门
Requests库的get()方法 requests.get(url, params=None, **kwargs) ∙ url : 拟获取页面的url链接 ∙ params : url中的额外参数, ...
requests库入门12-文件上传和下载
因为找不到可以演示上传接口,所以只能纯代码了文件上传上传文件是在请求中使用files参数,files需要指向一个dict,然后dict里面的键是接口中对应文件名的字段,而值就是打开这个文件读取到内 ...
requests库入门01-环境安装
最近在项目中写了一个接口自动化测试的脚本,想要写一些文章来一下,方便自己回头来温习,感兴趣的可以跟着看,先写关于requests库的一些基本操作,然后再写整个框架的搭建.使用的是Python3+req ...
Python 爬虫-Requests库入门
2017-07-25 10:38:30 response = requests.get(url, params=None, **kwargs) url : 拟获取页面的url链接∙ params : ...
Requests库入门
安装: $ pip install requests Response对象的一些基本属性: Response.status_code 请求的返回状态,正常为200 Response.text 页面的字 ...
requests库入门笔记1
1.使用requests库发送请求,fiddler无法抓到包:使用浏览器请求相同的url,可以抓到包在请求参数中添加 proxies参数,如下: proxies = { 'http': 'http: ...

随机推荐

VS2010 MFC 使用GDI+给图片添加汉字
1.配置GDI+ VS2010自带GDI+,直接使用. (1)首先要添加头文件和库 #pragma comment( lib, "gdiplus.lib" ) #include & ...
Android系统root破解原理分析
http://dengzhangtao.iteye.com/blog/1543494 root破解过程的终极目标是替换掉系统中的su程序.但是要想替换掉系统中su程序本身就是需要root权限的,怎样在 ...
2018.09.25 bzoj1856: [Scoi2010]字符串（组合数学）
传送门如果有n==m的条件就是卡特兰数. 但现在n不一定等于m. 我们可以考虑用求卡特兰数一样的方法来求答案. 我们知道有一种求卡特兰数的方法是转到二维平面求答案. 这道题就可以这样做. 我们将这个 ...
2018.07.03 HDU Rikka with Phi（线段树）
Rikka with Phi Time Limit: 16000/8000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/Others) P ...
如何设置vim中tab键缩进---配置初始化设置
转载自:http://blog.51cto.com/xuding/1725376:加了一些补充说明问题: Linux系统下,Tab键默认为8个字符,需呀将其修改为4个字符的方式使用步骤: 1.在用 ...
（最小生成树）Agri-Net -- POJ -- 1258
链接: http://poj.org/problem?id=1258 http://acm.hust.edu.cn/vjudge/contest/view.action?cid=82831#probl ...
常用算法（JS实现）
全排序列 function swap(array,a,b){ var m=array[a]; array[a]=array[b]; array[b]=m; } function full_sort(a ...
shell 脚本删除文件内容为空的文件
#!/bin/bask # cd /tmp for a in * ;do if [ ! -s $a ] ;then #[ ! -s $a ] 文件为空返回为真 rm -rf $a fi done 测试 ...
Bad Day -- Daniel Powter
Bad Day Bad Day (坏天气) 来自 Daniel Powter -- 2005年MTV欧洲音乐奖提名最佳新人, 出自专辑 ...
[翻译]CSS3 Media Queries
Media Queries Official Manual:http://www.w3.org/TR/css3-mediaqueries/ 原文链接:http://www.smashingmagazi ...

Requests库入门实例

爬虫入门5个实例

实例1：京东商品页面的爬取

实例2：亚马逊商品页面的爬取

实例3：百度搜索关键字提交

实例4：网络图片的爬取和存储

实例5：IP地址归属地的自动查询

Requests库入门实例的更多相关文章

随机推荐

热门专题