Python 小程序之恋爱表情包爬取

虽然恋爱跟我一毛钱关系没有，，但是我还是想爬它

实验爬取网址：http://qq.yh31.com/zjbq/1491124.html

# -*- coding: utf-8 -*-

# @Time    : 2018/3/24 22:18

# @Author  : TanRong

# @Software: PyCharm

# @File    : bqb.py

import requests

import re

def getSubUrls(website):

    response = requests.get(website)

    response.encoding = 'utf-8'   #必须加上网页编码格式

    subUrlAddr = r'<img src="/tp/zjbq/(.*?)" />'

    subUrlList = re.findall(subUrlAddr,response.text) #第二个位置参数是字符串，而response是html，所以需要response.text

    print(subUrlList)

    return subUrlList

def getImage(url, name):

    response = requests.get(url)

    with open('C:\\Users\\pc\\Desktop\\images\\%d.gif'%name, 'wb') as f:

        f.write(response.content)

if __name__ == '__main__':

    website = 'http://qq.yh31.com/zjbq/1491124.html'

    subUrlList = getSubUrls(website)

    name = 1

    for subUrl in subUrlList:

        url = 'http://qq.yh31.com/tp/zjbq/' + subUrl

        getImage(url, name)

        name += 1

Python 小程序之恋爱表情包爬取的更多相关文章

怎么样通过编写Python小程序来统计测试脚本的关键字
怎么样通过编写Python小程序来统计测试脚本的关键字通常自动化测试项目到了一定的程序,编写的测试代码自然就会很多,如果很早已经编写的测试脚本现在某些基础函数.业务函数需要修改,那么势必要找出那些引 ...
Python 小程序，对文件操作及其它
以下是自己写的几个对文件操作的小程序,里面涉及到文件操作,列表(集合,字典)的运用等.比方说,从文件里读取一行数据.分别存放于列表中,再对列表进行操作.如去掉里面的反复项.排序等操作. 常见对文件里行 ...
Day1：第一个python小程序
Day1:第一个python小程序与开发工具Pycharm 一.Hello World C:\Users\wenxh>python Python 3.6.2 (v3.6.2:5fd33b5, J ...
爬虫（二）Python网络爬虫相关基础概念、爬取get请求的页面数据
什么是爬虫爬虫就是通过编写程序模拟浏览器上网,然后让其去互联网上抓取数据的过程. 哪些语言可以实现爬虫 1.php:可以实现爬虫.php被号称是全世界最优美的语言(当然是其自己号称的,就是王婆 ...
Python网络爬虫第三弹《爬取get请求的页面数据》
一.urllib库 urllib是Python自带的一个用于爬虫的库,其主要作用就是可以通过代码模拟浏览器发送请求.其常被用到的子模块在Python3中的为urllib.request和urllib. ...
Python爬虫教程-13-爬虫使用cookie爬取登录后的页面(人人网)（下）
Python爬虫教程-13-爬虫使用cookie爬取登录后的页面(下) 自动使用cookie的方法,告别手动拷贝cookie http模块包含一些关于cookie的模块,通过他们我们可以自动的使用co ...
[Python爬虫] 使用 Beautiful Soup 4 快速爬取所需的网页信息
[Python爬虫] 使用 Beautiful Soup 4 快速爬取所需的网页信息 2018-07-21 23:53:02 larger5 阅读数 4123更多分类专栏: 网络爬虫版权声明: ...
Python使用urllib,urllib3,requests库+beautifulsoup爬取网页
Python使用urllib/urllib3/requests库+beautifulsoup爬取网页 urllib urllib3 requests 笔者在爬取时遇到的问题 1.结果不全 2.'抓取失 ...
Python网页解析库：用requests-html爬取网页
Python网页解析库:用requests-html爬取网页 1. 开始 Python 中可以进行网页解析的库有很多,常见的有 BeautifulSoup 和 lxml 等.在网上玩爬虫的文章通常都是 ...

随机推荐

Day7--------------IP地址配置
ifconfig 查看网卡 ifconfig eth0 查看网卡eth0 配置网络地址: 临时配置: ifconfig eth0 192.168.10.100 netmask 255.255.255. ...
Cocos2dx制作帧动画
1.使用plist + png方式加载资源图,参数只需要plist路径 cc.SpriteFrameCache:getInstance()::addSpriteFrames("res/yk/ ...
VUE (vue-cli)脚手架项目说明
1. 概述 1.1 说明使用vue-cli快速创建的vue项目目录如下: build -- webpack相关配置以及服务启动文件,配置多依赖于下边的config文件夹中内容 config -- ...
Android gradle provided、implementation等指令注意点
其实这类文章博客网上一搜一大堆,但有些地方可能说的不太清楚(都一样的内容,抄袭太严重),这里只是做个精简的总结和一些其他地方没提到的点. 一.Android Studio 3.0开始使用了新的指令,原 ...
LuoGu P1004 方格取数
题目传送门一开始这个题我是不会的(沙华弱DP啊QwQ),后来考完试我一想,这东西怎么和数字三角形那题这么像啊? 都是自上而下,只能向下或者向右,求一个max 那么...这不就是个走两遍的数字矩阵嘛 ...
Confluence 6 Confluence 安装目录
Confluence 安装的目录(Confluence Installation directory)定义的是 Confluence 是在那里进行安装的.这个目录有时候也被称为 Confluence ...
automaticallyAdjustsScrollViewInsets 详解
automaticallyAdjustsScrollViewInsets 自动缩进 20 像素默认是 True 项目中如果有UIViewController 和ScrollView 一般都要设置成f ...
Java的家庭记账本程序（E）
日期:2019.2.9 博客期:032 星期二今天是把程序的相关Bug补一补,嗯`: 1.添加了跳转说明生成了一个对于成员的权限声明内容,用户再登陆界面点击Go按钮后,切换至说明页面,再次点击Go ...
调试阶段获取微信小程序openid
wx.login({ success: function(res) { //首先获取用户code //res.code wx.request({ url: 'https://api.weixin.qq ...
学习Maven POM
什么是POM POM stands for "Project Object Model".It is an XML representation of a Maven projec ...

Python 小程序之 恋爱表情包爬取

Python 小程序之 恋爱表情包爬取的更多相关文章

随机推荐

热门专题

Python 小程序之恋爱表情包爬取

Python 小程序之恋爱表情包爬取的更多相关文章