【Python】转载一个python 爬虫的帖子
原帖地址
原帖标题:爬取图网的4K图片自动保存本地
https://www.52pojie.cn/thread-1809600-1-1.html
(出处: 吾爱破解论坛)
python 代码
import os.path
import random
import time
import requests
from lxml import etree
import webbrowser
webbrowser.open('https://pic.netbian.com')
ua = input("请输入浏览器的User-Agent,不会的请百度\n")
print('''例如:https://pic.netbian.com/4kmeinv
https://pic.netbian.com/4kfengjing
https://pic.netbian.com
''')
uuuu = input("请输入彼岸图的URL不带'/'\n")
headers = {
'User-Agent': ua
}
url = uuuu
def huoqu(urll):
url = urll
# print(url)
respones = requests.get(url, headers=headers)
mg = respones.content.decode("gbk")
tree = etree.HTML(mg)
img_url = tree.xpath('//ul[@class="clearfix"]//li')
# print(img_url)
for a in img_url:
c = a.xpath('./a//img/@alt')[0]
img_mg = a.xpath('./a//img/@src')
img_mgg = requests.get('https://pic.netbian.com' + ''.join(img_mg))
if not os.path.exists('彼岸图网'):
os.mkdir("彼岸图网")
with open(f'彼岸图网/{c}.jpg', 'wb') as f:
f.write(img_mgg.content)
print(f'彼岸图网/{c}.jpg,保存成功')
def zongpage(url):
url = url
print(url)
respones = requests.get(url, headers=headers)
mg = respones.content.decode("gbk")
tree = etree.HTML(mg)
page = tree.xpath('//div[@class="page"]/a/text()')
zongpage = page[-2]
print('总共:' + zongpage + '页')
return zongpage
zongpagee = zongpage(url)
for a in range(1, int(zongpagee)):
if a == 1:
huoqu(url)
else:
uu = f'{url}/index_{a}.html'
print(uu)
huoqu(uu)
time.sleep(random.randint(2, 5))
【Python】转载一个python 爬虫的帖子的更多相关文章
- 用Python写一个小爬虫吧!
学习了一段时间的web前端,感觉有点看不清前进的方向,于是就写了一个小爬虫,爬了51job上前端相关的岗位,看看招聘方对技术方面的需求,再有针对性的学习. 我在此之前接触过Python,也写过一些小脚 ...
- [python]做一个简单爬虫
为什么选择python,它强大的库可以让你专注在爬虫这一件事上而不是更底层的更繁杂的事 爬虫说简单很简单,说麻烦也很麻烦,完全取决于你的需求是什么以及你爬的网站所决定的,遇到的第一个简单的例子是pas ...
- Python编程-一个小爬虫工具的实现过程
需求描述: 1,打开网站: 2,获取网站的文件内容: 3,返回保存到文件中: 这里的就用到了多线程的方法 import requests,threading,time def write_html(u ...
- Python编写一个Python脚本
我想要一个可以为我的所有重要文件创建备份的程序.(下面测试环境为python2.7) 1.backup_ver1.py #!/usr/bin/python import os import time ...
- 【Python】一个python实例:给重要的文件创建备份.摘自crossin-python简明教程
问题:写一个可以为所有重要文件创建备份的程序 考虑:源路径和目标路径各是什么;所有重要文件-有哪些;备份文件格式是什么;定期备份的话,备份文件名称如何规定等等.(ps,我自己只想到一个路径和名称) 程 ...
- Python——第一个python程序helloworld
安装了Python的环境之后,就是编写Python的代码了. 首先,我们来写一个简单的“hello world” 新建一个空白的txt文本,将后缀改为.py 改了后缀之后即变为Python程序的图标 ...
- Python 第一个Python项目Hello,Python 学习之路(二)
print("Hello,Python")
- Python ->> 第一个Python程序
#coding:utf-8 #print 'input your name, please' #name = raw_input('请输入你的名字:'.decode('utf-8').encode(' ...
- 一个python爬虫小程序
起因 深夜忽然想下载一点电子书来扩充一下kindle,就想起来python学得太浅,什么“装饰器”啊.“多线程”啊都没有学到. 想到廖雪峰大神的python教程很经典.很著名.就想找找有木有pdf版的 ...
- 洗礼灵魂,修炼python(61)--爬虫篇—【转载】requests模块
requests 1.简介 Requests 是用Python语言编写的第三方库,所以你需要pip安装,安装过程就略过了.它基于urllib,采用 Apache2 Licensed 开源协议的 HTT ...
随机推荐
- linux tc命令进行网络限速、丢包、延迟设置(简单使用)
linux自带tc命令版本不是很低的linux系统都自带tc如果你的系统不带这个命令,建议使用类似括号中的命令进行安装 (yum -y install iproute) TC 中使用下列的缩写表示相应 ...
- 使用Apache commons-pool2实现高效的FTPClient连接池的方法
一. 连接池概述 频繁的建立和关闭连接,会极大的降低系统的性能,而连接池会在初始化的时候会创建一定数量的连接,每次访问只需从连接池里获取连接,使用完毕后再放回连接池,并不是直接关闭连接,这样可以保证 ...
- Qt音视频开发31-qmedia内核qt5/qt6播放视频
一.前言 在qt5中的多媒体框架明显比qt4丰富了很多,使用也极其友好,提供的api接口非常简单明了,不需要像qt4中那样还需要绑定和创建路径之类的.同样也还是依赖本地解码器,qt6中的多媒体框架据说 ...
- Qt编写物联网管理平台40-类型种类
一.前言 为了增强本系统的拓展性,做成通用的物联网管理平台,特意将控制器主设备类型.探测器子设备类型.对应种类符号等信息,全部做成表格可自定义添加和修改,这样在控制器信息表和探测器信息表管理的时候,可 ...
- 从异常{ 无法将 匿名方法 转换为类型“System.Delegate”,因为它不是委托类型 }说开去
从异常{ 无法将 匿名方法 转换为类型"System.Delegate",因为它不是委托类型 }说开去. 查看如下代码: this.Invoke(delegate { Messag ...
- WPF 记录鼠标、触摸多设备混合输入场景问题
本文记录在WPF应用中鼠标.触摸混合输入,鼠标事件抬起时不会有MouseUp事件触发的问题. 事件输入我们都知道有3类:鼠标.触摸.触笔,鼠标是windows系统出来就有的事件,后面加了触笔.触摸. ...
- blip2代码解析
请你作为一个代码翻译解释生成器,下面我会发送一个github链接给你,请你详细解析与介绍这个链接下代码 好的,请发送链接. https://github.com/huggingface/transfo ...
- 常见的运行窗口命令和命令提示符(DOS)命令
常见的运行窗口命令和命令提示符(DOS)命令 常见的运行窗口命令 Win + R 打开运行窗口 基础应用程序启动命令 calc:启动计算器. notepad:打开记事本. mspaint:启动画图工具 ...
- 21. C++快速入门--协程 Coroutine 入门
参考: https://www.cnblogs.com/blizzard8204/p/17563217.html https://www.bennyhuo.com/2022/03/09/cpp-cor ...
- 【转】为什么说java只有值传递?
原文地址: https://www.cnblogs.com/ironHead-cjj/p/11366888.html