Python爬取 | 王者荣耀英雄皮肤海报

这里只展示代码，具体介绍请点击下方链接。

Python爬取 | 王者荣耀英雄皮肤海报

import requests

import re

import os

import time

import winreg

count = 0  # 计数用

# 获取第一次页面所以英雄的id以及名字

def first_url(url):

    response = requests.get(url)

    response.encoding = 'gbk'

    response = response.text

    id_name = re.findall('<li><a href=.*?/(\d{3}).*?alt=.*?>(.*?)</a></li>', response, re.S)

    return id_name

# 获取英雄皮肤昵称以及获取皮肤数目

def second_url(url, name):

    response = requests.get(url)

    response.encoding = 'gbk'

    response = response.text

    # 第66行

    # <ul class="pic-pf-list pic-pf-list3" data-imgname="月光之女&0|哥特玫瑰&1|绯红之刃&0|紫霞仙子&12|一生所爱&44|瓷语鉴心&1">

    response = re.findall('<ul class=.*?data-imgname="(.*?)">', response)

    response = response[0].split('|')

    skin_names = []

    for i in response:

        names = re.sub('[^\u4e00-\u9fa5]', '', i) + ' ' + name

        skin_names.append(names)

    return skin_names

def download(url, skin_names, path):

    num = len(skin_names)  # 获取英雄皮肤数目，以控制循环次数

    times = str(num)  # 将皮肤个数字符化，用于文件名称显示皮肤个数

    name = skin_names[0].split(' ')[-1]  # 这里是获取英雄名字，如露娜，用于后面皮肤全称的拼接

    path = path + '/' + name + ' ' + times + '张'  # 皮肤存储路径

    if not os.path.exists(path):  # 如果路径不存在，则自动创建

        os.mkdir(path)

    for n in range(0, num):  # 循环

        skin_url = url + str(n + 1) + '.jpg'  # 皮肤图片的链接

        image_path = path + '/' + skin_names[n] + '.jpg'  # 每张皮肤的命名

        global count  # 定义全局变量，用于统计皮肤下载张数

        count = count + 1

        print(f'   第{count}张  正在下载>>{name}<<的第{str(n + 1)}张皮肤，共{times}张')

        with open(image_path, 'wb') as f:  # 皮肤图片下载并保存

            f.write(requests.get(skin_url).content)

        time.sleep(0.3)

def get_desktop():

    key = winreg.OpenKey(winreg.HKEY_CURRENT_USER,

                         r'Software\Microsoft\Windows\CurrentVersion\Explorer\Shell Folders')  # 利用系统的链表

    zm = winreg.QueryValueEx(key, "Desktop")[0]  # 获取的是Unicode类型数据

    return str(zm)  # Unicode转化为str并返回

def main():

    path = f'{get_desktop()}\\王者荣耀角色皮肤图片'

    print(path)

    if not os.path.exists(path):

        os.mkdir(path)

    url = 'https://pvp.qq.com/web201605/herolist.shtml'

    id_name = first_url(url)

    # 拼接链接

    for i in id_name:

        hero_url = f'http://pvp.qq.com/web201605/herodetail/{i[0]}.shtml'

        skin_names = second_url(hero_url, i[1])  # i[1]是英雄的名字，比如露娜，云中君等

        skin_url = f'http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/{i[0]}/{i[0]}-bigskin-'

        download(skin_url, skin_names, path)

if __name__ == '__main__':

    main()

Python爬取 | 王者荣耀英雄皮肤海报的更多相关文章

python 爬取王者荣耀英雄皮肤代码
import os, time, requests, json, re, sys from retrying import retry from urllib import parse "& ...
利用python爬取王者荣耀英雄皮肤图片
前两天看到同学用python爬下来LOL的皮肤图片,感觉挺有趣的,我也想试试,于是决定来爬一爬王者荣耀的英雄和皮肤图片. 首先,我们找到王者的官网http://pvp.qq.com/web201605 ...
python学习--第二天爬取王者荣耀英雄皮肤
今天目的是爬取所有英雄皮肤在爬取所有之前,先完成一张皮肤的爬取打开anacond调出编译器Jupyter Notebook 打开王者荣耀官网下拉找到位于网页右边的英雄/皮肤点击[+更多] 进入 ...
Python 爬取 "王者荣耀.英雄壁纸" 过程中的矛和盾
1. 前言学习爬虫,最好的方式就是自己编写爬虫程序. 爬取目标网站上的数据,理论上讲是简单的,无非就是分析页面中的资源链接.然后下载.最后保存. 但是在实施过程却会遇到一些阻碍. 很多网站为了阻止爬 ...
用Python爬取"王者农药"英雄皮肤
0.引言作为一款现象级游戏,王者荣耀,想必大家都玩过或听过,游戏里中各式各样的英雄,每款皮肤都非常精美,用做电脑壁纸再合适不过了.本篇就来教大家如何使用Python来爬取这些精美的英雄皮肤. 1.环 ...
用Python爬取"王者农药"英雄皮肤原
padding: 10px; border-bottom: 1px solid #d3d3d3; background-color: #2e8b57; } .second-menu-item { pa ...
python爬取王者荣耀全英雄皮肤
import os import requests url = 'https://pvp.qq.com/web201605/js/herolist.json' herolist = requests. ...
python爬虫---爬取王者荣耀全部皮肤图片
代码: import requests json_headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win ...
python 爬取王者荣耀高清壁纸
代码地址如下:http://www.demodashi.com/demo/13104.html 一.前言打过王者的童鞋一般都会喜欢里边设计出来的英雄吧,特别想把王者荣耀的英雄的高清图片当成电脑桌面 ...

随机推荐

redis 《scan命令》
此命令十分奇特建议参考文档:http://redisdoc.com/database/scan.html#scan 222222222222222并非每次迭代都要使用相同的 COUNT 值. ...
AQS实现原理
AQS实现原理 AQS中维护了一个volatile int state(共享资源)和一个CLH队列.当state=1时代表当前对象锁已经被占用,其他线程来加锁时则会失败,失败的线程被放入一个FIFO的 ...
eslint and stylelint config
eslint: module.exports = { root: true, env: { browser: true, es6: true, node: true ...
Spring之BeanFactory：解析getBean()方法
初探getBean()方法在使用Spring的时候可以通过如下方式调用getBean方法来获取某个Bean: User user = context.getBean(User.class); Abs ...
设置 ajax 同步获取数据
问题在处理DataTable的render进行列表渲染的时候发现通过ajax发送请求,返回的值并不正确. {"data":"id","render& ...
解决win10 cmd运行python弹出windows应用商店下python应用程序
方法一: 1.我一开始下载完python后,忘记下载到哪个位置,在win10底下输入框搜索python,点击打开文件所在位置,所在位置是python快捷键的位置,直接复制进行环境配置配置完环境变量后 ...
20210716 noip17
考场终于有一场在晚上考了 T1 随便画了画就发现要求每个点的后继个数,想起来有 dfs 和 toposort 两种方法,感觉很稳 T2 裸的网络流有 70pts?!真香一看 T3 就想起了 Mst ...
如果还是看不懂container_of()函数，那算我输
在linux 内核编程中,会经常见到一个宏函数container_of(ptr,type,member), 但是当你通过追踪源码时,像我们这样的一般人就会绝望了(这一堆都是什么呀? 函数还可以这样定义 ...
freeswitch python模块
概述 freeswitch支持多种语言的业务开发,包括C/C++,java,python,js,lua,Golang等等.freeswitch在使用python做业务开发时,有俩种接入方式,一种是ES ...
01-mysql必知必会
概述主键:唯一区分表中每个行(不可重复,不允许null mysql:基于客户-服务器的数据库系统使用mysql mysql是部署在主机上的,可以通过ssh建立mysql连接 # 显示数据库 sho ...

Python爬取 | 王者荣耀英雄皮肤海报

Python爬取 | 王者荣耀英雄皮肤海报的更多相关文章

随机推荐

热门专题