var code = “45f4267f-9476-44ca-ac68-6d32aad2d4e1”

data_analysis

import os

import string

import requests

# 百度图片搜索地址

url = "https://image.baidu.com/search/acjson"

# 构造请求头数据

header = {

    'Accept': 'text/plain, */*; q=0.01',

    'Accept-Encoding': 'gzip, deflate, br',

    'Accept-Language': 'zh-CN,zh;q=0.9',

    'Connection': 'keep-alive',

    'Host': 'image.baidu.com',

    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.106 Safari/537.36',

    'X-Requested-With': 'XMLHttpRequest',

}

# 构造请求参数

param = {

    'tn': 'resultjson_com',

    'ipn': 'rj',

    'ct': '201326592',

    'fp': 'result',

    'queryWord': '',

    'cl': '2',

    'lm': '-1',

    'ie': 'utf-8',

    'oe': 'utf-8',

    'st': '-1',

    'ic': '0',

    'word': '',

    'face': '0',

    'istype': '2',

    'nc': '1',

    'pn': '60',

    'rn': '30',

    'gsm': '1e',

}

def get_json(query_word=None, page_num=None):

    """

    根据查询的关键词及查询的页面返回 json 数据

    :param query_word: 输入的关键词

    :param page_num: 查询的页面数

    :return: 对应的 json 数据

    """

    # 参数列表中添加 queryWord 关键词

    param["queryWord"] = query_word

    param["word"] = query_word

    # 参数列表中添加 pn 关键词

    param["pn"] = f'{30 * page_num}'

    # 请求百度图片网站，将返回的 json 数据转换为 dict 数据

    res = requests.get(url=url, headers=header, params=param)

    res_dict = dict(res.json())

    return res_dict

def save_picture(query_word=None, pic_name=None, pic_url=None):

    """

    将图片保存在以 query_word 为名创建新的文件夹

    :param query_word:输入的关键词

    :param pic_name: json 中解析出来的图片名称

    :param pic_url: json 中解析出来的图片地址

    :return: None

    """

    # 获取当前 py 文件所在的绝对地址

    cwd = os.getcwd()

    # 拼接 images 文件夹地址

    images_path = os.path.join(cwd, "images")

    query_word_path = os.path.join(images_path, query_word)

    # 如果没有 images 文件夹，就新建一个

    if "images" not in os.listdir(cwd):

        os.mkdir(images_path)

    # 在 images 文件夹下，新建以 query_word 为名的文件夹

    if query_word not in os.listdir(images_path):

        os.mkdir(query_word_path)

    # 根据 pic_url 读取图片

    pic = requests.get(pic_url, stream=True)

    # 构造图片地址

    pic_path = os.path.join(query_word_path, pic_name)

    # 保存图片

    with open(pic_path, "wb") as f:

        for c in pic.iter_content(chunk_size=10240):

            f.write(c)

def get_pic_info(res=None):

    """

    解析 get_json 函数返回的 json 数据

    :param res: get_json 函数返回的 json 数据

    :return: 重新构造的图片数据，包含图片名称，图片地址

    """

    # 多张图片的信息列表

    pic_info = []

    # 图片数据存放在 data 中

    for data in res["data"]:

        # 获取图片名称

        pic_name = data.get("fromPageTitleEnc", None)

        # 获取图片地址

        pic_url = data.get("hoverURL", None)

        # 判断图片名称和图片地址是否存在

        if pic_name and pic_url:

            # 替换图片名称中的特殊字符

            pic_name = pic_name.replace(" ", '')

            for p in string.punctuation:

                pic_name = pic_name.replace(p, '')

            # 用图片名称命名图片

            if "png" in pic_url:

                pic_name += ".png"

            if "jpg" in pic_url:

                pic_name += ".jpg"

            if "gif" in pic_url:

                pic_name += ".gif"

            if "jpeg" in pic_url:

                pic_name += ".jpeg"

            if "bmp" in pic_url:

                pic_name += ".bmp"

            else:

                pic_name += ".jpg"

            pic_info.append({"pic_name": pic_name, "pic_url": pic_url})

    return pic_info

def main():

    # 程序运行的主函数

    while True:

        # 多次下载，直到输入 q 退出

        query_word = str(input("输入要下载的图片名（q退出）："))

        if query_word == "q":

            break

        while True:

            # 当输入的数量不为整数，循环输入

            pic_num = input("输入需要下载的页数（q退出）：")

            if pic_num == "q":

                break

            try:

                pic_num = int(pic_num)

            except:

                continue

            # 下载量不超过 30 就下载第一页图片

            page_num = 1 if int(pic_num / 30) == 0 else int(pic_num / 30)

            for i in range(1, page_num + 1):

                # 获取 json 数据

                res = get_json(query_word=query_word, page_num=i)

                # 获取图片名和图片地址

                pic_info = get_pic_info(res=res)

                # 保存图片

                for pic in pic_info:

                    print(pic["pic_name"], "下载完成")

                    save_picture(query_word=query_word, pic_name=pic["pic_name"], pic_url=pic["pic_url"])

            break

if __name__ == '__main__':

    main()

requests库获取指定关键词的图片，并保存到本地的更多相关文章

c# 应用NPOI 获取Excel中的图片，保存至本地的算法
要求:读取excel中的图片,保存到指定路径思路: 利用NPOI中 GetAllPictures()方法获取图片信息步骤: 1.新建一个Windows窗体应用程序 2.桌面新建一个excel,贴 ...
php获取网页中图片并保存到本地的代码
php获取网页中图片并保存到本地的代码,将网页中图片保存本地文件夹: <?php /** * 获取网页中图片,并保存至本地 * by www.jbxue.com */ header(" ...
php获取网页中图片并保存到本地
php获取网页中图片并保存到本地的代码,将网页中图片保存本地文件夹: save_img("http://www.jbxue.com" ?>
python爬取某个网站的图片并保存到本地
python爬取某个网站的图片并保存到本地 #coding:utf- import urllib import re import sys reload(sys) sys.setdefaultenco ...
微信小程序生成分享图片，保存到本地
1.页面 <canvas canvas-id="shareCanvas" style="width:600px;height:900px">< ...
Python：爬取网站图片并保存至本地
Python:爬取网页图片并保存至本地 python3爬取网页中的图片到本地的过程如下: 1.爬取网页 2.获取图片地址 3.爬取图片内容并保存到本地实例:爬取百度贴吧首页图片. 代码如下: imp ...
下载远程（第三方服务器）文件、图片，保存到本地（服务器）的方法、保存抓取远程文件、图片将图片的二进制字节字符串在HTML页面以图片形式输出 asp.net 文件操作方法
下载远程(第三方服务器)文件.图片,保存到本地(服务器)的方法.保存抓取远程文件.图片将一台服务器的文件.图片,保存(下载)到另外一台服务器进行保存的方法: 1 #region 图片下载 2 3 ...
使用URLConnection下载文件或图片并保存到本地
有时候需要从网络上面下载图片到本地进行保存,代码如下: package com.jointsky.jointframe.test; import java.io.FileOutputStream; i ...
吴裕雄--天生自然python学习笔记：编写网络爬虫代码获取指定网站的图片
我们经常会在网上搜索井下载图片,然而一张一张地下载就太麻烦了,本案例就是通过网络爬虫技术, 一次性下载该网站所有的图片并保存 . 网站图片下载并保存将指定网站的 .jpg 和 .png 格式的图片 ...
php将远程图片下载保存到本地
/* *功能:php完美实现下载远程图片保存到本地 *参数:文件url,保存文件目录,保存文件名称,使用的下载方式 *当保存文件名称为空时则使用远程文件原来的名称 */ function getIma ...

随机推荐

spring-security 解决
引入依赖 <dependency> <groupId>org.springframework.security</groupId> <artifactId&g ...
如何通过C#/VB.NET代码在Word中更改字体颜色
在日常工作中,我们有时会需要修改字体的颜色来突出文本重点,让读者更容易抓住文章要点.在今天这篇文章中,我将为大家介绍如何以编程方式,在Word更改字体颜色.本文将分为两部分分别介绍如何实现此操作.以下 ...
为Jekyll静态网站添加PlantUML插件
前言突然想起来要好好整理一下自己的博客空间,已经荒废很多年,如果再不捡起来,等到自己知识老化的时候再去写东西就没人看了. 使用Github Pages + Jekyll把博客发布为静态网站,给人感觉 ...
基于Vue3+TS的Monorepo前端项目架构设计与实现
写在前面你好,我是前端程序员鼓励师岩家兴!去年在另一个项目https://juejin.cn/post/7121736546000044046中,我向读者朋友们介绍了结合npm包管理工具yarn作v ...
记一次 .NET 某医保平台 CPU 爆高分析
一:背景 1. 讲故事一直在追这个系列的朋友应该能感受到,我给这个行业中无数的陌生人分析过各种dump,终于在上周有位老同学找到我,还是个大妹子,必须有求必应 . 妹子公司的系统最近在某次升级之后, ...
Vue-cli混入、elementUI的使用、vue-router、Vuex
目录混入.elementUI的使用.vue-router.Vuex 一.Vue项目改成比较纯净的状态及props其他使用 1.Vue项目改成纯净的项目 2.props的其他使用二.混入(mixin ...
GIN--HOW POWERFUL GNN
HOW POWERFUL ARE GRAPH NEURAL NETWORKS? 本文是 Jure Leskovec 又一力作,首先对图神经网络的原理做了深入检出.提纲挈领的叙述,然后从原理方面介绍了如 ...
JZOJ 2020.07.30【NOIP提高组】模拟
总结本场比赛很不负责对待暴力都没怎么打一个半小时后才开始打题很悲剧的只有 \(23+11+36=70\) 分 \(T1\) 4300. 装饰大楼题目略思路很无聊的找规律题考场弃疗 \ ...
Win下依据端口排查步骤
Win下依据端口排查步骤目录 Win下依据端口排查步骤 1 排查步骤 2 参考今天突然发现自己电脑出现7680端口的内网连接,决定看看这个端口是做什么用的 1 排查步骤确认7680端口连接情况与 ...
钓鱼攻击之：CHM电子书钓鱼
钓鱼攻击之:CHM电子书钓鱼目录钓鱼攻击之:CHM电子书钓鱼 1 CHM简介 2 .Chm文件因何变得危险 3 CHM 后门的优点 4 利用过程 4.1 准备工具 4.2 制作恶意chm文件 4. ...

requests库获取指定关键词的图片，并保存到本地

源码地址：https://gitee.com/myrensheng/data_analysis

requests库获取指定关键词的图片，并保存到本地的更多相关文章

随机推荐

热门专题