python批量下载图片3

import urllib.request

import os

def url_open(url):

    req = urllib.request.Request(url)

    req.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.134 Safari/537.36')

    response = urllib.request.urlopen(url)

    html = response.read()

    return html

def get_page(url):

    html =  url_open(url).decode('utf-8')

    a = html.find('current-comment-page') + 23

    b = html.find(']',a)

    return html[a:b]

def find_imgs(url):

    html = url_open(url).decode('utf-8')

    img_addrs = []

    a = html.find('img src=')

    while a!=-1:

        b = html.find('.jpg',a,a+255)

        if b != -1:

            img_addrs.append(html[a+9:b+4])

        else:

            b = a + 9

        a = html.find('img src=',b)

    return img_addrs

def save_imgs(folder,img_addrs):

     for each in img_addrs:

          filename = each.split('/')[-1]

          urllib.request.urlretrieve(each,filename,None)

def download_mm(folder='OOXX',pages=10):

    #os.mkdir(folder)

    os.chdir(folder)

    url = "http://konachan.com/post?tags=rating%3Asafe"

    page_num = int(2)

    for i in range(pages):

        page_num += i

        print(i)

        page_url = 'http://konachan.com/post?page=' + str(page_num) + '&tags=rating%3Asafe'

        print(page_url)

        img_addrs = find_imgs(page_url)

        save_imgs(folder,img_addrs)

if __name__=='__main__':

    download_mm()

和

import urllib.request

import os

def url_open(url):

    req = urllib.request.Request(url)

    req.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.134 Safari/537.36')

    response = urllib.request.urlopen(url)

    html = response.read()

    return html

def get_page(url):

    html =  url_open(url).decode('utf-8')

    a = html.find('current-comment-page') + 23

    b = html.find(']',a)

    return html[a:b]

def find_imgs(url):

    html = url_open(url).decode('utf-8')

    img_addrs = []

    a = html.find('img src=')

    while a!=-1:

        b = html.find('.jpg',a,a+255)

        if b != -1:

            img_addrs.append(html[a+9:b+4])

        else:

            b = a + 9

        a = html.find('img src=',b)

    return img_addrs

def save_imgs(folder,img_addrs):

     for each in img_addrs:

          filename = each.split('/')[-1]

          with open(filename,'wb')as f:

                img = url_open(each)

                f.write(img)
　　　　　　　　　 f.close()                                              #每次存储之后都要close()否则存储的只是一个图

def download_mm(folder='OOXX',pages=10):

    os.mkdir(folder)

    os.chdir(folder)

    url = "http://konachan.com/post?tags=rating%3Asafe"

    page_num = int(2)

    for i in range(pages):

        page_num += i

        print(i)

        page_url = 'http://konachan.com/post?page=' + str(page_num) + '&tags=rating%3Asafe'

        print(page_url)

        img_addrs = find_imgs(page_url)

        save_imgs(folder,img_addrs)

if __name__=='__main__':

    download_mm()

python批量下载图片3的更多相关文章

用python批量下载图片
一写爬虫注意事项网络上有不少有用的资源, 如果需要合理的用爬虫去爬取资源是合法的,但是注意不要越界,前一阶段有个公司因为一个程序员写了个爬虫,导致公司200多个人被抓,所以先进入正题之前了解下什么 ...
python——批量下载图片
前言批量下载网页上的图片需要三个步骤: 获取网页的URL 获取网页上图片的URL 下载图片例子 from html.parser import HTMLParser import urllib.r ...
python批量下载图片的三种方法
一是用微软提供的扩展库win32com来操作IE: win32com可以获得类似js里面的document对象,但貌似是只读的(文档都没找到). 二是用selenium的webdriver: sele ...
python 批量下载图片
#coding=utf-8import re,sysimport urllib def getHtml(url): page = urllib.urlopen(url) html = page.rea ...
python批量下载图片
从数据库拿了一批图片地址,需要一张一张的把图片下载下来,自从有了python,想到能省事就琢磨如何省事. 代码如下: import urllib.requestf=open("E:\999\ ...
【Python】nvshens按目录批量下载图片爬虫1.00(单线程版)
# nvshens按目录批量下载图片爬虫1.00(单线程版) from bs4 import BeautifulSoup import requests import datetime import ...
用Python批量下载DACC的MODIS数据
本人初次尝试用Python批量下载DACC的MODIS数据,记下步骤,提醒自己,数据还在下载,成功是否未知,等待结果中...... 若有大佬发现步骤有不对之处,望指出,不胜感激. 1.下载Python ...
Python批量修改图片格式和尺寸
Python批量修改图片格式和尺寸备注: 1.导入了PIL库,是处理图片用的,很强大; 2.导入了的win32库,是判断隐藏文件用的,我们的项目需要删除隐藏文件,不需要的可以直接找到删除. 3.导入 ...
scrapy操作mysql/批量下载图片
1.操作mysql items.py meiju.py 3.piplines.py 4.settings.py -------------------------------------------- ...

随机推荐

Z.XML第一次迭代分数分配
紧张的第一次迭代落下帷幕,便到了分数分配这样令人揪心又无奈的日子.如何进行分数分配,以使大家都能满意,这一直是个难以非常好地处理的问题.幸运地是,我们团队的所有成员每个人都对本次迭代乃至整个项目过程付 ...
编程练习：寻找发帖"水王"扩展问题一
回顾寻找发帖水王的问题总结起来就是在一个数组中某一个元素出现次数超过了数组长度的一半,那么可以很顺利的找到这个元素,实现见"编程练习:寻找发帖水王" 扩展上面的问题中,强调了某 ...
linux安装mysql之设置远程访问权限
1.将3306端口加入防火墙 /sbin/iptables -I INPUT -p tcp --dport 3306-j ACCEPT #添加端口3306/etc/rc.d/init.d/iptab ...
velocity模板加载
http://hi.baidu.com/ly_dayu/item/828b09c5c3c5e547a8ba9409 velocity使用基本来说比较简单,但在加载模板时老出问题,很多初学者经常会遇到找 ...
vue-cli配置jquery 以及jquery第三方插件
只使用jquery: 1. cnpm install jquery --save 2. cnpm install @types/jquery --save-dev (不使用ts的不需要安装此声明 ...
CSS兼容性总结
一.针对IE6的 !important 必须写在前面,例如: background:#9C6 !important;background:#999; 二.CSS HACK //IE6 专用 _heig ...
【题解】HAOI2008木棍分割
对于这道题目的两问,第一问直接二分答案求出最短长度.关键在于第二问应当如何求:建立dp方程,dp[i][j]代表到第i个分界线,切了j次(强制在第i处切一刀.这样就不会对后面的状态产生影响).状态转移 ...
yaml语法
http://blog.csdn.net/mack415858775/article/details/51015662 name: Tom Smith age: 37 spouse: name: Ja ...
lwIP配置文件opt.h和lwipopts.h
如何去配置lwip,使它去适合不同大小的脚,这就是lwIP的配置问题.尤其是内存的配置,配置多了浪费,配置少了跑不了或者不稳定(会出现的一大堆莫名奇妙的问题,什么打开网页的速度很慢啊?什么丢包啊,什么 ...
Linux下只允许用户远程scp
本文将介绍在Linux环境下,让用户不能远程登录只能使用scp命令使用到的软件:rssh(http://pizzashack.org/rssh/index.shtml ) 环境:centos6.x ...

python批量下载图片3

python批量下载图片3的更多相关文章

随机推荐

热门专题