# -*- coding: utf-8 -*-
__author__ = 'Administrator'
from PyQt4.Qt import *
from PyQt4.QtCore import *
from PyQt4.QtGui import *
import sys,os,datetime,urllib,urllib2,re,threading,thread
from g1 import Ui_Form
class Gui2(QDialog,Ui_Form):
    def __init__(self):
        super(Gui2,self).__init__()
        self.setupUi(self)
        self.UrlCount.setReadOnly(True)
        t=QTimer(self)
        t.timeout.connect(self.datetimes)
        t.start(1000)
        self.pushSelect.clicked.connect(self.FilePath)
        self.UrlFile.setText(r'\pic')
        self.DownButton.clicked.connect(download)
    def getWebsite(self):
        return self.UrlEdit.text() #获取网址的函数
    def getFilePath(self):
        return self.UrlFile.text() #获取文件路径的函数
    def setTag(self,downloadtag):
        self.UrlCount.setText(downloadtag) #显示状态
    def FilePath(self):
        filepath=QFileDialog.getExistingDirectory(self,'select','/pic')
        self.UrlFile.setText(unicode(filepath))
        while True:
            if (filepath.isEmpty()):
                QMessageBox.information(self,'Error','Error')
                filepath=QFileDialog.getExistingDirectory(self,'select','/')
                continue
            else:self.UrlFile.setText(unicode(filepath))
            break
    def datetimes(self):
        self.UrlTime.setText(datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S'))

def download():
    Wb=unicode(main.getWebsite(),'utf-8').encode('utf-8')
    Fp=main.getFilePath()
    main.setTag('ok')
    t=MyT(Wb,Fp)
    t.start()

class MyT(threading.Thread):
    def __init__(self,web,files):
        threading.Thread.__init__(self)
        self.web=web
        self.files=files
    def run(self):
        html=getHttl(self.web)
        print self.web
        print self.files
        getImg(html,self.files)
        main.setTag('ok')
def getHttl(url):
    return urllib.urlopen(url).read() #返回网页源码
def getImg(html,path):
  reg=re.compile(r'src="(.*?\.(jpg|gif|png|js))')
  imglist=reg.findall(html)
  print len(imglist)
  x=1
  for imgurl in imglist:
    print imgurl
    main.setTag(str(x)+'/'+str(len(imglist))) #在状态栏上显示进度
    if imgurl[1]=='gif':
      xpath=path+'\%d.gif' % x
      urllib.urlretrieve(imgurl[0],xpath)
    elif imgurl[1]=='png':
      xpath=path+'\%d.png' % x
      urllib.urlretrieve(imgurl[0],xpath)
    elif imgurl[1]=='js':
        xpath=path+'\%d.js' % x
        urllib.urlretrieve(imgurl[0],xpath)
    else:
        xpath=path+'\%d.jpg' % x
        urllib.urlretrieve(imgurl[0],xpath)
    x+=1
  print 'finish--------'
app=QApplication(sys.argv)
main=Gui2()
main.show()
sys.exit(app.exec_())

文件:http://url.cn/XDattY

python批量下载的更多相关文章

  1. 用Python批量下载DACC的MODIS数据

    本人初次尝试用Python批量下载DACC的MODIS数据,记下步骤,提醒自己,数据还在下载,成功是否未知,等待结果中...... 若有大佬发现步骤有不对之处,望指出,不胜感激. 1.下载Python ...

  2. python批量下载微信好友头像,微信头像批量下载

    #!/usr/bin/python #coding=utf8 # 自行下载微信模块 itchat 小和QQ496631085 import itchat,os itchat.auto_login() ...

  3. 用python批量下载贴吧图片 附源代码

    环境:windows 7 64位:python2.7:IDE pycharm2016.1 功能: 批量下载百度贴吧某吧某页的所有帖子中的所有图片 使用方法: 1.安装python2.7,安装re模块, ...

  4. 用python批量下载图片

    一 写爬虫注意事项 网络上有不少有用的资源, 如果需要合理的用爬虫去爬取资源是合法的,但是注意不要越界,前一阶段有个公司因为一个程序员写了个爬虫,导致公司200多个人被抓,所以先进入正题之前了解下什么 ...

  5. Python 批量下载BiliBili视频 打包成软件

    文章目录 很多人学习python,不知道从何学起.很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手.很多已经做案例的人,却不知道如何去学习更加高深的知识.那么针对这三类人,我给大家 ...

  6. python——批量下载图片

    前言 批量下载网页上的图片需要三个步骤: 获取网页的URL 获取网页上图片的URL 下载图片 例子 from html.parser import HTMLParser import urllib.r ...

  7. Python - 批量下载 IIS 共享的文件

    1.说明 用 IIS 以WEB形式发布了本地文件夹,提供文件下载,并设置了访问权限:默认下载需要点击一个一个的下载,web界面如下: 3.脚本 执行脚本批量下载文件,会在当前目录创建文件夹,并压缩该文 ...

  8. python批量下载图片的三种方法

    一是用微软提供的扩展库win32com来操作IE: win32com可以获得类似js里面的document对象,但貌似是只读的(文档都没找到). 二是用selenium的webdriver: sele ...

  9. 使用Python批量下载Plus上的Podcast

    Plus是一个介绍数学之美与实际应用的网络杂志,其中包含了数学知识.轶闻趣事.历史典故等许多精彩的内容.该杂志恰好有一个Podcast栏目,提供了不少采访与讲座的mp3音频.于是, 我使用Python ...

  10. python 批量下载图片

    #coding=utf-8import re,sysimport urllib def getHtml(url): page = urllib.urlopen(url) html = page.rea ...

随机推荐

  1. ios NSString 去除空格和回车

    去除两端空格 NSString *temp = [textField.text stringByTrimmingCharactersInSet:[NSCharacterSet whitespaceCh ...

  2. 关于driver_register做了些什么

    现在进入driver_register()函数去看看.在driver_register() 中,调用了driver_find(drv->name, drv->bus)函数,这里是干啥呢?这 ...

  3. 02-大文件Copy(FileStream文件流类)

    static void Main(string[] args) { string source = @"e:\1.exe";//要移动文件的路径 大文件 string target ...

  4. NHibernate之映射文件配置说明(转载1)

    源博客:http://www.cnblogs.com/kissdodog/archive/2013/02/21/2919886.html 1. hibernate-mapping 这个元素包括以下可选 ...

  5. Java_观察者模式(Observable和Observer) -转

    原文地址: Java_观察者模式(Observable和Observer) 一.观察者模式介绍    在Java中通过Observable类和Observer接口实现了观察者模式.一个Observer ...

  6. 三级联动数据表db_nove.sql

    -- phpMyAdmin SQL Dump -- version 2.11.2 -- http://www.phpmyadmin.net -- -- 主机: localhost -- 生成日期: 2 ...

  7. dede后台反应特别慢-转

    找到织梦后台管理目录下的/templets/index_body.htm文件 将第25行至第35行部分js代码注释掉. 就这么简单

  8. virtual pc中添加软盘支持

    最近对操作系统挺有兴趣的,实验了一下!准备找一个虚拟机,之前在xp上使用virtual pc感觉不错,准备在本机上装一下,但是发现居然不支持软盘了! 查阅了各种资料,终于找到了解决的办法. 1. 下载 ...

  9. Java学习笔记--PriorityQueue(优先队列)(堆)

    PriorityQueue(优先队列)实际上是一个堆(不指定Comparator时默认为最小堆)队列既可以根据元素的自然顺序来排序,也可以根据 Comparator来设置排序规则.队列的头是按指定排序 ...

  10. Android数据存储

    SharedPreferences----------->for primitive data Internal Storage-------------->for private dat ...