python批量下载
# -*- coding: utf-8 -*-
__author__ = 'Administrator'
from PyQt4.Qt import *
from PyQt4.QtCore import *
from PyQt4.QtGui import *
import sys,os,datetime,urllib,urllib2,re,threading,thread
from g1 import Ui_Form
class Gui2(QDialog,Ui_Form):
def __init__(self):
super(Gui2,self).__init__()
self.setupUi(self)
self.UrlCount.setReadOnly(True)
t=QTimer(self)
t.timeout.connect(self.datetimes)
t.start(1000)
self.pushSelect.clicked.connect(self.FilePath)
self.UrlFile.setText(r'\pic')
self.DownButton.clicked.connect(download)
def getWebsite(self):
return self.UrlEdit.text() #获取网址的函数
def getFilePath(self):
return self.UrlFile.text() #获取文件路径的函数
def setTag(self,downloadtag):
self.UrlCount.setText(downloadtag) #显示状态
def FilePath(self):
filepath=QFileDialog.getExistingDirectory(self,'select','/pic')
self.UrlFile.setText(unicode(filepath))
while True:
if (filepath.isEmpty()):
QMessageBox.information(self,'Error','Error')
filepath=QFileDialog.getExistingDirectory(self,'select','/')
continue
else:self.UrlFile.setText(unicode(filepath))
break
def datetimes(self):
self.UrlTime.setText(datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S'))
def download():
Wb=unicode(main.getWebsite(),'utf-8').encode('utf-8')
Fp=main.getFilePath()
main.setTag('ok')
t=MyT(Wb,Fp)
t.start()
class MyT(threading.Thread):
def __init__(self,web,files):
threading.Thread.__init__(self)
self.web=web
self.files=files
def run(self):
html=getHttl(self.web)
print self.web
print self.files
getImg(html,self.files)
main.setTag('ok')
def getHttl(url):
return urllib.urlopen(url).read() #返回网页源码
def getImg(html,path):
reg=re.compile(r'src="(.*?\.(jpg|gif|png|js))')
imglist=reg.findall(html)
print len(imglist)
x=1
for imgurl in imglist:
print imgurl
main.setTag(str(x)+'/'+str(len(imglist))) #在状态栏上显示进度
if imgurl[1]=='gif':
xpath=path+'\%d.gif' % x
urllib.urlretrieve(imgurl[0],xpath)
elif imgurl[1]=='png':
xpath=path+'\%d.png' % x
urllib.urlretrieve(imgurl[0],xpath)
elif imgurl[1]=='js':
xpath=path+'\%d.js' % x
urllib.urlretrieve(imgurl[0],xpath)
else:
xpath=path+'\%d.jpg' % x
urllib.urlretrieve(imgurl[0],xpath)
x+=1
print 'finish--------'
app=QApplication(sys.argv)
main=Gui2()
main.show()
sys.exit(app.exec_())
文件:http://url.cn/XDattY
python批量下载的更多相关文章
- 用Python批量下载DACC的MODIS数据
本人初次尝试用Python批量下载DACC的MODIS数据,记下步骤,提醒自己,数据还在下载,成功是否未知,等待结果中...... 若有大佬发现步骤有不对之处,望指出,不胜感激. 1.下载Python ...
- python批量下载微信好友头像,微信头像批量下载
#!/usr/bin/python #coding=utf8 # 自行下载微信模块 itchat 小和QQ496631085 import itchat,os itchat.auto_login() ...
- 用python批量下载贴吧图片 附源代码
环境:windows 7 64位:python2.7:IDE pycharm2016.1 功能: 批量下载百度贴吧某吧某页的所有帖子中的所有图片 使用方法: 1.安装python2.7,安装re模块, ...
- 用python批量下载图片
一 写爬虫注意事项 网络上有不少有用的资源, 如果需要合理的用爬虫去爬取资源是合法的,但是注意不要越界,前一阶段有个公司因为一个程序员写了个爬虫,导致公司200多个人被抓,所以先进入正题之前了解下什么 ...
- Python 批量下载BiliBili视频 打包成软件
文章目录 很多人学习python,不知道从何学起.很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手.很多已经做案例的人,却不知道如何去学习更加高深的知识.那么针对这三类人,我给大家 ...
- python——批量下载图片
前言 批量下载网页上的图片需要三个步骤: 获取网页的URL 获取网页上图片的URL 下载图片 例子 from html.parser import HTMLParser import urllib.r ...
- Python - 批量下载 IIS 共享的文件
1.说明 用 IIS 以WEB形式发布了本地文件夹,提供文件下载,并设置了访问权限:默认下载需要点击一个一个的下载,web界面如下: 3.脚本 执行脚本批量下载文件,会在当前目录创建文件夹,并压缩该文 ...
- python批量下载图片的三种方法
一是用微软提供的扩展库win32com来操作IE: win32com可以获得类似js里面的document对象,但貌似是只读的(文档都没找到). 二是用selenium的webdriver: sele ...
- 使用Python批量下载Plus上的Podcast
Plus是一个介绍数学之美与实际应用的网络杂志,其中包含了数学知识.轶闻趣事.历史典故等许多精彩的内容.该杂志恰好有一个Podcast栏目,提供了不少采访与讲座的mp3音频.于是, 我使用Python ...
- python 批量下载图片
#coding=utf-8import re,sysimport urllib def getHtml(url): page = urllib.urlopen(url) html = page.rea ...
随机推荐
- FoxOne---一个快速高效的BS框架--(2)
FoxOne---一个快速高效的BS框架--(1) FoxOne---一个快速高效的BS框架--(2) FoxOne---一个快速高效的BS框架--(3) FoxOne---一个快速高效的BS框架-- ...
- Java基础知识强化57:经典排序之希尔排序(ShellSort)
1. 希尔排序的原理: 希尔排序(Shell Sort)是插入排序的一种.也称缩小增量排序,是直接插入排序算法的一种更高效的改进版本.希尔排序是非稳定排序算法.该方法因DL.Shell于1959年提出 ...
- 零基础学习云计算及大数据DBA集群架构师【Linux系统\网络服务及安全配置2015年1月8日周五】
考试考一天,得分94,最后一题防火墙当时还没搞明白 考题如下: 注意事项: .确保在重启主机后所有配置仍然生效. .selinux 必须为Enforing 模式,防火墙必须开始.默认策略必须清空. . ...
- CentOS NFS的安装配置、启动及mount挂载方法
一.环境介绍: 服务器:centos 192.168.1.225 客户端:centos 192.168.1.226 二.安装: NFS的安装配置:centos 5 : yum -y install n ...
- Entrez检索实例 - NCBI
题目:已知来豆荚斑驳病毒(bean pod mottle virus,BPMV)的名字,查询BPMV基因组信息.核酸序列信息.蛋白序列信息和结构信息 解答: 1.直接搜索,点genome,即可看到病毒 ...
- ubuntu安装python3.5
ubuntu14.04系统会自带python2.7,请不要卸载它.不同版本的Python可以共存在一个系统上. 卸载之后,桌面系统会被影响. (1)sudo add-apt-repository pp ...
- Form( 表单) 组件
本节课重点了解 EasyUI 中 Form(表单)组件的使用方法, 这个组件不依赖于任何组件.一. 加载方式表单组件只能在 JS 区域设置,首先定义一张表单.<form id="box ...
- Tooltip(提示框)组件
一.加载方式 //class加载方式 <a href="http://www.ycku.com" title="这是一个提示信息!" class=&quo ...
- Neral的前言
大家好,我是Neral,我准备写一个js库. 在动笔之前,我一直都处在很忐忑的状态,因为我写代码讲究的是一种感觉,那是看到自己写的代码之后大脑中就出现之后的无数个编码分支的快感,但是,如果很长一段时间 ...
- win7 安装 IIS
和xp不同,xp安装 IIS需要下载额外的软件包. 步骤 1,依次打开 "控制面板" -> "程序" ->"打开或关闭windows功能& ...