用python批量下载贴吧图片附源代码

环境：windows 7 64位；python2.7；IDE pycharm2016.1

功能：

　　批量下载百度贴吧某吧某页的所有帖子中的所有图片

使用方法：

　　1.安装python2.7，安装re模块，安装urllib2模块

　　2.复制以下源代码保存为tbImgiDownloader.py文件

　　3.打开某个贴吧并复制其网址

　　4.打开文件tbImgiDownloader.py在第37行的单引号中输入网址，保存

　 5.双击tbImgiDownloader.py

说明：

　　1.本程序每次可以下载大概50个贴子中的图片

　　2.图片名字自动保存为时间+位序

　　3.如若不能运行，欢迎咨询

　　4.复制源码时注意别复制行号（我就这样做过-_-|||）

　　5.觉得好用的同学别忘了点推荐哦！

 #! /usr/bin/env python

 #coding=utf-8

 import re,time

 import urllib2,urllib

 def tiebaImgiDownloader(url):

   '''

   贴吧jpg格式图片下载器：

   形式参数某吧某帖子的url地址

   运行后将保存图片到本目录

   '''

   pattern = r'img class="BDE_Image" .*?src="(.*?jpg)"'#待爬取链接的正则表达式

   fstr = urllib2.urlopen(url).read()#读取帖子网页源代码为str传给fstr

   urllist =  re.findall(pattern,fstr)#爬取所有与正则表达式匹配的jpg链接，并保存在urllist中

   urllist = list( set(urllist) )

   print '总共爬取%d个图片链接'%len(urllist),'\n'

   i = 1

   for furl in urllist:

     timestr = time.strftime('%Y%m%d%H%M%S')

     urllib.urlretrieve(furl,timestr+'0%d.jpg'%i)#逐个下载图片，并命名为当前时间+序数

     print '已保存图片',timestr+'0%d.jpg\n'%i

     i+=1

   print  '图片下载完毕！\n\n\n'

   return True

 def __main__():

   print '\n\t\t\t欢迎使用贴吧jpg格式图片下载器！\n'

   html = urllib.urlopen('').read()  # 读取某吧某页的网页源代码  。。。。。。。。。。。。。。。。。粘贴网址区。。。。。。。。。。。。。。。。。。。。。。。。。。。。

   '''网址示例

   1.http://tieba.baidu.com/f?kw=%BE%CF%E6%BA%B5t&fr=ala0&loc=rec小鞠

   2.http://tieba.baidu.com/f?kw=%E9%9E%A0%E5%A9%A7%E7%A5%8E&ie=utf-8&pn=200小鞠

   3.http://tieba.baidu.com/f?kw=%E5%A3%81%E7%BA%B8&ie=utf-8&tab=good精品壁纸

   '''

   pattern = r'a href="(.p.[0-9]*)"'  # 待爬取二级网页网址的正则表达式

   urllist = re.findall(pattern, html)  # 抓取所有二级网页网址，返回list

   urllist = list(set(urllist))  # 删除重复的二级网页网址

   preurl = r'http://tieba.baidu.com'  # 二级网页网址的前缀网址

   print '抓取%d个二级网页\n'%len( urllist )

   for urlOne in urllist:

     tiebaImgiDownloader(preurl + urlOne)  # 下载二级网页中的图片

   return 0

 if __name__ == '__main__':

   __main__()

后记：此文是本人原创，转载请注明出处，谢谢合作

用python批量下载贴吧图片附源代码的更多相关文章

python批量下载淘宝图片3
import urllib.request import os def url_open(url): req = urllib.request.Request(url) req.add_header( ...
用Python批量下载DACC的MODIS数据
本人初次尝试用Python批量下载DACC的MODIS数据,记下步骤,提醒自己,数据还在下载,成功是否未知,等待结果中...... 若有大佬发现步骤有不对之处,望指出,不胜感激. 1.下载Python ...
用python批量下载图片
一写爬虫注意事项网络上有不少有用的资源, 如果需要合理的用爬虫去爬取资源是合法的,但是注意不要越界,前一阶段有个公司因为一个程序员写了个爬虫,导致公司200多个人被抓,所以先进入正题之前了解下什么 ...
python——批量下载图片
前言批量下载网页上的图片需要三个步骤: 获取网页的URL 获取网页上图片的URL 下载图片例子 from html.parser import HTMLParser import urllib.r ...
用 Python 批量下载百度图片
为了做一个图像分类的小项目,需要制作自己的数据集.要想制作数据集,就得从网上下载大量的图片,再统一处理. 这时,一张张的保存下载,就显得很繁琐.那么,有没有一种方法可以把搜索到的图片直接下载到本地 ...
python批量下载微信好友头像，微信头像批量下载
#!/usr/bin/python #coding=utf8 # 自行下载微信模块 itchat 小和QQ496631085 import itchat,os itchat.auto_login() ...
Python 批量下载BiliBili视频打包成软件
文章目录很多人学习python,不知道从何学起.很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手.很多已经做案例的人,却不知道如何去学习更加高深的知识.那么针对这三类人,我给大家 ...
Python - 批量下载 IIS 共享的文件
1.说明用 IIS 以WEB形式发布了本地文件夹,提供文件下载,并设置了访问权限:默认下载需要点击一个一个的下载,web界面如下: 3.脚本执行脚本批量下载文件,会在当前目录创建文件夹,并压缩该文 ...
python批量下载图片的三种方法
一是用微软提供的扩展库win32com来操作IE: win32com可以获得类似js里面的document对象,但貌似是只读的(文档都没找到). 二是用selenium的webdriver: sele ...

随机推荐

删除elasticsearch大于7天前的索引
curl -u 用户名:密码 -H'Content-Type:application/json' -d'{ "query": { "range": { &quo ...
SQL Server 删除当前数据库中所有数据库，无视约束
Sql Server中清空所有数据表中的记录清空所有数据表中的记录: exec sp_msforeachtable @Command1 ='truncate table ?' 删除所有数据表: e ...
Android（java）学习笔记75：ListViewProject案例（ListView + BaseAdapter + CheckBox）
这个案例可能稍微复杂一点,我会讲述详细一点: 1. 首先是AndroidManifest.xml: <?xml version="1.0" encoding="ut ...
【洛谷4287】[SHOI2011] 双倍回文（Manacher算法经典题）
点此看题面大致题意: 求一个字符串中有多少个长度为偶数的回文串,它的一半也是回文串. \(Manacher\)算法这应该是\(Manacher\)算法一道比较好的入门题,强烈建议在做这题之前先去学 ...
设置RichTextBox控件的文本的对齐方式
实现效果: 知识运用: RichTextBox控件的SelectionAlignment属性 //获取或设置在当前选择或插入点的对齐方式 public HorizontalAlignment Sele ...
C# 运用DirectoryInfo类和FileInfo类
DirectoryInfo类和FileInfo类的基类都是FileSystemInfo类,这个类是一个抽象类,也就是说你不可以实例化该类,只能通过继承产生其子类并实例化其子类.然而你却可以运用由该类定 ...
Wordpress菜单函数wp_nav_menu各参数详解及示例
Wordpress菜单函数wp_nav_menu各参数详解及示例注册菜单首先要注册菜单,将以下函数添加至function.php函数里 register_nav_menus(array( ...
java算法面试题：递归算法题2 第1个人10，第2个比第1个人大2岁，依次递推，请用递归方式计算出第8个人多大？
package com.swift; public class Digui_Return { public static void main(String[] args) { /* * 递归算法题2 ...
洛谷P1164小A点菜
这也是一道01背包的题用的方法比较的巧妙.这个动态规划相当于反过来做的,自己理解就知道了.代码很短 #include<bits/stdc++.h> using namespace std ...
C/C++程序基础（五）位运算
C++中四种转换运算符的区分 const_cast 修改const和volatile属性 reinterpret_cast 指针间类型转换或者指针和整形的转换.二进制重新翻译. static_cast ...

用python批量下载贴吧图片 附源代码

用python批量下载贴吧图片 附源代码的更多相关文章

随机推荐

热门专题

用python批量下载贴吧图片附源代码

用python批量下载贴吧图片附源代码的更多相关文章