Python抓取网页中的图片到本地

今天在网上找了个从网页中通过图片URL，抓取图片并保存到本地的例子：

 #!/usr/bin/env python

 # -*- coding:utf- -*-

 #   Author:    xixihuang

 #   Date  :     // : AM

 #   Desc:       抓取网页，获取图片URL，抓取图片内容并保存到本地。

 import os

 import uuid

 import urllib2

 import cookielib

 '''获取文件后缀名'''

 def get_file_extension(file):

   return os.path.splitext(file)[]

 '''創建文件目录，并返回该目录'''

 def mkdir(path):

   # 去除左右两边的空格

   path=path.strip()

   # 去除尾部 \符号

   path=path.rstrip("\\")

   if not os.path.exists(path):

     os.makedirs(path)

   return path

 '''自动生成一个唯一的字符串，固定长度为36'''

 def unique_str():

   return str(uuid.uuid1())

 '''

 抓取网页文件内容，保存到内存

 @url 欲抓取文件 ，path+filename

 '''

 def get_file(url):

   try:

     cj=cookielib.LWPCookieJar()

     opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))

     urllib2.install_opener(opener)

     req=urllib2.Request(url)

     operate=opener.open(req)

     data=operate.read()

     return data

   except BaseException, e:

     print e

     return None

 '''

 保存文件到本地

 @path 本地路径

 @file_name 文件名

 @data 文件内容

 '''

 def save_file(path, file_name, data):

   if data == None:

     return

   mkdir(path)

   if(not path.endswith("/")):

     path=path+"/"

   file=open(path+file_name, "wb")

   file.write(data)

   file.flush()

   file.close()

 #获取文件后缀名

 print get_file_extension("123.jpg");

 #創建文件目录，并返回该目录

 #print mkdir("d:/ljq")

 #自动生成一个唯一的字符串，固定长度为36

 print unique_str()

 url="http://qlogo1.store.qq.com/qzone/416501600/416501600/100?0";

 save_file("D:/test/", "123.jpg", get_file(url))

Python抓取网页中的图片到本地的更多相关文章

python抓取网页中图片并保存到本地
#-*-coding:utf-8-*- import os import uuid import urllib2 import cookielib '''获取文件后缀名''' def get_file ...
浅谈如何使用python抓取网页中的动态数据
我们经常会发现网页中的许多数据并不是写死在HTML中的,而是通过js动态载入的.所以也就引出了什么是动态数据的概念, 动态数据在这里指的是网页中由Javascript动态生成的页面内容,是在页面加载到 ...
python抓取网页中的动态数据
一.概念网页中的许多数据并不是写死在HTML中的,而是通过js动态载入的.所以也就引出了什么是动态数据的概念,动态数据在这里指的是网页中由Javascript动态生成的页面内容,是在页面加载到浏览器 ...
Java 抓取网页中的内容【持续更新】
背景:前几天复习Java的时候看到URL类,当时就想写个小程序试试,迫于考试没有动手,今天写了下,感觉还不错内容1. 抓取网页中的URL 知识点:Java URL+ 正则表达式 import jav ...
Python 抓取网页并提取信息(程序详解)
最近因项目需要用到python处理网页,因此学习相关知识.下面程序使用python抓取网页并提取信息,具体内容如下: #---------------------------------------- ...
python抓取网页例子
python抓取网页例子最近在学习python,刚刚完成了一个网页抓取的例子,通过python抓取全世界所有的学校以及学院的数据,并存为xml文件.数据源是人人网. 因为刚学习python,写的代码 ...
Python抓取页面中超链接(URL)的三中方法比较(HTMLParser、pyquery、正则表达式) <转>
Python抓取页面中超链接(URL)的3中方法比较(HTMLParser.pyquery.正则表达式) HTMLParser版: #!/usr/bin/python # -*- coding: UT ...
php抓取网页中的内容
以下就是几种常用的用php抓取网页中的内容的方法.1.file_get_contentsPHP代码代码如下:>>>>>>>>>>>&g ...
python 解决抓取网页中的中文显示乱码问题
关于爬虫乱码有很多各式各样的问题,这里不仅是中文乱码,编码转换.还包括一些如日文.韩文 .俄文.藏文之类的乱码处理,因为解决方式是一致的,故在此统一说明. 网络爬虫出现乱码的原因源网页编码和爬取下来 ...

随机推荐

Python基础(深、浅拷贝)
深.浅拷贝基础:对象,引用,可变与可变对于不可变的对象,如字符串.元组.数字深浅拷贝没有什么意义. 1.浅拷贝浅拷贝只拷贝第一层对象(拷贝的实际是一个框子,拷贝过去的框子是不会变的,但是原先的框 ...
Sql用变量拼语句
CREATE PROC Test_GetCollegeInfo @type int AS BEGIN ),@v int,@sql nvarchar(max) Begin )) END ELSE BEG ...
oracle数据导出工具sqluldr2
oracle数据导出工具sqluldr2可以将数据以csv.txt等格式导出,适用于大批量数据的导出,导出速度非常快.导出后可以使用oracle loader工具将数据导入.下载完sqluldr2,工 ...
学习OpenCV——KNN算法
转自:http://blog.csdn.net/lyflower/article/details/1728642 文本分类中KNN算法,该方法的思路非常简单直观:如果一个样本在特征空间中的k个最相似( ...
android Thread和Service的区别
http://www.cnblogs.com/devinzhang/archive/2012/01/11/2319433.html (zhuan)
eclipse远程debug
由于一般比较正规项目,都会有好几个版本,有时候在测试版本的时候,一切都好好的,然后提交到其他版本之后会有各种各样的问题,这个时候如果不能快速准确的定位到问题,那么我们就需要用 eclipse远程deb ...
字符编码 and cpp
预备知识字符:抽象的最小文本单位.仅代表符合没有实际意义(如:￥, a, 国) 字符集:字符的集合(如gb2312, ASCII, UNICODE) 编码:是对字符集的描述,计算机要准确的处理各种字 ...
完整成功配置wamp server小记
首先安装最新版本的wamp server,这是必须的! 配置默认”www目录”的路径(可选):下面以改为D:\site为例.打开wamp\scripts\config.inc.php第47行,$www ...
HDU 5686：2016"百度之星" - 资格赛 Problem B
原文链接:https://www.dreamwings.cn/hdu5686/2645.html Problem B Time Limit: 2000/1000 MS (Java/Others) ...
App.xaml
<Application x:Class="HelloWorld.App" xmlns="http://schemas.microsoft.com/winfx/20 ...

Python抓取网页中的图片到本地

Python抓取网页中的图片到本地的更多相关文章

随机推荐

热门专题