python抓取网页中图片并保存到本地

#-*-coding:utf-8-*- 

import os

import uuid

import urllib2

import cookielib

'''获取文件后缀名'''

def get_file_extension(file):

    return os.path.splitext(file)[1]  

'''創建文件目录，并返回该目录'''

def mkdir(path):

    # 去除左右两边的空格

    path=path.strip()

    # 去除尾部 \符号

    path=path.rstrip("\\")

    if not os.path.exists(path):

        os.makedirs(path)

    return path

'''自动生成一个唯一的字符串，固定长度为36'''

def unique_str():

    return str(uuid.uuid1())

'''

抓取网页文件内容，保存到内存

@url 欲抓取文件 ，path+filename

'''

def get_file(url):

    try:

        cj=cookielib.LWPCookieJar()

        opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))

        urllib2.install_opener(opener)

        req=urllib2.Request(url)

        operate=opener.open(req)

        data=operate.read()

        return data

    except BaseException, e:

        print e

        return None

'''

保存文件到本地

@path  本地路径

@file_name 文件名

@data 文件内容

'''

def save_file(path, file_name, data):

    if data == None:

        return

    mkdir(path)

    if(not path.endswith("/")):

        path=path+"/"

    file=open(path+file_name, "wb")

    file.write(data)

    file.flush()

    file.close()

#获取文件后缀名

print get_file_extension("123.jpg");

#創建文件目录，并返回该目录

#print mkdir("d:/ljq")

#自动生成一个唯一的字符串，固定长度为36

print unique_str()

url="http://qlogo1.store.qq.com/qzone/416501600/416501600/100?0";

save_file("d:/ljq/", "123.jpg", get_file(url))

python抓取网页中图片并保存到本地的更多相关文章

php获取网页中图片并保存到本地
php获取网页中图片并保存到本地的代码,将网页中图片保存本地文件夹: save_img("http://www.jbxue.com" ?>
php获取网页中图片并保存到本地的代码
php获取网页中图片并保存到本地的代码,将网页中图片保存本地文件夹: <?php /** * 获取网页中图片,并保存至本地 * by www.jbxue.com */ header(" ...
Python抓取网页中的图片到本地
今天在网上找了个从网页中通过图片URL,抓取图片并保存到本地的例子: #!/usr/bin/env python # -*- coding:utf- -*- # Author: xixihuang # ...
浅谈如何使用python抓取网页中的动态数据
我们经常会发现网页中的许多数据并不是写死在HTML中的,而是通过js动态载入的.所以也就引出了什么是动态数据的概念, 动态数据在这里指的是网页中由Javascript动态生成的页面内容,是在页面加载到 ...
python抓取网页中的动态数据
一.概念网页中的许多数据并不是写死在HTML中的,而是通过js动态载入的.所以也就引出了什么是动态数据的概念,动态数据在这里指的是网页中由Javascript动态生成的页面内容,是在页面加载到浏览器 ...
使用wget工具抓取网页和图片成功尝试
使用wget工具抓取网页和图片发表于1年前(2014-12-17 11:29) 阅读(2471) | 评论(14) 85人收藏此文章, 我要收藏赞7 wget 网页抓取图片抓取目录[-] ...
使用wget工具抓取网页和图片及相关工具几个
想保存一些网页,最后找到这 wget 的 shell脚本,虽然不是太理想,亲测可用呢. 使用wget工具抓取网页和图片来源 https://my.oschina.net/freestyletim ...
Java 抓取网页中的内容【持续更新】
背景:前几天复习Java的时候看到URL类,当时就想写个小程序试试,迫于考试没有动手,今天写了下,感觉还不错内容1. 抓取网页中的URL 知识点:Java URL+ 正则表达式 import jav ...
Python 抓取网页并提取信息(程序详解)
最近因项目需要用到python处理网页,因此学习相关知识.下面程序使用python抓取网页并提取信息,具体内容如下: #---------------------------------------- ...

随机推荐

编译C#代码
using Microsoft.CSharp; using System.CodeDom.Compiler; using System.Reflection; using System.Text; n ...
var和dynamic的区别及如何正确使用dynamic ?
C#中的很多关键词用法比较容易混淆,var和dynamic就是其中一组,他们都可以申明动态类型的变量,但是本质上他们还是有不少区别的.var 在编译阶段已经确定类型,在初始化时候,必须提供初始化的值, ...
jQuery 浮动标签插件，帮助你提升表单用户体验
浮动标签模式(Float Label Pattern)是最新流行的一种表单输入域的内容提示方式,当用户在输入框输入内容的时候,原先占位符的内容向上移动,显示在输入的内容的上面.这里推荐的这款 jQue ...
【HTML5】浅析HTML5应用程序缓存（ApplicationCache）
一.为什么需要Web应用程序缓存在移动互联网时代,设备终端位置不再固定,依赖无线信号,网络的可靠性变得降低,比如坐在火车上,过了一个隧道(15分钟),便无法访问网站,这对于web的伤害是很大的 ...
Hexo部署到GitHub出现spawn ENOENT的解决办法
最近用Hexo博客部署到GitHub时出现了这如下的错误: Error: spawn ENOENT at errnoException (child_process.js:980:11) at Pro ...
Snort - manual 笔记（四）
1.7 Basic Output Snort可以做很多任务, 并且在任务完成后输出很多有用的统计信息. 一些不用说明就可以看懂, 其他的总结在这里, 不过只是一些基本的 1.7.1 Timing St ...
SharePoint Online 创建门户网站系列之母版页
前言虽然SharePoint中母版页看起来只是头部Banner和底部版权信息这两个部分,但是实质在SharePoint Online中的页面模型中占有重要地位,而且SPO对母版页有着完善的签入签出 ...
SPC2014 :“FOSL”不是替代InfoPath，只是另外一种创建表单的方式
今天在SPC2014微软宣布他们技术路线图.其实,没有足够证据替代InfoPath,只是另外的一种尝试 - FOSL(对SharePoint列表表单). FOSL使用相同的引擎,用于创建表单的访问服务 ...
连接QuickBooks Online实现于IOS App数据同步功能的个人记录
公司项目需要用WebService与QBO实现后台数据同步,由于国内没有做过类似第三方产品接口的资料,前前后后找了N久,终于实现功能,现把实现功能步骤贴上来分享: QBO开发者地址(主要用于创建QBO ...
leetcode 第188题，我的解法，Best Time to Buy and Sell Stock IV
<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255) ...

python抓取网页中图片并保存到本地

python抓取网页中图片并保存到本地的更多相关文章

随机推荐

热门专题