这是一篇Python爬取CSDN下载资源信息的样例,主要是通过urllib2获取CSDN某个人全部资源的资源URL.资源名称.下载次数.分数等信息.写这篇文章的原因是我想获取自己的资源全部的评论信息.可是因为评论採用JS暂时载入.所以这篇文章先简介怎样人工分析HTML页面爬取信息. 源码 # coding=utf-8 import urllib import time import re import os #*******************************************
get和post方式总结 get方式:以URL字串本身传递数据参数,在服务器端可以从'QUERY_STRING'这个变量中直接读取,效率较高,但缺乏安全性,也无法来处理复杂的数据(只能是字符串,比如在servlet/jsp中就无法处理发挥java的比如vector之类的功能). post方式:就传输方式讲参数会被打包在数据报中传输,从CONTENT_LENGTH这个环境变量中读取,便于传送较大一些的数据,同时因为不暴露数据在浏览器的地址栏中,安全性相对较高,但这样的处理效率会受到影响. get
本文转自SUN'S BLOG 原文地址:IT这一行,如可高速下载国外资源之迅雷 我们这些做IT这一行的人,经常,下载一些国外的一些资源,可是让人蛋碎的是,往往这些资源下载都慢的像蜗牛,真的让人无法忍受.有时等待下载的时间比憋尿还难受.以前也听别人说过下载资源有技巧,可是听说了这么多年了,都没有人告诉我这个技巧是什么?唉--经常在蜗牛般的下载速度里煎熬-真的痛不堪言,真可谓是苦B一个啊. 但是,可是,就是,忽然,有一天,我天眼一开,神经错乱了一下,居然找到了高速下载国外资源,的方法!哈
如何用python下载一张图片 这里要用到的主要工具是requests这个工具,需要先安装这个库才能使用,该库衍生自urllib这个库,但是要比它更好用.多数人在做爬虫的时候选择它,是个不错的选择. 例如下载http://p1.pstatp.com/large/4af100050861e28b06ca这张图片,我们可以参考下面这个例子 import requests import os import time image_response=requests.get('http://p1.psta