Win7下python Scrapy一站式搭建全攻略(内附相关下载链接)
写在前面:
好久没有登录博客了,意外看到之前的几篇文章都有不错的阅读量,开心极了,不过没有什么点赞和评论,大概是没有给大家带来什么切实的帮助吧。o(*////▽////*)q。
最近在NTU负责一个国家研究基金委支持的智能城市交通的项目,第一步就是获取道路交通各种信息,收集分析数据。因为各种原因这次选择了Scrapy这个框架,也是我自己第一次接触python爬虫,圆满完成需求数据爬取之后,我在四台电脑上搭建了Scrapy环境,遇到了各种各样的问题,借此写一篇总结,也希望能够给大家提供一丝丝的帮助,更希望能帮助大家,流畅的搭建完成。
———————————————————————————————————————————————————————————
一、安装python
根据自己的需求,到官网下载适合自己电脑的版本,https://www.python.org/downloads/,这里我选择的是较为稳定的2.7版本
链接: http://pan.baidu.com/s/1i5hZPS5%20 密码: e6qi
安装过程十分简单,除了选择路径,一路next到底即可。完成之后,别忘将python添加到环境变量里。
点击“我的电脑”右键“属性”,进入到如下界面,左上角选择“高级系统设置”:

弹出一个对话框,在对话框里找到并选择“环境变量”选项,进入之后,下方找到“path”,之后编辑,用 ; 隔开,插入安装python的文件路径,这里为了之后安装方便,也将python下的script路径给添加进来。

添加到环境变量之后,打开命令行,输入,python,如果出现如下界面则安装成功,如果显示不是内部外部命令,回去检查环境变量设置环节。很大可能是误输入中文输入法之下的;检查一遍,修改之后,重启命令行再输入一遍。

二、安装pywin32
在Windows下,必须安装pywin32,下载地址:https://sourceforge.net/projects/pywin32/,链接: http://pan.baidu.com/s/1hsmL92W 密码: 3qnf
安装过程也很简单,一路next到底,安装完毕之后在命令行先输入python,之后输入import win32com验证:
如图所示,如果没有提示错误,则证明安装成功,如果错误就再来一遍,这个步骤一般不会出现问题。
三、安装pip
pip是一个安装和管理python包的工具,可以替代easy_install。下载地址:https://bootstrap.pypa.io/get-pip.py 或 http://pan.baidu.com/s/1dFKbFP3%20 密码:m3ar
打开命令行进入到保存get-pip的路径进行操作,可以用cd的命令,也可以shift+右键选择用命令行打开。然后键入:
python get-pip.py
即可
安装完成后在命令行输入
pip --version
显示
即安装成功
四、安装pyOPENSSL
在Windows下,是没有预装pyOPENSSL的,而在Linux下是已经安装好的。
安装地址:https://launchpad.net/pyopenssl 或 http://pan.baidu.com/s/1hrXS4Fa 密码:25pd
下载后,双击,一路next就可以。
五、安装 lxml
lxml是一种使用 Python 编写的库,可以迅速、灵活地处理 XML
直接执行如下命令
pip install lxml
然后,我们迎来了一个大坑,这里可能会报各种错,比较常见的:
1.报错说电脑没有匹配的 Microsoft Visual C++库,点击官网下载安装,点击网盘下载安装,密码:37h2。安装完成后重启命令行再次执行上述命令
2.报其他乱七八糟的错,或者上述库安装完成以后依旧不成功。这个时候可以尝试
easy_install lxml
或者,下载集成的安装包,直接双击一路next安装。如果还是不行,一个屡试不爽的方法,下载lxml.wheel文件。然后在wheel目录下键入
pip install lxml-3.6.4-cp27-cp27m-win_amd64.whl
六、安装Scrapy框架
在命令行下
pip install Scrapy

安装完毕后,在命令行输入Scrapy,如果显示如下图所示,则安装成功:

七、编译程序的时候发现,经常报告缺失lib2,所以这里附上安装httplib2的方法
下载,然后解压,在httolib2目录下,pip install httplib2 即可。
————————————————————————————————————————————————————————————
如果还有其他问题,欢迎留言讨论交流。
Win7下python Scrapy一站式搭建全攻略(内附相关下载链接)的更多相关文章
- Win7下Python WEB环境搭建
环境介绍: Win7 64位 SP1 Python:2.7.6 网关接口:flup Nginx安装:http://blog.csdn.net/jacson_bai/article/details/46 ...
- python——创建django项目全攻略(野生程序员到家养程序员的完美进化)
新建工程 我用pycharm写代码,所以一般就用pycharm创建django工程.右上角File-New Project.选择路径,修改项目名称,确定.就可以创建一个新的django工程. ...
- Ambari HDP集群搭建全攻略
世界上最快的捷径,就是脚踏实地,本文已收录[架构技术专栏]关注这个喜欢分享的地方. 最近因为工作上需要重新用Ambari搭了一套Hadoop集群,就把搭建的过程记录了下来,也希望给有同样需求的小伙伴们 ...
- Linux下Makefile的automake生成全攻略--转
http://www.yesky.com/120/1865620.shtml 作为Linux下的程序开发人员,大家一定都遇到过Makefile,用make命令来编译自己写的程序确实是很方便.一般情况下 ...
- Linux下Makefile的automake生成全攻略
作为Linux下的程序开发人员,大家一定都遇到过Makefile,用make命令来编译自己写的程序确实是很方便.一般情况下,大家都是手工写一个简单Makefile,如果要想写出一个符合自由软件惯例的M ...
- 21天速成python电子书pdf|超级厉害的书内附百度云链接可直接下载|
python的学习书籍小编看过很多,但是这本<21天学通python>真的是堪称极品!本书的作者团队成员为一线开发工程师.资深编程专家或专业培训师,在编程开发方面有着丰富的经验,并已出版过 ...
- win7下android开发环境搭建(win7 64位)
win7下android开发环境搭建(win7 64位) 一.安装 JDK 下载JDK最新版本,下载地址如下: http://www.oracle.com/technetwork/java/jav ...
- Python 自动化测试全攻略:五种自动化测试模型实战详解
随着移动互联网的发展,软件研发模型逐步完善,软件交付质量越来越受到软件公司的重视,软件测试技术特别是自动化测试技术开始在软件系统研发过程中发挥着越来越重要的作用. 与传统的手工测试技术相比,自动化测试 ...
- fiddler Android下https抓包全攻略
fiddler Android下https抓包全攻略 fiddler的http.https的抓包功能非常强大,可非常便捷得对包进行断点跟踪和回放,但是普通的配置对于像招商银行.支付宝.陌陌这样的APP ...
随机推荐
- PHP 调用asp.net Web Services服务问题总结
原文:PHP 调用asp.net Web Services服务问题总结 PHP是弱类型语言,转换非常不方便. < ?php //soap 客户端 $client=new SoapClient(' ...
- style、currentStyle、getComputeStylel的使用
(1)js中使用obj.style的用法,是为了获得内联样式,即style属性中的值. 如果想获取obj.style.display,但内联样式表中没有定义display,那么将返回一个空的字符串. ...
- C#6.0 中的那些新特性
C#6.0 中的那些新特性 前言 VS2015在自己机器上确实是装好了,费了老劲了,想来体验一下跨平台的快感,结果被微软狠狠的来了一棒子了,装好了还是没什么用,应该还需要装Xarmain插件,配置一些 ...
- 布尔逻辑运算,goto语句
布尔逻辑 bool类型可以有两个值:true或者false. 布尔比较需要使用布尔比较运算符(关系运算符),下图:var1为布尔类型的变量,var2,var3则可以是不同类型.
- Extjs 组件继承 模板说明(同GridPanel案件)
1. 重写initComponent()方法,并在该方法在调用父类的initComponent()方法. 如:subclass.superclass.initComponent.call(this) ...
- 查看mysql状态常用命令
最近服务器上mysql有些奇奇怪怪的问题,可惜我不是专业的dba,为了加深自己对mysql的了解,先从基础的查看mysql状态命令看起吧. 命令: show status; 命令: show stat ...
- 仿javascript中confirm()方法的小插件
10天没有写博客了,不知道为什么,心里感觉挺不舒服的,可能这是自己给自己规定要去完成的事情,没有按照计划执行,总会心里不怎么舒服.最近事情挺多的,终于今天抽空来更新一下博客了. 今天写的是一个小插件. ...
- 基于Jquery 简单实用的弹出提示框
基于Jquery 简单实用的弹出提示框 引言: 原生的 alert 样子看起来很粗暴,网上也有一大堆相关的插件,但是基本上都是大而全,仅仅几句话可以实现的东西,可能要引入好几十k的文件,所以话了点时间 ...
- Android高效开发环境(Genymotion,Gradle,Andriod Studio)
临近十一,项目接近上线,终于有些碎片时间可以查看一些博客. 这篇博客是Android开发大牛Cyril Mottier在去年写的博客,我把它翻译一下共享给国内志同道合的朋友,同时也是对自己一个很好的锻 ...
- iOS基础 - 静态库
一.什么是库? 库是共享程序代码的方式,一般分为静态库和动态库. 二.静态库与动态库的区别? 静态库:链接时完整地拷贝至可执行文件中,被多次使用就有多份冗余拷贝. 动态库:链接时不复制,程序运行时由系 ...