Ubuntu14.04下如何安装Python爬虫框架Scrapy
按照官方文档的说明,安装scrapy 需要以下程序或者库:
(1)、Python 2.7
(2)、lxml。 Most linux distributions ships PRepackaged versions of lxml. Otherwise refer tohttp://lxml.de/installation.html
(3)、OpenSSL。 This comes preinstalled in all Operating systems except Windows (see Platform specific installation notes)
(4)、pip or easy_install Python package managers
我们安装的Ubuntu14.01系统都已经自带了前面3个,Python的版本为2.7.6。为了验证是否有安装,我们来查看一下。
打开终端,执行如下命令python, 接下来就是import lxml, import OpenSSL。如下图。如果import没有报错,说明系统已经自带了。

为了能够保证下面的安装能够成功。我们先执行:sudo apt-get install python-dev。如图:

再执行:sudo apt-get install libevent-dev。如图:

在这里说明一下,不安装上面两个可能会出现一些错误,导致在后面的工作无法进行。
接下来就是安装pip了,执行:apt-get install python-pip。如图:

最后,也就是最重要的,安装Scrapy。执行:pip install Scrapy,如图:

到这里就已经安装完成了。接下来就是使用这个框架了。
Ubuntu14.04下如何安装Python爬虫框架Scrapy的更多相关文章
- Linux 安装python爬虫框架 scrapy
		
Linux 安装python爬虫框架 scrapy http://scrapy.org/ Scrapy是python最好用的一个爬虫框架.要求: python2.7.x. 1. Ubuntu14.04 ...
 - 安装 python 爬虫框架 Scrapy
		
官方安装说明文档:https://doc.scrapy.org/en/latest/intro/install.html#installing-scrapy 一.scrapy 需要以下依赖 二.一般来 ...
 - win环境安装python爬虫框架scrapy
		
#官网下载python for windows #https://www.python.org/downloads/ #安装后在“计算机->属性->高级系统设置->环境变量-> ...
 - ubuntu14.04下编译安装ambari-2.4.2.0
		
ubuntu14.04下编译安装ambari-2.4.2.0 编译前的准备工作 准备工作有: 系统参数 系统依赖(编译环境) 离线安装包 java环境 maven环境 Nodejs环境 git环境 a ...
 - Ubuntu14.04下Ambari安装搭建部署大数据集群(图文分五大步详解)(博主强烈推荐)
		
不多说,直接上干货! 写在前面的话 (1) 最近一段时间,因担任我团队实验室的大数据环境集群真实物理机器工作,至此,本人秉持负责.认真和细心的态度,先分别在虚拟机上模拟搭建ambari(基于CentO ...
 - ubuntu14.04下手动安装eclipse
		
ubuntu14.04下手动安装eclipse 第一步: 安装jdk 第二步: 下载eclipse,假设下载的文件文件名为eclipse.tar.gz 第三步: 解压 sudo -zxvf ./ecl ...
 - ubuntu14.04 下手动安装java jdk
		
ubuntu14.04 下手动安装java jdk 第一步: 下载jdk.tar.gz (这里假设下载的文件名为jdk.tar.gz) 第二步: 解压 sudo tar -zxvf ./jdk.tar ...
 - 教你分分钟学会用python爬虫框架Scrapy爬取心目中的女神
		
本博文将带领你从入门到精通爬虫框架Scrapy,最终具备爬取任何网页的数据的能力.本文以校花网为例进行爬取,校花网:http://www.xiaohuar.com/,让你体验爬取校花的成就感. Scr ...
 - 【转载】教你分分钟学会用python爬虫框架Scrapy爬取心目中的女神
		
原文:教你分分钟学会用python爬虫框架Scrapy爬取心目中的女神 本博文将带领你从入门到精通爬虫框架Scrapy,最终具备爬取任何网页的数据的能力.本文以校花网为例进行爬取,校花网:http:/ ...
 
随机推荐
- 转 rman 恢复报错
			
###sample 1 原因是新库起了FRA 区,FRA 区的旧文件属于之前的归档日志文件产生,这样会导致无法识别的问题. 解决办法,清空FRA或者恢复时候不启用FRA. RMAN RESTORE ...
 - iview  怎样屏蔽掉账户框自动显示账户名和密码(root,***)
			
用iview框架做出的登录页面,账户名和密码显示框,会自动有占位信息(root,****) 后来解决问题发现,只要在真正的输入框下面添加这样的一行隐藏的代码,占位信息会自动填充到隐藏的input框内, ...
 - git多账户使用
			
由于公司和个人分别有git账号,而git客户端在默认情况下是只能使用一个账号,如果需要使用多个账号,需要额外的设置. 1. 不使用全局设置,使用如下清除全局设置 git config --global ...
 - Jmeter调试脚本之关联
			
前言: Jmeter关联和loadrunner关联的区别: 1.在loadrunner中,关联函数是写在要获取变量值的页面的前面,而在就Jmeter中关联函数是要写在获取变量函数值的页面的后面 2.在 ...
 - Mutex,Monitor,lock,MethodImplAttribute,SynchronizedAttribute的用法差异
			
1)Mutex:进程之间的同步(互斥量). 2)lock/Monitor……:线程同步.其中lock是Monitor的简化版本(直接生成try{Monitor.Enter(……)}finally{Mo ...
 - <数据挖掘导论>读书笔记4--其他分类技术
			
1.基于规则的分类器 2.最近邻分类器 3.贝叶斯分类器 4.人工神经网络 5.支持向量机 6.组合方法 7.不平衡类问题 8.多类问题
 - 持续集成:TeamCity 的安装和使用
			
TeamCity 本文初衷 让大家了解持续集成(CI),以及入门了解 JetBrains 家的 TeamCity 的一些简单实用. TeamCity 的一些复杂使用我暂时也不会,一样也是要看文档的,所 ...
 - C++要点总结
			
1.内联成员函数 1)隐式声明:将成员函数直接定义在类的内部 2)显式声明:inline标示 2)在类中,使用inline定义内联函数时,必须将类的声明和内联成员函数的定义都放在同一个文件中,否则编译 ...
 - 深入理解JavaScript系列(45):代码复用模式(避免篇)
			
介绍 任何编程都提出代码复用,否则话每次开发一个新程序或者写一个新功能都要全新编写的话,那就歇菜了,但是代码复用也是有好要坏,接下来的两篇文章我们将针对代码复用来进行讨论,第一篇文避免篇,指的是要尽量 ...
 - centos 中输入ifconfig 只有lo 没有eth0
			
问题描述:linux中输入ifconfig命令,只有lo,没有eth0 解决方法: 1.进入/etc/sysconfig/network-scripts 目录,发现有ifcfg-eth0,即网卡(驱动 ...