Scrapy--1安装和运行

1.Scrapy安装问题

一开始是按照官方文档上直接用pip安装的，创建项目的时候并没有报错，

然而在运行 scrapy crawl dmoz 的时候错误百粗/(ㄒoㄒ)/~~比如：

ImportError: No module named _cffi_backend

Unhandled error in Deferred 等等,发现是依赖包好多没有装上，就去百度安装各种包，
有好多大神把这些都总结好了：膜拜！^_^

http://blog.csdn.net/niying/article/details/27103081

http://blog.csdn.net/pleasecallmewhy/article/details/19354723

2.没有得到数据，发现是拼写错误.

E:\tutorial>scrapy crawl dmoz

2015-10-30 13:44:02 [scrapy] INFO: Scrapy 1.0.3 started (bot: tutorial)

2015-10-30 13:44:02 [scrapy] INFO: Optional features available: ssl, http11

2015-10-30 13:44:02 [scrapy] INFO: Overridden settings: {'NEWSPIDER_MODULE': 'tu

torial.spiders', 'SPIDER_MODULES': ['tutorial.spiders'], 'BOT_NAME': 'tutorial'}

2015-10-30 13:44:02 [scrapy] INFO: Enabled extensions: CloseSpider, TelnetConsol

e, LogStats, CoreStats, SpiderState

2015-10-30 13:44:03 [scrapy] INFO: Enabled downloader middlewares: HttpAuthMiddl

eware, DownloadTimeoutMiddleware, UserAgentMiddleware, RetryMiddleware, DefaultH

eadersMiddleware, MetaRefreshMiddleware, HttpCompressionMiddleware, RedirectMidd

leware, CookiesMiddleware, ChunkedTransferMiddleware, DownloaderStats

2015-10-30 13:44:03 [scrapy] INFO: Enabled spider middlewares: HttpErrorMiddlewa

re, OffsiteMiddleware, RefererMiddleware, UrlLengthMiddleware, DepthMiddleware

2015-10-30 13:44:03 [scrapy] INFO: Enabled item pipelines:

2015-10-30 13:44:03 [scrapy] INFO: Spider opened

2015-10-30 13:44:03 [scrapy] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 i

tems (at 0 items/min)

2015-10-30 13:44:03 [scrapy] DEBUG: Telnet console listening on 127.0.0.1:6023

2015-10-30 13:44:03 [scrapy] INFO: Closing spider (finished)

2015-10-30 13:44:03 [scrapy] INFO: Dumping Scrapy stats:

{'finish_reason': 'finished',

 'finish_time': datetime.datetime(2015, 10, 30, 5, 44, 3, 292000),

 'log_count/DEBUG': 1,

 'log_count/INFO': 7,

 'start_time': datetime.datetime(2015, 10, 30, 5, 44, 3, 282000)}

2015-10-30 13:44:03 [scrapy] INFO: Spider closed (finished)

在spiders目录下的dmoz_spiders.py文件中将start_urls写成了start_url ，哎，╮(╯▽╰)╭

 start_urls = [

         "http://www.dmoz.org/Computers/Programming/Languages/Python/Books/",

         "http://www.dmoz.org/Computers/Programming/Languages/Python/Resources/"

     ]

Scrapy--1安装和运行的更多相关文章

Python 爬虫6——Scrapy的安装和使用
前面我们简述了使用Python自带的urllib和urllib2库完成的一下爬取网页数据的操作,但其实能完成的功能都很简单,假如要进行复制的数据匹配和高效的操作,可以引入第三方的框架,例如Scrapy ...
scrapy学习--安装
如果我们使用python爬取数据,那么scrapy必定是首选. 本文章记录学习过程中的两个问题 1,什么是scrapy 百科介绍: Scrapy,Python开发的一个快速.高层次的屏幕抓取和web抓 ...
Scrapy的安装--------Windows、linux、mac等操作平台
Scrapy安装 Scrapy的安装有多种方式,它支持Python2.7版本及以上或者是Python3.3版本及以上.下面来说py3环境下,scrapy的安装过程. Scrapy依赖的库比较多,至少需 ...
python3.5爬虫框架Scrapy的安装和排错（windows环境）
本文记录win7系统下使用python3.5安装Scrapy爬虫框架. Scrapy框架目前的官方文档说明是还不支持windows的python3环境的,但是网友反映以及实际测试均可以使用,下面就进行 ...
Scrapy框架安装失败解决办法
安装报错信息正常安装: pip3 install scrapy 出现报错信息如下: 两种解决办法第一种方法最根本得解决办法需要我们安装 Microsoft Visual C++ 14.0 ...
Scrapy框架——安装以及新建scrapy文件
一.安装 conda install Scrapy :之后在按y 表示允许安装相关的依赖库(下载速度慢的话也可以借助镜像源),安装的前提是安装了anaconda作为python , 测试scr ...
windows下python3使用pip安装scrapy提示安装失败
我的环境: python3.6, win10, 原因:不能成功安装twisted,因为twisted与高版本的python有兼容问题. 解决:1,先下载twisted二进制文 ...
Scrapy框架安装与使用（基于windows系统）
"人生苦短,我用python".最近了解到一个很好的Spider框架--Scrapy,自己就按着官方文档装了一下,出了些问题,在这里记录一下,免得忘记. Scrapy的安装是基于T ...
scrapy的安装，scrapy创建项目
简要: scrapy的安装 # 1)pip install scrapy -i https://pypi.douban.com/simple(国内源) 一步到位 # 2) 报错1: building ...
Python 2/3 安装与运行环境设置
Python 2/3 安装与运行环境设置: 1.Python 软件源:https://www.python.org/ 下载Win版本 https://www.python.org/downloa ...

随机推荐

C语言 01 形参实参
之前的都在印象笔记记录 continue 结束本轮循环体,进入下一次循环.break 直接结束整个while循环形参:定时函数时函数名后面中的参数实参:调用函数时传入的具体数据基本数据类型作为形参, ...
arm 2440 linux 应用程序 nes 红白机模拟器第1篇
对比了很多种,开源的 NES 模拟器 VirtuaNES , nestopia , FakeNES , FCEUX , InfoNES , LiteNES 最后决定使用 LiteNES 进行移值,它是 ...
Contains Duplicate III 下标范围<=k 值范围<=t
set妙用 1.维护一个大小最大位k的set set中数据是有顺序的 2.每次新加一个数据,只需要比较该数据加入有没有带来变化 3.找到 >= 新数据-t的数据对应的迭代器 pos 4.如果找 ...
JavaScript- jquery easyui 可编辑表格插件 easyui.editgrid
最近项目前端使用 jquery+easyui来做,用了几个月,觉得easyui是一个很不错的开源前端UI框架, 虽然偶尔会遇到一些小问题,但是凭借多年前端开发的实力积累都一一解决了,其中比较典型的就 ...
[ASM C/C++] C语言函数的可选性自变量
函数的可选性自变量 C语言允许定义自变量数量可变的函数,称为variadic函数.variadic函数需要固定数目的强制性自变量,后面是数量可变的可选性自变量. 也就是说必须至少有一个强制性 ...
javascirpt对象运用与JS变量
abcdefghijklmnopqrstuvwyz String 对象方法 charAt() 方法可返回指定位置的字符.stringObject.charAt(index)(index从0开始)[ht ...
我要谈对象之——JavaScript面向对象（1）
任何语言里都有面向对象,除了个别的.今天,我要说的是javascript中面向对象. 什么是面向对象? 计算机中的一切算法和逻辑都是源于生活中的,对象,这个抽象的概念并不是男同胞理解的妹子哈,对象,无 ...
IOS8解决获取位置坐标信息出错（Error Domain=kCLErrorDomain Code=0）(转)
标题:IOS8解决获取位置坐标信息出错(Error Domain=kCLErrorDomain Code=0) 前几天解决了在ios8上无法使用地址位置服务的问题,最近在模拟器上调试发现获取位置坐标信 ...
cygwin安装
我安装的是cygwin2.5.2,相关下载:https://cygwin.com/setup-x86_64.exe 先安装cygwin,x86_64版本,安装时选择库(gcc-core.gcc-c++ ...
css优先级问题
关于CSS specificityCSS 的specificity 特性或称非凡性,它是衡量一个衡量CSS值优先级的一个标准,既然作为标准,就具有一套相关的判定规定及计算方式,specificity用 ...

Scrapy--1安装和运行

Scrapy--1安装和运行的更多相关文章

随机推荐

热门专题