python 3 安装 scrapy 并运行成功

今天，python 3 安装 scrapy，并运行成功。特此纪念！

我的环境：windows 10(64位) + python 3.5.2(64位)

其中几个要点说明一下：

1、有几个依赖库需要事先单独安装

往往，在安装scrapy依赖库，即在

pip install scrapy

过程中，会出现红色错误的。此时，做两件事

更新pip: $ python pip install --upgrade pip
去lfd下载单独的whl文件，pip安装之(若有多个依赖库安装出现红色文字错误，则此步重复！)

2、特别地，pywin32的安装问题

去lfd下载单独的whl文件，pip安装之
然后，运行命令$ python pywin32_postinstall.py -install，切记！

好了，运行官网首页的例子：

import scrapy

class BlogSpider(scrapy.Spider):

    name = 'blogspider'

    start_urls = ['https://blog.scrapinghub.com']

    def parse(self, response):

        for url in response.css('ul li a::attr("href")').re('.*/category/.*'):

            yield scrapy.Request(response.urljoin(url), self.parse_titles)

    def parse_titles(self, response):

        for post_title in response.css('div.entries > ul > li a::text').extract():

            yield {'title': post_title}

保存为myspider.py文件，命令行进入此文件夹，运行如下命令，使启动爬虫：

scrapy runspider myspider.py

OK了，可以看到成功的信息。

python 3 安装 scrapy 并运行成功的更多相关文章

Python爬虫：scrapy 的运行流程和各模块的作用
scrapy的运行流程爬虫 -> 起始URL封装Request -> 爬虫中间件 -> 引擎 -> 调度器(Scheduler): 缓存请求, 请求去重调度器 -> ...
python 里安装 tensorflow 后运行出错的问题解决
如果出现一下错误: libcublas.so.8.0: cannot open shared object file: No such file or directory 原因是没有 cuda 环境, ...
Python：安装Bio库不成功，出现ModuleNotFoundError: No module named 'Bio'
Bio库的安装并不是pip install bio,而是biopython. ./anaconda3/bin/pip3 install biopython -i https://pypi.douban ...
Python|PyCharm安装scrapy包
[转]http://www.cnblogs.com/xiaoli2018/p/4566639.html
python3.7.1安装Scrapy爬虫框架
python3.7.1安装Scrapy爬虫框架环境:win7(64位), Python3.7.1(64位) 一.安装pyhthon 详见Python环境搭建:http://www.runoob.co ...
python3.7 安装Scrapy 失败问题
python的Scrapy框架,需要Twisted依赖以及VC++ 14 以上的环境,这些就不再赘述.讲讲今天安装Twisted和Scrapy遇到的其他问题. 首先就是直接安装Twisted成功后,安 ...
Python 爬虫6——Scrapy的安装和使用
前面我们简述了使用Python自带的urllib和urllib2库完成的一下爬取网页数据的操作,但其实能完成的功能都很简单,假如要进行复制的数据匹配和高效的操作,可以引入第三方的框架,例如Scrapy ...
python 安装scrapy
1. 首先你先得安装PYTHON...还是推荐2.7吧,之前装了3.3似乎和这个世界格格不入...先装个2.7. 并将python加入系统的环境变量. 2. 去scrapy 官网下载最新版本的scra ...
python爬虫随笔-scrapy框架(1)——scrapy框架的安装和结构介绍
scrapy框架简介 Scrapy,Python开发的一个快速.高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据.Scrapy用途广泛,可以用于数据挖掘.监测和自动化测试 ...

随机推荐

【转】IOS高级教程1:处理1000张图片的内存优化
转载请保留以下原文链接: http://my.oschina.net/taptale/blog/91894 一.项目需求在实际项目中,用户在上传图片时,有时会一次性上传大量的图片.在上传图片前,我们 ...
DP大作战—状态压缩dp
题目描述阿姆斯特朗回旋加速式阿姆斯特朗炮是一种非常厉害的武器,这种武器可以毁灭自身同行同列两个单位范围内的所有其他单位(其实就是十字型),听起来比红警里面的法国巨炮可是厉害多了.现在,零崎要在地图上 ...
github与eclipse创建仓库及克隆仓库
1.前往github官网注册账号,并下载客户端: 2.为eclipse工程创建本地仓库: 1,目前大多eclipse都预装了egit插件,如果没有请自行安装 2,在eclipse内创建工程->右 ...
采用 PAT工具及CSP语言，对一个问题进行自动机建模
pat是新加坡国立开发的工具,需要的去官网下http://www.comp.nus.edu.sg/~pat/ ,学了一天,是个不错的自动机验证工具,感觉还不错啊. 验证一个数是否为斐波那契数且为质数 ...
优秀的PHP开源项目集合
包管理Package Management Package Management Related 框架框架组件微框架Micro Frameworks 内容管理系统Content Managemen ...
java web中日期Date类型在页面中格式化显示的三种方式
一般我们经常需要在将服务器端的Date类型,传到页面进行显示,这就涉及到一个如何格式化显示Date类型的问题,一般我们有三种方式进行: 1)在服务端使用SimpleDateFormat等类格式化成字符 ...
UC 浏览器远程调试手机web网页记录
浏览器远程调试插件有很多,本来要使用chrome浏览器的调试插件的,但是需要FQ才能使用(公司网络有限制,果断放弃),最终选择使用UC浏览器的. 其实UC官网插件使用已经介绍的很详细了,但是有几处坑需 ...
MyCat 学习笔记第六篇.数据分片之按月数据分片
1 应用场景 Mycat 有很多数据分库规则,接下来几篇就相关觉得常用的规则进行试用与总结. 一般来说,按自然月份来进行数据分片的规则比较适用于商城订单查询,类似最近1周.2周.3个月内的数据.或是报 ...
使用Spring Security Oauth2完成RESTful服务password认证的过程
摘要:Spring Security与Oauth2整合步骤中详细描述了使用过程,但它对于入门者有些重量级,比如将用户信息.ClientDetails.token存入数据库而非内存.配置 ...
字符串长度函数strlen()
如下是我的测试文件: #include <stdio.h> #include <stdlib.h> #include <string.h> int main() { ...

python 3 安装 scrapy 并运行成功

1、有几个依赖库需要事先单独安装

2、特别地，pywin32的安装问题

python 3 安装 scrapy 并运行成功的更多相关文章

随机推荐

热门专题